美国纽约基因组研究中心的Yaniv Erlich等人探索了DNA喷泉结构(DNA Fountain)作为存储数据信息介质的可能性,以及最大的存储能力,相关文章发表于《科学》杂志。
人类正在以指数速率产生大量的数据,因此需要建立更好的数据存储设备。DNA就是这样一个非常出色的数据存储媒介,已经证明每克DNA可存储千兆兆字节的信息,高度持久,并且能经过生物进化将这种结构优化以如实地复制该信息。最近,一系列的概念验证实验已经证明,DNA具有作为一种数据存储媒介的价值。
研究人员报道了一种可行的存储策略,称之为DNA喷泉,该策略是高度稳健的(针对数据损坏),并且接近每个核苷酸的信息容量。使用上述存储策略,研究人员可以将一整台电脑操作系统、电影及其他文件(多达2.14 ×106字节的信息)存储于DNA的寡核苷酸中,还完美地从一个相当于iIIumina测序的单一tile(每一次测序荧光扫描的最小单位)的测序覆盖度中恢复了信息。研究人员还进行了一项测试:使用原始的DNA样品恢复了2.18×1015 次,并能完美地解码出数据信息。最后,研究人员在每个分子可存储多少字节信息方面探索了这种DNA喷泉结构的极限,发现在每克DNA存储215千兆兆字节的存储密度的情况下,仍能完美地恢复信息,这一数量级比之前的研究都要高。
研究人员还指出,还需要考虑DNA作为存储媒介的费用问题,但是可以从两个方面减少费用,一个是持续优化DNA合成的过程,预计每十年可以降低1个~2个数量级的DNA合成费用;另一个是持续探索快速应急的寡核苷酸合成方法,可减少仪器使用时间及试剂的使用,从而减少合成费用。通过上述两方面的改进,DNA或许可以成为经济可行的长期存储数据的介质。(作者:包丽霞)
参考文献:Science 2017;355:950-954