大游中国股份有限公司-BG大游官方网站-DNA存储纠错编码技术专家

DNA存储_百度文库

作者:小编 日期:Jul.13.2025 点击数:  

  四dna随机存储器的实现难题一步骤间的衔接在数据的写入操作中由于要先将原dna链分解再通过聚合酶合成新的dna链而这两步需要的酶并不相同也就是说这一个操作需要在两种反应缓二单链dna的稳定性dna随机存储器使用单链环状dna分子作为存储载体当它还是环状的时候相对比较稳定但是一旦要进行读写操作环链就会被破坏

  摘要:存储技术,这一计算机发展的重要支撑,越来越成为制约计算机技术发展的关键。DNA存储技术是一种基于生物分子的数据存储技术。作为生物分子计算机领域的一个重要分支,由于它存储密度大游中国股份有限公司高、硬件成本低廉、存取高度并行性、扩充性强、储存长久性好,所以极有可能替代传统的存储系统。这里首先回顾了DNA存储技术的起源与发展,接着以DNA随机存储器为例,介绍了其存储原理、研究的内容与方法。最后针对DNA随机存储器存在的问题进行了分析和展望。

  众所周知,存储对于计算机的重要性,如同记忆对于人的重要性。科学技术和信息产业的迅速发展.尤其是多媒体技术和计算机网络的发展,要求计算机存储设备不但有更大的数据存储容量、更高的数据传输速率以及更可靠的数据存储质量。还对如何使数据的存储更加经济和安全、存储在时间上和空间上的可扩展性都提出了更高的要求。目前的计算机存储体系的先天缺陷日趋显露且后续发展乏力。早已成为计算机应用提升的一大瓶颈。无论是硬盘还是CD/DVD光存储技术都无法应对未来计算机对存储的需求。据估计,不久的将来半导体、磁盘和光盘存储数据密度都将会达到其存储极限,这就迫切需要发展出可替代的新一代存储技术。

  DNA分子是一种强有力且有效的天然信息存储载体,它自1985年DNA合成以来得到广泛的应用.科学家发现:DNA与数据存储系统有着明显的相似之处,两者都顺序的存储编码信息,都用符号来标注单个信息段的开头和结尾,都使用数据纠错译码来保证信息的完整性。因此,DNA分子可被用来作为信息存储的载体。DNA存储技术就是以DNA分子为存储介质,以4种碱基A、C、G和T对信息进行编码;将信息存储于DNA分子上;同时用现有的生化实验方法,使DNA分子与各种生化酶进行生化反应,实现DNA分子的复制和DNA分子碱基的修改等操作,从而模拟存储器的数据读取和写入操作。由于DNA存储器具有工作稳定可靠、无磨损、信息容量大、存储寿命长、信息质量高、信息位的价格低、并行存取等优点而被视为超高密度、大容量的存储器。因此,基于生物存储的立体解决方案极有可能替代传统的存储系统。DNA存储技术的研究是利用DNA分子巨大的信息储藏能力和DNA分子能与多种生化酶相互反应的特点来模拟并实现具有随机读写能力的DNA数据存储器。它的研究也是整个生物分子计算机研究中的一个重要分支。

  早在20世纪70年代,科学家就发现可以利用DNA的不同状态来代表信息的有或无,而DNA分子的生化反应可以用来表示一个二进制数据的运算过程.由此萌生DNA生物计算机的概念。基于分子构象相互作用的分子模式识别是生物系统信息处理的基础。基于这一认识.Conrad在80年代就提出了自组织的分子器件模型.通过大量生物分子的识别与自组织可以解决宏观的模式识别与判定问题。美国南加州大学的Adleman教授于1994年11月在Science期刊上发表了一篇具有里程碑意义的论文。将生物分子技术成功地应用于解决传统的哈密顿圈问题。这一过程的实现向人们表明了用DNA分子处理方法来建立新的计算概念以新的计算机是可行的,开创了DNA分子计算的新纪元。

  但是理论上可行的技术发展确实十分艰难的,首要的问题是怎样才能将信息编码到DNA序列中。作为“信息”的DNA分子不能随机地产生,原因是由于DNA分子在杂交过程中可能产生不希望出现的假阳性和假阴性DNA分子。为避免不必要的分子杂交现象,需进行优化编码。如何给出最优长度的DNA序列是一个组合最优化问题。事实上,设计DNA序列比解决一个给定的问题还要难。这也是DNA计算的一个瓶颈。然而,如果我们能用同样的序列解决各种各样的问题,这种瓶颈将有望解决。目前。DNA存储器技术将是解决这一问题的较合适的办法,它将能被广泛应用于各种各样的DNA计算。Baum于1995年首次从理论上提出了构建DNA存储器的模型,设想通过并行的杂交技术能实现并行相联检索,奠定了DNA存储技术研究的基础。在此基础上,Rife于2002年用实验证实了Baum模型的有效性。2006年,Chen提出了具有学习和相联检索能力的存储器。Kashiwamura在2003年构建了一个具有高存储密度和高特异性杂交的小型DAN存储器.进一步于2005年证实了该存储模型具有高精度的可控性.并进行了大规模的计算机仿真。Takahashi利用发夹结构构建了4位的DNA RAM.作为DNA计算的一部分,被成功应用于解决最大独立集问题圈。

  DNA存储器在短短10年间,,各种理论模型和实验方法层出不穷,代表性的有Adleman模型,Splicing System模型,Insertion—Deletion System模型和DNA—EC模型。DNA随机存储器模型是这一系列模型的延续和发展,都是从理论上提出用生物分子来模拟计算机系统的设想,并设计出基于一定生物学背景的实验验证方法。现在就对其进行简单的介绍。

  DNA随机存储器使用环状单链DNA分子作为存储载体.DNA单链和DNA双链相比各有各的优点和不足,DNA双链比DNA单链稳定,这是大部分生命体选择DNA双链作为遗传物质的重要原因,但是双链的数据难以读取,需解链才可以;DNA单链则可以用碱基互补(Watson—CrickComple—ment)的原理来读取数据,但是它的性质不够稳定,比双链更容易断裂,而且还容易形成自身互补的发夹结构(hairpin)。选择单链作为存储载体是考虑了它的信息比较容易获取的特性,同时在设计中尽可能地避免发夹结构的产生。DNA长链和DNA环链相比,DNA长链如果被核酸内切酶剪切后将断裂成两段,而DNA环链如果被切断一次后,仍然是连在一起的,在一定的条件下还可以再连回成环链;DNA长链容易被某些核酸外切酶从其一端5’或3’降解,而环链被降解的可能性要小于长链。

  在环状单链DNA分子上存储数据时,考虑到数据能够被随机读写,数据必须加载地址信息,因此该DNA分子上同时编码了地址和数据的二元信息地址,数据.在一维的环状单链DNA分子上,地址和数据组成的二元信息是连续编码的.在对地址和数据的编码中,所能利用的符号是A、C、G、T4种碱基.除了考虑地址和数据的编码以外,DNA随机存储器还需要编码酶切位点(enzyme recognition site)的信息.由于存储在DNA存储器上的数据如果要进行读写操作必须借助于生化酶与DNA分子间的反应,因此DNA分子上必须编码生化酶的酶切位点信息.

  采取以上编码方式可以有效避免编码的错误和二义性,让地址码和数据码的区别明显,使得对DNA分子的编译码更加高效可靠。

  在DNA随机存储器中,数据的读写操作都需要在相关的酶的作用下,在适宜的反应溶液中进行。

  (1)读取数据的读写臂绑定到目标地址的位置,该读写臂的头部含有与目标地址段编码互补的引物段.

  (2)绑定到目标地址段上的读写臂前端在聚合酶的作用下开始延展(elongating),即复制DNA存储器上数据,延展过程在下一个地址段前结束.

  (1)写入数据的读写臂绑定到目标地址的位置,读写臂头部包含要写入的数据。

  (3)以读写臂头部的新数据为模板进行反向的聚合酶反应,将数据又读写臂的头部复制到DNA存储器上。

  在数据的写入操作中,由于要先将原DNA链分解,再通过聚合酶合成新的DNA链,而这两步需要的酶并不相同,也就是说,这一个操作需要在两种反应缓冲液的环境中分别进行。然而每一种缓冲液都需要单独配置,每一个小的步骤也需要单独进行,这就说明这两个步骤间的衔接尤为重要。为了解决这一问题,一个简单的办法是每次反应后都将DNA存储器与反应缓冲液分离,下一次反应的时候再将DNA存储器与新的缓冲液混合,这虽然在实验操作中是可以做到的,但它的代价也非常高,这中间必须考虑提取过程中DNA存储器分子的损耗和过程中消耗的时间,DNA存储器的损耗将影响存储的品质而大游中国股份有限公司时间的消耗将影响存储效率.就目前而言,尚不存在使各种酶都能发挥最大活性的通用缓冲液,因此操作步骤的衔接问题将不能彻底地解决。

  DNA随机存储器使用单链环状DNA分子作为存储载体,当它还是环状的时候,相对比较稳定,但是一旦要进行读写操作,环链就会被破坏。而每个碱基和嘌呤的连接是以磷酸二脂键相连的,这一化学键在生物体内可以稳定的存在,但是在体外进行操作时,由于温度、溶液性质的不稳定,极易遭到破坏,因此,单链DNA的稳定性问题也是值得考虑的。所以基于以上分析,我仍希望将来可以使用双链DNA作为存储载体,通过对A、T和G、C的冗余编码,增加氢键和磷酸二脂键的个数,保证存储载体的稳定和可靠。

  实际应用中,对于存储单元的查找、删除、排序等操作是必要的,而这些操作的基础都是单个存储单元。因此,如何方便快捷的对单个存储单元进行操作,也是这个DNA存储器没有解决的问题。由于对于该存储器而言,存取的操作都是在反应液中进行,这就无法保证可以进行精确的操作。所以我将希望寄托于新型材料科学的发展,希望今后的研究人员可以发明出可以适合DNA有序附着并且可以在其上进行快速简单的化学反应的新材料,以解决这一难题。

  截至目前,DNA存储技术的研究方兴未艾,正有越来越多的研究人员投身其中。尽管目前这一领域的研究刚刚处于起步阶段,在多方面都存在问题和不足,但是由于其巨大的研究价值,DNA存储技术仍是未来科学技术发展的最前沿。此外,DNA存储技术的研究也不仅仅局限于计算机领域,由于其本身的生物科学属性,所以对于生命科学、基因科学、医学方面都有重要意义。

  【1】沈俊杰,吕红兵。DNA随机存储器的设计,浙江大学学报,第32卷第5期,2005年9月。

  【2】崔光照,刘玉琳,张勋才。数据存储新方向:DNA分子存储技术,计算机工程与应用,第42卷第26期,2006年。

  【3】刘向荣,刘文斌,许进。激光诱导荧光技术在DNA计算输出中的应用,计算机工程与应用,第41卷第1期,2005年。