本发明专利技术公开了一种基于DNA‑Base128的DNA图像存储方法及系统,涉及DNA存储技术领域;首先要将图像信息转换为二进制数据,对二进制数据进行分割和概率统计。其次构建DNA‑Base128编码表,通过贪心算法列举出所有满足生化约束的均衡码。根据易错相邻碱基出现的概率筛选并排序出前127位均衡码。然后根据数据块的概率统计和DNA‑Base128编码表进行动态映射。最后,当图像需要恢复时,DNA‑Base128通过阈值设置和漂移比较完成内部纠错。本发明专利技术利用DNA‑Base128编码表的限制、漂移比对和阈值,能实现错误类型的判断以及概率矫正。
本专利技术涉及dna存储,具体涉及基于dna-base128的dna图像存储方法及系统。
1、国际数据公司报告称,数据将在2025年达到175pb,到2040年达到1.9×109pb,提供一种新的存储介质显得尤为紧迫。dna作为大多数生物体遗传信息的载体,与传统的存储介质相比,它具有存储密度高、存储寿命长等优点,因此dna成为了未来最有潜力的存储介质。dna存储主要涉及五个主要过程:编码,合成,保存,测序和解码。编码是dna存储的最重要步骤,合理有效的编码可以提高编码密度,降低测序错误的概率。2017年,erlich等人将喷泉码应用于dna编码。通过排除或操作,种子之间的编码序列满足gc含量和均聚物限制,净编码密度达到了1.57bits/nt。另外,除了使用喷泉码减少错误外,zhang等人通过引入平衡码,满足了gc含量和均聚物限制并提供了一定的内部检错功能。当前的存储方案提高了存BG大游储的密度和质量,但没有考虑图像数据的特点,在处理图像数据时存在序列稳定性和图像重建效果不足等问题。
1.基于DNA-Base128的DNA图像存储方法,其特征在于,包括以下步骤:
2.根据权利要求1所述基于DNA-Base128的DNA图像存储方法,其特征在于,构建DNA-Base128编码表方式为:首先通过贪心算法筛选出所有满足生化约束的10位平衡码,然后根据易错相邻碱基出现的概率筛选并排序在前127位的均衡码。
3.根据权利要求1所述基于DNA-Base128的DNA图像存储方法,其特征在于,所述碱基映射规则为00-A,01-T,10-C,11-G。
4.根据BG大游权利要求1所述基于DNA-Base128的DNA图像存储方法,其特征在于,判断偶数据块是
1.基于dna-base128的dna图像存储方法,其特征在于,包括以下步骤:
2.根据权利要求1所述基于dna-base128的dna图像存储方法,其特征在于,构建dna-base128编码表方式为:首先通过贪心算法筛选出所有满足生化约束的10位平衡码,然后根据易错相邻碱基出现的概率筛选并排序在前127位的均衡码。
3.根据权利要求1所述基于dna-base128的dna图像存储方法,其特征在于,所述碱基映射规则为00-a,01-t,10-c,11-g。
4.根据权利要求1所述基于dna-base128的dna图像存储方法,其特征在于,判断偶数据块是否发生错误及错误类型的具体方式为:如果当前奇数据块不存在均衡码表中或在编码时没有出现,则判断偶数据块发生替换错误,否则偶数据块未发生错误;向下遍历偶数据块的个数满足设置阈值时,则判断偶数据块发生替换错误,否则为移位错误;当判断为移位错误后,如果偶数据块向左漂移且向下遍历偶数据块的个数满足设置...