HEDGES纠错码增强了DNA数据存储

近年来,HEXUS新闻多次报道了 DNA在数据存储应用中的潜在用途。微软是该领域的佼佼者之一,它已经在DNA数据存储技术上投入了大量的专业知识和现金,与华盛顿大学和DNA合成公司Twist Bioscience等公司合作。

人和“事物”每分钟都会生成大量数据,这给科技公司带来了问题,尤其是那些具有视频共享和云功能的公司。但是,早在2016年,Microsoft和UW研究人员就树立了DNA数据存储里程碑,他们说这意味着“可以将所有Internet上公开访问的数据”安装在鞋盒大小的存储介质中。听起来不错,但在使用DNA存储方面存在一些障碍,需要克服这些障碍才能看到其潜力。

以前,DNA存储的一个大问题是,在编码信息时自然会有很高的错误率。因此,为确保安全地隔离信息,DNA编码器将需要对任何10倍甚至15倍的数据重复编码,这是非常低效的。现在,得克萨斯大学奥斯汀分校的科学家们提出了一种使用新颖的纠错码将信息存储在DNA链中的方法。

由Ilya J. Finkelstein领导的研究小组开发的一种算法,解决了DNA存储的独特特征及其10%的错误率。DNA“字母”不是二进制的,它有四个碱基。A,C,G和T(腺嘌呤,胞嘧啶,鸟嘌呤和胸腺嘧啶),这有助于更密集地存储,但使纠错算法的开发更加困难。该团队将信息记录像格子一样建立在DNA上,因此一条信息可以增强其他信息。

UT研究人员开发了HEDGES(哈希编码,由贪婪穷举搜索解码)纠错码,可修复所有三种基本类型的DNA错误:插入,删除和替换。此外,HEDGES可以将未解决的错误或复合错误转换为取代,并且可以避免重复次数过多,或者窗鸟嘌呤-胞嘧啶(GC)含量过高或过低。

为了测试HEDGES,UT团队存储了《绿野仙踪》的全部内容,并将其翻译成世界语,“比以前的DNA存储方法具有更高的准确性,”《大众力学》报道。UT新闻博客说,存储的数据经受了高温和极端湿度的破坏,从而破坏了DNA,但“所有信息仍被成功解码”。

必须记住DNA的潜力- “一茶匙的DNA包含如此之多的数据,使用当前的技术将需要大约10个沃尔玛超级中心大小的数据中心来存储,”另一篇新论文的合著者John Hawkins告诉《大众》。力学。

那么,科学家或商业组织开始使用DNA存储需要多长时间?Finkelstein估计,“细分市场的应用可能即将出现,但我认为十年或更长时间它不会成为大众市场的产品。”

(0)
上一篇 2022年3月27日
下一篇 2022年3月27日

相关推荐