- 0
- 0
- 约1.84千字
- 约 4页
- 2022-03-01 发布于浙江
- 举报
PAGE
PAGE 1
DNA存储技术在未来会有它的市场吗
简洁地说,根据这种速度,很快就没有足够的数据存储和计算材料可供使用。这就是为什么人们现在已经开头查找替代的数据存储介质的缘由。使用DNA来存储数据,这听起来很惊奇,实际上很有意义。现在,讨论人员取得了突破,使他们能够将DNA存储整合到流行的开源(数据库)PostgreSQL中。 伦敦帝国理工学院 SCALE试验室负责人Heinis和Eu(recom)数据科学系助理教授Appuswamy 在创新数据系统讨论会议上发表了题为“ OligoArchive: Using DNA in the DBMS storage hierarchy ”的讨论论文。虽然他们不是第一个使用DNA存储和检索数据的人,但他们是第一个使用结构化数据、与现成的数据库集成、并超越存储、实现计算的人。 关于DNA作为数据存储层的第一件事是,每次执行写操作时,都必需(合成)寡核苷酸。这将如何在实践中发挥作用?试验室技术人员是否必需待命执行此操作,并“重新填充”用于化学过程的原材料? 并非如此,依据Appuswamy和Heinis的说法,这是微软通过其自动DNA存储和检索系统所证明的价值所在。这表明,在没有人参加的状况下操作这样一个过程是可能的。就像除了维护,没有人监督数据中心的日常运作一样,这同样适用于基于DNA的数据中心。 尽管如此,我们还远没有用合成DNA阵列取代硬盘。首先,以这种方式存储数据的现代技术特别缓慢。刚开头,科学家们花了一周时间来存储一兆字节的数据。Appuswamy和Heinis全都认为,在这方面还需要更多的工作。但这超出了他们自己的讨论范围,所以只能等待生化合成过程进一步提高。 OligoArchive通过将基于磁带的归档层替换为基于DNA的归档层来转变数据库存储层次结构。合成DNA的存储需要额外的措施,对于一般的设备来说,基于DNA的存储是否有效还值得怀疑。但无论如何,数据和数据库都将进入云端,只要你的数据平安地存储在数据中心,对终端用户来说,这都是一个黑匣子。 Appuswamy和Heinis还指出,即使它仍旧很慢,DNA存储供应了很大的并行处理潜力。由于它很丰富、价格低廉 - 或者更准确地说,我们盼望它最终会是这样。根据目前的速度,存储一分钟的高质量立体声将花费100,000美元。 尽管使用合成DNA进行大规模存储仍旧过于昂贵,但Appuswamy和Heinis表示,他们估计成本会下降,这是包括存储技术在内的每一项科技突破的典型方式。 假如合成寡核苷酸在经济上变得可行,那么拥有大量的合成寡核苷酸将是一个合理的预期。这意味着很多DNA存储单元可以并行运行的巨大潜力。虽然不是每种算法的每一个方面都是可并行的,但对于那些算法来说,可以实现极大的加速。这就把我们带到了一个关键点。 直到今日,DNA始终被用于存储非结构化文件,无论是文本还是视频,或者其他什么。Appuswamy和Heinis所做的是将DNA存储整合到关系数据库中。他们采纳了标准数据库基准(测试)TPC-H中包含的数据和查询,并在PostgreSQL实例上运行了TPC-H。不是串行访问,而是随便选择数据。使用后端的DNA在数据库系统中存储结构化数据,并通过SQL查询,这在今日已成为现实。 讨论人员为PostgreSQL构建了归档和恢复工具(pg_oligo_dump和pg_oligo_restore),对DNA上的关系数据执行模式感知编码和解码,并使用这些工具将12KB TPC-H数据库归档到DNA,执行in-vitro计算,以及再次恢复它。这是巨大的。这意味着现在DNA存储还可以支持SQL操作,来有选择地访问和处理部分数据。请留意,数据不会被提取到数据库来执行操作。Appuswamy和Heinis找到了一种方法来处理寡核苷酸中的SQL连接。这超出了生化储存的范围——它还需要生物化学计算。 Eurecom,CN(RS),ICL,UCA以及DNA合成初创企业Helixworks已获得欧盟资助,以进一步开展DNA储存讨论。该系统将被设计成支持数据编码的全自动循环,将其合成为DNA,并通过序列读取数据。它将存储各种不同的数据类型,并在存储和精确检索数据时实现近距离数据处理。
原创力文档

文档评论(0)