DNA数据存储商用平台HelixVault上线:单盘容量1PB,保存千年不衰
存储公司Helix Bio推出全球首个商用DNA数据存储平台,将数字信息编码为合成DNA序列,单盘容量达1PB,理论保存期限超过1000年,数据读写速度首次达到实用水平。
全球数据量正以每年25%的速度增长,但传统存储技术的容量提升速度远远跟不上。硬盘容量每年增长约15%,闪存约20%。照此趋势,到2035年全球将面临存储容量的硬性瓶颈。DNA数据存储被视为终极解决方案,但长期以来受限于读写速度和成本问题,无法走出实验室。
2028年7月1日,美国存储技术公司Helix Bio宣布其商用DNA数据存储平台HelixVault正式上线销售。该平台将数字信息编码为合成DNA的四种碱基序列(A、T、G、C),单个存储盘包含约50克合成DNA,容量达1PB(1000TB),理论保存期限超过1000年。
HelixVault的技术突破主要体现在三个方面。首先是写入速度:Helix Bio开发了名为「并行合成引擎」的技术,可以同时在数百万条DNA链上并行写入数据,将写入速度从此前实验室水平的每秒几KB提升到每秒200MB。其次是读取速度:采用纳米孔测序技术的改进版本,读取速度达到每秒500MB。最后是成本:每GB存储成本约0.02美元,虽然仍高于硬盘的0.01美元,但对于冷数据归档场景已具有竞争力。
Helix Bio CEO Dr. James Mitchell表示:「DNA存储的优势不仅在于容量,更在于持久性。硬盘5年就会退化,磁带10年,而DNA在适当条件下可以保存上千年。对于需要长期保存的数据——政府档案、医疗记录、文化遗产——DNA是唯一真正可靠的介质。」
首批客户包括美国国家档案馆、挪威斯瓦尔巴全球种子库数字化项目,以及中国的国家图书馆。国家图书馆信息技术部主任在接受采访时表示:「我们正在将馆藏的5000万册古籍数字化,这些数据需要保存几百年甚至更久。DNA存储是目前唯一能满足这一需求的技术。」
DNA存储的工作原理并不复杂:将二进制数据(0和1)映射为四种碱基(A、T、G、C),然后通过化学合成将碱基序列实际制造出来。读取时,通过测序仪将碱基序列还原为二进制数据。关键挑战在于纠错——DNA合成和测序过程中会引入随机错误,需要强大的纠错编码来保证数据完整性。Helix Bio采用了改良的Reed-Solomon纠错码,将错误率控制在10⁻¹⁵以下。
但DNA存储并非完美替代方案。最大的局限是随机访问速度:虽然顺序读取很快,但要从PB级DNA存储中定位并读取特定文件,仍需要数分钟到数小时。这使得DNA存储目前只适合冷数据归档,不适合需要频繁访问的热数据。
另一个挑战是基础设施。DNA存储需要合成仪和测序仪,这些设备价格昂贵且需要专业维护。Helix Bio提供托管服务,企业可以将数据发送到Helix Bio的数据中心进行编码和存储,也可以购买完整的本地部署方案——后者的起步价格为50万美元。
中国科学院计算技术研究所在7月3日发表声明,表示正在研发国产DNA存储平台,预计2029年推出原型机。项目负责人表示:「DNA存储是未来数据基础设施的关键拼图,中国必须掌握自主技术。」
免责声明
内容为AI生成,请勿作为事实或决策依据。转载、引用时请勿当作真实报道。