科学家证明他们可以在一克DNA当中存储215PB数据
2023-09-11 14:20:34 时间
哥伦比亚大学的研究人员已经设法推动DNA数据存储的极限,并使令人兴奋的生物技术更接近成为现实。通过利用新技术,他们能够在DNA链中存储电影,操作系统和其他数据,并且无错误地检索这些数据。
在这个固态驱动器和MicroSD存储盛行的世界,磁带仍然是一些最常用和最重要的存储介质。这是因为存储大量数据,具有可靠性且不会使用大量的资源,仍然是计算机工程师的一个难题。然而,答案可能来自生活世界,即DNA存储。
多年来,科学家已经推理并且证明DNA可以用作数据存储介质,并且它具有一些显着的性质,使其成为理想的存储介质。现在,科学家已经设法在DNA当中存储比以往任何时候更多的数据,并且已经证明它可以被复制和检索几乎无限多次,具有零错误。
通过使用流式传输和在线压缩视频的数据技术,研究人员能够将1.6位数据包装到每个核苷酸中,接近理论极限的1.8。这听起来不是很多,但科学家证明他们可以有效地在一克DNA当中存储215PB数据。
该技术还具有其他优点,如高可靠性,以及DNA将永远不会过时的事实,像其他技术一样,DNA也可以储存数千年,之后仍然可以读取数据,但仍然有成本问题。使用这种技术存储和检索仅仅几兆字节的数据仍需要数千美元,因此我们不太可能在任何设备上看到DNA存储。然而,像谷歌和微软那样必须处理不可想象数据量的公司可能会发现DNA存储在经济上是可行的。
本文转自d1net(转载)
DNA 预测进入新时代!DeepMind 发布新模型Enformer,一次可编码20万个碱基对 DNA 存在大量的片段,破译信息是一个费时费力的工作,能否用AI 的力量来解决这个问题?DeepMind最近发布了一个新模型Enformer,能够一次编码超过20万个碱基对来进行预测,超过以往方法的5倍,准确率大大提升。
机器之心论文解读:可用于十亿级实时检索的循环二分嵌入模型(RBE) 今年 2 月,来自微软 Bing 的研究人员在今年的 KDD 会议上发表了论文《Recurrent Binary Embedding for GPU-Enabled Exhaustive Retrieval from Billion-Scale Semantic Vectors》。该论文提出了能够生成紧凑语义表征的「循环二分嵌入」(RBE),这些表征可存储在 GPU 上,RBE 使得十亿级的检索能够实时进行。机器之心对这篇论文进行了解读。
DNA存储,拯救人类数据危机的良方? 开一个脑洞:如果地球正在面临一场马上到来的毁灭性星际灾害,人类又想尽可能地保存地球的生命和文明,在现有条件下,该怎么办?
《中国人工智能学会通讯》——12.47 分类型数据聚类有效性 本节书摘来自CCAI《中国人工智能学会通讯》一书中的第12章,第12.47节, 更多章节内容可以访问云栖社区“CCAI”公众号查看。
相关文章
- 分布式系统中数据存储方案实践
- Android中数据的存储操作
- OpenCV的标量容器Scalar尽量别去做运算,用来存储标量数据即可
- 浅谈Kubernetes的持久化存储方案
- 存储创新陷入停滞?NO,这些技术正焕发着勃勃生机!
- C#,数值计算(Numerical Recipes in C#),大型稀疏线性系统(Sparse Linear Systems)的数据存储结构与源代码
- Ceph分布式存储实战3.2 CRUSH基本原理
- 科学家用钻石存储数据,未来婚纱照将可被存储在钻戒中
- 理解 Ceph:一个开源的分布式存储平台
- Oracle存储过程中异步调用的实际操作步骤
- 《大数据存储:MongoDB实战指南》一1.7 安装MongoDB
- IOS中NSUserDefaults的用法(轻量级本地数据存储)
- 无向图的 DFS 和 BFS实现 (以邻接表存储的图)
- 存储极客 | 瓜哥图解存储协议
- MySQL Merge存储引擎
- 有利于企业的闪存数据存储的新用例
- [Python]Python+redis数据存储与使用