生活中处处充满了数据

在地球上


【资料图】

我们每天都会产生

5亿条推文

400万GB的聊天数据

2940亿封电子邮件

……

根据IDC的数据,在2020年,全球创建、捕获、复制和消耗的数据总量约为64ZB,而到了2025年,全球数据总量可能会达到惊人的163ZB,如果将其存储在艾字节数据中心里,整个数据中心可能有好几个足球场那么大,建造和维护成本高达数十亿美元。

那么,有没有一种更有效的方式来存储这些数据呢?

那么,有没有一种更有效的方式来存储这些数据呢?

当然是有的啦~许多科学家认为,另一种更加高效的解决方案就潜藏在我们的DNA当中:既然DNA能够承载遗传信息,那么它也能够储存数字信息。按照国际上广泛接受的说法,每一克DNA可存储215PB的数据。麻省理工学院生物工程教授马克·巴斯这样说到:

理论上,一个装满DNA的咖啡杯可以存储世界上所有的数据。DNA的存储密度甚至比闪存要大一千倍,而当你制造出DNA聚合物后,它就不会消耗任何能量,你可以编写DNA,然后将其永久保存。”

我们可以看到,相比于其他存储介质,将DNA作为存储介质拥有诸多优势:

01

存储密度极高

每个核苷酸,最多相当于两个比特,约为1立方纳米。理论上讲,1立方毫米的DNA便能够存储大约1EB的数据,真正做到把EB级的数据“握到手心里”。

02

存储时间长

在合适的存储条件下,这些DNA可以存储上万年,且几乎没有后期维护成本。

03

能耗极低

使用DNA作为存储介质无需额外的维护成本,由于其高密度的特性,存储数据不再像其他介质一样需要占用大量场地,能耗也远远小于传统介质。

DNA的存储原理并不复杂,数字存储系统将文本、照片等信息编码为0和1;同样的,遗传密码的四种核苷酸在DNA中编码为:A、T、C和G。我们可以用0来表示G和C,用1来表示A和T。简单来讲就是用遗传代码ATGC来替代计算机的二进制代码。

整个DNA存储流程大致可以分为四个步骤:信息编码、DNA合成、DNA测序和信息解码:

第一步:借助信息科学领域的编码算法,将数据转换为DNA中的四种碱基序列。

第二步:利用DNA合成技术例如固相亚磷酰胺三脂法、酶合成法进行DNA的合成,这一步骤相当于数据的写入。

第三步:依靠基因测序技术,在众多信息中读取你所需要的DNA序列信息。

第四步:将碱基序列重新转换成二进制序列,在经过纠错后便可得到原始数据。

当然,将DNA作为存储介质并不是一个新颖的话题,使用DNA存储数据的想法可以追溯到1959年,但以当时的技术条件,该项研究并未取得突破性进展。近年来,随着算力上限的不断突破、各科学领域不断交叉融合,才让几十年前近乎疯狂的想法逐渐变为可能。

当然,人类在探索的路途中不止DNA存储一种,下一代颠覆性存储技术还有无惧湿热、干冷的玻璃存储以及可行性更高的全息光存储。我们可以发现,无论是哪一种存储技术,都在追求更小的体积和更大的容量,这也是存储的本质:通过提高读写效率以满足数据管理和数据应用的需求。

尽管大规模使用下一代存储介质还不能完全实现,但我们一直在朝着这一方向努力着,例如数据缩减技术:在存储介质上保留一个唯一实例,将冗余数据替换为指向唯一数据副本的一个指针,从而做到在更少的空间储存更多的数据,节约存储成本并延长SSD的使用时间。越高的数据缩减比就意味着更多的有效空间,而这一比例也是衡量一款存储产品先进与否的重要标准。

而在这方面,戴尔科技“第五代存储”家族的PowerStore绝对可以称作该领域的佼佼者,在不妥协性能的前提下至少实现4:1的无损数据缩减,即每4TB数据写入存储盘里最终只占用1TB的空间。

戴尔PowerStore采用英特尔®至强®可扩展处理器,该处理器可以优化工作负载,可靠性强,还有高计算力、高稳定性和高效敏捷性,帮助企业为数字化变革做好准备。

除了4:1的数据缩减比以外,PowerStore还采用了专用的压缩处理器,不会额外占用控制器的CPU资源,这就意味着用户不必担心开启缩减功能后,存储性能急剧下降,让您的数据缩减功能“始终可用”。

当然,数据缩减功能不仅仅是PowerStore独有,今年新发布的PowerMax 2500除了拥有开放系统4:1数据缩减以外,在大型机存储领域也能提供3:1的数据缩减保证,填补了业内该领域的空白。

30年前,人们很难想象GB级别的数据能够存放在一块十几克的塑料盒子里,而现在,包含闪存颗粒的U盘已经成为人们日常工作生活中的常客。戴尔科技作为全球数字化转型领导者,也将通过不断革新的技术帮助企业提炼宝贵的数据,挖掘数据的价值!

如果您想了解更多有关戴尔科技的产品和解决方案信息,请扫描以下二维码咨询戴尔官方客服。

推荐内容