學(xué)號15020199046
轉(zhuǎn)載自
https://3g.163.com/tech/article/DLM13S1400097U81.html?clickfrom=channel2018_tech_index_newslist#child=index&offset=8
【嵌牛導(dǎo)讀】
據(jù)國外媒體Quartz報道故源,如今污抬,將數(shù)據(jù)信息存儲在DNA上的成本已經(jīng)足夠便宜,因此該技術(shù)有望實現(xiàn)商業(yè)化绳军。
【嵌牛鼻子】數(shù)據(jù)信息? DNA? 商業(yè)化
【嵌牛正文】
我們需要承認(rèn)這樣一個事實:我們已經(jīng)成為數(shù)碼囤積者印机,耗費大量的空間來存儲我們的數(shù)據(jù)。
2016年门驾,人類共計產(chǎn)生了16.1萬億GB的數(shù)字信息射赛;到2025年,這一數(shù)字預(yù)計將增加十倍以上奶是。我們的個人照片楣责、文本和電子郵件只是占很小的一部分竣灌;真正的數(shù)據(jù)洪流來自于科學(xué)家們在其研究活動中所創(chuàng)造的海量信息,比如進(jìn)行實驗和臨床試驗秆麸,深入研究生物的最小組成部分初嘹;觀察其他行星,盡可能深入地觀察浩瀚的宇宙沮趣。而我們目前放置數(shù)據(jù)的地方——外部硬盤和云服務(wù)器機房——大部分都稱不上完美的解決方案屯烦。它們占用大量的空間,而且每隔十年左右就需要升級一次房铭。
生物技術(shù)創(chuàng)業(yè)公司正在尋找從我們的身體內(nèi)部來解決這個問題驻龟。具體地說,就是利用我們的細(xì)胞缸匪。
大容量存儲的最新趨勢是在DNA中編碼數(shù)據(jù)翁狐。畢竟,基因材料已經(jīng)是一種編碼技術(shù)凌蔬。它編碼的生活:每個人體細(xì)胞包含30億個堿基對谴蔑。配對的核苷酸要么是腺嘌呤(A)與胸腺嘧啶(T),要么是鳥嘌呤(G)與胞嘧啶(C)龟梦。它們的序列隐锭,是所有執(zhí)行我們(和所有生物)存活所需的功能的蛋白質(zhì)的秘訣所在。
包括美國國防高級研究計劃局(DARPA)在內(nèi)的幾家機構(gòu)已經(jīng)開發(fā)了基于DNA的存儲系統(tǒng)计贰,這種系統(tǒng)能夠?qū)⒏鞣N信息編碼到微小而穩(wěn)定的分子鏈中钦睡,分子鏈能夠持續(xù)數(shù)千年。
只有一個問題:制造編碼信息的獨特DNA成本十分高昂躁倒。據(jù)《連線》雜志報道荞怒,印制目前錄制一分鐘立體聲音所需的150萬對堿基對,成本約為10萬美元秧秉。
總部位于波士頓的Catalog公司正試圖降低那些成本褐桌。該公司是由麻省理工學(xué)院的前研究人員創(chuàng)辦的。Catalog并不是用信息填充一長串DNA象迎,而是制作20到30個堿基對長的DNA片段荧嵌,這些片段可以用酶縫合在一起。這些片段的排列決定了它們的意義砾淌。本質(zhì)上啦撮,它就像一種語言:在英語中,只有26個字母汪厨,但通過各種組合赃春,理論上,我們可以創(chuàng)造出無數(shù)不同的單詞劫乱。Catalog估計织中,存儲1MB數(shù)據(jù)的成本將不到0.001美分锥涕。作為參照,在Spotify上狭吼,一分鐘最高質(zhì)量的立體聲音約為2.4MB站楚。
6月26日,Catalog宣布搏嗡,它已經(jīng)使用這一系統(tǒng)將道格拉斯·亞當(dāng)斯(Douglas Adams)的小說《銀河系漫游指南》(A Hitchhiker’s Guide to the Galaxy)和羅伯特·弗羅斯特(Robert Frost)的詩《未選擇的路》(the Road Not Taken)存儲到基因材料當(dāng)中窿春。該公司還表示,已經(jīng)獲得了來自不同風(fēng)險投資公司的900萬美元投資采盒。它計劃明年將其技術(shù)商業(yè)化旧乞。
任何對該技術(shù)感興趣的公司可以將其想要存儲的數(shù)據(jù)提交給Catalog,然后Catalog會將那些信息轉(zhuǎn)換成二進(jìn)制代碼磅氨,即由0和1組成的長鏈尺栖。接著,該公司的流程為每個核苷酸分配一對0和1烦租;例如延赌,“A”可以是00,“C”可以是01叉橱,“T”可以是11挫以,“G”可以是10。之后窃祝,通過使用這種DNA代碼掐松,數(shù)據(jù)被轉(zhuǎn)換到一小瓶的基因材料里。小瓶子可以安全地存放在任何溫度達(dá)到4攝氏度的冰箱里粪小,比如餐館使用的那種冰箱大磺。
當(dāng)信息以這種方式存儲時,你需要使用密鑰來將DNA解碼回二進(jìn)制代碼探膊,然后轉(zhuǎn)換回可讀的格式杠愧。Catalog的創(chuàng)始人之一Hyunjun Park表示,一旦公司開始對信息進(jìn)行編碼逞壁,他們就會將他們的密鑰公開流济,這樣客戶就可讓任何人都能夠?qū)λ麄兊男畔⑦M(jìn)行重新排序。然而猾担,企業(yè)可以請求獲得一個新的私有密鑰袭灯,這樣他們的信息就有了額外的加密層。
如果Catalog的技術(shù)真如它所說的那樣有效绑嘹,那么該公司將有望為使得基因數(shù)據(jù)存儲可為任何人所用和持續(xù)數(shù)百年鋪平道路。Hyunjun Park說橘茉,該公司正與檔案學(xué)家合作工腋,尋找在DNA編碼中加入清晰而持久的密鑰的最佳方式姨丈,以便未來我們的曾曾孫(或外星入侵者)能夠自己解碼Catalog DNA。