'n Deurbraakstudie neem 'n beduidende stap vorentoe in die strewe om 'n DNA-gebaseerde stoorstelsel vir digitale data.
Digital data groei vandag teen 'n eksponensiële tempo as gevolg van ons afhanklikheid van toestelle en dit vereis robuuste langtermynberging. Databerging raak stadigaan uitdagend omdat huidige digitale tegnologie nie 'n oplossing kan bied nie. 'n Voorbeeld is dat meer digitale data in die afgelope twee jaar geskep is as in die hele geskiedenis van rekenaars, trouens 2.5 kwintiljoen grepe {1 kwintiljoen grepe = 2,500,000 Teragrepe (TB) = 2,500,000,000 Gigagrepe (GB)} data word elke dag in die wêreld geskep. Dit sluit data op sosiale netwerk-webwerwe, aanlyn banktransaksies, rekords van maatskappye en organisasies, data van satelliete, toesig, navorsing, ontwikkeling ens in. Hierdie data is groot en ongestruktureerd. Daarom is dit nou 'n groot uitdaging om groot bergingsvereistes vir data en die eksponensiële groei daarvan aan te pak, veral vir organisasies en korporasies wat robuuste langtermynberging benodig.
Die opsies wat tans beskikbaar is, is hardeskyf, optiese skywe (CD's), geheuestokkies, flitsaandrywers en die meer gevorderde bandstasie of optiese BluRay-skywe wat ongeveer tot 10 Teragrepe (TB) data stoor. Sulke bergingstoestelle, hoewel dit algemeen gebruik word, het baie nadele. Eerstens het hulle 'n lae-tot-medium raklewe en hulle moet onder ideale temperatuur- en humiditeitstoestande gestoor word om baie dekades te kan hou en dus spesiaal ontwerpte fisiese stoorruimtes benodig. Byna al hierdie verbruik baie krag, is lywig en onprakties en kan in 'n eenvoudige val beskadig word. Sommige van hulle is baie duur, word dikwels geteister deur datafoute en is dus nie robuust genoeg nie. 'n Opsie wat universeel deur organisasies aanvaar is, word wolkrekenaarkunde genoem - 'n reëling waarin 'n maatskappy basies 'n "buite" bediener huur om al sy IT- en databergingsvereistes te hanteer, waarna verwys word as die "wolk". Een van die primêre nadele van wolkrekenaars is sekuriteits- en privaatheidskwessies en kwesbaarheid vir aanvalle deur kuberkrakers. Daar is ook ander kwessies soos hoë koste betrokke, beperkte beheer deur ouerorganisasie en platformafhanklikheid. Wolkrekenaars word steeds gesien as 'n goeie alternatief vir langtermynberging. Dit lyk egter of die digitale inligting wat wêreldwyd gegenereer word, beslis ons vermoë om dit te stoor verbysteek en selfs meer robuuste oplossings is nodig om in hierdie datavloed te voorsien terwyl dit skaalbaarheid bied om ook toekomstige bergingsbehoeftes in ag te neem.
Kan DNA help met rekenaarberging?
ons DNA (Deoksiribonukleïensuur) word beskou as 'n opwindende alternatiewe medium vir digitale databerging. DNA is die self-repliserende materiaal teenwoordig in byna alle lewende organismes en is wat ons genetiese inligting uitmaak. 'n Kunsmatige of sintetiese DNA is 'n duursame materiaal wat gemaak kan word met behulp van kommersieel beskikbare oligonukleotiedsintesemasjiene. Die primêre voordeel van DNA is sy lang lewe as 'n DNA hou 1000 keer langer as silikon (silicon-chip – die materiaal wat vir die bou gebruik word rekenaars). Verbasend genoeg, net 'n enkele kubieke millimeter van DNA kan 'n kwintiljoen grepe data hou! DNA is ook 'n ultrakompakte materiaal wat nooit afbreek nie en kan vir honderde eeue op 'n koel, droë plek gestoor word. Die idee om DNS vir berging te gebruik, bestaan al lank terug tot in 1994. Die hoofrede is die soortgelyke wyse waarop inligting in 'n rekenaar en in ons DNA – aangesien beide die bloudrukke van inligting stoor. 'n Rekenaar stoor alle data as 0'e en 1'e en DNS stoor alle data van 'n lewende organisme deur die vier basisse te gebruik – timien (T), guanien (G), adenien (A) en sitosien (C). Daarom kan DNS 'n standaardbergingstoestel genoem word, net soos 'n rekenaar, as hierdie basisse voorgestel kan word as 0'e (basisse A en C) en 1'e (basisse T en G). DNS is taai en blywend, die eenvoudigste weerspieëling is dat ons genetiese kode – die bloudruk van al ons inligting wat in DNS gestoor is – doeltreffend van een generasie na die volgende op 'n herhaalde wyse oorgedra word. Alle sagteware- en hardewarereuse is gretig om sintetiese DNA te gebruik om groot hoeveelhede te stoor om hul doelwit te bereik om langtermynargivering van data op te los. Die idee is om eers die rekenaarkode 0'e en 1'e in die DNS-kode om te skakel (A, C, T, G), die omgeskakelde DNS-kode word dan gebruik om sintetiese stringe DNS te produseer wat dan in koelberging geplaas kan word. Wanneer dit ook al nodig is, kan DNS-stringe uit koelberging verwyder word en hul inligting wat met DNS-volgordemasjien gedekodeer word en DNS-volgorde word uiteindelik terugvertaal na binêre rekenaarformaat van 1'e en 0'e om op die rekenaar gelees te word.
Dit is gewys1 dat net 'n paar gram DNA kwintiljoen grepe data kan stoor en dit vir tot 2000 jaar ongeskonde kan hou. Hierdie eenvoudige begrip het egter 'n paar uitdagings in die gesig gestaar. Eerstens is dit redelik duur en ook pynlik stadig om data na DNA te skryf, dws die werklike omskakeling van 0'e en 1'e na die DNS-basisse (A, T, C, G). Tweedens, sodra die data op die DNA “geskryf” is, is dit uitdagend om lêers te vind en te herwin en vereis 'n tegniek genaamd DNA volgordebepaling – proses om die presiese volgorde van basisse binne a DNA molekule - waarna die data teruggedekodeer word na 0'e en 1'e.
In 'n onlangse studie2 deur wetenskaplikes van Microsoft Research en die Universiteit van Washington het 'n "lukraak toegang" op DNS-berging verkry. Die "random access"-aspek is baie belangrik, want dit beteken dat inligting oorgedra kan word na of van plek (gewoonlik 'n geheue) waarin elke plek, ongeag waar in die volgorde en direk toegang verkry kan word. Deur hierdie tegniek van ewekansige toegang te gebruik, kan lêers op 'n selektiewe wyse van DNS-berging herwin word in vergelyking met vroeër, toe so 'n herwinning die behoefte vereis het om 'n hele DNS-datastel te volgorde en te dekodeer om die paar lêers wat 'n mens wou hê, te vind en te onttrek. Die belangrikheid van "toeganklike toegang" word verder verhoog wanneer die hoeveelheid data toeneem en groot word, aangesien dit die hoeveelheid volgordebepaling wat gedoen moet word, verminder. Dit is vir die eerste keer ooit dat die ewekansige toegang op so 'n groot skaal gewys is. Navorsers het ook 'n algoritme ontwikkel om data meer doeltreffend te dekodeer en te herstel met meer verdraagsaamheid teenoor datafoute wat die volgordebepalingsprosedure ook vinniger maak. Meer as 13 miljoen sintetiese DNA-oligonukleotiede is in hierdie studie gekodeer wat data van 200MB grootte was wat bestaan het uit 35 lêers (wat video, oudio, beelde en teks bevat) wat in grootte wissel van 29KB tot 44MB. Hierdie lêers is individueel herwin sonder enige foute. Skrywers het ook nuwe algoritmes ontwerp wat meer robuust en foutverdraagsaam is in die skryf en lees van die DNS-volgordes. Hierdie studie gepubliseer in Nature Biotechnology in 'n groot vooruitgang wat 'n lewensvatbare, grootskaalse stelsel vir DNS-berging en herwinning toon.
DNA-bergingstelsel lyk baie aantreklik omdat dit 'n hoë datadigtheid, hoë stabiliteit het en maklik is om te stoor, maar dit het natuurlik baie uitdagings voordat dit universeel aangeneem kan word. Min faktore is tyd- en arbeidsintensiewe dekodering van die DNA (die volgordebepaling) en ook sintese van DNA. Die tegniek vereis meer akkuraatheid en breër dekking. Selfs al is vordering gemaak op hierdie gebied die presiese formaat waarin data gestoor sal word in die lang termyn as DNA is steeds besig om te ontwikkel. Microsoft het belowe om die produksie van sintetiese DNA te verbeter en die uitdagings aan te spreek om 'n volledig operasionele ontwerp te ontwerp DNA bergingstelsel teen 2020.
***
{Jy kan die oorspronklike navorsingsartikel lees deur die DOI-skakel wat hieronder gegee word in die lys van aangehaalde bronne te klik}
Bronne)
1. Erlich Y en Zielinski D 2017. DNA Fountain maak 'n robuuste en doeltreffende bergingsargitektuur moontlik. Wetenskap. 355 (6328). https://doi.org/10.1126/science.aaj2038
2. Organick L et al. 2018. Ewekansige toegang in grootskaalse DNS-databerging. Natuur Biotegnologie. 36. https://doi.org/10.1038/nbt.4079