Skip to content
Hem » Data lagring i syntetiskt DNA

Data lagring i syntetiskt DNA

Detta är artikel 7 i artikelserien om grön IT.

I en TED-talk på YouTube(1) förklarar forskaren Dina Zielinski om lagring av data i syntetiskt DNA. Trots den avancerade forskningen är kostnaderna för denna lagringsteknik fortfarande ett hinder. Ändå förväntas denna teknologi bli kommersiellt tillgänglig inom fem till tio år.

Så fungerar det

DNA finns i våra celler som en slags ritning för vår kropp. Det liknar lite en mycket lång kedja gjord av fyra byggstenar: adenin (kallas A), cytosin (C), guanin (G) och tymidin (T). Dessa byggstenar är sammanlänkade av något vi kallar vätebindningar.

Ett databestånd innehåller bara nollor och ettor, som 00, 01, 10 och 11. Dessa mönster kan vi omvandla till de fyra byggstenarna i DNA. Det är som en slags hemlig skrift, där 00 översätts till A, 01 till C, 10 till G och 11 till T. Detta “kodade meddelande” skickas sedan till ett laboratorium där det lagras i syntetiskt DNA.

Resultatet får du i form av ett rör på cirka tre centimeter. När du vill läsa av de lagrade data skickar du tillbaka röret till laboratoriet. Där omvandlas A:na, C:na, G:na och T:na tillbaka till binär kod – de ursprungliga filernas bitar och bytes.(2,3)

Många fördelar

Lagring av data i syntetiskt DNA erbjuder många fördelar: du kan behålla data i minst 10 000 år utan att förlora den. Genom att lagra all data som inte behöver vara direkt tillgängliga för användare i syntetiskt DNA kan vi betydligt minska mängden energi som krävs för molnlagring. En ytterligare fördel är att datan inte kan skrivas över.(4)

Dessutom har DNA en otroligt hög datatäthet. Till exempel ryms informationen från 100 miljoner HD-filmer i något så litet som ett suddgummi ovanpå en blyertspenna. Det motsvarar cirka 400 000 TB, vilket är jämförbart med kapaciteten hos en genomsnittlig hårddisk på 1 TB. Det beräknas till och med att all data på internet kan lagras i något så litet som en skokartong.(5)

En annan viktig fördel med lagring i syntetiskt DNA är att så länge det finns människor kommer det alltid att finnas möjligheter att dekryptera lagrade data. Våra kroppar innehåller nämligen själva koden för att göra denna översättning.

Men även nackdelar

Trots de många fördelarna med denna teknologi finns det också några nackdelar, åtminstone för närvarande. Tänk till exempel på de höga kostnaderna: 1000 dollar per TB. Dessutom tar det relativt lång tid att dekryptera datan. Processen kräver att datan skickas tillbaka till laboratoriet för en kemisk behandling, vilket innebär att datan inte är direkt tillgänglig. Dessutom finns det en betydande risk för kvalitetsförlust vid upprepad avkodning av data.

När vi tittar på miljöpåverkan av DNA-lagring märker vi att när datan väl är lagrad krävs ingen extra energi (kall lagring). DNA fungerar dock bäst vid lägre temperaturer och i en mörk miljö. Det gör det något känsligare för omgivningspåverkan än till exempel glas, vilket vi senare kommer att diskutera.

En nackdel är också att kodning och avkodning sker via biokemiska processer (jämförbart med PCR-testet som vi känner till från coronatiden), där kritiska råvaror används. En av dem är fosfor, som till och med är mer sällsynt än kisel.(6)

Stabilare datakvalitet

I maj 2023 publicerades en artikel i den nederländska tidskriften ’De Ingenieur’ där det beskrivs hur ett internationellt forskarteam, inklusive de från TU Eindhoven, Radboud Universitet och Microsoft, har utvecklat en mikroplast. Dessa bollar har strängar av nukleotider som tillsammans bildar en fil(7). Det gör det möjligt att snabbare hitta specifik information.

Tidigare var vi tvungna att dekryptera hela den “hemliga skriften”, där det var avgörande att data var korrekt metataggad för att hitta tillbaka den – jämförbart med att söka i en enorm hög med A4-ark. Tack vare mikrobollarna är det nu möjligt att söka mer riktat, och du kan bläddra igenom böcker snarare än att gräva igenom en enorm pappershög.

Dessutom resulterar denna nya metod i en stabilare kvalitet på lagrad data. Tidigare förlorades ungefär 35 procent av kvaliteten efter tre avkodningar, men med denna förbättrade metod är det bara 0,3 procent.

Närmare än vi tror

Forskare förväntar sig att det första DNA-datacentret kommer att öppna sina dörrar inom fem till tio år. Detta datacenter kommer att ha en särskild sektion där nya filer krypteras via DNA-syntes. Samtidigt kommer det att finnas stora fält med bollar som innehåller filer på en annan del av byggnaden. En robotarm väljer en boll, läser av innehållet och placerar sedan tillbaka den på sin plats.

På YouTube finns en video där ett team av forskare från University of Washington, i samarbete med Microsoft, demonstrerar det första helt automatiserade systemet för lagring och hämtning av data i syntetiskt DNA(8). Videon spelades in i mars 2019. Med tanke på hastigheten på dessa utvecklingar verkar prognosen om fem till tio år definitivt realistisk.

Källor

  1. Zielinski, Dina, ‘How can we store digital data in DNA’, TED Talk tillgänglig på YouTube, senast sedd den 1 november 2023.
  2. Seeker, ‘We Could Back Up The Entire Internet On A Gram of DNA’, YouTube-video, senast sedd den 1 november 2023.
  3. Ted-Ed, ‘Is DNA the future of data storage’, Ted-Ed tillgänglig på YouTube, senast sedd den 1 november 2023.
  4. Heijst, Ad van, ‘Monitoring van opslagtechnieken 5: Informatieopslag in de vorm van DNA’, publicerad den 3 februari 2023.
  5. Reactions, ‘Is DNA The Future of Data Storage?, Youtube-video, senast sedd den 1 november 2023.
  6. De Ingenieur, ‘Aminozuren als alternatief voor de cloud’,publicerad den 1 maj 2019.
  7. De Ingenieur, ‘Data-opslag in DNA weer stap dichterbij’, publicerad den 5 maj 2023.
  8. Microsoft Research, ‘Microsoft and UW demonstrate first fully automated DNA Data Storage’, YouTube-video, senast sedd den 1 november 2023.
Bild: Freepik

Om artikelserien

Denna artikelserie är författad av Tineke van Heijst från nederländska Van Heijst Information Consulting (VHIC) på uppdrag av den nederländska gruppen Network Digital Heritage (NDE). NDE har till uppgift att övervaka utvecklingen av grön IT (ibland kallad hållbar IT eller Green IT) och dess påverkan på klimatet i den framstegsvänliga digitaliseringen. Särskild uppmärksamhet ägnas åt den växande digitaliseringen inom kultursektorn.

Arkeion har fått godkännande från VHIC att översätta och publicera artikelserien på sin webbplats. Översättningen gjordes av Caspar Almalander.

Syftet med denna serie är att bistå kulturarvsinstitutioner att få en djupare förståelse för grön IT (Green IT), vilket möjliggör diskussioner kring detta viktiga ämne inom deras egna organisationer.

Tidigare artiklar