Skip to content
Hem » Det digitala databerget

Det digitala databerget

Detta är artikel 3 i en artikelserie om grön IT.

Har du någonsin tänkt på den enorma mängden data som genereras globalt varje minut? Sedan 2013 ger ’Data Never Sleeps Infographic’(1) inblick i detta. År 2022 skickade vi till exempel 231,4 miljoner e-postmeddelanden varje minut, delade 66 000 foton på Instagram och laddade upp 500 timmar videoklipp på YouTube. Imponerande siffror, särskilt när man tänker på att all denna data hamnar på olika platser – och sällan raderas.

Bytes och ännu mer bytes

International Data Corporation förutspår att den globala databergen kommer att växa till 166 Zettabytes år 2025 och till och med till 221 Zettabytes år 2026(2). Siffror som kanske inte ger omedelbar känsla. För att ge dig en bättre bild har MyNASA Data(3) placerat dataenheter i ett tilltalande perspektiv:

Enhet

Värde

Exempel

Kilobytes (kB)

1.000 bytes

Ett stycke text i ett dokument

Megabytes (MB)

1.000 Kilobytes

En liten roman

Gigabytes (GB)

1.000 Megabytes

Beethovens 5:e symfoni

Terabytes (TB)

1.000 Gigabytes

Alla röntgenbilder på ett stort sjukhus

Petabytes (PB)

1.000 Terabytes

Hälften av samlingen på alla akademiska forskningsbibliotek i USA

Exabytes (EB)

1.000 Petabytes

Ungefär en femtedel av alla ord som någonsin uttalats av människor

Zettabytes (ZB)

1.000 Exabytes

Samma mängd information som det finns sandkorn på alla stränder i världen

Yottabytes (YB)

1.000 Zettabytes

Samma mängd information som det finns atomer i 7 000 mänskliga kroppar

Exemplen i den tredje kolumnen i tabellen ger en uppfattning om hur omfattande databerget är. År 2026 förväntas den totala datamängden vara hela 200 gånger större än antalet sandkorn på alla världens stränder. Se också YouTube-videon från Techtarget, med titeln: ’What are Kilo, Mega, Giga, Tera, Peta, Exa, Zetta and All That?’, som förklarar på ett enkelt sätt hur datavolym mäts(4).

Är all denna data nödvändig? Lär känna dark data

När vi fokuserar på global datalagring visar det sig att 60-70 procent av datan som genereras inom en organisation kan klassificeras som dark data(5). Denna data inkluderar information som organisationer samlar in, bearbetar och lagrar under sin dagliga verksamhet, men som sedan inte används för andra ändamål(6). Ett exempel på detta är till exempel ett separat dokument med anteckningar som omvandlas till en rapport. Även om denna information inte längre aktivt används, lagras den och ingår i säkerhetskopior, vilket – när den är i molnet – leder till kontinuerlig energiförbrukning.

Denna aspekt framkom även i undersökningen ’Veritas: The UK 2020 Databerg Report Revisited(7). I denna undersökning analyserade Veritas och Vanson Bourne det växande databerget åren 2015 och 2020 och jämförde det med den metaforiska isbergets spets. Större delen finns under ytan, utanför vår syn. Kort sagt är den verkliga omfattningen av databergen många gånger större än vad vi vanligtvis uppfattar.

Forskarna bakom Databerg-rapporten ser, som tidigare nämnts, datan ’under vattenytan’ som dark data. Detta är data där det är oklart vad den används till. Forskarna använder också kategorin ROT-data, vilket står för Redundant, Obsolete eller Trivial data. Med andra ord: data som inte längre är relevant, har liten eller inget värde för organisationen eller som är lagrad på flera platser. Ett annat exempel på detta är exempelvis protokoll som skickas runt och sparas av varje mottagare.

Större delen av lagrade data är överflödig

När man lägger samman båda kategorierna visar det sig att år 2015 kunde 88 procent och år 2020 81 procent av all data klassificeras som dark eller ROT-data. Vi ser också att år 2015 var 12 procent och år 2020 19 procent av data av affärskritisk betydelse, det vill säga data som man vill (och ofta måste) spara. Här ser vi alltså en liten förskjutning. Detta beror på att fler organisationer har antagit en strategi för att märka sin data och hitta ROT-data. Författarna till Veritas-rapporten noterar dock att denna strategi har begränsad effekt eftersom organisationer ofta saknar resurser för att verkligen hantera detta komplexa problem.

Figur från Veritas rapporten, sida 7.

Konsekvenserna av dark data

När endast 19 procent av datan kan klassificeras som användbar affärskritisk data och 81 procent som dark och ROT-data slösar en organisation onödigt mycket pengar på lagrings- och underhållskostnader. Enligt nederländska Joost Rutgers i hans LinkedIn-inlägg ’Hoe ROT zijn de gegevens in uw organisatie??’(8) leder detta inte bara till produktivitetsförlust utan också till problem med efterlevnad och säkerhet. Detta beror på att en organisation inte vet vilken data de äger och var den finns i organisationen. Problemet med energiförbrukningen och det därmed sammanhängande (onödiga) CO2-utsläppet för att hålla all denna data tillgänglig nämns här ännu inte. Det är alltså av flera skäl viktigt att organisationer regelbundet granskar sina informationsfiler och uppmuntrar medarbetare att städa upp sin digitala arbetsmiljö.

Var med på Digital Clean Up Day

Den okontrollerade tillväxten av information fick den franska IT-specialist Kevin Guerin att organisera den första upplagan av Digital Clean Up Day 2020. Syftet med denna dag, inspirerad av World Clean Up Day(9), är att skapa medvetenhet globalt om den ekologiska påverkan av den digitala industrin. Initiativet uppmuntrar människor att agera genom att rensa upp sina digitala data. Huvudsyftet är att ge oanvänd utrustning som bara ligger och skräpar ett nytt liv.

Vad som började som ett lokalt initiativ i Frankrike spred sig snabbt till Italien och Schweiz. Under Digital Clean Up Day 2022 deltog människor från 124 olika länder och totalt raderades 530 884 GB data – en besparing av 133 ton CO2-utsläpp per år.

Kom igång – det är mycket enkelt

Hur mycket dark data finns det i din organisation? Och på din privata dator? Hur mycket utrymme och CO2-utsläpp kan du spara genom att ta bort onödiga data? Praktiska steg-för-steg-planer hittar du på Digital Clean Up Days webbplats(10).

Nästa artikel

I nästa artikel tittar vi på lagring av data i molnet, den vanligaste lagringsmetoden, och vi granskar datacentras påverkan på det föränderliga klimatet.

Tidigare publicerad i denna artikelserie

Tema: Introduktion grön IT

  1. IT:s dubbla roll inom hållbarhet
  2. Behovet av en hållbarhetsram

Källor

  1. ’Data Never Sleeps’ infografikerna finns på https://www.domo.com/data-never-sleeps (senast besökt 5 oktober 2023).
  2. IDC, ‘High Data Growth and Modern Applications Drive New Storage Requirements in Digitally Transformed Enterprises: a whitepaper sponsored by Dell Technologies and NVIDIA’, publicerad juli 2022.
  3. Tabell från MyNasaData: https://mynasadata.larc.nasa.gov/sites/default/files/inline-images/datavolume_0.png
  4. YouTube-videon från TechTarget ‘What are Kilo, Mega, Giga, Tera, Peta, Exa, Zetta and All That?’, publicerad i 2020.
  5. Zippia ’26 Stunning Big Data Statistics (2023): Market Size, Trends and Facts’ publicerad 16 januari 2023.
  6. Gartner, ‘IT Gartner Glossary: dark data’ (senast besökt 5 oktober 2023).
  7. Veritas: The UK 2020 Databerg Report Revisited, publicerad i 2020.
  8. Rutgers, Joost, ‘Hoe ROT zijn de gegevens in uw organisatie??’, Linkedin Post från 28 april 2022.
  9. World Clean Up Day är en dag då miljontals frivilliga världen över går ut på gatorna för att samla skräp. För mer information, besök https://www.worldcleanupday.org/
  10. Instruktioner och verktyg för att komma igång med digital städning finns på webbplatsen för Digital Clean Up Day: https://www.digitalcleanupday.org/home/resources-and-materials/

Om artikelserien

Denna artikelserie är författad av Tineke van Heijst från nederländska Van Heijst Information Consulting (VHIC) på uppdrag av den nederländska gruppen Network Digital Heritage (NDE). NDE har till uppgift att övervaka utvecklingen av grön IT (ibland kallad hållbar IT eller Green IT) och dess påverkan på klimatet i den framstegsvänliga digitaliseringen. Särskild uppmärksamhet ägnas åt den växande digitaliseringen inom kultursektorn.

Arkeion har fått godkännande från VHIC att översätta och publicera artikelserien på sin webbplats. Översättningen utfördes av Caspar Almalander.

Syftet med denna serie är att bistå kulturarvsinstitutioner att få en djupare förståelse för grön IT (Green IT), vilket möjliggör diskussioner kring detta viktiga ämne inom deras egna organisationer.

Tidigare artiklar