Arhiva Internetului, mai relevantă ca oricând

 
Arhiva Internetului, mai relevantă ca oricând

În câteva cuvinte

Arhiva Internetului joacă un rol crucial în conservarea istoriei digitale, mai ales în contextul ștergerii datelor de pe site-urile guvernamentale americane. Organizația se confruntă cu provocări, inclusiv procese costisitoare și atacuri cibernetice, dar rămâne dedicată misiunii sale de a oferi acces la informații și de a combate "putrezirea link-urilor". Creșterea numărului de utilizatori reflectă importanța crescândă a Arhivei ca sursă de informații alternative și ca instrument de protejare a patrimoniului digital.


Național

Arhiva Internetului, adăpostită într-o fostă biserică, zumzăie și devine mai relevantă ca oricând

23 Martie, 2025, 6:00 AM ET

Emma Bowman

Sediul Arhivei Internetului este găzduit într-o fostă biserică a Științei Creștine din San Francisco. La șase săptămâni de la instalarea noii administrații, Arhiva Internetului a declarat că a catalogat aproximativ 73.000 de pagini web care existau pe site-urile guvernului SUA înainte de inaugurarea lui Trump și care au fost eliminate de atunci.

Carolyn Fong pentru NPR

SAN FRANCISCO — Dacă ați dat vreodată clic pe un hyperlink care v-a dus la ceva numit Wayback Machine pentru a vizualiza o pagină web veche, ați făcut cunoștință cu Arhiva Internetului.

Organizația nonprofit, fondată în 1996, este o bibliotecă digitală de site-uri internet și artefacte culturale. Aceasta include sute de miliarde de copii ale site-urilor web guvernamentale, articole de știri și date. Wayback Machine este punctul de acces al arhivei la aproape trei decenii de istorie web. Dar mulți dintre cei aproximativ un milion de vizitatori zilnici care accesează adresa online a Arhivei Internetului s-ar putea să nu știe nimic despre cea fizică: o fostă biserică a Științei Creștine din zona Golfului San Francisco.

Sediul Arhivei Internetului, un templu impresionant cu coloane albe, în stil renascentist grecesc, se ridică chiar la sud de podul Golden Gate.

Lângă intrarea în naosul clădirii, un triptic de servere negre, înalte, zumzăie zgomotos.

„Aceasta este Arhiva Internetului”, a spus Mark Graham, directorul Wayback Machine al Arhivei Internetului, arătând spre stivele de servere. Graham conducea aproximativ o duzină de vizitatori într-un tur public săptămânal al sediului, într-o vineri recentă din martie. Și-a proiectat vocea pentru a fi auzit peste zgomotul computerelor. „Acele mașini sunt servere care sunt folosite chiar acum pentru a înregistra și a salva materiale. Luminile clipesc — asta înseamnă că ceva este scris sau citit de pe acele hard disk-uri.”

Mark Graham stă în fața serverelor de la Arhiva Internetului.

Carolyn Fong pentru NPR

Serverele înregistrează live World Wide Web. Rezultatele sunt uimitoare. În fiecare zi, aproximativ 100 de terabytes de material sunt încărcați în Arhiva Internetului, sau aproximativ un miliard de URL-uri, cu ajutorul unor crawlere automate. Cea mai mare parte a acestora ajunge în Wayback Machine, în timp ce restul este reprezentat de medii analogice digitizate — cărți, televiziune, radio, lucrări academice — scanate și stocate pe servere.

Fiind unul dintre puținii arhivatori la scară largă care fac backup pentru web, Arhiva Internetului se află într-o poziție deosebit de unică în acest moment. După inaugurarea președintelui Trump în ianuarie, unele pagini web federale au dispărut. În timp ce unele pagini au fost eliminate în întregime, multe au revenit online cu modificări despre care oficialii noii administrații au spus că au fost făcute pentru a se conforma ordinelor executive ale lui Trump de a elimina „politicile de diversitate, echitate, incluziune și accesibilitate”. Mii de seturi de date au fost șterse — majoritatea la agențiile axate pe știință și mediu — în zilele care au urmat revenirii lui Trump la Casa Albă.

Informațiile despre schimbările climatice, sănătatea reproducerii, identitatea de gen și orientarea sexuală au fost, de asemenea, pe lista celor eliminate. De exemplu, paginile care fac referire la Enola Gay — aeronava B-29 care a lansat o bombă atomică asupra Hiroshimei și care nu are o legătură specială cu istoria LGBTQ — s-au numărat printre o listă scursă de postări pe care Pentagonul le-a semnalat pentru eliminare. Unele pagini șterse, inclusiv cele legate de Enola Gay, au reapărut pe măsură ce agențiile își dau seama cum să respecte directivele lui Trump.

Arhiva Internetului se numără printre puținele eforturi care există pentru a prinde lucrurile care cad prin fisurile digitale, făcând în același timp acele informații accesibile publicului. La șase săptămâni de la instalarea noii administrații, directorul Wayback Machine, Graham, a declarat că Arhiva Internetului a catalogat aproximativ 73.000 de pagini web care existaseră pe site-urile web ale guvernului SUA și care au fost eliminate după inaugurarea lui Trump. Graham a menționat că, de exemplu, Arhiva Internetului este în prezent singurul loc în care publicul poate găsi o copie a unei cronologii interactive care detaliază evenimentele din 6 ianuarie. Cronologia este un produs al comisiei congresului care a investigat atacul de la Capitoliu și, de atunci, a fost eliminată de pe site-ul lor web. Graham a spus că este în interesul publicului să salveze astfel de înregistrări.

„Câți bani din taxele noastre au plătit pentru a o face?”, a spus el, referindu-se la cronologie și la lucrările comisiei. „A fost un exercițiu non-trivial și face parte din istoria noastră — și numai din acest motiv, merită păstrat și merită explorat, înțeles.” Este tipic pentru noile administrații prezidențiale să facă modificări site-urilor web federale. În 2008, Arhiva Internetului a co-creat un instrument numit Arhiva Web de sfârșit de mandat (End of Term Web Archive) pentru a urmări și a face backup pentru astfel de modificări. Dar Graham a spus că, sub al doilea mandat al lui Trump, amploarea și ritmul ștergerilor de date guvernamentale au fost fără precedent.

„Mulți oameni încearcă să spună: „Ce naiba s-a întâmplat?”, a spus Graham. „Noi doar ne facem treaba, încercând să fim cea mai bună bibliotecă pe care o putem fi, încercând să ajutăm la conservarea moștenirii culturale a timpului nostru — pentru a face acest material accesibil, util oamenilor acum și în viitor.”

De la a doua inaugurare a lui Trump, mai mulți oameni apelează la organizația non-profit

Potrivit lui Graham, pe baza saltului mare în vizualizările de pagini pe care le-a observat în ultimele două luni, Arhiva Internetului atrage mult mai mulți vizitatori decât de obicei la serviciile sale — jurnaliști, cercetători și alte minți curioase. Unii doresc să consulte arhiva pentru informații pierdute sau modificate în timpul epurării, în timp ce alții își propun să contribuie la procesul de arhivare. „Există un val de sprijin pentru Arhiva Internetului din cauza schimbării dramatice care se întâmplă în părți ale infrastructurii web guvernamentale despre care nu v-ați imagina că s-ar schimba”, a declarat Brewster Kahle, fondatorul și actualul director al Arhivei Internetului. „Oamenii vin și se adună în spatele nostru — folosindu-l, indicând lucruri, ajutând la organizarea lucrurilor, trimițând conținut pentru a fi arhivat — seturi de date care sunt amenințate sau care au fost eliminate.”

Fondatorul Arhivei Internetului, Brewster Kahle, vorbește pe scenă în timpul Unfinished Live la The Shed din New York City în 2022.

Roy Rochlin/Getty Images pentru Unfinished Live

Nancy Krieger, epidemiolog social la Universitatea Harvard, care a asemănat epurarea cu „o ardere digitală de cărți” într-un interviu din februarie cu Ailsa Chang de la NPR, este unul dintre ei. Ea a făcut echipă cu alți oameni de știință pentru a încerca să păstreze datele federale despre sănătate care au dispărut recent de pe site-urile web guvernamentale. Ea a ajutat la elaborarea unei liste de termeni de trimis Arhivei Internetului pentru a ajuta la efortul de căutare și conservare.

„Vrem să păstrăm datele de sănătate publică care sunt cruciale pentru bunăstarea oamenilor”, a declarat ea pentru NPR. De exemplu, a remarcat ea, există o pagină web pe site-ul Centrelor pentru Controlul și Prevenirea Bolilor (CDC) intitulată „Oprirea violenței bazate pe gen”. Aceasta evidențiază cercetările CDC care arată că adolescentele și tinerele femei poartă o povară disproporționată a cazurilor de HIV la nivel mondial, o problemă determinată de violența bazată pe gen și de accesul deficitar la serviciile de sănătate. Pagina, care era accesibilă pe 16 ianuarie, înainte de inaugurarea lui Trump, afișează acum „pagina nu a fost găsită”.

Echipa lui Graham a lucrat pentru a anticipa viitoarele epurări, încercând să identifice și să captureze materialul care ar putea fi expus unui risc mai mare de eliminare, a spus el.

„Cu siguranță, această administrație, în unele privințe, ne-a ușurat munca”, a spus el. „Chiar din prima zi, au început să împărtășească termeni, cuvinte, domenii de subiecte care urmau să fie examinate — termeni precum „DEI” (Diversitate, Echitate, Incluziune).” Arhiva Internetului nu prinde totul. Un raport despre riscurile gripei aviare pentru oameni și animale de companie a apărut și a dispărut pentru scurt timp pe site-ul web al Centrelor pentru Controlul și Prevenirii Bolilor. Graham a spus că se pare că Wayback Machine nu a putut să-l înregistreze la timp.

„Îmi amintesc, am intrat imediat și mi-am ținut respirația, gen: „O, avem asta?” Și nu am avut-o”, a spus el. Există șansa ca acesta să apară mai târziu, posibil prin fluxul de materiale provenite de la colaboratori și parteneri externi. Cea mai mare parte a ceea ce Arhiva Internetului absoarbe în Wayback Machine devine disponibilă publicului cu o întârziere minimă. În unele cazuri, deoarece organizația lucrează cu diferiți parteneri în procesul de arhivare, există o întârziere între momentul în care materialul este colectat de acei parteneri și momentul în care este pus la dispoziție prin Wayback Machine. „Încă îmi țin degetele încrucișate pentru asta”, a spus Graham. Când screperele Arhivei Internetului nu reușesc să captureze astfel de date, el a spus că „este o oportunitate pentru noi să învățăm cum să ne facem treaba mai bine”. Pe măsură ce organizația lucrează pentru a se adapta, Graham a spus că munca îl face să lucreze peste program. „La nivel personal, acesta a fost un pic un sprint”, a spus el. „Am lucrat șapte zile pe săptămână în ultimele multe săptămâni. M-am trezit, literalmente de la inaugurare, trezindu-mă mai devreme cu un sentiment de scop și energie.”

Menținerea publicului în prim-plan

În ciuda rolului său de pionierat în domeniul digital, echipa Arhivei Internetului dorește să mențină oamenii, nu doar mașinile, în centrul atenției. Lângă servere, sculpturi din lut — mici sosii care imortalizează persoanele care au lucrat pentru organizație — se aliniază pe pereți și se revarsă în bănci.

Mark Graham arată spre o sculptură ceramică a propriei sale imagini la Arhiva Internetului.

Carolyn Fong pentru NPR

„Avem toate acele statuete mici, care cred că sunt o modalitate de a sărbători oamenii care lucrează la aceste colecții”, a spus Kahle. „Oamenii au capacitatea de a construi tehnologiile despre care credem că ne vor servi bine. Este [important] ca oamenii să înțeleagă cum pot participa, că nu este ceva ce li se întâmplă. Este al nostru.” Avinash Krishna, un tânăr de 22 de ani, absolvent recent de facultate, a venit din zona Sacramento pentru a vizita sediul. El a spus că folosește serviciile Arhivei Internetului de aproximativ un deceniu. Turul era de mult timp pe lista lui de lucruri de făcut, dar o vizită recentă pe o pagină Wikipedia l-a împins mai sus. Pentru el, a fost un exemplu al modului în care a văzut că web-ul devine din ce în ce mai dependent de instrumentele arhivei. „Nu-mi amintesc pagina, dar, știi, un procent semnificativ din link-urile care erau pe articolul Wikipedia sunt link-uri ale Arhivei Internetului”, a spus el. „Este foarte trist — că ceea ce oamenii consideră o sursă primară este ceva ce nu mai există.”

Mark Graham conduce un tur gratuit al biroului Arhivei Internetului.

Carolyn Fong pentru NPR

Krishna deplânge ceea ce este cunoscut sub numele de degradare digitală sau „putrezirea link-urilor” — cimitirul masiv, în expansiune, de link-uri rupte de pe web. Este ceea ce vedeți când întâlniți „Eroare 404” sau „pagina nu a fost găsită”. În timp ce ștergerea de către administrația Trump a paginilor web federale reprezintă un exemplu notabil al problemei link-urilor întrerupte, aceasta a fost de mult timp o epidemie. Un studiu al Pew Research Center publicat anul trecut a constatat că aproximativ 38% din paginile web de pe internet care existau în 2013 nu mai erau accesibile începând cu 2023. Potrivit unui studiu al Harvard Law Review publicat în 2014, aproximativ jumătate din toate link-urile citate în opiniile Curții Supreme a SUA nu mai duceau la materialul sursă original.

Kahle, care a recunoscut de timpuriu natura efemeră a web-ului, a spus că deteriorarea rapidă a web-ului viu este o amenințare serioasă la adresa conservării istorice. „Ne construim cultura pe nisipuri mișcătoare”, a spus el.

Un angajat al biroului Arhivei Internetului digitizează o carte.

Carolyn Fong pentru NPR

Un mastodont al reparării putregaiului link-urilor, Arhiva Internetului salvează zilnic o medie de 10.000 de link-uri moarte care apar pe paginile Wikipedia. În total, a reparat peste 23 de milioane de link-uri putrede numai pe Wikipedia, potrivit organizației.

Decimarea rapidă a datelor de pe site-urile guvernamentale este doar cea mai recentă provocare cu care se confruntă organizația non-profit. Din 2020, Arhiva Internetului a fost lovită de procese costisitoare privind drepturile de autor pentru digitizarea cărților și a muzicii care nu sunt în domeniul public. Casele de discuri și editurile de cărți au dat în judecată organizația non-profit pentru sute de milioane de dolari. Fondatorul Kahle a spus că procesele costisitoare — despre care experții juridici spun că sunt menite să fie un factor de descurajare — amenință viitorul arhivei. Cu un personal de aproximativ 120 de persoane, organizația a avut un buget de aproximativ 28 de milioane de dolari anul trecut — mai puțin de o cincime din bugetul Bibliotecii Publice din San Francisco. Este finanțată prin donații mari și mici, precum și prin bani care provin de la muzee, biblioteci și alte instituții care plătesc organizația non-profit pentru a-și păstra colecțiile. În plus, organizația a fost, de asemenea, o țintă într-o serie recentă de atacuri cibernetice asupra bibliotecilor. Chiar și într-un moment în care Arhiva Internetului este amenințată, fondatorul său, Kahle, a apreciat că, înapoi la sediu, camera mare de servere înalte — sângele vital al bibliotecii — rămâne neobstrucționată, la vedere publică.

„Este ca niște rafturi deschise”, a spus el. „Nu este ascuns într-un buncăr undeva. Este „acesta suntem noi”. Pare un pic vulnerabil, nu-i așa?” Kahle a spus că el crede că această vulnerabilitate transmite un mesaj: „Trebuie să ne sprijinim instituțiile sau vor dispărea.”

Membrii turului se uită la serverele Arhivei Internetului care sunt expuse și funcționează activ.

Carolyn Fong pentru NPR

  • Facebook
  • Flipboard
  • Email

Read in other languages

Про автора

Elena este un jurnalist de investigație neobosit, ale cărei reportaje dezvăluie scheme de corupție la cele mai înalte niveluri ale puterii. Munca ei se distinge prin analiză profundă, colectarea minuțioasă a faptelor și curajul în acoperirea subiectelor controversate. Nu se oprește în fața întrebărilor incomode și duce investigațiile până la capăt, în ciuda posibilelor amenințări.