În ultimii ani au apărut din ce în ce mai mulți asistenți de inteligență artificială. Dacă multă lume și-a pus întrebarea cum au reușit aceștia să acumuleze cantitățile enorme de informație, răspunsul poate părea dezarmant de simplu: prin „cumpărarea, scanarea și aruncarea a milioane de cărți”, potrivit publicației Washington Post, care susține că „misterul” a fost deslușit prin documentele depuse la tribunal.
Astfel, companiile din Silicon Valley s-au întrecut în a construi modele de inteligență artificială.
La începutul anului 2024, directorii executivi ai start-up-ului de inteligență artificială Anthropic au demarat un proiect ambițios pe care au încercat să-l țină secret.
„Proiectul Panama este efortul nostru de a scana 'în mod distructiv' toate cărțile din lume. Nu vrem să se afle că lucrăm la acest proiect”, se arată într-un document intern de planificare, dezvăluit săptămâna trecută, în cadrul unor proceduri legale.
Cum a luat naștere chatbotul Claude și cum a fost antrenat
Conform documentelor, în aproximativ un an, compania a cheltuit zeci de milioane de dolari pentru a achiziționa și a „tăia cotorul” a milioane de cărți, apoi le-a scanat paginile și le-a folosit pentru a învăța modelele de inteligență artificială (IA), așa cum este chatbotul Claude.
În document este descris modul în care „mașina de tăiat cu acționare hidraulică tăia cu precizie” cărțile, ale căror pagini erau apoi „scanate cu scanere de mare viteză, de înaltă calitate, la nivel industrial”.
Numai că au apărut și procesele pentru drepturi de autor împotriva companiei Anthropic, cea de care aparține chatbotul Claude.
Compania Anthropic, care este evaluată de investitori la 183 miliarde de dolari, a plătit 1,5 miliarde de dolari pentru a soluționa cazul, în august 2025. Însă decizia instanței, care a venit săptămâna trecută, a fost de a dezvălui documente din această speță. Sunt multe documente din aceste dosare, care dezvăluie cazuri de încălcare a drepturilor de autor de către companiile de IA. Aceste documente arată cât de departe au reușit să meargă companiile de tehnologie, precum Anthropic, Meta, Google sau OpenAI, pentru a obține cantități uriașe de date cu care să-și „antreneze” software-ul.
Din procesele intentate pentru drepturile de autor reiese că marile companii de tehnologie se află într-o cursă frenetică și, uneori, nelegală, pentru a pune mâna pe diverse informații ale umanității. Iar cărțile erau considerate de către companii „un premiu crucial”, după cum reiese din documentele judiciare. De exemplu, dintr-un document din ianuarie 2023 reiese că unul dintre cofondatorii Anthropic a susținut că un antrenamentul modelelor de inteligență artificială cu ajutorul cărților le-ar putea învăța pe aceste modele „cum să scrie bine”, în loc să imite „limbajul de slabă calitate de pe internet”.
Alte date scot la iveală un e-mail din 2024, din cadrul Meta, care spunea că accesul la o colecție digitală de cărți este „esențial” pentru a fi competitiv cu rivalii din domeniul IA.
Unele companii cereau permisiunea autorilor
Tot din documentele judiciare reiese că aceste companii nu au considerat „practic” să obțină permisiunea directă a editorilor și autorilor pentru a utiliza operele acestora. În schimb, Anthropic, Meta și alte companii au găsit modalități de a achiziționa cărți „în bloc”, fără știrea autorilor, inclusiv prin descărcarea de copii piratate.
Totodată, prin intermediul mesajelor, angajații Meta și-au exprimat îngrijorarea repetată că descărcarea unei colecții de milioane de cărți, fără permisiune, încalcă legea drepturilor de autor. Însă în decembrie 2023, un e-mail intern menționa că această practică fusese aprobată după „escaladarea către MZ” (CEO-ul Mark Zuckerberg). Meta a refuzat să comenteze această poveste.
Un an mai târziu, unul dintre fondatorii Anthropic, Ben Mann, a salutat lansarea, în iulie 2022, a unui nou site numit Pirate Library Mirror, care pretindea că deține o bază de date uriașă de cărți și declara că „încălcăm în mod deliberat legea drepturilor de autor din majoritatea țărilor”. Atunci, Mann a trimis link-ul către alți angajați ai Anthropic, împreună cu mesajul „La țanc!!!”.
În documentele oficiale, Anthropic a precizat că nu a antrenat „niciodată un model comercial de IA care să genereze venituri folosind datele LibGen” și nu a folosit niciodată Pirate Library Mirror pentru a antrena „un model complet de IA”.
Google, Microsoft și OpenAI se confruntă și ei cu procese privind drepturile de autor. Majoritatea proceselor împotriva companiilor de IA sunt în curs de desfășurare.
Chiar dacă spectrul legalității planează asupra acestor procese, există două hotărâri anterioare în care judecătorii au constatat că utilizarea de către companiile de tehnologie a cărților, cu scopul antrenării modelelor de IA, fără permisiunea autorului, „poate fi legală”, conform unei doctrine din legislația privind drepturile de autor, cunoscută sub numele de „utilizare loială”.
De exemplu, în iunie 2025, judecătorul William Alsup a constatat că Anthropic avea dreptul să utilizeze cărți pentru a-și antrenarea modelelor de inteligență arificială, pentru că acestea „procesează materialul într-un mod transformativ”. William Alsup a acordat statutul de „acțiune colectivă” autorilor ale căror cărți au fost incluse în așa-numitele biblioteci fantomă (colecții uriașe de cărți digitalizate, partajate online fără autorizație) pe care Anthropic le-a descărcat. Pentru a nu se confrunta cu un proces, compania a acceptat să plătească 1,5 miliarde de dolari autorilor, fără însă a recunoaște că a comis o ilegalitate. Autorii ale căror cărți au fost descărcate pot revendica partea lor din acord, estimată la aproximativ 3.000 de dolari per titlu.
„Acest caz a fost soluționat, dar hotărârea istorică a instanței din iunie 2025 rămâne intactă. Judecătorul Alsup a susținut că instruirea AI era 'în esență transformatoare': modelele AI ale Anthropic au fost instruite să nu 'le reproducă sau înlocuiască, ci să depășească o etapă dificilă și să creeze ceva diferit'. Problema pe care am soluționat-o se referea la modul în care au fost obținute anumite materiale, nu la faptul dacă le-am putea utiliza pentru a dezvolta modele AI”, a declarat Aparna Sridhar, consilierul general adjunct al Anthropic, într-un e-mail adresat The Washington Post.
Ce discutau între ei angajații companiilor de IA
Atunci când Anthropic a început operațiunea Project Panama, pentru a cumpăra și scana cărți fizice, a apelat la Tom Turvey, un director Google care contribuise la crearea celebrului proiect Google Books, un proiect controversat.
Dar inițial, Anthropic a luat în considerare cumpărarea de cărți second hand de la biblioteci sau librării, cum ar fi Strand, din New York City. Magazinul era „interesat să furnizeze cărți second-hand”. În cele din urmă, Anthropic a cumpărat milioane de cărți, inclusiv second-hand din Marea Britanie.
În cadrul procesului, autorii susțin că șefii Meta au optat să descarce milioane de cărți gratuit de pe platforme de tip „torrent”.
„Descărcarea de torrente de pe un laptop al companiei nu mi se pare corectă”, a scris un inginer în 2023, potrivit documentelor. El și-a exprimat ulterior îngrijorarea față de echipa juridică a companiei și a spus că utilizarea site-urilor de torente ar putea implica „partajarea de opere piratate cu alte persoane”, ceea ce „ar putea fi ilegal”.
E-mailul din decembrie 2023 din dosarele instanței arată clar că utilizarea LibGen a fost aprobată de Zuckerberg.
„OpenAI a dat startul care a dus la pirateria în creștere a companiilor de IA și la exploatarea intensivă a întregii expresii a umanității”, a declarat Justin A. Nelson, avocat la Susman Godfrey LLP, care îi reprezintă pe autorii de cărți atât în cazul OpenAI, cât și în cazul Anthropic.
