Ci sono il New York Times e il
Guardian tra gli editori che hanno bloccato l'accesso dei loro
siti web da parte dell'Internet Archive. Il motivo, come
spiegano i portavoce al sito Nieman Lab dell'Università di
Harvard, è che gli stessi contenuti, resi liberamente
accessibili attraverso lo strumento Wayback Machine, possono
essere utilizzati dalle aziende di intelligenza artificiale per
l'addestramento dei modelli. "Non hanno l'autorizzazione",
spiega il Times al Nieman Lab, "per questo abbiamo deciso di
bloccarlo".
Il media ricorda che lo scorso agosto, la piattaforma Reddit
ha bloccato lo stesso archivio per impedirne la registrazione di
forum e commenti. "Si tratta di contenuti che proprio Reddit
concede in licenza a Google come dati di addestramento per
l'intelligenza artificiale, per decine di milioni di dollari"
scrive Nieman Lab.
Interrogato sulla decisione, il fondatore di Internet
Archive, Brewster Kahle, ha affermato che "se gli editori
limitano le biblioteche, come Internet Archive, il pubblico avrà
meno accesso ai documenti storici".
A maggio del 2023, l'Internet Archive è andato
temporaneamente offline dopo che un'azienda di intelligenza
artificiale ha causato un sovraccarico del server, per estrarre
dati di testo dagli archivi di pubblico dominio.
Riproduzione riservata © Copyright ANSA

1 giorno fa
3











English (US) ·