Il paradosso dell'IA: il web che la nutre sta morendo

Wired Italia chiude, Google risponde prima del click: se il web che nutre l'AI muore, come si addestreranno i modelli tra dieci anni? Il model collapse spiegato bene.

Il primo modem che ho sentito fischiare aveva 56k di velocità massima teorica e non li raggiungeva mai. Trent'anni dopo, chiedo a un'intelligenza artificiale di spiegarmi come funziona la fibra ottica e mi risponde in meno di un secondo, senza che io debba aprire un solo sito. È lì, in quel secondo, che si nasconde il paradosso di cui nessuno parla abbastanza.

Chi ha vissuto internet dagli albori ricorda il rumore. Quel fischio, quei crepitii, quei quindici secondi di attesa prima che la pagina iniziasse a caricarsi riga per riga, dall'alto verso il basso, come se il sito si stesse rivelando un pixel alla volta. Ricorda le GeoCities piene di gif animate, i forum dove si discuteva per ore di modem esterni e schede video, i primi blog scritti da persone vere che raccontavano la propria vita o la propria competenza senza secondi fini, se non il gusto di condividerla.

Quel web funzionava perché esisteva uno scambio semplice: tu scrivi, io leggo, i banner pubblicitari pagano il server. Un patto implicito che ha retto per vent'anni e che oggi si sta rompendo sotto i nostri occhi.

Wired Italia è solo il sintomo

A giugno 2026 Wired Italia ha chiuso. Non è un caso isolato, è un sintomo. Prima di lei sono spariti decine di magazine, testate locali, blog indipendenti che per anni hanno prodotto informazione di qualità. Il motivo non è mai uno solo, ma due si intrecciano in modo particolarmente pericoloso.

Il primo è che non siamo più disposti a pagare quasi nulla per i contenuti online. Abbiamo passato vent'anni ad abituarci alla gratuità — gratuità finanziata dalla pubblicità, che a sua volta viveva del traffico. Ma se il traffico crolla, crolla tutto il castello.

E il traffico sta crollando per il secondo motivo, quello meno raccontato: Google, con Gemini e le AI Overview, ormai la risposta te la dà direttamente in pagina. Non hai più bisogno di cliccare su un sito per sapere come si installa WireGuard su Debian o quale sia la differenza tecnica tra 4G e 5G. La risposta è lì, sintetizzata, pronta, gratuita. La chiamano "zero-click search" ed è già oggi la normalità per la maggioranza delle ricerche informative.

Il risultato è semplice da immaginare: se il sito che ha scritto quella guida non riceve più visite, non riceve più pubblicità. Se non riceve più pubblicità, chiude. E se chiude, quella guida sparisce dal web per sempre.

Il problema è che l'AI ha ancora bisogno di noi

Qui arriva la parte che mi tiene sveglio la notte, da persona che lavora con la tecnologia da quando la tecnologia era ancora un hobby per pochi.

I modelli di intelligenza artificiale non nascono sapendo le cose. Vengono addestrati leggendo enormi quantità di testo scritto da esseri umani: articoli, forum, documentazione tecnica, blog, wiki. È lì che imparano cos'è un firewall, come si configura un DNS, cosa significa davvero "banda disponibile" contro "banda pubblicizzata". Il web umano è il loro libro di scuola.

Ma se il modello economico che tiene in vita quel web sta collassando — se Wired Italia chiude, se i blog tecnici indipendenti spariscono uno dopo l'altro perché nessuno più li visita — chi scriverà il prossimo libro di scuola?

La risposta, oggi, è già in corso: lo scrive l'intelligenza artificiale stessa. Si stima che una fetta enorme dei nuovi contenuti pubblicati online — secondo alcune analisi già oltre il 90% in certe categorie — sia oggi generata o assistita da AI. E qui si chiude il cerchio, in un modo che a un tecnico fa venire i brividi.

Fotocopiare una fotocopia

Immagina di fotocopiare un foglio. La copia sarà quasi identica all'originale, con una minima perdita di nitidezza, impercettibile. Ora fotocopia quella copia, e poi la copia della copia, e continua così per mille volte. Alla millesima fotocopia il testo non sarà più leggibile: sarà rumore, macchie, un'ombra dell'originale.

È esattamente quello che i ricercatori chiamano "model collapse", e non è fantascienza: è stato dimostrato scientificamente, con uno studio pubblicato su Nature nel 2024 (Shumailov et al., "AI models collapse when trained on recursively generated data"). Quando un modello linguistico viene addestrato — anche solo in parte — su testi generati da altri modelli linguistici, gli errori non restano stabili: si amplificano a ogni generazione. Le sfumature rare spariscono per prime, poi i dettagli tecnici corretti ma poco comuni, poi la varietà stessa del linguaggio, finché quello che resta è un impasto sempre più uniforme, sempre più povero, sempre più simile a se stesso.

Oggi quell'errore è piccolo. Un dettaglio tecnico leggermente impreciso in una guida su un protocollo di rete, una sfumatura persa in una spiegazione di crittografia, un'informazione ormai vecchia spacciata per attuale perché nessuno l'ha più aggiornata avendo perso l'incentivo economico per farlo. Piccolo, oggi. Ma il web che stiamo costruendo nel 2026 sarà il materiale di addestramento dei modelli del 2030, che a loro volta scriveranno il materiale del 2034. Ogni generazione fotocopia la fotocopia precedente, con sempre meno esseri umani reali nel mezzo a correggere, verificare, aggiornare con esperienza diretta.

Tra dieci anni quel piccolo errore di oggi potrebbe essere diventato una voragine. Non per colpa dell'intelligenza artificiale in sé, ma perché avremo smesso di darle da mangiare cibo vero.

Cosa resta, quando il resto sparisce

Non credo che la soluzione sia rimpiangere il modem a 56k, e non credo nemmeno che l'intelligenza artificiale sia il nemico — la uso ogni giorno, come probabilmente la stai usando tu in questo momento per leggere un riassunto di questo articolo invece del pezzo intero. Il problema non è lo strumento, è l'equilibrio che si sta rompendo.

Quello che penso è che, se il contenuto umano diventa scarso, diventa anche prezioso. Le cose che un'intelligenza artificiale non può inventare sono esattamente le cose che varrà la pena continuare a scrivere: un dato misurato davvero, un'esperienza vissuta davvero, un errore commesso e raccontato davvero, un test fatto sul serio invece che dedotto per analogia statistica.

È anche per questo che qui a speedtest.it continuiamo a misurare la velocità reale delle connessioni italiane invece di stimarla: perché un numero verificabile, generato da un test reale eseguito da una persona reale sulla propria rete reale, è esattamente il tipo di dato primario che nessuna intelligenza artificiale può generare da sola. Può riassumerlo, può spiegarlo, ma non può inventarlo dal nulla senza che qualcuno, da qualche parte, l'abbia prima misurato davvero.

Forse è proprio questa la lezione di trent'anni di internet: gli strumenti cambiano, i protocolli cambiano, la velocità con cui la pagina si carica è passata da un pixel alla riga a un intero sito in trecento millisecondi. Ma il valore, alla fine, è sempre stato lo stesso — qualcuno che ha davvero vissuto o misurato qualcosa, e ha avuto la pazienza di scriverlo perché qualcun altro potesse impararlo. Vale la pena continuare a farlo, anche ora che il pubblico più affamato di quella conoscenza non è più fatto solo di persone, ma anche delle macchine che le persone hanno costruito.