Testi accademici per bambini: come tl;dr papers li spiega

Condensare le informazioni di una ricerca di livello accademico può risultare arduo persino per chi lo fa quotidianamente di mestiere, ma tl;dr papers promette di spiegare anche a un bambino di 7 anni il contenuto di una pubblicazione scientifica. Il progetto che ha portato alla creazione di questa intelligenza artificiale per l’analisi e il riassunto delle pubblicazioni accademiche nasce da Yash Dani e Cindy Wu come un modo per “esplorare ed imparare di più sul mondo dello sviluppo software“.

Negli ultimi giorni il servizio in grado di generare un estratto di semplice lettura a partire da un qualsiasi tipo di testo è diventato virale su Twitter, dove diversi accademici hanno iniziato a pubblicare i risultati di tl;dr papers sui propri lavori. Neanche a dirlo, i risultati sono stati quelli che ci si aspetta: a volte totalmente inaccurati, altre volte invece carichi di una profonda intuizione insita nel linguaggio estremamente semplice utilizzato. Tanto semplice che persino un bambino di seconda elementare potrebbe capirli.

Y’all https://t.co/eZw3712jVd is incredible. It translates your abstract so that a 2nd grader can understand it. If anyone wants to skip my article, here’s the tl;dr… pic.twitter.com/JrbS90V84b

— Zane Griffin Talley Cooper (@ZaneGTCooper) January 15, 2022

Nell’esempio qui presentato si parla di periferiche per lo stoccaggio dei dati correlato alle materie prime necessarie per la produzione di tali periferiche, come gli hard disk. L’intelligenza artificiale di tl;dr papers ha riassunto il testo così: Grandi quantità di informazioni sono archiviate sugli hard disk. Questi hard disk sono composti da piccoli magneti. I magneti vengono estratti dal terreno.

Pur nella sua semplicità, l’estratto generato dall’IA è disarmante per la capacità di riassumere un argomento così complesso in poche righe, pur risultando completo. Sono pochi gli adulti dotati di una tale capacità di sintesi e linguaggio da risultare comprensibili a bambini di 6-7 anni, specie quando si tratta di argomenti carichi di differenti sfumature, livelli e significati. C’è però un dettaglio da non trascurare: tl;dr papers riassume e semplifica soltanto il sommario – in inglese abstract – delle ricerche accademiche, non l’intero testo. Non importa quindi se il documento presenta 20, 50 o 100 pagine: l’analisi viene fatta soltanto su questo riassunto dell’articolo scientifico, scritto in modo tale da non aggiungere alcuna interpretazione e valutazione, denso di informazioni ma con un limite massimo obbligatorio di parole.

Lo sviluppo di strumenti software come tl;dr papers può risultare incredibilmente utile, al di là dell’effetto “wow” oppure “meh” che possa generare quando si prova a leggere uno degli estratti generati – qui ne trovate una vera e propria collezione. OpenAI è da anni al lavoro su GPT-3, una delle migliori AI per l’analisi del linguaggio, utilizzata per costruire strumenti capaci di completare in modo automatico stringhe di codice per sviluppatori software. Ci sono interi lavori di scrittura creativa generati dal modello GPT-3 di OpenAI: poesie, novelle e giochi linguistici. Sul tutto però grava un pesante fardello: quello del controllo sui dati utilizzati per istruire il modello di intelligenza artificiale.

Internet è un enorme database contenente miliardi e miliardi di scritti utili a poter istruire un’intelligenza artificiale, ma sicuramente non è il posto in cui uomini e donne danno il meglio di sé. Può capitare che nella marea di informazioni insulti, imprecazioni, bestemmie, stereotipi, luoghi comuni, fake news e tanto altro materiale di bassa qualità finiscano per influenzare i risultati dell’addestramento, seppur in modo marginale. Tanto è vero che i modelli GPT-2 e GPT-3 non sono mai stati rilasciati pubblicamente: il rischio che venga utilizzata per generare fake news è troppo grande.

Per questo, e tanti altri motivi, l’utilizzo di modelli di intelligenza artificiale di scrittura autonoma ha bisogno di essere regolamentato, ponendo dei limiti e cercando di sradicare sul nascere quello che potrebbe essere una perpetuazione di modelli non condivisibili nella società moderna, impegnata sempre più ad interrogarsi sulla natura del linguaggio utilizzato ogni giorno. Anche perché utilizziamo modelli simili ogni giorno: quando usiamo Gmail e ci vengono suggerite frasi o durante il controllo ortografico e grammaticale in Microsoft Word o Google Docs.

Se siete curiosi di provare tl;dr papers per divertimento, sembra che il sito sia in stato di manutenzione: gli autori hanno già fatto sapere di non avere nessuna intenzione di riportarlo online, o di continuare l’esperimento. Se avete sempre sognato di poter riassumere i vostri articoli scientifici esistono altre soluzioni, come quella di Study International.

Potrebbe interessarti: L’intelligenza artificiale di Google aiuterà gli utenti a identificare i problemi della pelle