Riconoscimento di testi by AI: passi avanti

08/06 AI

In un mondo in cui i contenuti generati dai chatbot basati sull’intelligenza artificiale (AI) stanno inondando ogni settore della comunicazione, diventa sempre più importante essere in grado di distinguere tra le parole di veri esseri umani e quelle generate dalle macchine. Come rivelato in una recente ricerca pubblicata dalla rivista Cell Reports Physical Science, degli scienziati dell’Università del Kansas hanno compiuto un passo avanti significativo in questa direzione, progettando un algoritmo in grado di rilevare con oltre il 99% di accuratezza i testi accademici generati dai Chatbot GPT (Generative Pre-trained Transformer).

La questione della distinzione tra contenuti umani e quelli generati dall’AI ha suscitato un crescente interesse negli ultimi tempi, spingendo molte aziende a competere nella realizzazione di tecnologie di rilevazione. Tuttavia, fino ad ora, nessuna delle soluzioni proposte ha ottenuto risultati soddisfacenti, compresa quella creata dalla stessa OpenAI, l’azienda che ha sviluppato ChatGPT. Gli strumenti esistenti sono talmente inefficienti da risultare praticamente inutili nella pratica.

La ricerca dell’Università del Kansas rappresenta quindi una svolta promettente. Gli scienziati coinvolti nel progetto hanno selezionato un campione di 64 articoli di ricerca scientifica scritti da autori umani in vari ambiti disciplinari - dalla biologia alla fisica - e hanno utilizzato tali testi per alimentare ChatGPT, generando un dataset di 128 articoli artificiali, composti da un totale di 1.276 paragrafi di “nonsense” generato dai chatbot. Attraverso l’analisi di questi paragrafi, gli scienziati sono riusciti a creare un algoritmo in grado di rilevare il testo prodotto da ChatGPT.

Per verificare l’efficacia dell’algoritmo, gli studiosi hanno raccolto un nuovo insieme di dati composto da 30 articoli reali e 60 articoli generati dal ChatGPT, per un totale di 1.210 paragrafi. La loro ricerca ha mostrato che l’algoritmo è stato in grado di rilevare gli articoli interi scritti da ChatGPT il 100% delle volte e ha individuato il 92% dei paragrafi generati dall’AI.

Heather Desaire, autrice della carta e professoressa di chimica all’Università del Kansas, ha dichiarato in un’intervista a EurekAlert che la speranza è che altri possano utilizzare questa ricerca per adattare il software di rilevazione alle loro specifiche esigenze e contesti. “Abbiamo cercato di creare un metodo accessibile, in modo che anche gli studenti delle scuole superiori possano realizzare un rilevatore di AI per diversi tipi di scrittura con poche indicazioni”, ha affermato Desaire.

Nel corso della loro ricerca, gli scienziati hanno identificato alcune caratteristiche tipiche del testo generato da ChatGPT, come l’uso di paragrafi più brevi, un vocabolario più limitato, un numero minore di segni di punteggiatura e l’assenza di termini come “sebbene”. Inoltre, l’AI tende ad essere meno specifica nelle citazioni di figure e riferimenti ad altri scienziati.

Va notato che l’algoritmo progettato dall’équipe di Desaire è stato sviluppato specificatamente per la scrittura accademica presente nelle riviste scientifiche e potrebbe non essere immediatamente applicabile ad altri contesti, come la valutazione dei lavori scolastici. Tuttavia, la tecnica utilizzata può essere teoricamente adattata anche ad altre tipologie di testo.

La ricerca dell’Università del Kansas rappresenta quindi un importante “proof of concept”, che potrebbe portare allo sviluppo di strumenti di rilevazione ancora più efficaci e accurati a fronte di un più ampio set di dati. Se il progresso in questo campo dovesse continuare a questo ritmo, il giorno in cui potremo distinguere facilmente tra la scrittura umana e quella generata da intelligenze artificiali potrebbe non essere poi così lontano.

Michele Laurelli

Ciao, sono Michele! Ho 32 anni, mi occupo di intelligenza artificiale. Insegno, scrivo e realizzo progetti. Quando non lavoro tiro di scherma.

Cosa ne pensi?

Mostra l'area commenti