Test di Turing

criterio per determinare se una macchina sia in grado di pensare inventato da Alan Turing

Il test di Turing è un criterio per determinare se una macchina è in grado di esibire un comportamento intelligente, suggerito da Alan Turing nell'articolo Computing machinery and intelligence apparso nel 1950 sulla rivista Mind.[1]

Rappresentazione grafica del test di Turing

Descrizione

modifica

Nell'articolo Turing prende spunto da un gioco, chiamato "gioco dell'imitazione", con tre partecipanti: un uomo A, una donna B, e una terza persona C. Quest'ultima è tenuta separata dagli altri due e attraverso una serie di domande deve stabilire qual è l'uomo e quale la donna. Dal canto loro anche A e B hanno dei compiti: A deve ingannare C e portarlo a un'identificazione errata, mentre B deve aiutarlo. Affinché C non possa disporre di alcun indizio (come l'analisi della grafia o della voce), le risposte alle domande di C devono essere dattiloscritte o trasmesse in modo simile.

Il test di Turing si basa sul presupposto che una macchina si sostituisca ad A. Se la percentuale di volte in cui C indovina chi è l'uomo e chi la donna è simile prima e dopo la sostituzione di A con la macchina, allora la macchina stessa dovrebbe essere considerata intelligente, dal momento che - in questa situazione - sarebbe indistinguibile da un essere umano.

Per macchina intelligente Turing intende una in grado di pensare, ossia capace di concatenare idee ed esprimerle. Per Turing, quindi, tutto si limita alla produzione di espressioni non prive di significato. Nell'articolo, riprendendo il Cogito cartesiano, scrive:

«Secondo la forma più estrema di questa opinione, il solo modo per cui si potrebbe essere sicuri che una macchina pensa è quello di essere la macchina stessa e sentire se si sta pensando. [...] Allo stesso modo, la sola via per sapere che un uomo pensa è quello di essere quell'uomo in particolare. [...] Probabilmente A crederà "A pensa, mentre B no", mentre per B è l'esatto opposto: "B pensa, ma A no". Invece di discutere in continuazione su questo punto, è normale attenersi all'educata convenzione che ognuno pensi.»

Rispondendo alle critiche al suo test, Turing si dichiarò consapevole del fatto che l'algoritmo capace di superarlo sarebbe stato più simile a un "pappagallo ammaestrato" che ad un essere intelligente in grado di pensare. Egli sottolineò la differenza radicale fra un fenomeno intelligente e un essere realmente intelligente.[2]

Le macchine di Turing sono macchine a stati finiti che possono simulare altre macchine a stati discreti. Una macchina per sostenere il test deve essere programmata considerando la descrizione di un uomo in termini discreti (stati interni, segnali, simboli). Dalla complessità del software, si legge tra le righe dell'articolo, emergeranno le funzioni intellettuali. Su questa aspettativa si fonda una disciplina nota come intelligenza artificiale, il cui scopo è la costruzione di una macchina in grado di riprodurre le funzioni cognitive umane.

Prove a confutazione del test

modifica

Negli anni il test di Turing è stato via via riformulato. Le ragioni sono varie e passano dall'imprecisione della formulazione originale al sorgere di nuovi problemi relativi alla definizione di macchina intelligente. A volte semplici programmi, come ad esempio ELIZA che emula un terapista rogersiano, hanno costretto a riformulare i criteri del test perché inadeguati o troppo facilmente soddisfatti da programmi evidentemente non pensanti.

Il filosofo John Searle ha proposto una modifica al test di Turing, che ha preso il nome di stanza cinese, sostenendo l'inattendibilità del test di Turing come prova sufficiente a dimostrare che una macchina o un qualsiasi sistema informatico sono sistemi dotati di vera intelligenza, sia che questi abbiano superato o no tale test.

Varianti successive

modifica

Numerose altre versioni del test di Turing, comprese quelle di cui sopra, sono state sviluppate nel corso degli anni.

Turing test totale

modifica

La variante totale[3] del test di Turing, proposta dallo scienziato cognitivo Stevan Harnad,[4] aggiunge due ulteriori requisiti al test di Turing tradizionale. L'interrogatore può anche testare le abilità percettive del soggetto (il che coinvolge la visione artificiale) e la capacità del soggetto di manipolare gli oggetti, coinvolgendo la robotica. (Russell, Stuart J.; Norvig, Peter (2010), Artificial Intelligence: A Modern Approach (3rd ed.), Upper Saddle River, NJ: Prentice Hall).

Test di Turing dell'esperto

modifica

Nel test di Turing dell'esperto la risposta di una macchina deve mostrare la sua capacità di specializzarsi in un campo di conoscenza specifico e deve risultare indistinguibile da quella fornita da un esperto in questo campo. È noto anche come "test Feigenbaum" ed è stato proposto da Edward Feigenbaum nel 2003.[5][6]

Record sanitari elettronici

modifica

Una lettera pubblicata su Communications of the ACM[7] concepisce la generazione di una popolazione di pazienti artificiali e propone una variazione del test di Turing per valutare la differenza tra questi e i pazienti reali: "Sebbene un medico umano possa distinguere facilmente tra i pazienti generati artificialmente e quelli umani, [ci si chiede se], nel contesto della CCE, è possibile fornire una macchina dell'intelligenza per fare tale determinazione da sola", e poi: "Prima che le identità sintetiche dei pazienti diventino un problema di salute pubblica, il mercato legale delle CCE potrebbe trarre vantaggio dall'applicazione di tecniche di test di Turing per garantire maggiore affidabilità e valore diagnostico dei dati. Qualsiasi nuova tecnica deve quindi considerare l'eterogeneità dei pazienti ed è probabile che abbia una complessità maggiore rispetto alla sfida di Allen".[7]

Test del minimo segnale intelligente

modifica

Il test del minimo segnale intelligente (Minimum intelligent signal test), proposto da Chris McKinstry come "la massima astrazione del test di Turing",[8] consente solo le risposte binarie (vero/falso o sì/no), per concentrarsi unicamente sulla capacità di pensiero. Elimina i problemi di chat testuale come il pregiudizio di antropomorfismo (cioè il distinguere una macchina da una persona perché non capisce atteggiamenti umani che non hanno diretta correlazione con l'intelligenza di per sé, come parlare alle piante o adorare una divinità) e non richiede l'emulazione di comportamenti umani non intelligenti (come l'attenzione allo stile), ammettendo sistemi che differiscono dall'intelligenza umana. Le domande devono essere isolate e rendono il test più simile a un test del QI che a un interrogatorio. Generalmente si usa per raccogliere dati statistici rispetto ai quali misurare le prestazioni dei programmi di intelligenza artificiale.[9]

Test di Turing inverso e CAPTCHA

modifica

Una modifica del test di Turing, in cui sono stati invertiti uno o più ruoli tra le macchine e l'uomo, è detta test di Turing inverso. Un esempio si trova nel lavoro dello psicanalista Wilfred Bion,[10] che era particolarmente affascinato dalla "tempesta" (in inglese 'storm') risultante dell'incontro di una mente con un'altra.

Nel suo libro del 2000,[11] tra diverse considerazioni originali sul test di Turing, lo studioso letterario Peter Swirski esaminò nel dettaglio l'idea di ciò che definì il test Swirski, essenzialmente il test di Turing inverso, sottolineando che risolveva la maggior parte delle obiezioni alla versione standard. Portando avanti questa idea, R. D. Hinshelwood[12] descrisse la mente come un "apparato per riconoscere la mente". Nel test di Turing inverso viene messo alla prova un computer per verificare se è in grado di determinare se sta interagendo con un essere umano o con un altro computer. Questa è un'estensione della domanda originale alla quale Turing ha tentato di rispondere, ma potrebbe offrire un protocollo sufficientemente accurato per delineare una macchina in grado di "pensare" in un modo che potremmo definire tipicamente umano.

Il CAPTCHA è di fatto una forma di test di Turing inverso. Prima di poter eseguire un'azione su un sito Web, all'utente vengono presentati caratteri alfanumerici in un'immagine grafica distorta e gli viene chiesto di digitarli. Questo ha lo scopo di impedire il ricorso ai sistemi automatici per compiere azioni fraudolente sul sito. La logica è che attualmente non esiste (o comunque non è disponibile per l'utente medio) un software abbastanza sofisticato da leggere e riprodurre l'immagine distorta, quindi se uno è in grado di farlo è probabile che sia un essere umano.

Lo sviluppo dei software in grado di decriptare un CAPTCHA con una certa accuratezza, analizzando i pattern nel motore di generazione, è iniziato subito dopo la creazione dei CAPTCHA.[13] Nel 2013 i ricercatori della Vicarious (ditta che si occupa dello sviluppo di intelligenza artificiale) hanno dichiarato di aver creato un sistema per risolvere le sfide CAPTCHA di Google, Yahoo! e PayPal fino al 90% delle volte.[14] Nel 2014 gli ingegneri di Google hanno raggiunto il 99,8%.[15]

Test Hutter Prize

modifica

Gli organizzatori del premio Hutter credono che comprimere un testo in linguaggio naturale sia un problema di intelligenza artificiale, equivalente al superamento del test di Turing.[16] Il test di compressione dei dati ha alcuni vantaggi rispetto alla maggior parte delle versioni e varianti del test di Turing: fornisce infatti un singolo valore che può essere utilizzato direttamente per stabilire quale delle due macchine è "più intelligente"; inoltre non richiede al computer di mentire all'osservatore giudice. I principali svantaggi: non è possibile testare in questo modo gli umani; non si sa quale particolare "punteggio" ottenuto (se mai esistesse) equivale al superamento di un test di Turing da parte di un umano.

Altri test basati sulla compressione o sulla complessità di Kolmogòrov

modifica

Alla fine degli anni novanta del XX secolo venne proposto un approccio apparso molto prima, ma legato al suddetto test Hutter Prize. Si tratta dell'inclusione di problemi di compressione in un test di Turing esteso.[17] Altri protocolli agiscono tramite prove che derivano interamente dalla complessità di Kolmogorov.[18] Alcuni test su questa linea sono presentati da Hernandez-Orallo e Dowe.[16]

L'Algorithmic IQ (o AIQ) è invece un tentativo di convertire la misura di intelligenza universale teorizzata da Legg e Hutter (basata sull'inferenza induttiva di Solomònoff) in un test pratico di intelligenza artificiale.[16] I due principali vantaggi di alcuni di questi test sono la loro applicabilità alle intelligenze non umane e l'assenza di requisiti per i testatori umani.

Test Ebert

modifica

Il test di Turing ha ispirato il test Ebert proposto nel 2011 dal critico cinematografico Roger Ebert. Esso verifica se una voce sintetizzata dal computer ha abilità sufficienti in termini di intonazioni, inflessioni, tempismo e così via, per far ridere la gente.[19]

  1. ^ Alan M. Turing, Computing machinery and intelligence Archiviato il 2 luglio 2008 in Internet Archive., in Mind, 59, pp. 433-460, 1950. URL consultato il 12-12-2009.
  2. ^ Intelligenza Artificiale. ChatGpt è un pappagallo. Capace di superare il test di Turing, su avvenire.it, Avvenire, 1º aprile 2023.
  3. ^ Oppy, Graham & Dowe, David (2011) The Turing Test. Stanford Encyclopedia of Philosophy
  4. ^ Edd Gent, The Turing Test: brain-inspired computing's multiple-path approach, 2014. URL consultato il 1º giugno 2018 (archiviato dall'url originale il 3 giugno 2016).
  5. ^ McCorduck, 2004, Feigenbaum, 2003.
  6. ^ Kurzweil, Ray (2005), The Singularity is Near, Penguin Books
  7. ^ a b A Leap from Artificial to Intelligence
  8. ^ Copia archiviata, su tech.groups.yahoo.com. URL consultato il 1º giugno 2018 (archiviato dall'url originale il 30 giugno 2013).
  9. ^ Chris McKinstry, Minimum Intelligent Signal Test: An Alternative Turing Test, in Canadian Artificial Intelligence, n. 41, 1997.
  10. ^ Bion, W.S. (1979), "Making the best of a bad job", Clinical Seminars and Four Papers, Abingdon: Fleetwood Press.
  11. ^ Swirski, Peter (2000), Between Literature and Science: Poe, Lem, and Explorations in Aesthetics, Cognitive Science, and Literary Knowledge, McGill-Queen's University Press
  12. ^ Hinshelwood, R.D. (2001), Group Mentality and Having a Mind: Reflections on Bion's work on groups and on psychosis
  13. ^ Jitendra Malik e Greg Mori, Breaking a Visual CAPTCHA.
  14. ^ Pete Pachal, Captcha FAIL: Researchers Crack the Web's Most Popular Turing Test.
  15. ^ Liam Tung, Google algorithm busts CAPTCHA with 99.8 percent accuracy.
  16. ^ a b c Tests of Machine Intelligence Shane Legg/Marcus Hutter - December 2007. http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.126.9552&rep=rep1&type=pdf
  17. ^ D L Dowe e A R Hajek, A computational extension to the Turing Test, in Proceedings of the 4th Conference of the Australasian Cognitive Science Society, 1997. URL consultato il 21 luglio 2009 (archiviato dall'url originale il 28 giugno 2011).
  18. ^ Jose Hernandez-Orallo, Beyond the Turing Test, in Journal of Logic, Language and Information, vol. 9, n. 4, 2000, pp. 447–466, DOI:10.1023/A:1008367325700. URL consultato il 21 luglio 2009.
  19. ^ Alex_Pasternack, A MacBook May Have Given Roger Ebert His Voice, But An iPod Saved His Life (Video), Motherboard, 18 aprile 2011. URL consultato il 12 settembre 2011 (archiviato dall'url originale il 7 aprile 2012).
    «He calls it the "Ebert Test," after Turing's AI standard...»

Bibliografia

modifica

Voci correlate

modifica

Altri progetti

modifica

Collegamenti esterni

modifica
Controllo di autoritàLCCN (ENsh93008808 · GND (DE4770569-3 · BNF (FRcb16644546h (data) · J9U (ENHE987007549165905171
  Portale Informatica: accedi alle voci di Wikipedia che trattano di informatica