ChatGPT, un assistente AI basato sul modello di intelligenza artificiale GPT-4 di OpenAI, sta rivoluzionando la vita di persone ipovedenti come Chela Robles, che ha perso la capacità di vedere dall’occhio sinistro all’età di 28 anni e dall’occhio destro un anno dopo. Questa situazione le ha impedito di cogliere i piccoli dettagli che facilitano le interazioni sociali, come le espressioni facciali e le indicazioni. Tuttavia, grazie a ChatGPT, Chela è in grado di ottenere una descrizione dettagliata del mondo circostante attraverso i suoi Google Glass.
Chela Robles è stata una delle prime persone a sottoscrivere una prova con Ask Envision, un assistente AI che utilizza il modello GPT-4 per fornire risposte di tipo conversazionale basate su immagini e testi. Questo assistente AI, insieme ad altri simili come Be My Eyes, sta integrando modelli linguistici per fornire agli utenti ipovedenti maggiori dettagli visivi e maggiore indipendenza. In particolare, Envision è in grado di leggere il testo di una foto e rispondere alle domande successive, rendendo possibile, ad esempio, la lettura di un menu e la scoperta dei prezzi, delle restrizioni dietetiche e delle opzioni per il dessert.
Secondo Sina Bahram, un informatico non vedente che si occupa di consulenza in materia di accessibilità e inclusione per aziende come Google e Microsoft, l’integrazione dell’intelligenza artificiale nei prodotti per non vedenti potrebbe avere un impatto profondo sugli utenti. Bahram ha utilizzato Be My Eyes con GPT-4 e sottolinea che questo modello linguistico di grandi dimensioni fa una differenza significativa rispetto alle generazioni precedenti di tecnologia, offrendo informazioni dettagliate su oggetti e luoghi che fino a poco tempo fa erano inaccessibili ai non vedenti.
Tuttavia, c’è anche una nota di cautela nella diffusione di questa tecnologia. Danna Gurari, assistente alla cattedra di informatica presso l’Università del Colorado a Boulder, ha evidenziato che i modelli di intelligenza artificiale, come GPT-4, possono essere soggetti a errori e allucinazioni, inventando informazioni o fornendo descrizioni incomplete. Ciò potrebbe essere pericoloso per le persone non vedenti, specialmente se si tratta di situazioni che coinvolgono la salute, come una descrizione errata di un farmaco. Inoltre, l’IA può incorrere nell’identificazione erronea di caratteristiche quali età, razza e sesso delle persone, a causa dei pregiudizi e delle distorsioni presenti nei dati utilizzati per addestrarla.
Per mitigare questi rischi, Sina Bahram suggerisce di fornire agli utenti un punteggio di fiducia che indichi la precisione delle informazioni fornite dall’intelligenza artificiale. Questo consentirebbe alle persone non vedenti di prendere decisioni più consapevoli basate su ciò che l’IA vede. L’obiettivo finale è garantire alle persone non vedenti lo stesso accesso alle informazioni visive di cui godono le persone vedenti.
In conclusione, l’integrazione dell’intelligenza artificiale nei prodotti per non vedenti sta aprendo nuove prospettive per queste persone, consentendo loro di avere una descrizione del mondo circostante e di vivere in modo più autonomo. Tuttavia, è fondamentale affrontare le sfide e i rischi legati all’utilizzo di questi modelli linguistici per garantire informazioni corrette, complete e prive di pregiudizi.
Le AI possono fare del bene vero, ne gioveranno soprattutto le persone non vedenti
Il testo parla dell’utilizzo di ChatGPT e di altri assistenti AI per aiutare le persone con problemi di vista a percepire il mondo circostante. Chela Robles, una donna cieca, ha utilizzato Google Glass e Ask Envision, un assistente AI che utilizza il modello GPT-4 di OpenAI, per ottenere descrizioni visive del mondo esterno. Questo le permette di cogliere dettagli che altrimenti non avrebbe potuto notare, come le espressioni facciali. Altri servizi come Be My Eyes e SeeingAI hanno incorporato il GPT-4 per aiutare gli utenti a identificare gli oggetti e ottenere informazioni più dettagliate. Tuttavia, l’intelligenza artificiale non è perfetta e può fornire informazioni incomplete o errate. Ci sono anche preoccupazioni riguardo all’uso dei modelli linguistici di grandi dimensioni nell’identificare erroneamente caratteristiche come l’età, la razza e il sesso delle persone. Nonostante ciò, l’integrazione dell’intelligenza artificiale nei prodotti per i non vedenti potrebbe avere un impatto profondo ed offrire loro maggior indipendenza e accesso alle informazioni visive.