Tecnologia per la lettura labiale

Sviluppata nuova tecnologia per la lettura labiale

Una nuova tecnologia per la lettura del labiale sviluppata in Inghilterra all’University of East Anglia (UEA) potrebbe essere d’aiuto nel risolvere crimini e nel fornire assistenza nella comunicazione alle persone con disturbi all’udito o di linguaggio.

 

La nuova tecnologia per la lettura labiale

La dottoressa Helen L. Bear e il professor Richard Harvey dell’University of East Anglia hanno sviluppato una tecnologia per il riconoscimento visivo del linguaggio parlato che potrebbe essere utile in diversi ambiti. Qual è la particolarità di questa tecnologia? Secondo la dottoressa, tale tecnologia può essere applicata “in qualsiasi luogo in cui l’audio non è abbastanza buono per determinare costa stanno dicendo le persone.“. E quindi si rivelerebbe particolarmente adeguata in ambienti piuttosto rumorosi, come nelle auto, nelle cabine di pilotaggio degli aerei o in qualsiasi altro luogo in cui non è facile ascoltare e capire le conversazioni.

Per la professoressa Bear, gli unici problemi nell’identificare un linguaggio sorgono quando il suono non è disponibile o se l’audio non è adeguato e non ci sono indizi per contestualizzare la conversazione. Le pronunce delle lettere /p/, /b/ ed /m/ appaiono molto simili tra loro sulle labbra. Ma grazie a questo dispositivo è possibile fare una distinzione tra i diversi suoni per una traduzione migliore.

La dottoressa Bear ha spiegato: “Stiamo ancora imparando la scienza del discorso visivo e di cosa hanno bisogno le persone per creare un modello di riconoscimento infallibile per la lettura del labiale, ma questo sistema di classificazione migliora sui precedenti metodi di lettura del labiale usando un metodo di allenamento innovativo per i classificatori.“.

Si tratta dunque di una tecnologia abbastanza efficiente, ma che dovrà essere potenziata per offrire risultati ancora più soddisfacenti. Il professor Harvey è comunque contento dei traguardi finora raggiunti. “La lettura labiale è uno dei problemi più difficili nel campo dell’intelligenza artificiale. Quindi è grandioso fare progressi su uno degli aspetti più complicati, ovvero come addestrare le macchine a riconoscere l’aspetto e la forma delle labbra umane.“.

 

Applicazioni ed eventuali rischi per la privacy

La dottoressa Bear ha fatto anche una precisazione sugli ambiti di applicazione. “Fondamentalmente, mentre ci sono ancora miglioramenti da fare, tale sistema potrebbe essere adattato per una serie di scopi. Per esempio, per le persone con invalidità dell’udito e del linguaggio. In alternativa, una buona macchina per la lettura labiale potrebbe essere parte di un sistema di riconoscimento facciale.”.

Nel primo caso i vantaggi sono evidenti. Un sistema del genere potrebbe essere di grande aiuto per le persone sorde e per quelle con difficoltà di comunicazione. Nel secondo caso, invece, è facile che possa nascere qualche perplessità. Perché un sistema di riconoscimento facciale potrebbe diventare uno strumento di supporto per le indagini di polizia. Ma, se non adeguatamente regolamentato, potrebbe sollevare problemi che interferirebbero con la tutela della privacy.

Queste macchine diventano sempre più precise. Per questo motivo assume ancora più importanza il come e il quando adottarle. Immagina la capacità di una tecnologia per la lettura labiale con il 76% di accuratezza. Uniscila a un sistema di riconoscimento facciale che funziona anche al buio. Ottieni una tecnologia da paura. Sistemi del genere potrebbero essere adottati per la sorveglianza di luoghi pubblici e privati. E allora basterà una violazione del sistema o una condotta illecita da parte di chi vi ha accesso per mettere a rischio la vita privata delle persone.

È il progresso dell’intelligenza artificiale. Abbiamo il doppio lato della medaglia. Da una parte la possibilità di rintracciare e incastrare criminali. Dall’altra il pericolo dell’archiviazione di immagini del proprio volto e delle ricostruzioni delle conversazioni. Anche quelle che non avranno rilevanza per le indagini.

Non è sicuramente uno scenario auspicabile. Ormai sappiamo benissimo che queste tecnologie, purtroppo, possono essere utilizzate per scopi ostili anche da chi meno ce lo aspettiamo. Vedi lo scandalo Datagate dell’NSA.

 

Fin dove riusciremo ad arrivare?

Tuttavia, queste minacce sono ancora lontane. La tecnologia per la lettura labiale dell’UEA, al momento, non è precisissima. Ha una percentuale di accuratezza nel riconoscimento delle singole parole che oscilla tra il 10 e il 20%. È ancora poco. Inoltre dobbiamo considerare che il modello adottato dai ricercatori si basa solo sulla lingua inglese. Ogni linguaggio possiede le sue peculiarità. Ciò rappresenta una grande sfida per gli scienziati che sviluppano sistemi di lettura del labiale e per il settore dell’intelligenza artificiale in generale.

In futuro la tecnologia per la lettura labiale dell’UEA verrà combinata con altre tecniche predittive di linguistica. La lettura labiale verrà migliorata ulteriormente  tramite dispositivi digitali. Lo ha confermato proprio la dottoressa Bear: “È esattamente ciò che amerei essere capace di fare. Avere qualcosa di così forte sarebbe incredibile, ma ci vorrà ancora più lavoro. Non andrà sul mercato in tempi brevi.“. Quindi, è solo questione di tempo. Prima o poi avremo a che fare con queste tecnologie, con tutti i loro vantaggi e i loro rischi.


Fonti: ueatechcrunch

Fonte immagine: Flickr


Lascia un commento

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.