Le ricerche in corso sono numerose e i primi risultati già si intravedono nelle varie applicazioni di assistenti personali che arricchiscono le piattaforme Mobile come Siri di Apple, Google Now per Android e Cortana per Windows 10. Il futuro prossimo venturo potrebbe vedere un’interazione diretta, dialogante e conversazionale tra consumatori e i loro dispositivi gestita semplicemente attraverso l’uso della voce. Nulla di nuovo se si pensa ai numerosi film (Star Trek, 2001 Odissea nello spazio, Guerre stellari, Iron Man e soprattutto Her) che hanno anticipato e mostrato in che modo dispositivi tecnologici di varia forma e potenza potrebbero comunicare con gli umani. Le tecnologia mostrata nei film non è nata semplicemente dalla fantasia di sceneggiatori e registi ma ha pescato nei numerosi progetti di ricerca e svilppo, condotti da ingegneri ma anche linguisti e psicologi, che fin dagli anni settanta hanno implementato soluzioni utili ad una interazione vocale con la tecnologia, per prenotare un volo aereo, così come per attivare e gestire la casella di posta elettronica su un computer. Molti risultati di questi progetti sono stati eccezionali ma non sono mai diventati oggetto di strategie aziendali e commerciali per i loro costi e la impossibilità di costruirvi sopra dei modelli di scala e di distribuzione profittevoli.
Dai garage e dai piccoli laboratori di innovatori e visionari oggi lo sviluppo di nuove interfacce vocali è diventato strategico e oggetto di grandi investimenti da parte dei grandi produttori tecnologici, da Intel a Microsoft, da Amazon all’onnipresente Google oltre che di una miriade di startup. Obiettivo di tutti è essere protagonisti della prossima rivoluzione delle interfacce, quella che potrebbe trasformare la relazione e l’interazione uomo-macchina da tattile a vocale e trasformare radicalmente il nostro modo di vivere le nostre esperienze digitali. La rivoluzione, quando avverrà, sarà profonda perché eliminerà il bisogno di usare e apprendere linguaggi e sistemi di comunicazione diversi da quello naturale di cui tutti siamo dotati, la nostra lingua nazionale.
La strada per arrivare a destinazione è ancora lunga e complicata. I numerosi assistenti personali e le interfacce vocali fin qui disponibili sono limitate nelle loro conoscenze, funzionalità e capacità offerte e non posseggono ancora la potenza di un linguaggio umano. Sono ancora limitate nella loro capacità di contribuire a alimentare una vera conversazione senza dover suggerire di ricorrere ad una ricerca Google per ottenere una risposta e di ritornare ad una interazione tattile per farlo.
Le limitazioni attuali non sono però insuperabili e numerosi sono i progetti e i prototipi applicativi basati su qualche forma di intelligenza artificiale e grandi disponibilità di dati che permettono alle nuove interfacce applicative di interpretare comprendere le domande e fornire risposte adeguate e corrette. Ci sono già in fase di test avanzato applicazioni capaci di riconoscere istruzioni, comandi o richieste vocali e di elaborarle in tempo reale. Il tutto grazie alla grande convergenza che sta caratterizzando l’evoluzione tecnologica attuale. Una convergenza fatta da grandissima potenza di elaborazione da parte di processori di ultima generazione e computer sempre più veloci, da logiche e software avanzati per il riconoscimento della voce umana, connettività mobile, cloud computing, reti neurali e Big Data. Una convergenza che contribuirà grandemente anche alla riduzione dei costi e alla trasformazione di prototipi da laboratorio in prodotti commerciali.
Come è successo per altre rivoluzioni tecnologiche per essere vincente ogni nuova innovazione o tecnologia deve anche poter contare sulla maturazione e sul cambiamento della domanda. Oggi la maggioranza dei consumatori e degli utenti si è abituata alle gesture dei loro dispositivi con schermi tattili e stanno sperimentando con alterne e contrastanti percezioni le nuove interfacce vocali nella forma di assistenti personali o applicazioni per la macchina, la casa e numerosi oggetti che popolano la rete delle cose. La domanda è destinata a cambiare anche per i limiti percepiti delle interfacce grafiche e tattili attuali che non permettono di sfruttare al meglio le funzionalità e le caratteristiche tecniche di molte applicazioni oggi disponibili. Cambierà anche grazie al passaggio di molti possessori di smartphone alle nuove piattaforme di ultima generazione di Windows 10, iOS 9 e Android 6 ma anche delle nuove applicazioni con interfacce vocali che produttori come Facebook stanno introducendo, con l’obiettivo di semplificare l’interazione e potenziare la relazione o come Amazon con il suo prodotto Echo. Infine cambierà anche grazie a nuove generazioni di nativi digitali che già oggi hanno abbandonato strumenti di input come la tastiera e il mouse e generano i loro contenuti solamente attraverso gesti tattili rivolti agli schermi dei loro dispositivi mobili.
Quando offerta e domanda si incontreranno le nuove interfacce vocali potranno diffondersi e diventare pervasive. A quel punto l’interazione vocale con le macchine ci apparirà così naturale da praticarla normalmente in conversazioni e dialoghi simili a quelli praticati con altri esseri umani. Il tutto grazie ad agenti tecnologici intelligenti dotati di intelligenze artificiali sempre più evolute e capaci di personalizzare le loro prestazioni al loro interlocutore umano, sia in termini di caratteristiche della sua voce che di domande e interrogazioni poste.
Il futuro di queste nuove interfacce non è ora ma non è neppure molto lontano!
* Spunti per l'articolo tratti da un testo di David Pierce di WIRED.