Un'iniziativa sostenuta da Facebook che mira a consentire alle persone di digitare pensando si è conclusa con nuove scoperte pubblicate oggi.
Il progetto Steno è stato una collaborazione pluriennale tra Facebook e il Chang Lab dell'Università della California di San Francisco, con l'obiettivo di creare un sistema che traduce l'attività cerebrale in parole. Un nuovo documento di ricerca, pubblicato sul New England Journal of Medicine, mostra il potenziale per l'implementazione della tecnologia per le persone con disabilità del linguaggio.
Ma insieme alla ricerca, Facebook ha chiarito che sta rifiutando l'idea di un dispositivo commerciale per la lettura del cervello montato sulla testa e sta costruendo invece interfacce indossate dal polso. La nuova ricerca non ha una chiara applicabilità per un prodotto tecnologico per il mercato di massa e, in un comunicato stampa, Facebook ha affermato che sta “rifocalizzando” le sue priorità lontano dalle interfacce cervello-computer montate sulla testa.
“Facebook non è interessato a sviluppo di prodotti che richiedono elettrodi impiantati”
“Per essere chiari, Facebook non ha interesse a sviluppare prodotti che richiedono elettrodi impiantati”, ha affermato Facebook in un comunicato stampa. Altrove nel comunicato, ha osservato che “mentre crediamo ancora nel potenziale a lungo termine delle tecnologie BCI ottiche montate sulla testa, abbiamo deciso di concentrare i nostri sforzi immediati su un diverso approccio di interfaccia neurale che ha un percorso a più breve termine per mercato.”
La ricerca in corso del Chang Lab prevede l'utilizzo di interfacce cervello-computer (BCI) impiantate per ripristinare le capacità linguistiche delle persone. Il nuovo articolo si concentra su un partecipante che ha perso la capacità di parlare dopo un ictus più di 16 anni fa. Il laboratorio ha dotato l'uomo di elettrodi impiantati in grado di rilevare l'attività cerebrale. L'uomo ha quindi trascorso 22 ore (distribuite su più di un anno di sessioni) addestrando un sistema per riconoscere modelli specifici. In quella formazione, avrebbe tentato di pronunciare parole isolate da un set di vocaboli di 50 parole. In un altro corso di formazione, ha cercato di produrre frasi complete usando quelle parole, che includevano verbi e pronomi di base (come “sono” e “io”), nonché nomi utili specifici (come “occhiali” e “computer”) e comandi ( come “sì” e “no”).
Il sistema decodifica i modelli del cervello per 50 parole
Questa formazione ha contribuito a creare un modello linguistico in grado di rispondere quando l'uomo stava pensando di pronunciare determinate parole, anche se in realtà non poteva pronunciarle. I ricercatori hanno messo a punto il modello per prevedere a quale delle 50 parole stesse pensando, integrando un sistema di probabilità per modelli di lingua inglese simile a una tastiera predittiva per smartphone. I ricercatori hanno riferito che nelle prove finali, il sistema potrebbe decodificare una velocità media di 15,2 parole al minuto, contando gli errori, o 12,5 parole al minuto con solo parole decodificate correttamente.
Il Chang Lab ha pubblicato una precedente ricerca del progetto Steno nel 2019 e nel 2020, dimostrando che gli array di elettrodi e i modelli predittivi possono creare sistemi di digitazione del pensiero relativamente veloci e sofisticati. Molte opzioni di digitazione precedenti prevedevano di spingere mentalmente un cursore attorno a una tastiera su schermo utilizzando un impianto cerebrale, sebbene alcuni altri ricercatori abbiano sperimentato metodi come la visualizzazione della scrittura a mano. Laddove la precedente ricerca del laboratorio riguardava la decodifica dell'attività cerebrale in persone che parlavano normalmente, quest'ultimo documento dimostra che funziona anche quando i soggetti non parlano (e non possono) parlare ad alta voce.
In un comunicato stampa, il presidente di neurochirurgia della UCSF Eddie Chang afferma che il prossimo passo è migliorare il sistema e testarlo con più persone. “Per quanto riguarda l'hardware, dobbiamo creare sistemi con una risoluzione dei dati più elevata per registrare più informazioni dal cervello e più rapidamente. Per quanto riguarda l'algoritmo, abbiamo bisogno di sistemi in grado di tradurre questi segnali molto complessi dal cervello in parole pronunciate, non in testo, ma in parole pronunciate orali e udibili”. Una delle principali priorità, afferma Chang, è ampliare notevolmente il vocabolario.
Facebook si concentrerà sui cinturini EMG montati sul polso
La ricerca di oggi è preziosa per le persone che non sono servite da tastiere e altre interfacce esistenti, poiché anche un vocabolario limitato può aiutarle a comunicare più facilmente. Ma è molto al di sotto dell'ambizioso obiettivo che Facebook si è prefissato nel 2017: un sistema BCI non invasivo che consentirebbe alle persone di digitare 100 parole al minuto, paragonabili alle velocità massime che potrebbero raggiungere su una tastiera tradizionale. L'ultima ricerca dell'UCSF riguarda la tecnologia impiantata e non si avvicina a quel numero, o addirittura alle velocità che la maggior parte delle persone può raggiungere sulla tastiera di un telefono. Ciò è di cattivo auspicio per le prospettive commerciali di una tecnologia come una fascia esterna che misura otticamente i livelli di ossigeno nel cervello, che Facebook Reality Labs (l'ala hardware dell'azienda di realtà virtuale e aumentata) ha presentato in forma di prototipo.
Da allora, Facebook ha acquisito la società di braccialetti per elettromiografia (EMG) CTRL-Labs nel 2019, offrendogli un'opzione di controllo alternativa per AR e VR. “Siamo ancora nelle prime fasi per sbloccare il potenziale dell'elettromiografia da polso (EMG), ma crediamo che sarà l'input principale per gli occhiali AR e l'applicazione di ciò che abbiamo appreso su BCI ci aiuterà ad arrivarci più velocemente “, afferma il direttore della ricerca di Facebook Reality Labs Sean Keller. Facebook non rinuncerà completamente al sistema di interfaccia cerebrale montato sulla testa, ma sta pianificando di rendere il software open-source e condividere i prototipi hardware con ricercatori esterni, mentre chiude la propria ricerca.