Através da monitorização da atividade cerebral, a tecnologia agora apresentada no Scientific Reports, é capaz de reconstruir as palavras ouvidas com uma clareza sem precedentes, como refere, em comunicado o Instituto Zuckerman da Universidade Columbia, nos Estados Unidos.
Este avanço, que sublinha o poder dos sintetizadores de voz e da inteligência artificial, é visto como uma esperança para pessoas com deficiência ou incapacidade na fala. Segundo a equipa de neuroengenheiros e neurocientistas envolvida no trabalho, este pode ser o caminho para novas formas de comunicação direta entre os computadores e o cérebro e ajudar pessoas que não podem falar – tais como as que têm esclerose lateral amiotrófica ou sofreram um acidente vascular cerebral – a recuperarem a capacidade de comunicação.
Para conduzirem a sua tarefa, os cientistas usaram um sintetizador de voz humana em que um algoritmo num computador é capaz de sintetizar a fala depois de ter sido treinado com registos de conversação de pessoas.
O sintetizador foi “ensinado” a interpretar a atividade cerebral de doentes epiléticos que ouviram frases ditas por várias pessoas.
Aos doentes foi pedido que ouvissem também pessoas a enumerarem dígitos de 0 a 9 enquanto os sinais cerebrais por eles emitidos durante esta tarefa eram registados.
O som produzido pelo sintetizador de voz em resposta a estes sinais foi depois analisado e ‘limpo’ por redes de inteligência artificial que mimetizam a estrutura dos neurónios (células) no cérebro humano. O resultado obtido foi uma voz robótica a recitar uma sequência de números.
Para testar a fiabilidade da gravação, a mesma equipa científica pediu aos doentes para que ouvissem o registo e relatassem o que tinham ouvido.
“O sintetizador e as redes neuronais de inteligência artificial interpretavam com uma exatidão impressionante os sons que os doentes tinham inicialmente ouvido”, defendeu Nima Mesgarani, principal autor do estudo e investigador no Instituto Zuckerman da Universidade Columbia.
Num próximo passo, o seu grupo de trabalho pretende testar o sistema com palavras e frases mais complexas e pô-lo a traduzir para discurso verbal sintetizado os sinais cerebrais emitidos quando uma pessoa está a pensar.