Os neuroengineers de Colômbia criam o sistema novo para traduzir pensamentos no discurso

Em um primeiro científico, os neuroengineers de Colômbia criaram um sistema que traduzisse o pensamento no discurso inteligível, reconhecível. Monitorando alguém a actividade de cérebro, a tecnologia pode reconstruir as palavras que uma pessoa se ouve com claridade inaudita. Esta descoberta, que aproveita a potência de sintetizadores de discurso e da inteligência artificial, poderia conduzir às maneiras novas para que os computadores comuniquem-se directamente com o cérebro. Igualmente coloca o fundamento para os povos de ajuda que não podem falar, como aqueles vivendo com como a esclerose de lateral amyotrophic (ALS) ou recuperando do curso, recuperar sua capacidade para comunicar-se com o mundo exterior.

Estes resultados foram publicados hoje em relatórios científicos.

“Nossas vozes ajudam a conectar-nos a nossos amigos, família e o mundo em torno de nós, que é porque perder a potência de sua voz devido a ferimento ou à doença é tão devastador,” disse Nima Mesgarani, PhD, autor superior do papel e um investigador principal no instituto do comportamento do cérebro do Mortimer B. Zuckerman Mente da Universidade de Columbia. “Com estudo de hoje, nós temos uma maneira potencial de restaurar essa potência. Nós mostramos que, com a tecnologia direita, os pensamentos destes povos poderiam ser descodificados e compreendido por todo o ouvinte.”

As décadas da pesquisa mostraram aquela quando os povos falam -- ou mesmo imagine falar -- os testes padrões indicadores da actividade aparecem em seu cérebro. O teste padrão distinto (mas reconhecível) dos sinais igualmente emerge quando nós escutamos alguém falamos, ou imaginamos escutar. Os peritos, tentando gravar e descodificar estes testes padrões, vêem um futuro em que os pensamentos não precisam de permanecer escondidos dentro do cérebro -- mas pelo contrário podia ser traduzido no discurso verbal na vontade.

Mas realizar este repto provou o desafio. Os esforços adiantados para descodificar sinais do cérebro pelo Dr. Mesgarani e outro centraram-se sobre modelos de computador simples que os spectrograms analisados, que são representações visuais de freqüências sadias.

Mas porque esta aproximação não produziu qualquer coisa que se assemelha ao discurso inteligível, a equipe do Dr. Mesgarani girou pelo contrário para um vocoder, um algoritmo do computador que pudesse sintetizar o discurso após a formação em gravações da fala dos povos.

“Esta é a mesma tecnologia usada pelo eco das Amazonas e Apple Siri para dar respostas verbais a nossas perguntas,” disse o Dr. Mesgarani, que é igualmente um professor adjunto da engenharia elétrica na escola de fundação do Fu de Colômbia da engenharia e de ciência aplicada.

Para ensinar o vocoder para interpretar à actividade de cérebro, o Dr. Mesgarani teamed acima com Ashesh Dinesh Mehta, DM, PhD, um neurocirurgião no instituto da neurociência dos sócios do médico da saúde de Northwell e co-autor do papel de hoje. O Dr. Mehta trata os pacientes da epilepsia, algum de quem deve se submeter a cirurgias regulares.

“Trabalhando com Dr. Mehta, nós perguntamos aos pacientes da epilepsia já que submetem-se à cirurgia de cérebro para escutar as frases faladas por povos diferentes, quando nós medimos testes padrões da actividade de cérebro,” dissemos o Dr. Mesgarani. “Estes testes padrões neurais treinaram o vocoder.”

Em seguida, os pesquisadores pediram que àqueles os mesmos pacientes escutassem os oradores que relatam dígitos entre 0 a 9, quando os sinais de gravação do cérebro que poderiam então ser executados através do vocoder. O som produzido pelo vocoder em resposta 2 aqueles sinais foi analisado e limpado pelas redes neurais, um tipo de inteligência artificial que imita a estrutura dos neurônios no cérebro biológico.

O resultado final era uma voz desom que relata uma seqüência dos números. Para testar a precisão da gravação, o Dr. Mesgarani e sua equipe encarregaram indivíduos de escutar a gravação e de relatar o que se ouviu.

“Nós encontramos que os povos poderiam compreender e para repetir os sons aproximadamente 75% do tempo, que é bem acima e além de todas as tentativas precedentes,” dissemos o Dr. Mesgarani. A melhoria na inteligibilidade era especialmente evidente ao comparar as gravações novas às tentativas mais adiantadas, spectrogram-baseadas. “O vocoder sensível e as redes neurais poderosas representaram os sons que os pacientes tinham escutado originalmente com a precisão surpreendente.”

O Dr. Mesgarani e sua equipe planeia testar em seguida umas palavras e umas frases mais complicadas, e querem executar os mesmos testes nos sinais do cérebro emissores quando uma pessoa fala ou imagina falar. Finalmente, esperam que seu sistema poderia ser peça de um implante, similar àqueles gastos por alguns pacientes da epilepsia, que traduza os pensamentos do portador directamente em palavras.

“Nesta encenação, se o portador me pensa “precise um vidro da água, “nosso sistema poderia tomar os sinais do cérebro gerados por esse pensamento, e transforma-os no sintetizado, discurso verbal,” disse o Dr. Mesgarani. “Este seria um cambiador do jogo. Daria qualquer um que perdeu sua capacidade para falar, se com ferimento ou a doença, a possibilidade renovada conectar ao mundo em torno deles.”

Source: https://zuckermaninstitute.columbia.edu/