La Universidad Tecnológica de Sydney ha presentado DeWave, un modelo de inteligencia artificial capaz de traducir pensamientos humanos en texto. Esta innovadora tecnología utiliza una combinación de electroencefalografía (EEG), interfaces cerebro-computadora y grandes modelos de lenguaje para decodificar la actividad cerebral, lo que representa un importante avance en la comunicación de cerebro a texto. Este avance refleja los avances documentados en el trabajo de investigación “BRAIN DECODING: TOWARD REAL-TIME RECONSTRUCTION OF VISUAL PERCEPTION” de Yohann Benchetrit, Hubert Banville y Jean-Remi King.
Explorando el aumento de 2023 en el mercado de la IA y el papel de Nvidia en medio de los desafíos tecnológicosDeWave simplifica el proceso de traducir pensamientos a texto, distinguiéndose de otras tecnologías en este espacio. Los usuarios sólo necesitan usar unos auriculares EEG y activar sus pensamientos para permitir la traducción. Este método es notablemente menos invasivo en comparación con otras tecnologías, como Neuralink de Elon Musk, que requiere la implantación quirúrgica de un chip de interfaz cerebro-máquina. El enfoque de DeWave ofrece una solución más accesible y no invasiva, lo que la convierte en una herramienta potencialmente revolucionaria para quienes tienen problemas del habla debido a afecciones como derrames cerebrales, trombosis cerebral o sordera. Actualmente, DeWave alcanza una tasa de precisión de aproximadamente el 40% en sus traducciones.
La importancia de esta tecnología fue reconocida a nivel mundial cuando fue seleccionada como un documento importante en la conferencia NeurIPS, una de las reuniones más prestigiosas en la comunidad de aprendizaje automático. El enfoque de DeWave es algo similar a un proyecto de Meta, que utilizó MEG (magnetoencefalografía) para reconstruir procesos de imágenes del cerebro humano. Ambas iniciativas comparten el objetivo común de capturar y decodificar la actividad cerebral débil mediante herramientas EEG y MEG. Después de adquirir los datos cerebrales sin procesar, los investigadores emplean grandes modelos de lenguaje para decodificarlos, extrayendo información visual y textual crucial. Este proceso es fundamental para traducir y reconstruir pensamientos e imágenes mentales humanas.
El impacto generalizado de la IA y la dinámica de la fuerza laboral en 2023La tecnología central de DeWave implica transformar señales continuas de ondas cerebrales en códigos discretos. Esto se logra utilizando una estructura conocida como codificador variacional cuantificado vectorial, que convierte las señales de ondas cerebrales recibidas en una serie de representaciones de características vectorizadas. Luego, estas representaciones se convierten en una serie de códigos discretos, cada uno de los cuales corresponde a un vector de palabras discreto en un libro de códigos. El libro de códigos funciona como un diccionario y contiene un número limitado de vectores de palabras discretos. El vector de palabras discreto más coincidente del libro de códigos se utiliza para obtener el código discreto correspondiente. Una vez que se obtiene una serie de códigos discretos, se pueden procesar como vectores de palabras del lenguaje e ingresarlos en un modelo de lenguaje grande previamente entrenado para generar el contenido del texto traducido.
A pesar de su enfoque innovador y sus posibles aplicaciones, DeWave no está exento de desafíos. La dependencia del modelo de modelos de lenguaje previamente entrenados como BART limita su rendimiento a la calidad y capacidades de estos modelos. Si el modelo de lenguaje previamente entrenado carece de precisión o una comprensión amplia del lenguaje, podría afectar el rendimiento de traducción del método DeWave. Además, el proceso de entrenamiento del método DeWave requiere el uso de datos de pares de texto y ondas cerebrales paralelos para el aprendizaje supervisado. La adquisición de datos paralelos a gran escala puede resultar difícil o costosa para determinadas tareas, lo que podría limitar el rendimiento del método DeWave. Otra limitación es la dependencia del modelo de los datos etiquetados. A pesar de las afirmaciones de poder traducir ondas cerebrales en texto sin etiquetas, como el seguimiento ocular, DeWave todavía depende de un proceso de alineación basado en etiquetas. Utiliza marcadores de eventos para segmentar ondas cerebrales en características a nivel de palabra, lo que podría provocar imprecisiones en la traducción y segmentación en ausencia de etiquetas.
Revelando a los pioneros: las 10 principales empresas de IA generativa a las que hay que prestar atenciónEn conclusión, DeWave representa un importante paso adelante en el campo de la IA y la neurociencia. Al permitir la traducción de pensamientos humanos a texto, abre nuevas posibilidades de comunicación, especialmente para aquellas personas con problemas del habla. Sin embargo, como cualquier tecnología pionera, enfrenta desafíos y limitaciones que deberán abordarse en desarrollos futuros. A medida que la investigación y la tecnología continúan avanzando, DeWave tiene el potencial de convertirse en una herramienta aún más eficaz para cerrar la brecha entre el pensamiento humano y la comunicación.
Fuente de la imagen: Shutterstock