Viernes, 22 de Noviembre 2024
Tecnología | Desarrolló un código para identificar datos en grabaciones

El INAOE diseña buscador mexicano para archivos de audio

El proyecto se orientó a la utilización de la codificación fonética que generalizará la pronunciación de las palabras para ser más eficiente

Por: EL INFORMADOR

El proyecto cuenta con el financiamiento de la SEP-Conacyt. ID  /

El proyecto cuenta con el financiamiento de la SEP-Conacyt. ID /

CIUDAD DE MÉXICO (20/OCT/2012).- La búsqueda de información en archivos de audio es una actividad frecuente en dependencias públicas como la Presidencia y la Secretaría de Gobernación, así como en el Congreso de la Unión, programas de radio y televisión, e incluso en redacciones de revistas y periódicos; sin embargo, para recuperar cierto contenido se requiere la transcripción íntegra del archivo.

Aun cuando en la actualidad existen diversos software que llevan a cabo la tarea de convertir el archivo de audio en texto, suelen cometer errores por ruido ambiente o por vocablos que no reconocen. Con el propósito de facilitar este trabajo, investigadores del Instituto Nacional de Astrofísica Óptica y Electrónica (INAOE) trabajan con algoritmos de codificación fonética, gracias a los cuales podrá ubicarse el punto exacto en el que se encuentran los datos deseados dentro de la grabación.

De acuerdo con el doctor Luis Villaseñor Pineda, titular del proyecto, este algoritmo permite asignar el mismo código fonético a palabras con pronunciación similar, lo cual facilitará abordar los errores de la transcripción.

Explicó el especialista que el algoritmo se aplica a la transcripción del archivo de voz, por lo que a partir del código se representará con números la forma en que se pronuncia la palabra, lo cual permitirá que el buscador automático ubique los fragmentos exactos en los que aparece la información deseada.

Aseguró que este tipo de algoritmos de codificación fonética existen para el idioma inglés; sin embargo, el que se desarrolla en este Centro Público de Investigación Conacyt será el primero orientado al español que garantice mayor fidelidad al recuperar información, pues los errores que ocurren al trascribir serán menos relevantes.

Para llevar a cabo esta investigación, señaló el académico, no se desarrolló un reconocedor de voz propio ni se mejoró el funcionamiento de uno comercial, pues estos programas siempre tienen problemas, debido a que el lenguaje cambia constantemente y quedan palabras fuera del vocabulario del software.

En función de ello, el proyecto se orientó a la utilización de la codificación fonética que generalizará la pronunciación de las palabras, gracias a la cual resultarán más eficientes las búsquedas en los archivos de sonido.

Pese a que Villaseñor Pineda advirtió que de emplearse comercialmente sería necesario trabajar en la manera en que se presentan los resultados, debido a que la idea final es mostrar el fragmento específico dentro del audio o video y no en la transcripción.

Además, expuso el investigador que la recuperación de información es la labor que realizan habitualmente los buscadores de internet; consiste en encontrar por medios automáticos una determinada pieza de información dentro de una colección de documentos a partir de una petición o consulta.

En el caso de los documentos orales, dijo el doctor Luis Villaseñor Pineda, es imprescindible realizar la transformación de voz a texto para lograr aplicar las técnicas desarrolladas de recuperación de información.

Cabe señalar que este proyecto de búsqueda automática de datos en archivos de voz cuenta con el financiamiento del Fondo Sectorial Investigación Básica SEP-Conacyt.

Con información de la Agencia de la ID

Temas

Lee También

Recibe las últimas noticias en tu e-mail

Todo lo que necesitas saber para comenzar tu día

Registrarse implica aceptar los Términos y Condiciones