Un planteamiento híbrido de la traducción automática

En el ámbito de la investigación académica se ha prestado una atención considerable a la traducción automática (TA) estadística, pero en la práctica siguen siendo dominantes las arquitecturas tradicionales de traducción automática basada en reglas (RBMT). Ello se debe a la existencia de argumentos a favor y en contra de las dos alternativas.

Ante esta situación, los responsables del proyecto HYGHTRA (A hybrid high quality translation system) propusieron una arquitectura híbrida que conjugaba las virtudes de los dos planteamientos y mitigaba sus puntos débiles de cara a obtener una TA de gran calidad. La iniciativa se emprendió a modo de proyecto de colaboración entre una escuela universitaria de traductología y una empresa de ingeniería del lenguaje, ambas alemanas.

Los integrantes del proyecto idearon una metodología y establecieron una serie de recursos y herramientas informáticas que integran con rapidez nuevas lenguas y directrices traductológicas en un sistema de TA basado en reglas valiéndose de técnicas de TA estadística.

Los trabajos condujeron también a una infraestructura de desarrollo modular. Ello dio lugar a una nueva gama de productos y servicios que, con posterioridad, el socio industrial ha introducido en mercados nuevos y diferentes a los de los usuarios tradicionales de la TA. En concreto, módulos para análisis lingüístico detallado y generación de lenguaje, extracción terminológica y apoyo al proceso de traducción colaborativa.

El equipo estudió asimismo usos novedosos de la tecnología de TA en ámbitos como el aprendizaje de idiomas y la formación de traductores. Así, propuso un método con base pedagógica y diferentes situaciones tipo donde usar la TA para apoyar el proceso de aprendizaje de idiomas en alumnos avanzados.

Las metodologías creadas poseen relevancia para la conformación de gramáticas y diccionarios con anotaciones profusas a partir de colecciones extensas de textos, la extracción de bases de datos de traducciones equivalentes, la preparación de gramáticas y diccionarios electrónicos para lenguajes nuevos y muy similares, y la desambiguación estadística de aplicaciones contrapuestas de reglas de análisis sintáctico. Al impartir un módulo a nivel universitario titulado «Inglés para traductores», se ensayaron situaciones tipo con base pedagógica para el uso de la TA de cara a generar pruebas lingüísticas negativas para el aprendizaje avanzado de idiomas y la formación de traductores.

Entre las actividades realizadas en el seno del proyecto hubo también una serie de talleres sobre lingüística computacional enmarcados en destacados congresos internacionales. A esos talleres acudió un conjunto de investigadores dedicados a la TA y de desarrolladores privados de programas de TA interesados en enfoques híbridos de la TA.

Una destacada aportación científica de HYGHTRA consiste en el desarrollo de una forma nueva de construir sistemas híbridos de TA, añadiendo técnicas estadísticas a la ya existente RBMT de gran cobertura. El núcleo de la arquitectura del sistema sigue estando basado en reglas, pero se dispone de métodos estadísticos que facilitan un desarrollo rápido de gramáticas y diccionarios de cara a contar con nuevas directrices traductológicas. Ello ayuda a mantener la exactitud del análisis lingüístico y a reducir la «huella computacional».

publicado: 2015-11-13
Comentarios


Privacy Policy