El proyecto «Testing the portability of techniques to handle dissimilar
source and target languages in MT» (ENEUS), financiado con fondos de la
Unión Europea, reunió a expertos en los campos de la lingüística, la
informática y la traducción. El trabajo del equipo beneficiará a los
usuarios de herramientas de TA, además de contribuir al estudio de las
interacciones entre los lenguajes artificiales y los humanos.
ENEUS evaluó la posibilidad de aplicar la arquitectura de TA Matxin a
distintos pares de lenguas. Asimismo, estudió la validez del sistema
cuando la lengua de partida es analítica, como es el caso del inglés, y
la de destino aglutinante, como el vasco. Gracias a su capacidad de
análisis profundo, basado especialmente en la morfosintaxis, Matxin
ofreció buenos resultados de traducción entre lenguas dispares.
Tras adaptar el sistema español-vasco a la combinación inglés-vasco,
se creó una herramienta piloto de traducción automática basada en
reglas (RBMT). Este prototipo cuenta con 35 000 entradas. Permite
traducir oraciones simples afirmativas, negativas e interrogativas en
cualquier tiempo del indicativo para los cuatro paradigmas
sujeto-objeto, así como voces activas o pasivas e imperativos.
El equipo de ENEUS analizó las características aglutinantes y el
orden de las palabras en inglés, vasco, finés y húngaro, siendo las tres
últimas lenguas aglutinantes.
El consorcio logró demostrar que los sistemas de TAE (traducción
automática estadística) ofrecen resultados dispares con las distintas
lenguas aglutinantes, mientras que un planteamiento orientado a la
lengua origen podría resultar factible y pertinente en estos casos. Las
investigaciones sobre alineación de los pares inglés-finés,
inglés-húngaro e inglés-vasco dieron lugar al desarrollo de sistemas
ENEUS de TAE para todas las combinaciones citadas.
El programa de difusión de ENEUS incluía la realización de pruebas
piloto con más de quinientos usuarios, los cuales compararon cuatro
sistemas de TA entre el inglés y el vasco desarrollados por el consorcio
y el traductor más moderno lanzado por Google. Los resultados de la
evaluación dejaron patente que el sistema de TAE con reconocimiento
morfológico era tan eficaz como el traductor de Google, y que estas dos
herramientas superaban al resto.
El mejor sistema de ENEUS se ha integrado en la plataforma de
traducción Bologna Translation Service de Elhuyar, y los usuarios podrán
acceder a los prototipos de ENEUS a través de la página web de Matxin
(gestionada por
Elhuyar). El
sistema RBMT de TA es el primero de código abierto para la combinación
de lenguas inglés-vasco. Esta herramienta está a disposición de los
desarrolladores en
sourceforge
y ofrece opciones de desarrollo e investigación con el inglés y el
español como lenguas de partida y cualquier otro idioma como lengua de
destino.