En el Workshop on Machine Translation (WMT), uno de los mayores eventos de investigación de traducción automática, Samsung Electronics se unió a las filas de investigadores de todo el mundo para analizar formas nuevas e innovadoras de comprender el lenguaje humano utilizando máquinas y programas informáticos.

Samsung Research y Samsung R&D Institute Poland (SRPOL) participaron en una competencia entre grupos científicos y laboratorios para comparar la calidad de sus herramientas de traducción. Equipos de todo el mundo participaron en los ocho concursos de tareas de traducción automática, que iban desde empresas muy conocidas hasta grupos de investigación de varias universidades.

El laboratorio de idiomas del Samsung Research Global AI Center participó en la tarea de traducción biomédica, cuyo objetivo es evaluar los sistemas de traducción de oraciones en el campo biomédico. La tarea cubrió un total de 14 pares de idiomas, incluidos inglés, francés, alemán y español. El equipo ganó el primer premio por la traducción eficaz de dos pares de idiomas: inglés → español y español → inglés. Esta fue una hazaña particularmente impresionante debido al uso frecuente de la terminología del campo en el campo biomédico.

En el caso de la traducción de dominio específico, uno de los principales factores que determina la calidad de la traducción es la traducción terminológica. Incluso con la misma palabra, la palabra traducida puede variar según el campo y, en comparación con los términos generales, los términos técnicos se usan con menos frecuencia, lo que dificulta su aprendizaje. Dadas estas limitaciones, el Laboratorio de idiomas del Samsung Research Global AI Center mejoró el rendimiento de la traducción de dominios específicos al incorporar la traducción de terminología con restricciones suaves, que proporciona las restricciones de terminología del idioma de destino como entrada con oraciones de origen. dominio para que se refleje tanto como sea posible en los resultados de la traducción. Actualmente, Samsung Research está realizando investigaciones de traducción de dominios específicos, incluida la prestación de un servicio de traducción de patentes (coreano).inglés) en el servicio de traducción «SR Translate» de Samsung Research (https://translate.samsung.com).

▲ Laboratorio de idiomas del Centro Global de IA de Samsung Research

SRPOL también participó en dos tareas generales de traducción automática, logrando altas clasificaciones al quedar en segundo lugar en inglés → ruso e inglés → croata.

Durante las competencias, WMT solo proporciona a los equipos un número limitado de corpus, colecciones de textos estructurados, para analizar su modelo de traducción. Por lo tanto, el equipo de SRPOL atribuyó su éxito a la mejora de la calidad de los corpus a través de procesos como el preprocesamiento y filtrado de datos. Además, el equipo se centró en optimizar la arquitectura de su modelo y el proceso de formación de IA.

Usando el corpus mejorado, el equipo de traducción automática de SRPOL creó un clasificador utilizando un marco de aprendizaje automático llamado BERT (Representaciones de codificador bidireccional de transformadores). Este clasificador ha clasificado con éxito millones de oraciones del corpus en diferentes dominios. Como resultado, SRPOL pudo crear plantillas no solo para traducción general sino también médica y legal.

SRPOL ha logrado buenos resultados en el campo de la traducción automática, ganando los desafíos del Taller internacional sobre traducción de idiomas hablados (IWSLT), uno de los talleres más antiguos del mundo sobre traducción automática, durante cuatro años consecutivos de 2017 a 2020.

Hoy más que nunca, la meta de alcanzar un nivel humano de comprensión del lenguaje parece estar al alcance de la mano. A medida que la traducción automática y la comprensión de idiomas se vuelven parte de nuestra vida diaria, Samsung se mantendrá a la vanguardia de esta tecnología para crear las herramientas que superen las barreras del idioma y mejoren su vida diaria.

▲ Instituto de I+D de Samsung Polonia

Dejar un comentario

Deja un comentario