Los centros de investigación y desarrollo (I + D) globales de Samsung Electronics continúan siendo pioneros en su investigación sobre inteligencia artificial (IA). Tras varios premios globales de IA y el reconocimiento de la industria a los investigadores de Samsung en todo el mundo, investigadores de Polonia y China ganaron recientemente una serie de Desafíos de IA globales muy prestigiosos.

Investigación líder en traducción de voz

El Instituto de Investigación y Desarrollo de Samsung Polonia y el Instituto de Investigación y Desarrollo de Samsung China-Beijing compitieron con algunas de las mejores universidades y laboratorios de investigación del mundo por el primer lugar en dos desafíos separados en el Taller internacional sobre traducción de idiomas hablados (IWSLT), uno de los talleres de traducción de lenguaje automático más antiguos del mundo. Este año, el IWSLT se unió a la conferencia de la Asociación de Lingüística Computacional (ACL), una conferencia líder en el campo de la lingüística computacional, para cubrir una amplia gama de áreas de investigación relevantes para enfoques informáticos del lenguaje natural.

Para la tarea de traducción de voz sin conexión, que evalúa la traducción de conferencias TED del inglés al alemán, el Samsung R&D Institute Polonia ganó el primer lugar por segunda vez con sus propias capacidades de investigación de traducción de audio-texto. La concesión de este premio marca el cuarto año consecutivo en que los equipos de Samsung R&D Institute Polonia han ganado el primer premio en los desafíos de IWSLT, incluidas las tareas de traducción de textos de años anteriores.

La tarea de traducción de voz sin conexión de este año permitió a los participantes enviar sistemas basados ​​en el sistema de canalización de traducción de voz tradicional que consiste en reconocimiento automático de voz (ASR) y reconocimiento automático de voz (ASR) traducción automática (MT) o sistema de extremo a extremo (E2E). El sistema de Samsung R&D Institute Poland se basa en una única red neuronal profunda de codificador-decodificador, un sistema E2E, capaz de leer textos en inglés y alemán.

En lingüística computacional, los sistemas E2E se explotan para resolver el problema común de la acumulación de errores, donde en una tubería tradicional un error en la fase de reconocimiento de voz puede conducir a una traducción absurda. Sin embargo, la investigación de los últimos tres años ha demostrado que los sistemas tradicionales superan sistemáticamente a los sistemas de traducción de voz E2E. El sistema del equipo de Samsung no solo ocupó el primer lugar en la categoría E2E, sino que también superó a todos los participantes de los sistemas de tuberías tradicionales, un logro notable que coloca al Instituto de I + D de Samsung en Polonia a la vanguardia de la investigación. sobre la traducción de voz.

El equipo de Samsung R&D Institute Poland que participó en los desafíos IWSLT de este año

Enfoques innovadores en el campo de la IA lingüística computacional

El Instituto de Investigación y Desarrollo de Samsung China-Beijing participó en un segundo desafío, con la tarea de Traducción de dominio abierto que evaluó la capacidad de traducir del japonés al chino, y finalmente ocupó el primer lugar. Los principales objetivos de esta tarea fueron la promoción de la investigación sobre la traducción entre el idioma asiático, la explotación de ruidosos corpus web paralelos para la traducción automática y la gestión cuidadosa de la procedencia de los datos.

Samsung R&D Institute China-Beijing introdujo un sistema basado en la arquitectura del modelo Transformer y adoptó la atención posicional relativa. El equipo se centró en mejorar el sistema central Transform con un extenso preprocesamiento de datos y logró lograr mejoras significativas. El equipo también intentó incorporar palabras compartidas y exclusivas y comparó diferentes granularidades de tokens, abordando el proceso a nivel de subpalabras, incluida la codificación de pares de bytes. (BPE) y la sentencia. La traducción inversa a gran escala en un corpus monolingüe se ha utilizado para mejorar el rendimiento de la traducción automática neuronal (NMT).

Miembros del equipo de Samsung R&D Institute China-Beijing que participaron en los desafíos IWSLT de este año

Logros en la interpretación de la señal de audio de IA

Además de su primer lugar en el desafío IWSLT, Samsung R&D Institute Poland también fue reconocido como uno de los equipos líderes en el Desafío 2020 de detección y clasificación de eventos y escenas acústicas (DCASE), organizado por el IEEE. (Instituto de Ingenieros Eléctricos y Electrónicos), cuyo objetivo es utilizar tecnología de inteligencia artificial de vanguardia para comprender e interpretar señales de audio.

Los ingenieros del Samsung R&D Institute Polonia, que tienen experiencia previa en las tareas de comprensión de escenas acústicas y localización de fuentes de sonido (después de ocupar el primer lugar en dos tareas en 2019), se centraron en Tarea 2: Detección no supervisada de sonidos anormales para el monitoreo del estado de la máquina. El propósito de esta tarea era identificar si el sonido emitido por una máquina objetivo era normal o anormal. El principal desafío fue detectar sonidos anómalos desconocidos en condiciones en las que solo se proporcionaron muestras de sonido normales como datos de entrenamiento. Los ingenieros ocuparon el segundo lugar de 40 equipos.

El equipo de Polonia del Instituto de I + D de Samsung que participó en el desafío DCASE de este año

Visualizando el futuro de la visión por computadora y el reconocimiento de patrones

En junio, el Samsung R&D Institute China-Beijing también participó en tres desafíos organizados por la Conferencia de reconocimiento de patrones y visión por computadora de 2020 (CVPR 2020): el desafío de IA incorporada, el desafío de VizWiz-Captions y el video VATEX. Desafío de subtítulos. El equipo ganó el segundo lugar en los desafíos.

El desafío Embodied AI tenía como objetivo permitir a los robots comprender los comandos humanos y realizar acciones correctas en un entorno virtual, mientras que el desafío VizWiz-Captions implicaba predecir una leyenda precisa cuando una imagen fue tomada por un Se le dio a una persona con discapacidad visual y el desafío de subtítulos de video VATEX tenía como objetivo evaluar el progreso hacia modelos capaces de describir videos en diferentes idiomas, incluidos inglés y chino.

Miembros del equipo China-Beijing del Samsung R&D Institute que participaron en los desafíos CVPR de este año

Dejar un comentario

Deja un comentario