
Europarl-ST: A Multilingual Corpus for Speech Translation of Parliamentary Debates
Demostrador
vrain
Demostrador
vrainEuroparl-ST es un corpus multilingüe de traducción del habla compuesto por muestras de audio-texto emparejadas, basado en las grabaciones de debates del Parlamento Europeo en el período comprendido entre 2008 y 2012. Contiene tripletas de audio-transcripción-traducción desde y hacia 9 idiomas europeos, lo que supone un total de 72 direcciones de traducción diferentes. El corpus se publica bajo licencia Creative Commons y es de libre acceso y descarga. Los detalles completos del corpus están disponibles en el artículo “Europarl-ST: A Multilingual Corpus For Speech Translation Of Parliamentary Debates” (Iranzo-Sánchez et al., ICASSP 2020).
Desarrollo de sistemas de traducción del habla. Desarrollo de sistemas de traducción automática. Desarrollo de sistemas de reconocimiento de voz.
* Reconocimiento automático del habla (ASR)* Traducción automática (MT) * Síntesis del habla.