TC-STAR Transcriptions of Spanish Parliamentary Speech

Transcriptions des discours du parlement espagnol TC-STAR




TC-STAR is a European integrated project focusing on all core technologies for Speech-to-Speech Translation (SST): Automatic Speech Recognition (ASR), Spoken Language Translation (SLT), and Text to Speech Synthesis (TTS).

This corpus consists of the transcriptions of 100 hours of Spanish Parliamentary speech. These comprise the following:
a) 38:24 hours of speech recorded from the Spanish Parliament during plenary sessions and commissions between September 2004 and December 2004, and
b) 61:53 hours of speech recorded from the European Parliament speaking in the parliamentary plenary sessions as well as recordings of interpreters, between May 2004 and January 2005.

The corresponding recordings are made available separately in this catalogue as TC-STAR Spanish Training Corpora for ASR: Recordings of EPPS Speech (ref. ELRA-S0252).

TC-STAR est un projet intégré européen dédié à toutes les technologies de base pour la traduction parole-parole (ou SST pour Speech-to-Speech Translation) : reconnaissance automatique de la parole (ou ASR pour « Automatic Speech Recognition »), traduction de la langue parlée (ou SLT pour « Spoken Language Translation ») et technologies texte-parole (ou TTS pour « Text-to-Speech »).

Ce corpus comprend les transcriptions de 100 heures de parole du Parlement espagnol. Celles-ci sont composées comme suit:
a) 38:24 heures de parole enregistrées par le Parlement espagnol pendant les sessions plénières et les commissions entre septembre 2004 et décembre 2004, et
b) 61:53 heures de parole enregistrées par le Parlement espagnol pendant les sessions plénières parlementaires ainsi que les enregistrements des interprètes, entre mai 2004 et janvier 2005.

Les enregistrements correspondants sont disponibles de façon distincte dans ce catalogue dans le Corpus d’entraînement TC-STAR espagnol pour l’ASR: Enregistrements EPPS (réf. ELRA-S0252).

