TRAD Pashto-French Parallel corpus of transcribed Broadcast News Speech - Test data

View resource name in all available languages

Corpus TRAD parallèle pachto-français (transcriptions d’actualités radio et télédiffusées) - Données de test

547-897-479-723-3

ID:

ELRA-W0094

This is a parallel corpus, which contains 10,000 Pashto words translated into French by two different translators. The source texts come from 3 broadcast news transcriptions of the TRAD Pashto Broadcast News Speech Corpus (ELRA-S0381). These texts are VOA Ashna TV programs recorded on 15/01/2011, 18/01/2011 and 19/01/2011. These translations are different from the one provided in the TRAD Pashto-French Parallel corpus of transcribed Broadcast News Speech - Training set (ELRA-W0093).

The content has also been translated into English (see ELRA-W0095 TRAD Pashto-English Parallel corpus of transcribed Broadcast News Speech).

Pashto is an indo-iranian language spoken by the Pashtun people mainly in Pakistan and Afghanistan.

This corpus was produced by ELDA within the PEA TRAD project supported by the French Ministry of Defence (DGA). It was used as a test set for an internal MT evaluation campaign.

View resource description in French

Il s’agit d’un corpus parallèle qui contient 10 000 mots en pachto traduits vers le français par deux traducteurs différents. Les textes sources correspondent à la transcription de trois émissions de VOA Ashna TV des 15/01/2011, 18/01/2011 et 19/01/2011, extraites du corpus TRAD d’actualités radio et télédiffusées en pachto (référence S0381). La traduction fournie est différente de celle fournie dans le Corpus TRAD parallèle pachto-français (transcriptions d’actualités radio et télédiffusées) - Données d'entraînement (ELRA- W0093)

Le contenu a également été traduit vers l’anglais (voir W0095 Corpus TRAD parallèle pachto-anglais - transcriptions d’actualités télédiffusées).

Le pachto (ou pachtou) appartient à la famille des langues indo-iranienne. Il est parlé par les Pachtounes, principalement au Pakistan et en Afghanistan.

Ce corpus a été produit par ELDA dans le cadre du projet PEA TRAD, avec le soutien de la Direction Générale de l'Armement (DGA). Il a été utilisé lors d’une campagne d’évaluation interne en tant que données de test.

MEMBERacademiccommercial
Licence: Non Commercial Use - ELRA END USER
350.00 € submit
1000.00 € submit
Licence: Commercial Use - ELRA VAR
1000.00 € submit
1000.00 € submit
NON MEMBERacademiccommercial
Licence: Non Commercial Use - ELRA END USER
500.00 € submit
2000.00 € submit
Licence: Commercial Use - ELRA VAR
2000.00 € submit
2000.00 € submit
06/04/2016
People who looked at this resource also viewed the following:
Resources from the same project