TRAD Arabic-English Mailing lists Parallel corpus - Development set

View resource name in all available languages

Corpus TRAD parallèle arabe-anglais - listes de discussion - Données de développement

213-044-240-074-6

ID:

ELRA-W0108

This is a parallel corpus of 10,000 words in Arabic and a reference translation in English. The source texts are emails collected from Wikiar-I, a mailing list for discussions about the Arabic Wikipedia. The collected emails are dated from 2004 to 2007.

The translation has been conducted following a strict protocol aimed at producing high quality translations.

The content is also translated into French (see ELRA-W0107).

This corpus was produced by ELDA within the PEA TRAD project supported by the French Ministry of Defence (DGA). It was used as a development set for an internal MT evaluation campaign.

View resource description in French

Il s’agit d’un corpus parallèle de 10,000 mots en arabe et de la traduction de référence en anglais. Les textes sources sont extraits de la liste de diffusion Wikiar-l, une liste permettant de discuter du Wikipedia en langue arabe. Les courriels collectés ont été écrits sur la période 2004-2007.

La traduction a été réalisée en suivant un protocole rigoureux permettant de produire des traductions de bonne qualité.

Le contenu a également été traduit vers le français (voir ELRA-W0107).

Ce corpus a été produit par ELDA dans le cadre du projet PEA TRAD, avec le soutien de la Direction Générale de l'Armement (DGA). Il a été utilisé en tant que corpus de développement lors d'une campagne d’évaluation sur la traduction automatique interne au projet.

MEMBERacademiccommercial
Licence: Non Commercial Use - ELRA END USER
150.00 € submit
500.00 € submit
Licence: Commercial Use - ELRA VAR
500.00 € submit
500.00 € submit
NON MEMBERacademiccommercial
Licence: Non Commercial Use - ELRA END USER
300.00 € submit
1000.00 € submit
Licence: Commercial Use - ELRA VAR
1000.00 € submit
1000.00 € submit
14/10/2016
People who looked at this resource also viewed the following:
Resources from the same project