Catalan-Spanish Parallel Corpus

View resource name in all available languages

Corpus parallèle catalan-espagnol

124-613-721-890-1

ID:

ELRA-W0053

This corpus contains more than 100 million words and it contains 10 years of bilingual articles from “El Periódico de Catalunya”. Both language data are rather close as the Catalan text is a translation of the Spanish one, partly achieved by means of Machine translation and then post-edited.

The data are aligned at sentence level and stored in text files, in a one sentence per line basis. The data are provided in plain text, with no encoding whatsoever.

View resource description in French

Ce corpus comprend plus de 100 millions de mots et consiste en 10 années d’articles bilingues de “El Periódico de Catalunya”. Les données des deux langues sont très proches puisque le texte catalan est une traduction de la version espagnole, achevée en partie au moyen d’une traduction automatique puis post-éditée.

Les données sont alignées au niveau de la phrase et stockées en fichiers texte, sur la base d’une phrase par ligne. Les données sont fournies au format texte plein, sans aucun codage.

MEMBERacademiccommercial
Licence: Non Commercial Use - ELRA END USER
2000.00 € submit
20000.00 € submit
Licence: Commercial Use - ELRA VAR
20000.00 € submit
20000.00 € submit
NON MEMBERacademiccommercial
Licence: Non Commercial Use - ELRA END USER
3000.00 € submit
24000.00 € submit
Licence: Commercial Use - ELRA VAR
24000.00 € submit
24000.00 € submit
18/06/2010
People who looked at this resource also viewed the following: