Learner Corpus of Portuguese L2 – COPLE2 – ELRA Catalogue

Last view: 2024-07-26

652 Last view: 2024-07-26

Last update: 2023-01-27

3 Last update: 2023-01-27

Learner Corpus of Portuguese L2 – COPLE2

View resource name in all available languages

Corpus d’apprenants du portugais L2 – COPLE2

ISLRN: 936-320-703-366-7

ID:

ELRA-W0331

The Learner Corpus of Portuguese as Second/Foreign Language (COPLE2) is a corpus of written and oral texts produced by students of Portuguese as Foreign/Second Language courses in the Instituto de Cultura e Língua Portuguesa (the Institute of Portuguese Language and Culture) (ICLP – FLUL) and by applicants for examinations in the Centro de Avaliação de Português Língua Estrangeira (Center for Evaluation of Portuguese as a Foreign Language) (CAPLE – FLUL).

The corpus contains texts from learners with 15 different native languages (L1s) and proficiencies from A1 to C1, and covers different topics and types of tasks. It is encoded in TEI format through the TEITOK environment. The corpus includes at the moment a total of 182,474 tokens and 978 texts, classified according to the CEFR scales.

Each learner text is codified with complete metadata concerning the learner profile, the type of task and the circumstances where the text was produced. The corpus contains annotations for part of speech, lemma and learner errors. All the information encoded is searchable through the CQP query language.

The corpus was funded by Fundação Calouste Gulbenkian, within the RECAP and the LeCIEPLE projects, by Associação para o Desenvolvimento da Faculdade de Letras da Universidade de Lisboa (ADFLUL), and Instituto de Cultura e Língua Portuguesa. It results from a partnership between several institutions such as ICLP, CAPLE and Centro de Linguística da Universidade de Lisboa (CLUL).

View resource description in French

Le corpus d'apprenants du portugais seconde langue/langue étrangère (COPLE2) est un corpus de textes écrits et oraux produits par des étudiants de portugais langue étrangère/seconde langue de l'Instituto de Cultura e Língua Portuguesa (l’Institut Culturel de la Langue et de la Culture Portugaise) (ICLP - FLUL) et par les candidats aux examens au Centro de Avaliação de Português Língua Estrangeira (Centre d’évaluation du portugais langue étrangère) (CAPLE – FLUL).

Le corpus contient des textes d'apprenants de 15 langues maternelles différentes (L1) et de compétences linguistiques de niveaux A1 à C1. Il couvre différents sujets et types de tâches. Il est encodé au format TEI via l'environnement TEITOK. Le corpus comprend actuellement un total de 182 474 tokens et 978 textes, classés selon l’échelle du CECR.

Chaque texte d'apprenant est codifié avec des métadonnées complètes concernant le profil de l'apprenant, le type de tâche et les circonstances dans lesquelles le texte a été produit. Le corpus contient des annotations pour les parties du discours, les lemmes et les erreurs de l'apprenant. Toutes les informations encodées sont consultables via le langage de requête CQP.

Le corpus a été financé par la Fundação Calouste Gulbenkian (la Fondation Calouste Gulbenkian) dans le cadre des projets RECAP et LeCIEPLE, par l'Associação para o Desenvolvimento da Faculdade de Letras da Universidade de Lisboa (l’Association pour le Développement de la Faculté de Lettre de l’Université de Lisbonne) (ADFLUL), et l'Instituto de Cultura e Língua Portuguesa (l’Institut de la Langue et de la Culture Portugaise) (ICLP). Il résulte d'un partenariat entre plusieurs institutions telles que l'ICLP, le CAPLE et le Centro de Linguística da Universidade de Lisboa (Centre de Linguistique de l’Université de Lisbonne) (CLUL).

MEMBER	academic	commercial
Licence: Non Commercial Use - ELRA END USER	0.00 €	1000.00 €
Licence: Commercial Use - ELRA VAR	1000.00 €	1000.00 €

NON MEMBER	academic	commercial
Licence: Non Commercial Use - ELRA END USER	0.00 €	1000.00 €
Licence: Commercial Use - ELRA VAR	1000.00 €	1000.00 €

DistributionAvailability start date 26/01/2023 Contact Person

Valérie Mapelli

text

Monolingual text corpusLanguages

Portuguese

Linguality

Linguality type: Monolingual

Size

182,474 Tokens

Metadata

Created: 01/26/2023

Last Updated: 01/26/2023

Metadata Language: French, English (fr, en)

Version

Version: 1.0

People who looked at this resource also viewed the following: