Arbobanko (Esperanto Treebank)
View resource name in all available languages
Arbobanko (treebank en esperanto)
The Arbobanko (Esperanto Treebank) is a 52,000 token dependency treebank of Esperanto with texts from the MONATO news magazine, consisting of random excerpts from the period 2000-2010. All words were annotated for lemma, part-of-speech, inflection, compounding and affixing, syntactic function, dependency links, NER types, semantic types of nouns and adjectives, and verb frame categories.
Morphosyntactic and dependency annotation was performed with the EspGram parser, and manually revised. Semantic categories were added in a second round of annotation, and are also manually revised and disambiguated.
The format is native Constraint Grammar sgml, with token-based tag lines, xml with feature-attribute pairs or CoNNL tab format.
View resource description in
Arbobanko (treebank en esperanto) est un corpus de 52 000 tokens en Esperanto réalisé à partir de textes du magazine MONATO, composé d'extraits aléatoires choisis au cours de la période 2000-2010. Tous les mots ont été annotés avec les informations suivantes : les lemmes, la partie du discours, les flexions, la composition des mots et les affixes, la fonction syntaxique, les liens de dépendance, les types d’entités nommées, les catégories sémantiques des noms et adjectifs et les catégories de cadrage verbal.
Les annotations morphosyntaxiques et de dépendance ont été réalisées grâce à l’analyseur syntaxique EspGram et révisées manuellement. Les catégories sémantiques ont été ajoutées lors du deuxième passage d’annotation et ont été également révisées manuellement et désambigüisées.
Le corpus est disponible au format sgml natif de grammaire contrainte, avec des lignes d’étiquettes basées sur les tokens, ainsi qu’en xml avec des paires élément-attribut, et au format tableur CoNNL.
MEMBER | academic | commercial |
Licence: Non Commercial Use - ELRA END USER |
0.00 €
900.00 €
Licence: Commercial Use - ELRA VAR |
900.00 €
900.00 €
NON MEMBER | academic | commercial |
Licence: Non Commercial Use - ELRA END USER |
0.00 €
1500.00 €
Licence: Commercial Use - ELRA VAR |
1500.00 €
1500.00 €