euLEX (Lexical Database for Basque)

View resource name in all available languages

euLEX (Base de données lexicale basque)

593-049-611-011-8

ID:

ELRA-L0085

euLEX is a general lexicon which contains 115,000 entries, divided into 94,000 dictionary entries or lemmas, 12,000 allomorphs, 7,500 verb forms and about 1,200 dependent morphemes. All entries include linguistic information such as morphology and usage.

The lexicon includes general purpose entries and terms (each of them with its corresponding thematic classification). The non-standard entries, specifically marked by the Academy of the Basque Language, are included and linked to the correct entry.

The lexicon is in XML format and is constantly updated following the latest normalization decisions from the Academy of the Basque Language.

Potential applications for this resource are PoS tagging, lemmatizing, and term detection and correction.

All this information is used as the basis for the automatic lemmatizer tLEMA and the morphological analyzer built up in UZEI, together with the term checker.

View resource description in French

euLEX est un lexique général contenant 115 000 entrées, réparties en 94 000 entrées du dictionnaire ou lemmes, 12 000 allomorphes, 7 500 formes verbales et environ 1 200 morphèmes dépendants. Toutes les entrées comprennent des informations linguistiques telles que la morphologie et l’usage.

Le lexique comprend des entrées et des termes de vocabulaire général (chacun avec sa classification thématique correspondante). Les entrées non standards, spécifiquement marquées par l’Académie de la Langue Basque, sont incluses et reliées à l’entrée correcte.

Le lexique est fourni au format XML et régulièrement mis à jour en fonction des dernières décisions de normalisation de l’Académie de la Langue Basque.

Les applications potentielles pour cette ressource sont l’étiquetage de la partie du discours, la lemmatisation et la détection et la correction de termes.

Toutes ces informations sont utilisées comme base pour le lemmatiseur automatique tLEMA, ainsi que l’analyseur morphologique et que le correcteur de termes, réalisés par UZEI.

MEMBERacademiccommercial
Licence: Non Commercial Use - ELRA END USER
3000.00 € submit
6000.00 € submit
Licence: Commercial Use - ELRA VAR
15000.00 € submit
15000.00 € submit
NON MEMBERacademiccommercial
Licence: Non Commercial Use - ELRA END USER
6000.00 € submit
10000.00 € submit
Licence: Commercial Use - ELRA VAR
20000.00 € submit
20000.00 € submit
30/06/2008 Downloadable
People who looked at this resource also viewed the following: