English lexicon with morphological information

View resource name in all available languages

Lexique anglais avec information morphologique

626-368-496-109-9

ID:

ELRA-L0067

This English lexicon is made up of 174,000 inflected forms corresponding to 68,000 simple word lemmas. It contains:
- 31,900 nouns, with number and inflected forms (including irregular forms),
- 11,800 verbs, with mood, tense, person, number and inflected forms (including irregular forms),
- 19,900 adjectives,
- 4,100 adverbs,
- 300 pronouns, articles, prepositions/postpositions and conjunctions.

Each line in the resource file shows an inflected form, its part of speech, its related lemma and its morphological information. The inflected forms were generated using two databases: one containing the lemmas with the related root(s) and paradigm number(s), the other one containing the paradigm numbers with the related terminations and morphological information.

Each row in the resource file consists of four fields following the structure below:
Lemma|part of speech|inflected form|morphological information

The part of speech and the morphological information are encoded using an internal standard (an abbreviation key file is also provided).

View resource description in French

Ce lexique anglais est constitué de 174 000 formes fléchies correspondant à 68 000 mots-lemmes simples. Il comprend :
- 31 900 noms, incluant le nombre et les formes fléchies (dont les formes irrégulières),
- 11 800 verbes, incluant le mode, le temps, la personne, le nombre et les formes fléchies (dont les formes irrégulières),
- 19 900 adjectifs,
- 4 100 adverbes,
- 300 pronoms, articles, prépositions/postpositions et conjonctions.

Chaque ligne de fichier présente une forme fléchie, la partie du discours, le lemme correspondant et l’information morphologique. Les formes fléchies sont générées en utilisant deux bases de données, l’une contenant les lemmes avec la ou les racines correspondantes et le ou les nombres de paradigmes, tandis que la deuxième comprend les nombres de paradigmes avec les terminaisons correspondantes et l’information morphologique.

Chaque ligne de fichier est constituée de quatre champs présentés selon la structure suivante :
Lemme|partie du discours|forme fléchie|information morphologique

La partie du discours et l’information morphologique sont codées selon un standard interne (un fichier des abréviations utilisées est également fourni).

MEMBERacademiccommercial
Licence: Non Commercial Use - ELRA END USER
3500.00 € submit
5000.00 € submit
Licence: Commercial Use - ELRA VAR
6000.00 € submit
6000.00 € submit
NON MEMBERacademiccommercial
Licence: Non Commercial Use - ELRA END USER
4500.00 € submit
7000.00 € submit
Licence: Commercial Use - ELRA VAR
8500.00 € submit
8500.00 € submit
19/06/2006 Downloadable
People who looked at this resource also viewed the following: