Italian lexicon with morphological information and clitic verbs

View resource name in all available languages

Lexique italien avec information morphologique et verbes clitiques

565-957-248-233-5

ID:

ELRA-L0070

This Italian lexicon is the same as the one described in ELRA-L0069, but with the addition of clitic verbs, which increases the number of inflected forms to 1,800,000 (still corresponding to 112,000 simple words lemmas). Half the lexicon is made up of clitic verbs. It contains:
- 66,340 nouns, with type, gender, number and inflected forms (including irregular forms)
- 12,030 verbs, with mood, tense, person, gender, number, indication of clitic verbs and inflected forms (including irregular forms),
- 28,080 adjectives, with degree, gender, number and inflected forms (including irregular forms),
- 4,890 adverbs, with degree,
- 660 pronouns, articles, prepositions/postpositions and conjunctions.

Each line in the resource file shows an inflected form, its part of speech, its related lemma and its morphological information. The inflected forms were generated using two databases: one containing the lemmas with the related root(s) and paradigm number(s), the other one containing the paradigm numbers with the related terminations and morphological information.

Each row in the resource file consists of four fields following the structure below:
Lemma|part of speech|inflected form|morphological information

The part of speech and the morphological information are encoded using our internal standard (an abbreviation key file is also provided).

View resource description in French

Ce lexique italien est identique à celui décrit dans ELRA-L0069, avec l’ajout de verbes clitiques, ce qui augmente le nombre de formes fléchies à un total de 1 800 000 formes (toujours correspondant à 112 000 mots-lemmes simples). La moitié du lexique est constitué de verbes clitiques. Il comprend :
- 66 340 noms, incluant le type, le genre, le nombre et les formes fléchies (dont les formes irrégulières),
- 12 030 verbes, incluant le mode, le temps, la personne, le genre, le nombre, l’indication des verbes clitiques et les formes fléchies (dont les formes irrégulières),
- 28 080 adjectifs, incluant le degré, le genre, le nombre et les formes fléchies (dont les formes irrégulières),
- 4 890 adverbes, incluant le degré,
- 660 pronoms, articles, prépositions/postpositions et conjonctions.

Chaque ligne de fichier présente une forme fléchie, la partie du discours, le lemme correspondant et l’information morphologique. Les formes fléchies sont générées en utilisant deux bases de données, l’une contenant les lemmes avec la ou les racines correspondantes et le ou les nombres de paradigmes, tandis que la deuxième comprend les nombres de paradigmes avec les terminaisons correspondantes et l’information morphologique.

Chaque ligne de fichier est constituée de quatre champs présentés selon la structure suivante :
Lemme|partie du discours|forme fléchie|information morphologique

La partie du discours et l’information morphologique sont codées selon un standard interne (un fichier des abréviations utilisées est également fourni).

MEMBERacademiccommercial
Licence: Non Commercial Use - ELRA END USER
6500.00 € submit
8000.00 € submit
Licence: Commercial Use - ELRA VAR
10000.00 € submit
10000.00 € submit
NON MEMBERacademiccommercial
Licence: Non Commercial Use - ELRA END USER
8500.00 € submit
10000.00 € submit
Licence: Commercial Use - ELRA VAR
12500.00 € submit
12500.00 € submit
19/06/2006
People who looked at this resource also viewed the following: