Basque WordNet

View resource name in all available languages

WordNet Basque

699-845-639-511-8

ID:

ELRA-M0049

The Basque WordNet is a lexical database including information about Basque words. It is an extension of WordNet 1.6, a lexical database for English developed at the Princeton University. The Basque WordNet is tightly aligned to the English WordNet.

The Basque WordNet models nouns, verbs and adjectives. Each sense is linked to a so-called synset. Every synset encodes the synonymy relation between (possibly) several words (synonyms), having a unique meaning, belonging to one and the same part of speech (specified in the POS tag value), and expressing the same lexical meaning. Each synset is related to the corresponding synset in the English WordNet 1.6. via its identification number ID, which includes the synset number and the POS tag. The only exceptions are newly created synsets to account for cultural concepts not present in WordNet 1.6.

The Basque WordNet is provided following the Lexical Markup Framework (LMF, ISO/TC37) and it contains the following:
• set of variants or synonyms making up the synset;
• part-of-speech;
• language-internal relations to other synsets;
• a unique-id linking the Basque synsets to the English Wordnet 1.6;
• glosses and examples for a subset of the synsets
• mappings to WordNet domains, Sumo and Basic Concepts

LMF can be imported directly in the DebVisDic tool for browsing and editing wordnets (not included).

Figures for the Basque WordNet are distributed as follows :
- 30,281 Synsets: 26,708 nouns, 3,455 verbs, 118 adjectives
- 49,688 Variants: 40,042 nouns, 9,491 verbs, 155 adjectives
- 26,727 Lemma + pos: 23,176 nouns, 3,494 verbs, 57 adjectives
- 1.66 Synonym per synset: 1.52 nouns, 2.74 verbs, 1.21 adjectives
- 1.86 Senses per lemma+pos: 1.73 nouns, 2.72 verbs, 2.72 adjectives
- 94,482 InternalRelations: 74,857 nouns, 19,492 verbs, 133 adjectives
- 2,323 Definitions (nouns only)
- 35,346 WordNet Domains mappings: 31,631 nouns, 3,590 verbs, 125 adjectives
- 30,018 Sumo mappings: 26,446 nouns, 3,454 verbs, 118 adjectives
- 1,138 Basic Concepts: 740 nouns, 398 verbs

View resource description in French

Le WordNet Basque est une base de données lexicale comprenant des informations sur les mots de la langue basque. C’est une extension du WordNet 1.6, une base de données lexicale pour l’anglais développée à l’université de Princeton. Le WordNet Basque est en grande partie aligné avec le WordNet anglais.

Le WordNet Basque modélise les noms, verbes et adjectifs. Chaque sens est relié à un ensemble appelé synset. Chaque synset contient le codage de la relation synonymique entre plusieurs (autant que possible) mots (synonymes), ayant une signification unique, qui appartiennent à une ou à la même partie du discours (spécifié dans la valeur d’étiquette de la partie du discours), et exprimant la même signification lexicale. Chaque synset est relié au synset correspondent du WordNet anglais 1.6. via un numéro d’identifiant ID, qui inclut le numéro du synset et l’étiquette de la partie du discours. Les seules exceptions sont les synsets nouvellement créés pour prendre en compte les concepts culturels absents dans le WordNet 1.6.

Le WordNet Basque est fourni dans le format Lexical Markup Framework (LMF, ISO/TC37) et contient les informations suivantes:
• un ensemble de variantes ou synonymes formant le synset;
• la partie du discours;
• des relations à d’autres synsets internes à la langue;
• un identifiant unique reliant le synset au WordNet anglais 1.6.
• des gloses et exemples pour un sous-ensemble des synsets
• des mises en correspondance avec les domaines WordNet, Sumo et les Concepts de base

LMF peut être importé directement dans l’outil DebVisDic pour naviguer et éditer des wordnets (non inclus).

Les chiffres du WordNet Basque sont répartis comme suit:
- 30,281 Synsets: 26,708 noms, 3,455 verbes, 118 adjectifs
- 49,688 Variantes: 40,042 noms, 9,491 verbes, 155 adjectifs
- 26,727 Lemmes + partie du discours: 23,176 noms, 3,494 verbes, 57 adjectifs
- 1.66 Synonymes par synset: 1.52 noms, 2.74 verbes, 1.21 adjectifs
- 1.86 Sens par lemme + partie du discours: 1.73 noms, 2.72 verbes, 2.72 adjectifs
- 94,482 Relations internes: 74,857 noms, 19,492 verbes, 133 adjectifs
- 2,323 Définitions (noms uniquement)
- 35,346 Correspondances avec les domaines WordNet: 31,631 noms, 3,590 verbes, 125 adjectifs
- 30,018 Correspondances Sumo: 26,446 noms, 3,454 verbes, 118 adjectifs
- 1,138 Concepts de base: 740 noms, 398 verbes

MEMBERacademiccommercial
Licence: Non Commercial Use - ELRA END USER
300.00 € submit
3000.00 € submit
Licence: Commercial Use - ELRA VAR
4500.00 € submit
4500.00 € submit
NON MEMBERacademiccommercial
Licence: Non Commercial Use - ELRA END USER
600.00 € submit
6000.00 € submit
Licence: Commercial Use - ELRA VAR
9000.00 € submit
9000.00 € submit
20/05/2009 Downloadable
People who looked at this resource also viewed the following: