GlobalPhone 2000 Speaker Package

View resource name in all available languages

Ensemble de 2000 locuteurs GlobalPhone




The GlobalPhone 2000 Speaker Package contains transcribed read speech spoken by 2000 native speakers in 22 languages. The data are sampled from the GlobalPhone Speech and Text Data available in the ELRA Catalogue, i.e.: Arabic (ELRA-S0192), Bulgarian (ELRA-S0319), Chinese-Mandarin (ELRA-S0193), Chinese-Shanghai (ELRA-S0194), Croatian (ELRA-S0195), Czech (ELRA-S0196), French (ELRA-S0197), German (ELRA-S0198), Hausa (ELRA-S0347), Japanese (ELRA-S0199), Korean (ELRA-S0200), Polish (ELRA-S0320), Portuguese (Brazilian) (ELRA-S0201), Russian (ELRA-S0202), Spanish (Latin America) (ELRA-S0203), Swahili (ELRA-S0375), Swedish (ELRA-S0204), Tamil (ELRA-S0205), Thai (ELRA-S0321), Turkish (ELRA-S0206), Ukrainian (ELRA-S0377), and Vietnamese (ELRA-S0322).

The GlobalPhone 2000 Speaker Package covers about 9,000 randomly selected utterances read by 2000 native speakers in 22 languages, i.e. on average 4.5 utterances corresponding to 40 seconds of speech per speaker amounting to a total of 22 hours of speech. The package is designed for various tasks in speaker recognition research and development, such as (1) text-dependent and text-independent speaker recognition (e.g. speaker verification and speaker identification), (2) speaker recognition in multiple languages, (3) multilingual speaker identification, (4) multilingual speaker verification, and (5) speaker recognition with low resources.

View resource description in French

L’ensemble de 2000 locuteurs GlobalPhone contient de la parole lue transcrite pour 2000 locuteurs natifs en 22 langues. Les données sont échantillonnées à partir des données orales et textuelles Globalphone disponibles dans le catalogue ELRA: arabe (ELRA-S0192), bulgare (ELRA-S0319), chinois-mandarin (ELRA-S0193), chinois de Shanghai (ELRA-S0194), croate (ELRA-S0195), tchèque (ELRA-S0196), français (ELRA-S0197), allemand (ELRA-S0198), haoussa (ELRA-S0347), japonais (ELRA-S0199), coréen (ELRA-S0200), polonais (ELRA-S0320), portugais (Brésilien) (ELRA-S0201), russe (ELRA-S0202), espagnol (d’Amérique latine) (ELRA-S0203), swahili (ELRA-S0375), suédois (ELRA-S0204), tamoul (ELRA-S0205), thaï (ELRA-S0321), turc (ELRA-S0206), ukrainien (ELRA-S0377), et vietnamien (ELRA-S0322).

Cet ensemble couvre environ 9,000 occurrences sélectionnées aléatoirement et lues par 2000 locuteurs natifs en 22 langues, soit une moyenne de 4,5 occurrences correspondant à 40 secondes de parole par locuteur pour un total 22 heures de parole. T Il est conçu pour diverses tâches de recherche et développement en reconnaissance du locuteur, tells que (1) la reconnaissance du locuteur dépendant et indépendant du texte (par ex. vérification et identification du locuteur), (2) la reconnaissance du locuteur dans plusieurs langues, (3) l’identification multilingue du locuteur, (4) la verification multilingue du locuteur, et (5) la verification du locuteur à partir d’un faible nombre de ressources.

Licence: Non Commercial Use - ELRA END USER
1200.00 € submit
6000.00 € submit
Licence: Commercial Use - ELRA VAR
6000.00 € submit
6000.00 € submit
NON MEMBERacademiccommercial
Licence: Non Commercial Use - ELRA END USER
1400.00 € submit
7200.00 € submit
Licence: Commercial Use - ELRA VAR
7200.00 € submit
7200.00 € submit
People who looked at this resource also viewed the following: