Mandarin Heavy Accent Speech Data by Mobile Phone - 662 Hours

View resource name in all available languages

Base de données orales en mandarin non standard par téléphone portable - 662 heures

018-830-641-039-1

ID:

ELRA-S0482

It collects 2,034 local Chinese from 26 provinces like Henan, Shanxi, Sichuan, Hunan, Fujian, etc. It is mandarin speech data with heavy accent. The recording contents are finance and economics, entertainment, policy, news, TV, and movies.

Format:16kHz, 16bit, uncompressed wav, mono channel.
Recording environment:1,288 people complete the recording in relatively quiet indoor environment; and 746 in the normal environment with noise that does not affect the voice recognition
Recording content (read speech):finance; entertainment; policy; news; television; film; digital; music
Demographics:2,034 people; 52% are females; people aged from 21-30 account for 51%; people are from 26 provinces including Henan, Shaanxi, Sichuan, Hunan, Fujian, Heilongjiang, Guizhou.
Device:Android mobile phone, iPhone.
Language:mandarin with heavy local accent
Application Scenario:speech recognition;  voiceprint recognition
Sentence Accuracy Rate:not lower than 98%.

View resource description in French

Ce corpus regroupe 2 034 Chinois originaires de 26 provinces telles que le Henan, le Shanxi, le Sichuan, le Hunan, le Fujian, etc. Il s'agit de données de parole du mandarin non standard. Les contenus d'enregistrement sont la finance et l'économie, le divertissement, la politique, les actualités, la télévision et les films.

Format : 16 kHz, 16 bits, wav non compressé, canal mono.
Environnement d'enregistrement : 1 288 personnes ont effectué l'enregistrement dans un environnement intérieur relativement calme ; et 746 dans un environnement normal avec un bruit qui n'affecte pas la reconnaissance vocale
Contenu des enregistrements (parole lue):finance, divertissement, politique, actualités, télévision, film, numérique, musique
Données démographiques : 2 034 personnes ; dont 52 % sont des femmes ; les personnes âgées de 21 à 30 ans représentent 51 % du groupe ; les locuteurs viennent de 26 provinces, dont Henan, Shaanxi, Sichuan, Hunan, Fujian, Heilongjiang, Guizhou.
Supports d'enregistrement : téléphone mobile Android, iPhone.
Langue : mandarin non standard
Applications : reconnaissance vocale ; reconnaissance d'empreinte vocale
Taux de précision des phrases : pas inférieur à 98 %.

MEMBERacademiccommercial
Licence: Commercial Use - ELRA VAR
37734.00 € submit
37734.00 € submit
NON MEMBERacademiccommercial
Licence: Commercial Use - ELRA VAR
37734.00 € submit
37734.00 € submit

Special offer:

06/10/2022
People who looked at this resource also viewed the following: