Chinese Children Speech data by Mobile phone - 3,255 Hours

View resource name in all available languages

Base de données orales de chinois parlé par des enfants par téléphone portable - 3 255 heures

607-995-858-759-4

ID:

ELRA-S0458

Mobile phone captured audio data of Chinese children, with total duration of 3,255 hours. 9,780 speakers are children aged 6 to 12, with accent covering seven dialect areas; the recorded text contains common children languages such as essay stories, numbers, and their interactions on cars, at home, and with voice assistants, precisely matching the actual application scenes. All sentences are manually transcribed with high accuracy.

Format:16kHz/22.05kHz/44.1kHz (mobile phone/microphone), 16bit, uncompressed wav, mono channel
Recording environment:quiet indoor environment, without echo
Recording content (read speech):kids' stories; human-machine interaction category; smart home command and control category; numbers; general category
Demographics:9,780 speakers totally, with 51% males and 49% females, all children are 6-12 years old
Device:Android mobile phone, iPhone; part of the speakers has data recorded by microphone
Language:mandarin
Application scenarios:speech recognition; voiceprint recognition.
Accuracy rate:97% (the accuracy rate of the noise symbols and pinyin is not included)

View resource description in French

3 255 heures de données audio collectées par téléphone portable, enregistrés par 9 780 enfants âgés de 6 à 12 ans, avec un accent couvrant sept zones dialectales du chinois; le texte enregistré contient le langage d'enfants courant tels que des petites histoires, des chiffres et leurs interactions en voiture, à la maison et avec des assistants vocaux, correspondant précisément aux scènes d'application réelles. Toutes les phrases sont transcrites manuellement avec une précision élevée.

Format : 16 kHz/22,05 kHz/44,1 kHz (téléphone mobile/microphone), 16 bits, wav non compressé, canal mono
Environnement d'enregistrement : environnement intérieur silencieux, sans écho
Contenu des enregistrements (parole lue) : histoires pour enfants ; catégorie interaction homme-machine ; catégorie de commande et de contrôle de la maison intelligente ; nombres; catégorie générale
Démographie:9 780 locuteurs au total, avec 51 % de garçons et 49 % de filles âgés de 6 à 12 ans
Support d'enregistrement:téléphone mobile Android, iPhone ; une partie des locuteurs ont des données enregistrées par microphone
Langue:mandarin
Application:reconnaissance vocale ; reconnaissance d'empreinte vocale.
Taux de précision : 97 % (le taux de précision des symboles de bruit et du pinyin n'est pas inclus)

MEMBERacademiccommercial
Licence: Commercial Use - ELRA VAR
247380.00 € submit
247380.00 € submit
NON MEMBERacademiccommercial
Licence: Commercial Use - ELRA VAR
247380.00 € submit
247380.00 € submit

Special offer:

06/10/2022
People who looked at this resource also viewed the following: