Wuhan Dialect Speech Data by Mobile Phone - 997 Hours

View resource name in all available languages

Base de données orales en dialecte du Wuhan par téléphone portable - 997 heures

822-900-971-360-0

ID:

ELRA-S0455

Mobile phone captured audio data of Wuhan dialect, 997 hours in total, recorded by more than 2,000 Wuhan dialect native speakers. The recorded text covers generic, interactive, on-board, home and other categories, with rich contents. Wuhan locals participate in quality check and proofreading. Sentence accuracy rate reaches 95 %; this data set can be used for automatic speech recognition, machine translation, and voiceprint recognition.

Format:16kHz, 16bit, uncompressed wav, mono channel
Recording environments:quiet indoor environment, without echo
Recording content (read speech):generic category; human-machine interaction category; smart home command and control category; numbers; dialect
Demographics:2,291 people, 55% of which are female.
Transcription content:text, noisy symbols, special identifiers
Device:Android mobile phone, iPhone
Language:Wuhan dialect
Accuracy rate:95% (the accuracy rate of noise symbols and other identifiers is not included)
Application scenarios:speech recognition, voiceprint recognition

View resource description in French

997 heures de données audio collectées sur téléphone mobile et enregistrées par plus de 2 000 locuteurs natifs du dialecte de Wuhan. Le texte enregistré couvre les catégories génériques, interactives, embarquées, domestiques et autres, avec des contenus riches. Les habitants de Wuhan ont participé au contrôle qualité et à la révision. Le taux de précision des phrases atteint 95 %. Cet ensemble de données peut être utilisé pour la reconnaissance automatique vocale, la traduction automatique et la reconnaissance d'empreintes vocales.

Format : 16 kHz, 16 bits, wav non compressé, canal mono
Environnements d'enregistrement : environnement intérieur calme, sans écho
Contenu des enregistrements (parole lue) : catégorie générique ; catégorie interaction homme-machine ; catégorie de commande et de contrôle de la maison intelligente ; nombres; dialecte
Données démographiques : 2 291 personnes, dont 55 % de femmes.
Contenu de la transcription : texte, symboles bruyants, identifiants spéciaux
Supports d'enregistrement : téléphone mobile Android, iPhone
Langue : dialecte de Wuhan
Taux de précision : 95 % (taux de précision des symboles de bruit et autres identifiants n'est pas inclus)
Scénarios d'application:reconnaissance vocale, reconnaissance d'empreinte vocale

MEMBERacademiccommercial
Licence: Commercial Use - ELRA VAR
94715.00 € submit
94715.00 € submit
NON MEMBERacademiccommercial
Licence: Commercial Use - ELRA VAR
94715.00 € submit
94715.00 € submit

Special offer:

06/10/2022
People who looked at this resource also viewed the following: