Cantonese Conversational Speech Data by Mobile Phone and Voice Recorder - 607 Hours

View resource name in all available languages

Base de données orales de conversations en cantonais par téléphone portable et enregistreur vocal - 607 heures

722-447-977-629-5

ID:

ELRA-S0427

995 local Cantonese speakers participated in the recording, and conducted face-to-face communication in a natural way. They had free discussion on a number of given topics, with a wide range of fields; the voice was natural and fluent, in line with the actual dialogue scene. Text is transcribed manually, with high accuracy.

Format:Mobile phone: 16kHz, 16bit, mono channel, .wav;   Voice recorder: 44.1kHz, 16bit, dual channel, .wav;
Environment:quiet indoor environment, without echo
Recording Content:dozens of topics are specified, and the speakers make dialogue under those topics while the recording is performed
Demographics:995 Cantonese; 45% speakers of all are in the age group of 26-45; 504 speakers of them spoke in groups of two speakers, 195 speakers of them spoke in groups of three speakers, 196 speakers of them spoke in groups of four speakers, and the other 100 speakers spoke in groups of five speakers
Annotation:annotating for the transcription text, speaker identification and gender
Device:mobile phone and voice recorder
Language:Cantonese
Application Scenario:Voice Recognition, Voice Print Recognition
Accuracy rate:95%

View resource description in French

995 locuteurs cantonais locaux ont participé à l'enregistrement du corpus et ont mené une conversation en face à face de manière naturelle. Ils ont poursuivi des discussions libres sur un certain nombre de thèmes donnés, avec un large éventail de domaines. La voix était naturelle et fluide, en ligne avec la scène de dialogue réelle. Le texte est transcrit manuellement, avec une précision élevée.

Format : téléphone portable : 16 kHz, 16 bits, canal mono, .wav ; Enregistreur vocal : 44,1 kHz, 16 bits, double canal, .wav ;
Environnement : environnement intérieur calme, sans écho
Contenu des enregistrements : des dizaines de thèmes sont spécifiés, et les locuteurs dialoguent sur ces thèmes pendant l'enregistrement
Données démographiques : 995 cantonais ; 45% des locuteurs sont dans la tranche d'âge des 26-45 ans ; 504 locuteurs ont parlé en groupes de deux locuteurs, 195 locuteurs ont parlé en groupes de trois locuteurs, 196 locuteurs ont parlé en groupes de quatre locuteurs et les 100 autres locuteurs ont parlé en groupes de cinq locuteurs
Annotation : annotation pour le texte de transcription, l'identification du locuteur et le sexe
Supports d'enregistrement : téléphone portable et enregistreur vocal
Langue : cantonais
Applications : reconnaissance vocale, reconnaissance d'impression vocale
Taux de précision : 95 %

MEMBERacademiccommercial
Licence: Commercial Use - ELRA VAR
98030.50 € submit
98030.50 € submit
NON MEMBERacademiccommercial
Licence: Commercial Use - ELRA VAR
98030.50 € submit
98030.50 € submit

Special offer:

06/10/2022
People who looked at this resource also viewed the following: