Mandarin Chinese Speech Synthesis Corpus (Basic Corpus)

View resource name in all available languages

Corpus de synthèse de la parole du chinois mandarin (corpus de base)

137-453-512-467-4

ID:

ELRA-S0228-01

This corpus contains the recordings of 1 native Chinese speaker (female).
The corpus is composed of 20 texts with 109,227 words and has been proofread manually. The corpus contents include: phrases, digit strings, letter strings, uncommon words, neutral tone, final retroflexion, Latin alphabet, interrogative sentences, 282 English words.
The speaker has been recorded in a professional recording studio over 2 channels: microphone and glottis wave (fundamental frequency) signals for a total of 18.2 hours.
Speech samples are stored as sequences of 16-bit 44,1 kHz PCM on two channels. The total data size is 5.67 Gb for a total of 12,679 files. The data is encoded in GB-2312 format.
The transcriptions include labels for four-class pause boundaries.
This database is aimed to be used within text-to-speech and speech synthesis applications.

View resource description in French

Ce corpus contient les enregistrements d’une locutrice de langue maternelle chinoise.
Le corpus est composé de 20 textes de 109 227 mots et a été vérifié manuellement. Le corpus contient des locutions, des séquences de chiffres, de lettres, des mots peu fréquents, le ton neutre, la rétroflexion, l’alphabet latin, des phrases interrogatives, et 282 mots anglais.
La locutrice a été enregistrée dans un studio d’enregistrement professionnel sur deux canaux : microphone et signaux de la glotte (fréquence fondamentale), pour un total de 18,2 heures.
Les échantillons de parole sont stockés sous la forme de séquences 16-bit 44,1 kHz PCM sur deux canaux. La taille totale des données est de 5,67 Go pour un total de 12 679 fichiers. Les données sont codées au format GB-2312.
Les transcriptions comprennent la segmentation utilisant quatre types de balises.
Cette base de données a été conçue pour des applications relatives aux technologies texte-parole (« text-to-speech ») et à la synthèse de la parole.

MEMBERacademiccommercial
Licence: Non Commercial Use - ELRA END USER
13932.00 € submit
13932.00 € submit
Licence: Commercial Use - ELRA VAR
13932.00 € submit
13932.00 € submit
NON MEMBERacademiccommercial
Licence: Non Commercial Use - ELRA END USER
13932.00 € submit
13932.00 € submit
Licence: Commercial Use - ELRA VAR
13932.00 € submit
13932.00 € submit
17/01/2007 Downloadable
People who looked at this resource also viewed the following: