BITS Logatome Synthesis Corpus – BITS-LG

View resource name in all available languages

Corpus de synthèse de logatomes BITS-LG




BITS stands for "BAS Infrastructures for Technical Speech Processing" and was funded by the German Ministry of Science and Education during 2003-2005. The BITS synthesis corpus consists of two parts: a set of logatome recordings for controlled diphone synthesis (ELRA-S0217) and a set of sentence recordings for unit selection techniques (ELRA-S0224).

This corpus contains 11,036 recordings of logatomes spoken by 4 professional German speakers covering all German diphone combinations as well as the most prominent combination German - French – English (each speaker had at least foreign language competence in English).

The data is stored on 4 DVDs. Each DVD contains the recordings, the annotation files and the meta data files of one of the four professional speakers, and the entire corpus' documentation. Each speaker was recorded in an insulated room with low reverberation.

Each logatome was recorded in three channels: close microphone, large membrane microphone and laryngographic signal. All diphones are segmented and labelled into phonemic units.

Total number of recordings: 11036
Total duration: 187 minutes
Format: WAV 48 kHz, 16 bit, Praat TextGrid, BAS Partitur Format (BPF)
Segmentation: extended German SAM-PA

View resource description in French

BITS ("BAS Infrastructures for Technical Speech Processing" - Infrastructures BAS pour le traitement de la parole technique) a été financé par le ministère allemand des sciences et de l’éducation entre 2003 et 2005. Le corpus de synthèse BITS est constitué de deux parties : un ensemble d’enregistrements de logatomes pour la synthèse de diphones contrôlés (ELRA-S0217) et un ensemble d’enregistrements de phrases pour les techniques de sélection d’unités (ELRA-S0224).

Ce corpus comprend 11 036 enregistrements de logatomes prononcés par 4 locuteurs professionnels allemands et couvre toutes les combinaisons de diphones allemands, ainsi que les combinaisons allemand - français - anglais les plus importantes (chaque locuteur a au moins des connaissances de l’anglais en tant que langue étrangère).

Les données sont fournies sur 4 DVD. Chaque DVD contient les enregistrements, les fichiers d’annotation et les fichiers de méta-données pour un locuteur, ainsi que la documentation complète du corpus. Chaque locuteur a été enregistré dans une salle isolée avec une réverbération basse.

Chaque logatome a été enregistré sur 3 canaux : un micro-casque, un microphone à membrane large et un signal laryngographique. Tous les diphones sont segmentés et étiquetés en unités phonémiques.

Nombre total d’enregistrements : 11 036
Durée totale : 187 minutes
Format: WAV 48 kHz, 16 bit, Praat TextGrid, Format « Partitur » de BAS
Segmentation: SAM-PA étendu à l’allemand

Licence: Non Commercial Use - ELRA END USER
627.17 € submit
4627.17 € submit
Licence: Commercial Use - ELRA VAR
4627.17 € submit
4627.17 € submit
NON MEMBERacademiccommercial
Licence: Non Commercial Use - ELRA END USER
754.35 € submit
9000.00 € submit
Licence: Commercial Use - ELRA VAR
9000.00 € submit
9000.00 € submit