UPC-TALP database of isolated meeting-room acoustic events

View resource name in all available languages

Base de données d’événements acoustiques isolés enregistrés en salle de réunion (UPC-TALP)

759-635-787-154-3

ID:

ELRA-S0268

This database was produced within the CHIL Project (Computers in the Human Interaction Loop), in the framework of an Integrated Project (IP 506909) under the European Commission's Sixth Framework Programme. It contains a set of isolated acoustic events that occur in a meeting room environment and that were recorded for the CHIL Acoustic Event Detection (AED) task. The recorded sounds do not have temporal overlapping. The database can be used as training material for AED technologies as well as for testing AED algorithms in quiet environments without temporal sound overlapping.

The database contains signals corresponding to 23 audio channels with corresponding labels (out of 84 channels used in the whole CHIL task). The 23 audio channels correspond to: 12 microphones of the 3 T-shaped clusters, 4 tabletop omni directional microphones, and 7 channels of the Mark III array.

Data was recorded at 44.1kHz, 24-bit precision, and then converted to 16-bit Raw Little Endian format. All the channels were synchronized. During all recordings two-three additional people were inside the room for a more realistic scenario.

Approximately 60 sounds per sound class were recorded. Each session was produced by the same ten people (5 men and 5 women). There are 3 sessions per participant. At each session, the participant took a different place in the room out of 7 fixed different positions. During each session a person had to produce a complete set of sounds twice. A script indicating the order of events to be produced was given to each participant. Almost each event was followed and preceded by a pause of several seconds. All sounds were produced individually, except “applause” and several “laugh” that were produced by the people that were inside the room altogether. The annotation was done manually.

The database is stored on 3 DVDs (one session per DVD).

The following table summarizes the content of the DVDs and shows the number of annotated acoustic events in each session:
















Event typeSession 1Session 2Session 3
Knock (door, table)151817
Door open202020
Door close202120
Steps282421
Chair moving232825
Spoon (cup jingle)232124
Paper work (listing, wrapping)312924
Key jingle212123
Keyboard typing212520
Phone ringing/Music373643
Applause202020
Cough222221
Laugh222121
Unknown384642

View resource description in French

Cette base de données a été produite dans le cadre du projet CHIL (Computers in the Human Interaction Loop), issu d’un projet intégré (IP 506909) du sixième programme-cadre de la Commission européenne. Il contient un ensemble d’événements acoustiques isolés qui ont été enregistrés dans une salle de réunion pour la tâche de détection d’événement acoustique CHIL (AED). Les sons ont été enregistrés sans chevauchement temporel. La base de données peut être utilisée pour l’entraînement des technologies AED ainsi que pour l’évaluation d’algorithmes AED en milieu calme sans chevauchement temporel des sons.

Cette base de données contient les signaux de 23 canaux audio accompagnés des étiquettes correspondantes (sur un total de 84 canaux utilisés pour la tâche intégrale dans CHIL). Les 23 canaux audio correspondent à: 12 microphones provenant de 3 groupes en forme de T, 4 microphones omnidirectionnels posés sur la table et 7 canaux enregistrés sur un tableau de microphones (Mark III array).

Les données ont été enregistrées à 44,1 kHz, à une précision de 24-bit, et ont été ensuite converties au format 16-bit Raw Little Endian. Tous les canaux ont été synchronisés. Pendant toute la durée des enregistrements, deux à trois personnes complémentaires étaient présentes dans la salle pour obtenir un scénario plus réaliste.

Environ 60 sons par classe de sons ont été enregistrés. Chaque session a été produite par les dix mêmes personnes (5 hommes et 5 femmes). La base comprend 3 sessions par participant. A chaque session, le participant prenait une place différente dans la salle parmi les 7 positions fixées. Pendant chaque session, une personne devait produire deux fois un même ensemble complet de sons. Un script indiquant l’ordre des événements à produire a été donné à chaque participant. La quasi-totalité des événements a été précédée et suivie d’une pause de plusieurs secondes. Tous les sons ont été produits individuellement, excepté “applause” et plusieurs “laugh”, qui ont été produits par l’ensemble des personnes présentes dans la salle en même temps. L’annotation a été faite manuellement.

La base de données est stockée sur 3 DVDs (une session par DVD).

Le tableau suivant résume le contenu des DVDs en donnant le nombre d’événements acoustiques qui ont été annotés pour chaque session:
















Type d’événementSession 1Session 2Session 3
Coup (porte, table)151817
Ouverture de porte202020
Fermeture de porte202120
Bruit de pas282421
Mouvement de chaise232825
Bruit de cuillère (bruit de tasse)232124
Bruit de papier (Feuilletage, bruissement)312924
Bruit de clé212123
Frappe au clavier212520
Sonnerie/Musique de téléphone373643
Applaudissement202020
Toux222221
Rire222121
Inconnu384642

MEMBERacademiccommercial
Licence: Non Commercial Use - ELRA END USER
0.00 € submit
0.00 € submit
Licence: Commercial Use - ELRA VAR
1000.00 € submit
1000.00 € submit
NON MEMBERacademiccommercial
Licence: Non Commercial Use - ELRA END USER
0.00 € submit
0.00 € submit
Licence: Commercial Use - ELRA VAR
1200.00 € submit
1200.00 € submit
11/01/2008 Downloadable
People who looked at this resource also viewed the following:
Resources from the same project