M2VTS Speaker Verification Database

View resource name in all available languages

Base de données M2VTS

389-991-760-604-7

ID:

ELRA-S0021

The Multi Modal Verification for Teleservices and Security applications project (M2VTS), running under the European ACTS programme, has produced a database designed to facilitate access control using multimodal identification of human faces. This technique improves recognition efficiency by combining individual modalities (i.e. face and voice). Its relative novelty means that new test material had to be created, since no existing database could offer all modalities needed.

The M2VTS database comprises 37 different faces, with 5 shots of each being taken at one-week intervals, or when drastic face changes occurred in the mean time. During each shot, subjects were asked to count from 0 to 9 in their native language (generally French), and to move their heads from left to right, both with and without glasses. The data were then used to create three sequences, for voice, motion and "glasses off". The first sequence can be used for speech verification, 2-D dynamic face verification and speech/lips movement correlation, while the second and third provide information on 3-D face recognition, and may also be used to compare other recognition techniques.

View resource description in French

Le projet M2VTS (Multi Modal Verification for Teleservices and Security applications), issu du programme européen ACTS, a produit une base de données pour le contrôle d'accès utilisant l'identification multimodale de l'utilisateur. La base de données M2VTS comprend 37 visages différents, dont 5 prises de vues sont effectuées à raison d'une par semaine, ou plus si des changements significatifs du visage ont eu lieu entre temps. A l'occasion de chaque session de prise de vue, les sujets ont également prononcé la séquence des chiffres de 0 à 9 dans leur langue maternelle (en général, le français), et déplacé leur tête de la gauche vers la droite, avec et sans lunettes.

Les enregistrements ont été utilisées pour créer trois familles de données. La première peut être utilisée pour la vérification du locuteur, la vérification dynamique bidimensionnelle de visage, et l'utilisation des corrélations entre la parole et le mouvement des lèvres. La seconde et la troisième fournissent des informations pour la reconnaissance de visage tridimensionnelle et peuvent être utilisées pour des comparaisons avec d'autres techniques de vérification.

MEMBERacademiccommercial
Licence: Non Commercial Use - ELRA END USER
250.00 € submit
250.00 € submit
NON MEMBERacademiccommercial
Licence: Non Commercial Use - ELRA END USER
500.00 € submit
500.00 € submit
01/09/1996 Downloadable
People who looked at this resource also viewed the following: