CLEF Question Answering Test Suites (2003-2008) – Evaluation Package

View resource name in all available languages

Séquences de test CLEF Questions Réponses (2003-2008) – Package d’évaluation

394-993-527-034-7

ID:

ELRA-E0038

The Cross-Language Evaluation Forum (CLEF) promotes R&D in multilingual information access (MLIA) by (i) developing an infrastructure for the testing, tuning and evaluation of information retrieval systems operating on European languages in both monolingual and cross-language contexts, and (ii) creating test-suites of reusable data which can be employed by system developers for benchmarking purposes.

The CLEF Question Answering Suites (2003-2008) contain the data used for the Question Answering (QA) track of the CLEF campaigns carried out from 2003 to 2008. This track tested the performance of monolingual, bilingual and multilingual Question Answering systems on multilingual collections of news documents.

The CLEF Test Suite is composed of:
• News Data Collections
• Questions
• Guidelines
• Relevance assessments
• Official campaign results
• Working notes papers

The News Data Collections consist of the following datasets:
• Bulgarian
o Sega 2002 (33,356 documents, 120 Mb)
o Standart 2002 (35,839 documents, 93 Mb)
o Novinar 2002 (18,086 documents, 48 Mb)
• Dutch
o NRC Handelsblad 1994/95 (84,121 documents, 299 Mb)
o Algemeen Dagblad 1994/95 (106,483 documents, 241 Mb)
• English
o Glasgow Herald 1995 (56,472 documents, 154 Mb)
o Los Angeles Times 1994 (113,005 documents, 425 Mb)
• Finnish
o Aamulehti late-1994/95 (55,344 documents, 137 Mb)
• French
o Le Monde 1994 (44,013 documents, 157 Mb)
o Le Monde 1995 (47,646 documents, 156 Mb)
o SDA French 1994 (43,178 documents, 86 Mb)
o SDA French 1995 (42,615 documents, 88 Mb)
• German
o Frankfurter Rundschau 1994 (139,715 documents, 320 Mb)
o Der Spiegel 1994/95 (13,979 documents, 63 Mb)
o SDA German 1994 (71,677 documents, 144 Mb)
o SDA German 1995 (69,438 documents, 141 Mb)
• Italian
o La Stampa 1994 (58,051 documents, 193 Mb)
o SDA Italian 1994 (50,527 documents, 85 Mb)
o SDA Italian 1995 (48,980 documents, 85 Mb)
• Portuguese
o Público 1994 (51,751 documents, 164 Mb)
o Público 1995 (55,070 documents, 176 Mb)
o Folha de São Paulo 1994 (51,875 documents, 108 Mb)
o Folha de São Paulo 1995 (52,038 documents, 116 Mb)
• Romanian
o Wikipedia
• Spanish
o EFE 1994 (215,738 documents, 509 Mb)
o EFE 1995 (238,307 documents, 577 Mb)

The full package is stored on 1 DVD.

View resource description in French

Le forum CLEF (Cross-Language Evaluation Forum) a pour but de promouvoir les travaux de R&D pour l’accès à l’information multilingue (i) en développant une infrastructure pour le test, le réglage et l’évaluation des systèmes de recherche d’information fonctionnant sur des langues européennes dans des contextes à la fois monolingues et cross-lingues, et (ii) en créant des séquences de test de données réutilisables qui peuvent être utilisées par des développeurs de systèmes dans des objectifs de benchmarking.

Les séquences de test CLEF Questions Réponses (2003-2008) contiennent les données utilisées pendant la tâche Questions Réponses des campagnes CLEF réalisées de 2003 à 2008. Cette tâche a testé la performance de systèmes de questions réponses monolingues, bilingues et multilingues sur des collections de textes d’actualités multilingues.

Le package CLEF est composé de:
• Collections de textes d’actualités
• Questions
• Manuels
• Jugements de pertinence
• Résultats de la campagne officielle
• Notes de travail

Les collections de textes d’actualités comprennent les ensembles de données suivants:
• Allemand
o Frankfurter Rundschau 1994 (139 715 documents, 320 Mo)
o Der Spiegel 1994/95 (13 979 documents, 63 Mo)
o SDA allemand 1994 (71 677 documents, 144 Mo)
o SDA allemand 1995 (69 438 documents, 141 Mo)
• Anglais
o Glasgow Herald 1995 (56 472 documents, 154 Mo)
o Los Angeles Times 1994 (113 005 documents, 425 Mo)
• Bulgare
o Sega 2002 (33 356 documents, 120 Mo)
o Standart 2002 (35 839 documents, 93 Mo)
o Novinar 2002 (18 086 documents, 48 Mo)
• Espagnol
o EFE 1994 (215 738 documents, 509 Mo)
o EFE 1995 (238 307 documents, 577 Mo)
• Finnois
o Aamulehti late-1994/95 (55 344 documents, 137 Mo)
• Français
o Le Monde 1994 (44 013 documents, 157 Mo)
o Le Monde 1995 (47 646 documents, 156 Mo)
o SDA français 1994 (43 178 documents, 86 Mo)
o SDA français 1995 (42 615 documents, 88 Mo)
• Italien
o La Stampa 1994 (58 051 documents, 193 Mo)
o SDA italien 1994 (50 527 documents, 85 Mo)
o SDA italien 1995 (48 980 documents, 85 Mo)
• Néerlandais
o NRC Handelsblad 1994/95 (84 121 documents, 299 Mo)
o Algemeen Dagblad 1994/95 (106 483 documents, 241 Mo)
• Portugais
o Público 1994 (51 751 documents, 164 Mo)
o Público 1995 (55 070 documents, 176 Mo)
o Folha de São Paulo 1994 (51 875 documents, 108 Mo)
o Folha de São Paulo 1995 (52 038 documents, 116 Mo)
• Roumain
o Wikipedia

Le package complet est stocké sur 1 DVD.

MEMBERacademiccommercial
Licence: Evaluation Use - ELRA EVALUATION
150.00 € submit
500.00 € submit
NON MEMBERacademiccommercial
Licence: Evaluation Use - ELRA EVALUATION
300.00 € submit
1000.00 € submit
03/11/2010
People who looked at this resource also viewed the following:
Resources from the same project