NRC Emotion Lexicon - Revised version

View resource name in all available languages

Lexique d’émotions NRC – version révisée

007-544-786-822-8

ID:

ELRA-L0130

The NRC Emotion Lexicon was originally built by Saif M. Mohammad and Peter D. Turney through crowdsourcing. The NRC was created in order to assist with emotion analysis as other emotion lexicons were smaller at the time. In order to be able to fix this problem, Saif crowdsourced a huge collection of English terms obtained from sources like the Macquarie Thesaurus, Global Inquirer, and the WordNet Affect Lexicon. From this, human annotation was done through Amazon's Mechanical Turk and thus, the NRC Lexicon was validated and distributed.

After close inspection of the NRC emotion lexicon, a large number of troubling entries were identified, where words that should in most contexts be emotionally neutral, with no affect (e.g., lesbian, stone, mountain), are associated with emotional labels that are inaccurate, nonsensical, pejorative, or, at best, highly contingent and context-dependent (e.g. lesbian labeled as DISGUST and SADNESS, stone as ANGER, or mountain as ANTICIPATION).

The revised NRC consists of 5,916 entries that result from the works referenced in Zad et al. (2021) "Hell Hath No Fury? Correcting Bias in the NRC Emotion Lexicon", published at the WOAH, the 5th Workshop on Online Abuse and Harms.

The root of the main archive contains a Readme file which explains the archive contents. The Java code inside the archive can be imported directly into the Eclipse IDE as a project encapsulating which can be used to reproduce the results of the paper; the code compiles with Java 1.8. The main archive also contains the final camera ready copy of the paper for reference. The code and data are released under the terms of CC-BY-NC 4.0. (2021-08-05).

View resource description in French

Le lexique d’émotions NRC a été initialement produit par Saif M. Mohammad et Peter D. Turney via une méthode de crowdsourcing. Le NRC a été créé afin d’aider à l’analyse des émotions à une période où d’autres lexiques d’émotions étaient moins conséquents. Afin de résoudre ce manque, Saif a utilisé une méthode de crowdsourcing pour obtenir une grande collection de termes en anglais provenant de sources telles que le thesaurus Macquarie, Global Inquirer, et le lexique WordNet Affect. Sur cette base, une annotation humaine a été produite via le Mechanical Turk d’Amazon et le lexique NRC a ainsi été validé et distribué.

Suite à un examen approfondi de ce lexique, un grand nombre d’entrées problématiques ont pu être identifiées, où les mots qui auraient dû dans la plupart des contextes être considérés comme émotionnellement neutres, sans affect particulier (par exemple “lesbian”, “stone”, “mountain”), avaient été associés à des étiquettes émotionnelles inadéquates, absurdes, pejoratives, ou, au mieux, fortement dépendantes du contexte (par exemple, “lesbian” avait pour etiquettes “DISGUST” et “SADNESS”, “stone” était labellisée “ANGER”, ou “mountain” était associée à “ANTICIPATION”).

La version révisée de NRC comprend 5916 entrées resultant des travaux référencés dans Zad et al. (2021) "Hell Hath No Fury? Correcting Bias in the NRC Emotion Lexicon", publiés à la 5ème edition du WOAH (Workshop on Online Abuse and Harms).

La racine de l’archive principale contient un fichier Readme qui détaille le contenu de l’archive. Le code Java fourni dans l’archive peut être importé directement dans Eclipse IDE comme projet pouvant être utilisé afin de reproduire les résultats de l’article sus-mentionné. Le code est compilé sous Java 1.8. L’archive principale contient également la version finale de l’article pour référence. Le code et les données sons distribués selon les termes de la licence CC-BY-NC 4.0. (2021-08-05).

MEMBERacademiccommercial
Licence: Non Commercial Use - CC-BY-NC-4.0
NON MEMBERacademiccommercial
Licence: Non Commercial Use - CC-BY-NC-4.0
22/09/2021
People who looked at this resource also viewed the following: