Uniformisation de corpus anglais annotés en sens (Unification of sense annotated English corpora for word sense disambiguation)

Loïc Vial, Benjamin Lecouteux, Didier Schwab


Abstract
Pour la désambiguïsation lexicale en anglais, on compte aujourd’hui une quinzaine de corpus annotés en sens dans des formats souvent différents et provenant de différentes versions du Princeton WordNet. Nous présentons un format pour uniformiser ces corpus, et nous fournissons à la communauté l’ensemble des corpus annotés en anglais portés à notre connaissance avec des sens uniformisés du Princeton WordNet 3.0, lorsque les droits le permettent et le code source pour construire l’ensemble des corpus à partir des données originales.
Anthology ID:
2017.jeptalnrecital-demo.9
Volume:
Actes des 24ème Conférence sur le Traitement Automatique des Langues Naturelles. Volume 3 - Démonstrations
Month:
6
Year:
2017
Address:
Orléans, France
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
27–29
Language:
French
URL:
https://www.aclweb.org/anthology/2017.jeptalnrecital-demo.9
DOI:
Bib Export formats:
BibTeX MODS XML EndNote
PDF:
http://aclanthology.lst.uni-saarland.de/2017.jeptalnrecital-demo.9.pdf