Typologies pour l’annotation de textes non standard en français (Typologies for the annotation of non-standard French texts)
Louise Tarrade, Cédric Lopez, Rachel Panckhurst, Geroges Antoniadis
Abstract
La tâche de normalisation automatique des messages issus de la communication électronique médiée requiert une étape préalable consistant à identifier les phénomènes linguistiques. Dans cet article, nous proposons deux typologies pour l’annotation de textes non standard en français, relevant respectivement des niveaux morpho-lexical et morpho-syntaxique. Ces typologies ont été développées en conciliant les typologies existantes et en les faisant évoluer en parallèle d’une annotation manuelle de tweets et de SMS.- Anthology ID:
- 2017.jeptalnrecital-court.15
- Volume:
- Actes des 24ème Conférence sur le Traitement Automatique des Langues Naturelles. Volume 2 - Articles courts
- Month:
- 6
- Year:
- 2017
- Address:
- Orléans, France
- Venue:
- JEP/TALN/RECITAL
- SIG:
- Publisher:
- ATALA
- Note:
- Pages:
- 118–125
- Language:
- French
- URL:
- https://www.aclweb.org/anthology/2017.jeptalnrecital-court.15
- DOI:
- PDF:
- http://aclanthology.lst.uni-saarland.de/2017.jeptalnrecital-court.15.pdf