Identification de descripteurs pour la caractérisation de registres (Feature identification for register characterization)

Jade Mekki, Delphine Battistelli, Gwénolé Lecorvé, Nicolas Béchet


Abstract
L’article présente une étude des descripteurs linguistiques pour la caractérisation d’un texte selon son registre de langue (familier, courant, soutenu). Cette étude a pour but de poser un premier jalon pour des tâches futures sur le sujet (classification, extraction de motifs discriminants). À partir d’un état de l’art mené sur la notion de registre dans la littérature linguistique et sociolinguistique, nous avons identifié une liste de 72 descripteurs pertinents. Dans cet article, nous présentons les 30 premiers que nous avons pu valider sur un corpus de textes français de registres distincts.
Anthology ID:
2018.jeptalnrecital-recital.6
Volume:
Actes de la Conférence TALN. Volume 2 - Démonstrations, articles des Rencontres Jeunes Chercheurs, ateliers DeFT
Month:
5
Year:
2018
Address:
Rennes, France
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
73–84
Language:
French
URL:
https://www.aclweb.org/anthology/2018.jeptalnrecital-recital.6
DOI:
Bib Export formats:
BibTeX MODS XML EndNote
PDF:
http://aclanthology.lst.uni-saarland.de/2018.jeptalnrecital-recital.6.pdf