2020
pdf
bib
abs
Étude sur le résumé comparatif grâce aux plongements de mots (Comparative summarization study using word embeddings)
Valentin Nyzam
|
Aurélien Bossard
Actes de la 6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 2 : Traitement Automatique des Langues Naturelles
Dans cet article, nous présentons une nouvelle méthode de résumé automatique comparatif. Ce type de résumé a pour objectif de permettre de saisir rapidement les différences d’information entre deux jeux de documents. En raison de l’absence de ressources disponibles pour cette tâche, nous avons composé un corpus d’évaluation. Nous présentons à la fois la méthodologie de son élaboration ainsi que le corpus lui-même. Notre méthode utilise les avancées récentes dans le calcul de similarité entre phrases afin de détecter les informations comparatives. Nous montrons que sur ce corpus, notre méthode est comparable en termes de qualité de résultats à une méthode de l’état de l’art, tout en réduisant d’un facteur dix le temps de calcul, la rendant donc exploitable dans le cadre de l’aide à l’analyse de documents.
2019
pdf
bib
abs
A Modular Tool for Automatic Summarization
Valentin Nyzam
|
Aurélien Bossard
Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics: System Demonstrations
This paper introduces the first fine-grained modular tool for automatic summarization. Open source and written in Java, it is designed to be as straightforward as possible for end-users. Its modular architecture is meant to ease its maintenance and the development and integration of new modules. We hope that it will ease the work of researchers in automatic summarization by providing a reliable baseline for future works as well as an easy way to evaluate methods on different corpora.
2018
pdf
bib
abs
MOTS : un outil modulaire pour le résumé automatique (MOTS : A Modular Framework for Automatic Summarization )
Valentin Nyzam
|
Christophe Rodrigues
|
Aurélien Bossard
Actes de la Conférence TALN. Volume 1 - Articles longs, articles courts de TALN
Cet article présente un système open source et modulaire pour le résumé automatique : MOTS, développé en Java. Son architecture permet d’implémenter et tester de nouvelles méthodes de résumé automatique et de les comparer avec des méthodes existantes dans un cadre unifié. Ce système, le premier complètement modulaire pour le résumé automatique permet à l’heure actuelle de définir plus de cent combinaisons de modules afin de résumer automatiquement des textes en langage naturel.
2017
pdf
bib
abs
Un outil modulaire libre pour le résumé automatique (A Modular Open Source Tool for Automatic Summarization)
Valentin Nyzam
|
Aurélien Bossard
Actes des 24ème Conférence sur le Traitement Automatique des Langues Naturelles. Volume 3 - Démonstrations
automatique Valentin Nyzam Aurélien Bossard LIASD, Université Paris 8 - IUT de Montreuil, 140 rue de la Nouvelle France, 93100 Montreuil, France valentin.nyzam@iut.univ-paris8.fr, aurelien.bossard@iut.univ-paris8.fr R ÉSUMÉ Nous proposons une démonstration d’un outil modulaire et évolutif de résumé automatique qui implémente trois méthodes d’extraction de phrases de l’état de l’art ainsi que sept méthodes d’évaluation des phrases. L’outil est développé en Java et est d’ores-et-déjà disponible sur la plateforme Github.
pdf
bib
abs
Résumer automatiquement en ligne : démonstration d’un service web de résumé multidocument (Summarizing Automatically Online : We propose a demonstration of an automatic multidocument summarization web service)
Valentin Nyzam
|
Nathan Gatto
|
Aurélien Bossard
Actes des 24ème Conférence sur le Traitement Automatique des Langues Naturelles. Volume 3 - Démonstrations
r automatiquement en ligne : démonstration d’un service web de résumé multidocument Valentin Nyzam Nathan Gatto Aurélien Bossard LIASD, Université Paris 8 - IUT de Montreuil, 140 rue de la Nouvelle France, 93100 Montreuil, France valentin.nyzam@iut.univ-paris8.fr, nathan.gatto@free.fr, aurelien.bossard@iut.univ-paris8.fr R ÉSUMÉ Nous proposons une démonstration d’un webservice de résumé automatique multidocument. Ce webservice s’appuie sur un outil ouvert qui implémente plusieurs algorithmes reconnus de résumé automatique, et permet de résumer des documents en utilisant des configurations différentes.
pdf
bib
abs
An Evolutionary Algorithm for Automatic Summarization
Aurélien Bossard
|
Christophe Rodrigues
Proceedings of the International Conference Recent Advances in Natural Language Processing, RANLP 2017
This paper proposes a novel method to select sentences for automatic summarization based on an evolutionary algorithm. The algorithm explores candidate summaries space following an objective function computed over ngrams probability distributions of the candidate summary and the source documents. This method does not consider a summary as a stack of independent sentences but as a whole text, and makes use of advances in unsupervised summarization evaluation. We compare this sentence extraction method to one of the best existing methods which is based on integer linear programming, and show its efficiency on three different acknowledged corpora.
2015
pdf
bib
abs
ROBO, an edit distance for sentence comparison Application to automatic summarization
Aurélien Bossard
|
Christophe Rodrigues
Actes de la 22e conférence sur le Traitement Automatique des Langues Naturelles. Articles courts
Dans cet article, nous proposons une mesure de distance entre phrases fondée sur la distance de Levenshtein, doublement pondérée par la fréquence des mots et par le type d’opération réalisée. Nous l’évaluons au sein d’un système de résumé automatique dont la méthode de calcul est volontairement limitée à une approche fondée sur la similarité entre phrases. Nous sommes donc ainsi en mesure d’évaluer indirectement la performance de cette nouvelle mesure de distance.
pdf
bib
abs
Une Approche évolutionnaire pour le résumé automatique
Aurélien Bossard
|
Christophe Rodrigues
Actes de la 22e conférence sur le Traitement Automatique des Langues Naturelles. Articles courts
Dans cet article, nous proposons une méthode de résumé automatique fondée sur l’utilisation d’un algorithme génétique pour parcourir l’espace des résumés candidats couplé à un calcul de divergence de distribution de probabilités de n-grammes entre résumés candidats et documents source. Cette méthode permet de considérer un résumé non plus comme une accumulation de phrases indépendantes les unes des autres, mais comme un texte vu dans sa globalité. Nous la comparons à une des meilleures méthodes existantes fondée sur la programmation linéaire en nombre entier, et montrons son efficacité sur le corpus TAC 2009.
2009
pdf
bib
Integrating Document Structure into a Multi-Document Summarizer
Aurélien Bossard
|
Thierry Poibeau
Proceedings of the International Conference RANLP-2009
pdf
bib
CBSEAS, a Summarization System – Integration of Opinion Mining Techniques to Summarize Blogs
Aurélien Bossard
|
Michel Généreux
|
Thierry Poibeau
Proceedings of the Demonstrations Session at EACL 2009