Une plate-forme générique et ouverte pour le traitement des expressions polylexicales (An Open and Generic Framework for the Acquisition of Multiword Expressions) [in French]
نویسنده
چکیده
An Open and Generic Framework for the Acquisition of Multiword Expressions In this paper, we present and evaluate an open and flexible methodological framework for the automatic acquisition of multiword expressions (MWEs) from monolingual textual corpora. We start with a pratical motivation followed by a theoretical discussion of the behaviour and of the challenges that MWEs pose for NLP applications. Afterwards, we describe the modules of our framework, the overall pipeline and the design choices of the tool implementing the framework. The evaluation of the framework was performed extrinsically based on an application : computerassisted lexicography. This application can benefit from MWE acquisition because the expressions acquired automatically from corpora can both speed up the creation and improve the quality and the coverage of the lexical resources. The promising results of previous and ongoing experiments encourage further investigation about the optimal way to integrate MWE treatment into NLP applications, and particularly into machine translation systems. MOTS-CLÉS : Expressions polylexicales, extraction lexicale, lexique, mesures d’association, corpus, lexicographie.
منابع مشابه
A generic and open framework for multiword expressions treatment: from acquisition to applications. (Un environnement générique et ouvert pour le traitement des expressions polylexicales)
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi
متن کاملThe impact of domains for Keyphrase extraction (Influence des domaines de spécialité dans l'extraction de termes-clés) [in French]
Résumé. Les termes-clés sont les mots ou les expressions polylexicales qui représentent le contenu principal d’un document. Ils sont utiles pour diverses applications, telles que l’indexation automatique ou le résumé automatique, mais ne sont pas toujours disponibles. De ce fait, nous nous intéressons à l’extraction automatique de termes-clés et, plus particulièrement, à la difficulté de cette ...
متن کاملDe E-Wiz à C-Clone. Recueil, modélisation et synthèse d'expressions authentiques
RÉSUMÉ. Différents niveaux d’affects sont exprimés dans différents niveaux du traitement de la parole : les expressions des émotions, relevant d’un contrôle déclenché involontairement, les expressions des attitudes et des intentions du locuteur et les stratégies expressives métalinguistiques. C-Clone (Communicative Clone) est présenté comme une architecture cognitive interactive de la communica...
متن کاملCOBRA : Une plate-forme de RàPC basée sur des ontologies
Résumé : Cet article présente un projet en cours qui a pour objectif de développer une plateforme de RàPC pour le diagnostic basée sur des ontologies, appelée COBRA. Cette plate-forme est constituée de deux parties principales : les modèles de connaissances décrits par des ontologies, et les processus de raisonnement. Nous travaillons actuellement sur la défaillance des barrières de sécurité in...
متن کاملNeurological complications during leukemia and lymphosarcoma in children
Dans un service de 36 lits de medicine infantile une periode de 18 mois, 33 enfants furent hospitalises pour une affection hematologique maligne: 21 cas de leucemie aigi.ie, 1 cas de leucemie myeloide chronique, 2 cas de lymphomes malins, 9 cas de Hodgkin aux differents stades evolutifs. Aucune complication neurologique ne fut observe chez les malades attaints de Hodgkin. Ia moitie des enfa...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
دوره شماره
صفحات -
تاریخ انتشار 2012