Atténuation des surdétections d'un correcteur grammatical de qualité commerciale

نویسندگان

  • Fabrizio Gotti
  • Philippe Langlais
  • Guy Lapalme
  • Simon Charest
  • Éric Brunelle
چکیده

We describe a study conducted on the proposal of Druide informatique inc., in collaboration with RALI, aiming at developing a system capable of detecting “overdetections”, i.e. designed for filtering detections erroneously flagged by a grammar checker. Various families of classifiers have been trained in a supervised way for 14 types of detections made by a commercial grade French grammar checker. Eight of the 14 classifiers we devised are now part of the latest edition of the grammar checker, embedded in a popular writing assistant. This project was conducted over a six-month period and is an interesting illustration of how a machine learning component can be successfully embedded in a robust, popular natural language application for commercial use. MOTS-CLÉS : correction grammaticale, classification de détections, ingénierie langagière.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Gestion de la qualité des Modèles de Processus Métier : Méthode et Outil

RÉSUMÉ. La problématique scientifique abordée correspond à la modélisation et à l'amélioration des processus métiers. Ce problème est d'un intérêt croissant pour les entreprises qui prennent conscience de l'impact indéniable que peuvent avoir une meilleure compréhension et une meilleure gestion des processus métiers (PM) sur l'efficacité, la cohérence et la transparence de leurs activités. Le t...

متن کامل

Une nouvelle approche pour la recherche d'images par le contenu

Résumé. On utilise l’analyse factorielle des correspondances (AFC) pour la recherche d’images par le contenu en s’inspirant directement de son utilisation en analyse des données textuelles (ADT). L’AFC permet ici de réduire les dimensions du problème et de sélectionner des indicateurs pertinents pour la recherche par le contenu. En ADT, l’AFC est appliquée à un tableau de contingence croisant m...

متن کامل

Evaluation modulaire d'un système de questions-réponses sur un corpus de questions semi-spontanées

RÉSUMÉ. Cet article présente une évaluation séquentielle du système de questions-réponses modulaire et stochastique SQuALIA. L’évaluation se fonde sur un corpus de question semispontanées obtenu en faisant poser 20 questions de référence à des adultes francophones, non francophones ou dyslexiques. Les expériences montrent que ce sont les fautes d’orthographe qui ont le plus d’impact sur les mod...

متن کامل

Dosage by High Performance Liquid Chromatography (HPLC) coupled with the dissolution of a combination of anti-tuberculous: a pilot study conducted in Cotonou, Benin

Efficient tuberculosis treatment requires the use of good quality medicines. The present study developed a method of dosage by High Performance Liquid Chromatography (HPLC) coupled with the dissolution of a combination of fixed doses of four anti-tuberculous (Isoniazid, Pyrazinamide, Ethambutol Hydrochlorate, Rifampicine). The elaborated protocol was thereafter used to assess the quality of med...

متن کامل

Dosage by High Performance Liquid Chromatography (HPLC) coupled with the dissolution of a combination of anti-tuberculous: a pilot study conducted in Cotonou, Benin

Efficient tuberculosis treatment requires the use of good quality medicines. The present study developed a method of dosage by High Performance Liquid Chromatography (HPLC) coupled with the dissolution of a combination of fixed doses of four anti-tuberculous (Isoniazid, Pyrazinamide, Ethambutol Hydrochlorate, Rifampicine). The elaborated protocol was thereafter used to assess the quality of med...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:
  • TAL

دوره 53  شماره 

صفحات  -

تاریخ انتشار 2012