Évaluation des critères asymétriques pour les arbres de décision
نویسندگان
چکیده
L’apprentissage supervisé sur données déséquilibrées fait l’objet de nombreux travaux (Provost (2000)). Pour le cas des arbres de décision, différents auteurs ont proposé d’utiliser des mesures d’entropie prenant en compte l’asymétrie pour la recherche du meilleur éclatement. Nous avons ainsi proposé une axiomatique permettant de définir une famille de mesures asymétriques (Zighed et al. (2007)). Comment évaluer la qualité des arbres construits avec de telles mesures ? En effet, les critères de performances globaux (comme le taux d’erreur) ne prennent pas en compte l’asymétrie des classes. Ceux qui évaluent les performances du modèle sur une seule classe sont tributaires de la règle d’affectation d’une classe dans chaque feuille. Or, dans le cas de données déséquilibrées, la règle majoritaire utilisée habituellement ne convient pas. Nous proposons donc une méthodologie et une évaluation des arbres construits avec une entropie asymétrique.
منابع مشابه
Arbres de décision sur des données de type intervalle : évaluation et comparaison
Résumé. Le critère de découpage binaire de Kolmogorov-Smirnov nécessite un ordre total des valeurs prises par les variables explicatives. Nous pouvons ordonner des intervalles fermés bornés de nombres réels de différentes façons. Notre contribution dans cet article consiste à évaluer et à comparer des arbres de décision obtenus sur des données de type intervalle à l’aide du critère de découpage...
متن کاملClassement d'objets incomplets dans un arbre de décision probabiliste
Résumé. Nous présentons une approche probabiliste pour déterminer les valeurs manquantes des objets incomplets pendant leur classement dans les arbres de décision. Cette approche est dérivée de la méthode d’apprentissage supervisé appelée Arbres d’Attributs Ordonnés proposée par Lobo et Numao en 2000, qui construit un arbre de décision pour chacun des attributs, selon un ordre croissant en fonc...
متن کاملExtraction automatique de connaissances pour la décision multicritère. (Automatic Knowledge Extraction pour Multicriteria Decision Making)
Cette application, sans prendre parti, aborde le sujet délicat qu’est l’automatisation cognitive. Elle propose la mise en place d’une chaîne informatique complète pour supporter chacune des étapes de la décision, en particulier la phase d’apprentissage en faisant de la connaissance actionnable (CA) une entité informatique manipulable par des algorithmes. La connaissance est extraite directement...
متن کاملProgrammation orientée-agent : évaluation comparative d'outils et environnements
RÉSUMÉ. Cet article propose une évaluation de différents outils de programmation et environnements de développement orientés-agents. L’évaluation se base sur un ensemble de critères déterminés à partir des caractéristiques jugées importantes pour les environnements de développement de systèmes multi-agents. Une justification des caractéristiques et des différents critères est donnée. Une grille...
متن کاملDiscretization of Continuous Features by Resampling
Résumé. Les arbres de décision sont largement utilisés pour générer des classificateurs à partir d’un ensemble de données. Le processus de construction est une partitionnement récursif de l’ensemble d’apprentissage. Dans ce contexte, les attributs continus son discrétisés. Il s’agit alors, pour chaque variable à discrétiser de trouver l’ensemble des points de coupure. Dans ce papier nous montro...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
دوره شماره
صفحات -
تاریخ انتشار 2008