Mon article pour Chimio2009 en Word

نویسنده

  • C. Gomes
چکیده

Faced to safety constraints, one cannot rely on a single prediction method, especially when the sample size is low. Stacking introduced by Wolpert (1992) and Breiman (1996) is a successful way of combining several models. We modify the usual stacking methodology when the response is binary and predictions highly correlated, by combining predictions with PLS-Discriminant Analysis instead of ordinary least squares. A strategy based on repeated split samples is then developed to select relevant variables and ensure the robustness of the final model. This method is applied to the prediction of hazard of 165 chemicals, based upon 35 in vitro and in silico characteristics.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Transport électronique dans le graphène

Remerciements Durant ces 3 années de Doctorat j'aurai beaucoup appris. Bien sûr, cela m'a per-mis d'aller beaucoup plus loin en physique. Cette thèse aura aussi été une leçon de vie, ces trois ans qui m'ont été donnés pour réaliser un projet de recherche ont été plus qu'instructifs. Tant sur le point de vue humain que professionnel, ce projet m'a donné l'occasion d'interagir avec beaucoup de mo...

متن کامل

Aspirant FNRS

Cohomologie BRST locale des théories de p-formes Dissertation présentée en vue de l'obtention du grade de Docteur en Sciences 3 Titre de la thèse annexe L'utilisation des méthodes de simulation des grandeséchelles et de la modé-lisation des structures les plus petites permet de caractériser la turbulence magnéto-hydrodynamique. 5 Remerciements Je remercie vivement mon promoteur, Marc Henneaux, ...

متن کامل

Recherche en temps réel de préfixes massifs hiérarchiques dans un réseau IP à l'aide de techniques de stream mining

Résumé. Au cours de ces dernières années, de nombreuses techniques de stream mining ont été proposées afin d’analyser des flux de données en temps réel. Dans cet article, nous montrons comment nous avons utilisé des techniques de stream mining permettant la recherche d’objets massifs hiérarchiques (hierarchical heavy hitters) dans un flux de données pour identifier en temps réel dans un réseau ...

متن کامل

Tensions entre théorie et pratique dans les systèmes de TAL. Étude historique et épistémologique (Tensions Between Theory and Practice in NLP Systems. Historic and Epistemological Study) [in French]

RÉSUMÉ Le TAL est tenu pour une activité pratique hétérogène susceptible d’associer dans un même système des méthodes et des théories linguistiques ou philosophiques parfois contradictoires. Dans mon exposé, je vais tâcher d’expliciter cette tension en m’appuyant sur une étude de tout premiers systèmes de TAL, modèles de traduction automatique et d’extraction d’information, mis au point dans le...

متن کامل

Conception et normalisation des bases de données en Sciences Humaines et Sociales

Parmi mes recherches de supports de cours en ligne sur la toile, je conseillais le document de mon collègue Marc Grange de l’université de Lyon 2. Pourquoi ? Pour sa clarté et sa pédagogie et la mise en amont des concepts du modèle relationnel indépendamment des domaines d’applications, ici les sciences humaines et sociales. Ensuite, suit l’apprentissage, dans le cas du relationnel, du langage ...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2013