Author Archives: Pari

Classification consensuelle

Objectif : Proposer le développement d’une plateforme d’algorithmes de classification statique et dynamique.
Dans tous les secteurs d’activités de notre société, le développement des systèmes d’acquisition et de production génère des quantités importantes de données. Leur exploitation par les systèmes informatiques est essentielle pour relever des défis scientifiques et technologiques dans des domaines tels que la santé, l’environnement, la biologie, les télécommunications, le multimédia, l’énergie, le transport en général, le contrôle non destructif … Les traitements sont améliorés grâce au développement d’algorithmes performants alliant des connaissances physiques à des aspects mathématiques et informatiques. Parmi les traitements, un des enjeux est de mettre en évidence des interactions entre les données pour mieux les comprendre et établir un modèle. Une étape indispensable est de regrouper les observations selon un ou plusieurs critères pour établir des classes.
Nous proposons de développer une plateforme de classification pour:
1) pouvoir comparer les performances des algorithmes entre eux.
2) les faire dialoguer pour qu’ils puissent éventuellement se corriger et faire émerger de nouveaux algorithmes de classification.
3) effectuer une agrégation de plusieurs classifieurs.
Concernant les aspects classifications, ce sujet s’inscrit au niveau national dans le cadre des GdR 720 ISIS (Information, Signal, Images et ViSion) et GdR MACS (Modélisation, Analyse et Conduite des Systèmes Dynamiques). C’est une structure d’animation du CNRS évaluée tous les quatre ans qui a été renouvelée par l’INS2I (Institut des Sciences Informatiques et de leurs Interactions). Le GdR ISIS compte 105 laboratoires affiliés et 17 partenaires industriels. La thématique est soutenue par des associations de professionnels en France telles que la SEE, le club EEA, ou à l’international tel que IEEE. Au niveau du laboratoire, le thème de la classification est une préoccupation de l’axe 1. Notre objectif à plus long terme est d’enrichir la plateforme en s’orientant vers un dépôt de projet ANR ou des projets européens de type ICT (STREP, …).
Il existe de nombreux algorithmes de classification développés par la communauté scientifique. Leurs performances sont évaluées sur les jeux de données répertoriés (par exemple : http://archive.ics.uci.edu/ml/). Appliqués sur un même jeu, certains algorithmes fournissent de bons résultats, c’est-à-dire des résultats conformes à nos attentes en matière de bonne classification, alors que d’autres fournissent des résultats globalement moins performants. Par contre, un algorithme aux résultats moins performants peut mettre en évidence des liens qui n’auront pas été vus par l’algorithme plus performant. Par exemple un algorithme peut fournir un très bon taux de classification et ne pas détecter une classe alors qu’un autre fournira un taux de classification plus faible mais détectera la classe en question.
L’idée du multiclassifieur est apparue dans les années 1990, l’enjeu est d’améliorer les performances globales en cumulant les avantages et sans garder les inconvénients. Deux approches se dégagent, la première approche cherche à fusionner (Ruta 2000) [1].. les résultats de plusieurs classifieurs alors que la seconde consiste à choisir un ensemble de meilleurs classifieurs parmi un ensemble plus vaste (Aksela 2003) [2]..
La fusion peut être réalisée en adoptant une architecture de classifieur en parallèle ou en cascade (Gunes, 2003) [3] .. Si l’architecture est en parallèle, la sortie finale peut dépendre : 1) de la sortie de chaque classifieur pondérée par un poids en fonction des performances, 2) de la fusion des sorties par la règle de Demster-Schafer, 3) de la théorie bayésienne ou 4) de règles fixes
(Chen, 1997)
[4].
Si la fusion est réalisée par une architecture séquentielle, le nombre de classes est réduit progressivement jusqu’à la décision finale, de sorte que le multi-classifieur guide progressivement la décision. Le choix des classifieurs est 1) soit statique (Aksela, 2003) : il est défini pendant la phase d’apprentissage, 2) soit dynamique (Giacinto, 1999) [5].: auquel cas un classifieur est utilisé si à un moment donné il convient le mieux.Concernant l’implantation de la plate-forme une réflexion avait été menée sur sa faisabilité (H Akdag, 2005) [6]..dans laquelle les classifieurs de type supervisé par méthode d’apprentissage communiquent pour que chacun choisisse le meilleur jeu d’échantillons. Dans l’exemple testé, la méthode dynamique avec un nombre d’échantillons constant conduisait aux meilleurs résultats. Un exemple d’architecture de plate-forme est la plateforme multi-agents Madkit développée par Olivier Gutknecht Jacques Ferber et Fabien Michel au LIRMM (http://www.madkit.org/).
Bien évidemment, d’autres tests, d’autres bases, d’autres méthodes sont à explorer, ainsi que les méthodes de coopération entre les échantillons. Notre consortium regroupe des enseignants-chercheurs qui réunissent des compétences en Intelligence artificielle, en Systèmes Multi-Agents, en Traitement du Signal et en Synthèse d’Images. La complémentarité de nos compétences nous permet d’entreprendre l’élaboration d’une plateforme de classification en vue de disposer d’un outil performant d’aide à la classification dans des contextes où le choix de l’algorithme est difficile.



[1] D. Ruta & B. Gabrys, “An Overview of Classifier Fusion Methods”, Computing and Information Systems, 7, 2000.
[2] M. Aksela, “Comparison of Classifier Selection Methods forImproving Committee Performance”, Lecture Notes in Computer Science, Volume 2709, 2003.
[3] V. Gunes, M. Menard, P. Loonis & S. Petit-Renaus, “Combination, Cooperation and Selection of Classifiers : A State of Art”, International Journal of Pattern Recognition and Artificilal Intelligence, Volume 17, Issue 8, 2003.

[4]
K. Chen, L. Wang & H. Chi, “Methods of Combining Multiple Classifiers with Different Features and their Applications to Text-Independent Speaker Identification”, International Journal of Pattern Recognition and Artificial Intelligence, 11(3), 1997.
[5] G. Giacinto & F. Roli, Methods for Dynamic Classifier Selection, 10th International Conference on Image Analysis and Processing (ICIAP’99), 1999.
[6] A. Saidane, H. Akdag & I. Truck, Une approche SMA
de l’Agrégation et de la Coopération des Classifieurs, Conférence Internationale SETIT’2005.



mots-clés :
Apprentissage Automatique, Classification, Plateforme Multi-Agent, Aggrégation de classifieurs.