Potentiel

De manière générale, les classifieurs requièrent la définition d’une mesure, la définition d’un espace de représentation des données et l’établissement de règles de décisions. Leur mise en relation permet de construire le classifieur. Les résultats des algorithmes peuvent être évalués à l’aide d’ « une vérité terrain » si celle-ci est accessible ou d’indices tels que le taux de bonne classification ou la matrice des contingences…

Considérons deux algorithmes A et B, le taux de bonne classification peut être élevé pour l’algo A alors qu’une classe n’a pas été détectée, et moins élevé pour l’algo B alors que toutes les classes ont été détectées mais il existe un nombre d’erreurs plus important. En fonction de la mesure d’évaluation des algorithmes, leur pertinence n’est pas non plus perçue de la même manière. Un algorithme peut être « bon » sur un critère et « mauvais » sur un autre, ceci découle du fait que dans la plupart des travaux de recherche, les problèmes à résoudre sont non triviaux.

L’originalité consiste à exploiter le fait que les algorithmes sont indépendants et complémentaires pour les faire dialoguer et parvenir à une meilleure classification qui soit fiable, précise, robuste. Pour une application donnée, il n’est pas nécessaire d’utiliser tous les algorithmes disponibles mais de constituer un ensemble d’algorithmes dont les résultats sont évalués selon plusieurs critères. Les algorithmes peuvent aussi être exécutés en parallèle et échanger des informations pour améliorer leur performance globale. Dans les cas de classification supervisée où le classifieur est entrainé à partir d’un ensemble d’échantillons, l’objectif est d’obtenir les échantillons les plus représentatifs de la population. Ceci est particulièrement intéressant pour une application de diagnostic en ligne où un multiclassifieur à structure de sélection dynamique est mis en œuvre.

L’objectif final est une agrégation-coopération des algorithmes de classification qui consiste à incorporer des informations indépendantes et complémentaires et à échanger des informations entre algorithmes. D’abord un travail important consiste à recenser les algorithmes existants et à établir des bibliothèques en fonction des critères qu’ils optimisent et la manière dont ils les optimisent, de même pour les indices de mesure de performance. Pour des applications types (bases recensées, applications sur des images médicales), l’influence des paramètres des algorithmes sera testée et leurs performances estimées pour essayer de dégager des indications sur les paramètres à prendre en première approximation. A partir de là, pour un type d’application une sorte de mode d’emploi dans le choix des algorithmes et des paramètres sera définie. L’aspect « fusion » sera abordé de manière séquentielle ou parallèle en vue de dégager des combinaisons d’algorithmes intéressantes, incorporer les informations complémentaires et développer l’aspect communication entre les algorithmes.