Dans de nombreuses applications, les variables explicatives sont des
fonctions discrétisées et non des données multidimensionnelles classiques.
Beaucoup de méthodes d'analyse statistique des données ont été transposées au
cadre fonctionnel sous le nom générique de FDA (Functional Data Analysis).
Nous nous proposons ici de présenter l'utilisation des SVM, connus pour leurs
bonnes capacités de généralisation, pour la discrimination de courbes. Nous
montrons comment des noyaux simples peuvent prendre en compte la nature
fonctionnelle des données et produire des classifieurs consistants. Nous
illustrons notre propos par diverses expériences sur données réelles ou
simulées.
In FrenchNovember 16th: Séminaire du groupe de travail MAFIA, Laboratoire de Statistique et Probabilités, Université Paul Sabatier, Toulouse, Discrimination de courbes par SVM.
In FrenchMay 30th: Séminaire de l’Instituto de Territorio y Patrimonio Historico, University of Granada, Spain, Modélisation de la dynamique d’occupation du sol par réseaux de neurones.
In FrenchMay 16th: Séminaire du Laboratoire de Statistique et Probabilités, Université Paul Sabatier, Toulouse, MTraitement de données fonctionnelles par Support Vector Machine.
In FrenchNovember 24th: Séminaire du SAMOS, Université Paris 1, Réseaux de neurones et SVM à entrées fonctionnelles : une approche par régression inverse.
Dans le domaine de l'analyse des données fonctionnelles, les
méthodes statistiques classiques sont confrontées à des
problèmes nouveaux dus au fait que les variables aléatoires
étudiées vivent dans des espaces de dimension infinie.
Beaucoup de méthodes statistiques classiques ont donc été
repensées pour s'adapter aux données fonctionnelles. Nous
nous intéressons ici à l'utilisation des perceptrons
multi-couches pour traiter des problèmes de régression et de
classification à entrées fonctionnelles : la méthode proposée
est basée sur une approche par régression inverse permettant
d'obtenir un pré-traitement pertinent des données ; des
résultats théoriques et des applications sur données réelles
montrent l'efficacité de cette approche. Nous expliquons
également comment cette méthodologie peut être adaptée à
d'autres types de traitements statistiques et, notamment, aux
Support Vector Machine ; là aussi, des simulations illustrent
notre propos.