Apport de lACP probabiliste pour la gestion des données manquantes en ACPReport as inadecuate




Apport de lACP probabiliste pour la gestion des données manquantes en ACP - Download this document for free, or read online. Document in PDF available to download.

1 LMA2 - Laboratoire de Mathématiques Appliquées Agrocampus 2 IRMAR - Institut de Recherche Mathématique de Rennes 3 AGROCAMPUS OUEST

Résumé : Dans cette présentation, nous nous intéressons à la gestion des données manquantes en Analyse en Composantes Principales ACP. Une solution classique pour réaliser une ACP sur données incomplètes consiste à chercher les axes et les composantes qui minimisent l-erreur de reconstitution sur les données présentes. Pour ce faire, différents algorithmes ont été proposés dans la littérature dont une approche par moindres carrés alternés pondérés et une approche par ACP itérative. Cette dernière consiste en une imputation itérative des données au cours du processus d-estimation et s-apparente à un algorithme EM d-un modèle particulier. Nous détaillons dans un premier temps ces deux algorithmes et donnons leurs propriétés. Nous évoquons ensuite les difficultés rencontrées par ces algorithmes pour nous focaliser sur le problème de surajustement. Puis nous montrons comment la formulation probabiliste de l-ACP Bishop et Tipping, 1997 offre un terme de régularisation adapté pour pallier au surajustement. Enfin, les performances de ces algorithmes sont évaluées à partir de simulations et d-exemples réels.





Author: Julie Josse - François Husson - Jérôme Pagès -

Source: https://hal.archives-ouvertes.fr/



DOWNLOAD PDF




Related documents