Réduisez la dimensionnalité et visualisez vos données.
Définition
L'ACP transforme un grand nombre de variables corrélées en un nombre réduit de composantes principales non-corrélées qui capturent l'essentiel de la variabilité des données. Elle est idéale pour l'exploration et la visualisation de données multivariées.
Quand l'utiliser ?
Réduire la dimensionnalité d'un jeu de données avec de nombreuses variables
Visualiser des groupes ou des tendances dans des données multivariées
Éliminer la multicolinéarité avant une régression
Explorer la structure sous-jacente des données
Conditions requises
Variables continues et corrélées entre elles
Données standardisées (moyenne 0, écart-type 1)
N > nombre de variables recommandé
Ce que StatsLab calcule
Valeurs propres et % de variance expliquée
Éboulis (Scree plot)
Loadings (contributions des variables)
Biplot (scores + loadings)
Scores individuels sur les composantes
Cercle de corrélation
Exemple concret
Contexte : ACP sur 8 paramètres biologiques mesurés chez 120 patients.
Interprétation : Deux composantes suffisent à résumer 60% de l'information. Le biplot révèle que la pression artérielle et le cholestérol sont fortement corrélés (même direction sur PC1), tandis que l'âge et la glycémie définissent une dimension indépendante (PC2).