PLS-DA (Partial Least Squares Discriminant Analysis)
Discriminez des groupes dans des données omiques ou haute dimension.
Définition
La PLS-DA est une méthode supervisée qui combine la réduction de dimension (comme l'ACP) avec la discrimination de groupes. Elle est particulièrement utilisée en métabolomique, protéomique et génomique où le nombre de variables dépasse largement le nombre d'observations.
Quand l'utiliser ?
Discriminer des groupes dans des données haute dimension (p >> n)
Identifier les variables discriminantes les plus importantes
Quand l'ACP ne discrimine pas suffisamment les groupes
Conditions requises
Variable dépendante catégorielle (2 groupes ou plus)
Variables indépendantes continues et nombreuses
Données standardisées recommandées
Ce que StatsLab calcule
Scores plots (composantes latentes)
Loadings plots (contribution des variables)
VIP scores (Variable Importance in Projection)
% de variance expliquée par composante
Séparation visuelle des groupes
Exemple concret
Contexte : Discrimination de 3 types de cancer (n=90) à partir de 150 métabolites sanguins.
Résultat obtenu : LV1 : 28% variance · LV2 : 19% · Séparation nette des 3 groupes sur le scores plot
Interprétation : La PLS-DA discrimine parfaitement les 3 types de cancer sur les 2 premières composantes. Les 15 métabolites avec VIP > 1,5 sont les biomarqueurs candidats les plus pertinents.