Visualisez la structure hiérarchique de vos données.
Définition
Le clustering hiérarchique agglomératif (AGNES) construit une hiérarchie de clusters représentée par un dendrogramme. Contrairement au K-means, il ne nécessite pas de spécifier k à l'avance et permet d'explorer différents niveaux de regroupement.
Quand l'utiliser ?
Explorer la structure hiérarchique naturelle des données
Visualiser des relations entre observations avec un dendrogramme
Quand le nombre de clusters n'est pas connu a priori
Données génomiques, écologiques, textuelles
Conditions requises
Variables continues (ou distance calculée au préalable)
Taille d'échantillon modérée (< 500 recommandé pour la lisibilité)
Différentes méthodes de liaison disponibles (Ward, Complete, Average)
Ce que StatsLab calcule
Dendrogramme SVG interactif
Assignation des clusters (coupe à la hauteur choisie)
Statistiques descriptives par cluster
Méthodes : Ward, Complete, Single, Average, Centroid
Exemple concret
Contexte : Classification hiérarchique de 30 pays selon 5 indicateurs de développement.
Résultat obtenu : 4 groupes distincts à la coupure h=8 : Pays développés, Émergents, En développement, Fragiles
Interprétation : Le dendrogramme révèle deux grands super-clusters : pays à haut IDH vs pays à bas IDH. La méthode de Ward produit des clusters de taille équilibrée.