# ================================================================ # CAH sur tableau de contingence avec les packages ade4 et cluster # ================================================================ # Les options de la procédure "agnes" ne prévoyant pas le calcul des distances du chi-2 sur un # tableau de contingence initial, il convient de construire préalablement le tabeau des distances. # On peut utiliser le package "ade4" (voir l'aide pour ce package et ses procédures...) paris = read.table("paris2007.csv", header=TRUE, sep=";",,, "Candidat") # la colonne "Candidat" est l'identifiant # Élections à Paris. Candidats en lignes et arrondissements en colonnes, première colonne et première ligne # identifiants fix(paris) # pour voir à l'éditeur (ne pas oublier de le refermer) library(ade4) # chargement du package "ade4" supposé déjà installé depuis un site de R # on utilise les procédures "dudi.coa" et "dist.dudi" simplement pour construire les tableaux # des distances du chi-2 entre les lignes (candidats) et les colonnes (arrondissements) afcparis = dudi.coa(paris, scannf = FALSE, nf=2) # AFC standard du tableau, les paramètres sont sans importance distlig = dist.dudi(afcparis) # on récupère les distances entre les lignes distlig # pour voir distcol = dist.dudi(afcparis, amongrow = FALSE) # et les distances entre les colonnes distcol # pour voir library(cluster) # chargement du package pour la classification # On utilise "agnes" directement sur un tableau de distances (ou dissimilarités) # help(agnes) si nécessaire... cahlig = agnes(distlig, diss=TRUE, method="average") # la CAH et l'arborescence des candidats pltree(cahlig) cahcol = agnes(distcol, diss=TRUE, method="average") # la CAH et l'arborescence des arrondissements pltree(cahcol)