# ================================================================
# CAH sur tableau de contingence avec les packages ade4 et cluster 
# ================================================================

# Les options de la procédure "agnes" ne prévoyant pas le calcul des distances du chi-2 sur un
# tableau de contingence initial, il convient de construire préalablement le tabeau des distances.
# On peut utiliser le package "ade4" (voir l'aide pour ce package et ses procédures...)

paris = read.table("paris2007.csv", header=TRUE, sep=";", row.names="Candidat") # la colonne "Candidat" est l'identifiant

# Élections à Paris. Candidats en lignes et arrondissements en colonnes, première colonne et première ligne
# identifiants

fix(paris) # pour voir à l'éditeur (ne pas oublier de le refermer)

library(ade4) # chargement du package "ade4" supposé déjà installé depuis un site de R

# on utilise seulement les procédures "dudi.coa" et "dist.dudi" pour construire les tableaux
# des distances du chi-2 entre les lignes (candidats) et les colonnes (arrondissements)

afcparis = dudi.coa(paris, scannf = FALSE, nf=2) # AFC standard du tableau, les paramètres sont sans importance

distlig = dist.dudi(afcparis) # on récupère les distances entre les lignes
distlig # pour voir

distcol = dist.dudi(afcparis, amongrow = FALSE) # et les distances entre les colonnes
distcol # pour voir

library(cluster) # chargement du package pour la classification

# On utilise "agnes" directement sur un tableau de distances (ou dissimilarités)
# help(agnes) si nécessaire...

cahlig = agnes(distlig, diss=TRUE, method="average") # la CAH et l'arborescence des candidats
pltree(cahlig)

cahcol = agnes(distcol, diss=TRUE, method="average") # la CAH et l'arborescence des arrondissements
pltree(cahcol)