mercredi 25 avril 2012

L'analyse statistique du premier tour : corrélations, typologies et reports de voix au second tour


Quels enseignements tirer des suffrages exprimés,  non exprimés et de l’abstention lors du premier tour de l’élection présidentielle de 2012 ? Le but de cet article n’est pas de faire de la sociologie électorale comme la concevait Paul Lazarsfeld, c'est-à-dire en essayant d’expliquer le vote pour tel ou tel candidat par un certain nombre de variables sociologiques « lourdes » comme le revenu par personne, la pratique religieuse, le métier exercé... Un tel travail demanderait des données dont nous ne disposons pas, et beaucoup de temps, chose dont, hélas, nous ne disposons pas non plus.
Le but de cet article est avant tout de saisir la dynamique du vote des Français : chaque électeur a voté pour son candidat préféré, mais chacun n’a pas donné le même sens à son bulletin de vote ; deux personnes qui ont voté pour le même candidat peuvent l’avoir fait dans des états d'esprit très différents. Nous allons donc essayer de construire une typologie du vote exprimé par les Français lors de cette élection.



Le 22 Avril dernier les Français ont eu le choix entre dix candidats, le vote blanc ou l’abstention, ce qui laisse donc 12 possibilités. Les données dont nous disposons sont les résultats du premier tour pour chaque commune  de France (cela fait plus de 36 000 observations !) et exprimés en pourcentage du nombre d’inscrits dans la commune. La méthode utilisée pour extraire l’information intéressante de ces données est l’analyse en composantes principales.


Commençons par expliquer brièvement la méthode de l'analyse en composantes principales  : nous disposons de 12 variables (le score de chaque candidat, plus l'abstention, plus le vote blanc, dans chacune des 36 000 communes de France). Cela nous permet d'obtenir un nuage de 36 000 points en 12 dimensions (une dimension par candidat, plus une pour l'abstention, et une pour le vote blanc), qu'il est impossible de représenter graphiquement. Or ce nuage de points a une structure particulière avec des déformations, des excroissances, dues au fait que le vote entre les différents candidats est corrélé et inégalement réparti sur l'ensemble des communes : en général, dans les communes où Nicolas Sarkozy remporte beaucoup de voix, François Hollande en remporte moins ; certaines communes ont massivement voté pour Marine Le Pen, tandis que d'autres ont très peu voté pour elle.  

Ce nuage de points pourrait par exemple adopter la forme d'un ballon de rugby (cela correspond à une déformation). Il y aurait alors un axe long et deux axes courts. Cet axe long pourrait correspondre au vote pour un candidat, prenons au hasard, Jacques Cheminade. Cela voudrait dire que le vote pour Jacques Cheminade est le plus discriminant, c'est à dire qu'il permet de bien distinguer les communes entre elles, certaines ayant massivement voté pour lui et d'autres l'ayant rejeté. Le vote pour Jacques Chemiande serait en quelque sorte le fait marquant de cette élection (!). Mais cet axe long peut aussi ne correspondre à aucun candidat ; il correspond alors à une combinaison de candidats. Il devient alors intéressant d'analyser dans quelles proportions chaque candidat contribue à la formation des axes qui déforment le nuage de points pour lui donner sa forme si particulière, c'est à dire pour donner une saveur si particulière au vote du 22 Avril 2012. 

Ainsi, la méthode de l'analyse des composantes principales, nous permet d'obtenir trois axes d'analyse du suffrage exprimé par les Français le 22 Avril 2012, axes indépendants entre eux. Pour chacun de ces axes il est possible de mesurer la façon dont chaque candidat contribue à sa formation : les déformations du nuage de 36 000 points sont en effet dues à certains candidats (ou à certaines combinaisons de candidats) et pas à d'autres. Or c'est précisément cela qui nous intéresse : quels candidats ont donné à cette élection sa saveur particulière, et de quelle façon, c'est à dire en s'opposant à quels autres candidats ? 

Le vote traditionnel : le clivage droite/gauche

Le premier axe obtenu, l'axe structurant de la vie politique française, est celui du clivage traditionnel qui oppose les candidats de droite aux candidats de gauche. Trois candidats contribuent en des proportions sensiblement égales à la formation de ce premier axe : il s’agit de François Hollande , suivi de Nicolas Sarkozy et de Jean-Luc Mélenchon, qui contribuent pour chacun d'entre eux à hauteur de 25%  à la formation de ce premier axe.  Plus loin nous trouvons Marine Le Pen qui ne contribue à former cet axe qu'à hauteur de 10% . Il est intéressant de noter que les scores des candidats Mélenchon, Sarkozy et Hollande sont très fortement corrélés (à 75 % !) avec ce vote traditionnel : autrement dit, Nicolas Sarkozy, François Hollande, Jean-Luc Mélenchon, et beaucoup plus modestement Marine Le Pen ont fait de bons scores dans les communes où le clivage droite gauche est important. Un nombre important de communes de France est donc un lieu d'affrontement entre les candidats de droite (essentiellement représentés par Nicolas Sarkozy, et dans de moindres proportions par Marine Le Pen) et les candidats de gauche, représentés par François Hollande et Jean-Luc Mélenchon dans des proportions sensiblement égales. . 

Le vote antisystème

Le second axe d’analyse est celui du vote antisystème. Cet axe oppose Marine Le Pen et l'abstention d'un côté, à Eva Joly et François Bayrou de l'autre. 

Ainsi, nous voyons qu'il y a deux modes de "l'antisystème" : un mode incarné par François Bayrou et Eva Joly, que l'on pourrait qualifier "d'intégré", au regard de la sympathie de la presse et des grands partis à l'égard de ces deux candidats ; et un mode que l'on pourrait qualifier de "subversif", incarné par Marine Le Pen et l'abstention, au regard du rejet dont ces deux attitudes électorales sont victimes tant dans les journaux que dans les discours des hommes politiques.

De façon peu surprenante, l’abstention contribue à hauteur de 25 % à cet axe de déformation "antisystème" de notre nuage de 36 000 points. Cela se comprend : les électeurs qui ne se reconnaissent ni dans la droite ni dans la gauche ont préféré ne pas participer à cette élection qui semblait déjà d’avance devoir se jouer entre l’UMP et le PS. La présence de Marine Le Pen parmi les électeurs antisystème n’est pas non plus surprenante. Nous sommes même étonnés de son faible apport à la composante "antisystème" du vote des Français (13%). Sur ce segment de l'électorat elle a sans doute pâti de la concurrence de l'abstention. Sans doute Marine Le Pen aurait gagné à organiser des opérations de porte à porte, pour mobiliser les abstentionnistes !

François Bayrou contribue à hauteur de 40 % au vote « antisystème », et ses résultats à l’échelle de l’ensemble des communes sont très fortement corrélés (à 75 % aussi) avec ce vote antisystème. Cela montre que les électeurs du candidat centristes sont avant tout des personnes qui ne se reconnaissent pas dans le clivage droite/gauche et qui ne voient plus le Modem comme  un parti de centre-droit. Ce candidat n’a peut-être pas intérêt à donner une consigne de vote au second tour, comme il l’a pourtant promis : il pourrait froisser une large partie de son électorat ... 

Les électeurs antisystème ont ensuite choisi  Eva Joly, qui contribue à hauteur de 10% à la composante antisystème. L’aspect antisystème d’Eva Joly se comprend d’une certaine manière : le positionnement écologique d’Eva Joly est radical et original et est totalement étranger aux positions du PS et de l’UMP qui en termes d’environnement sont tout à fait semblables. A sa façon, la candidate écologiste incarne donc une facette de « l’antisystème », et aurait peut-être obtenu un meilleur score si elle avait plus parlé d’écologie…. 


L'axe vertical représente les oppositions entre candidats "antisystème". L'axe horizontal représente les oppositions relatives au vote traditionnel. Chaque flèche restitue le succès de chaque candidat dans ces deux types de vote : Hollande et Mélenchon ont surtout bénéficié d'un vote traditionnel, et très peu d'un vote antisystème par exemple, ce qui est le contraire de François Bayrou.




Le vote antilibéral

Vient ensuite le vote antilibéral ou protectionniste. Ce vote oppose les candidats Marine Le Pen, Nathalie Arthaud, Philippe Poutou, Nicolas Dupont Aignan à l'abstention, au vote blanc et aux autres candidats, Jean-Luc Mélenchon compris. Sans grande surprise, Marine Le Pen et Nathalie Arthaud contribuent le plus à cet axe structurant du vote des Français (22 %  et 20 % respectivement), tandis que Philippe Poutou (12%) et Nicolas Dupont Aignan (9%) sont un peu plus distants. Là aussi, l'abstention contribue de façon importante à cet axe antilibéral (à hauteur de 21 %).

La grande surprise de cet axe provient de l'absence de Jean-Luc Mélenchon. Lui qu'on appelait volontiers "le tribun du peuple", et qui refusait de céder l'électorat ouvrier à Marine Le Pen, était plus qu'attendu dans le vote antilibéral. Or il ne contribue qu'à hauteur de 2% (moins que Nicolas Sarkozy, à 4% !) à cette déformation "antilibérale" du nuage des 36 000 points. De là à confirmer l'analyse d'Eric Zemmour, il n'y a qu'un pas, que l'on franchit volontiers...

Il est intéressant de noter que l'abstention contribue très peu à la formation du premier axe (celui du vote traditionnel droite/gauche), mais contribue plus fortement au vote antisystème et au vote antilibéral.

Quels sens les électeurs de chacun des cinq candidats ont-ils donné à leur vote ?


Sans grande surprise, Nicolas Sarkozy et François Hollande ont capté le vote clivé « droite gauche », et rien que ce vote, comme les commentateurs s’y attendaient. 
 
Les candidats moyens (Marine Le Pen, Jean-Luc Mélenchon et François Bayrou) ont eux obtenu des résultats plus complexes : le vote pour Marine Le Pen se décompose en trois catégories de taille comparable : un vote de droite issu de personnes qui acceptent le clivage droite gauche, et qui se reporteront vraisemblablement sur Nicolas Sarkozy au second tour. Nous avons peut-être ici le vote de l’ancienne  base d’extrême droite du Front National, déjà présente aux élections précédentes. Vient ensuite un vote antisystème, qui tend à rapprocher la candidate du Front national de François Bayrou.  Ces électeurs, séduits par le positionnement "ni droite ni gauche" affirmé à plusieurs reprises par Marine Le Pen, n’ont probablement pas de préférence entre les deux candidats qualifiés pour le second tour.  
Vient enfin un vote antilibéral, vraisemblablement exprimé par les travailleurs des milieux populaires, qui rapproche Marine Le Pen de Nathalie Arthaud et Philippe Poutou. Ces électeurs se reporteront vraisemblablement sur François Hollande.
 
L’analyse du vote en faveur de Jean-Luc Melenchon   montre que ce candidat a séduit une partie de la gauche traditionnelle, qui d’habitude se reconnaît dans le discours du parti socialiste. Finalement le vote pour Jean-Luc Melencon n’a rien d’un vote révolutionnaire ou antisystème : rien ne le rapproche de Marine Le Pen, François Bayrou, Nathalie Arthaud ou Philippe Poutou, mais tout le rapproche du couple Nicolas Sarkozy et François Hollande.   

Enfin, le vote Bayrou est avant tout un vote antisystème. Or sur ce segment de l’électorat il a dû affronter la concurrence de Marine Le Pen, d’Eva Joly et de l’abstention. Si « le produire français » lui a sûrement permis de  concurrencer une partie de l’électorat frontiste antisystème, il aurait sans doute gagné à ajouter à son programme une dimension écologique radicale et originale. Cela lui aurait permis de gagner les électeurs écologistes séduits par l’aspect antisystème d’Eva Joly.  


Quels reports de voix pour le second tour ?


Pour prédire les reports de voix il est intéressant d’analyser les coefficients de corrélation  entre candidats. Le coefficient de corrélation a une valeur comprise entre -1 et 1. Lorsqu’il est proche de 1 cela signifie que les scores des deux candidats évoluent de la même façon : là où l’un est fort, l’autre est fort ; là où l’un est faible  l’autre est faible ; on parle alors de corrélation positive. Les résultats du premier tour ne permettent pas de mette en avant de corrélations positives : même au sein de l’extrême gauche (Poutou Arthaud Melenchon), dont les discours étaient pourtant similaires.

Lorsque le coefficient de corrélation est proche de -1, les candidats sont négativement corrélés. C’est le cas pas exemple de François Hollande et de Nicolas Sarkozy, candidats pour lesquels le coefficient de corrélation vaut -0,57. Cela signifie que là où Nicolas Sarkozy a enregistré de bons scores, François Hollande a été faible et qu’inversement, là où François Hollande a enregistré de bons scores, Nicolas Sarkozy a reçu moins de suffrages. De même, le coefficient de corrélation entre Nicolas Sarkozy et Jean-Luc Mélenchon est important (-0,5). Ces deux résultats, associés à la légère corrélation positive entre les candidats du PS et du Front de Gauche (0,3) laissent alors entrevoir une sorte de division du travail au sein de la gauche modérée : Jean-Luc Mélenchon investit une niche électorale particulière trop coûteuse à convaincre pour François Hollande, qui votera socialiste au second tour, au moins par antisarkozysme.

Les données montrent qu’aucun candidat n’a tiré profit de l’abstention : les coefficients de corrélation entre les scores de chaque candidat et l’abstention sont tous négatifs et proches de 0. Lorsque le coefficient de corrélation est proche de 0, cela signifie qu’il n’y a pas de lien, ni positif, ni négatif, entre les différents candidats et l’abstention. François Bayrou, avec un coefficient de -0,26, semble être le candidat qui a le plus souffert de l’abstention, devant, dans l’ordre, Nicolas Sarkozy, Jean-Luc Mélenchon, François Hollande et Marine Le Pen, qui ont tous de faibles coefficients de corrélations négatifs, entre -0,2 et -0,14 . Sans doute si les électeurs s’étaient plus mobilisés, ces cinq candidats auraient obtenu un peu plus de voix…


Savinien

3 commentaires:

  1. Quoique j'honore tout à fait votre entreprise d'analyse sociologique des résultats du premier tour et la relative clarté du propos, je ne suis pas tout à fait d'accord avec votre article.
    Le premier point que je veux soulever c'est d'abord votre approche, en elle-même. On ne sait pas trop sur quel pied danser, celui du commentaire journalistique ou celui de l'analyse sociologique en bonne et due forme. Or je pense que vous péchez dans les deux. Mais mon impression est que vous avez voulu approfondir les commentaires habituellement faits sur les résultats de présidentielles par une analyse sociologique rigoureuse. Or elle est loin de l'être : vous répétez les jugements de valeur, vos concepts ne sont pas clairement définis (qu'est-ce que l'"antisystème" ? En quoi pouvez-vous affirmer que les seules intentions de vote pour le Front national se limitent aux 3 catégories que vous mentionnez ? Des travaux majeurs de sociologues comme Lahire sont éclairants sur ce point)... Bref, il manque à votre analyse statistique ce qui fait sa valeur réelle : un véritable commentaire. Vous citez Lazarsfeld en début d'article : la sociologie a montré depuis longtemps que le quantitativisme (dont il est un des tenants majeurs) produit de beaux artefacts quand il n'est pas complété par une analyse qualitative. Or je ne vois nulle mention de travaux d'entretiens ou de quelque autre élément qui puissent permettre de forger de solides catégories d'analyse.
    Enfin. Pour résumer. la sociologie ne se manie pas comme ça, à l'envie, en faisant dire n'importe quoi à des travaux statistiques, même rigoureux. Toute sa valeur tient justement dans le commentaire. Je pense que le vôtre, en mêlant style journalistique et auréole scientifique, manque son objet.

    RépondreSupprimer
  2. Cher Anonyme,
    Merci tout d’abord pour votre commentaire qui permet d’apporte quelques précisions intéressantes.
    Je n’ai pas eu la prétention de mener une analyse sociologique du premier tour de l’élection présidentielle de 2012. Je n’en ai ni la compétence, ni le temps, ni les moyens. Mon but est simplement d’analyser la structure objective du vote exprimé par les Français le 22 Avril 2012. En votant comme ils l’ont fait, les Français ont dit quelque chose de la façon dont ils voyaient les différents candidats à la présidentielle : ils ont structuré l’offre politique en opposant ou en associant les candidats, sous différents aspects.
    Le but de mon article est de mettre à la lumière du jour les axes de tension du champ politique français et d’exhiber les oppositions qui se dessinent entre les différents candidats. Les oppositions, les similarités, les axes structurants que je propose sont objectifs et s’appuient sur la réalité du scrutin du 22 Avril 2012. Ce que l’on peut contester ce sont les noms que je donne aux différentes catégories. Il est vrai que je ne prends pas le soin de définir ce que sont la droite, la gauche, l’antisystème, et l’antilibéralisme. Ce n’est pas l’objet de mon propos et je laisse à d’autres le soin de le faire. En mobilisant ces catégories, je me suis rattaché au sens qui leur est habituellement donné dans la presse. J’ai choisi ces noms parce qu’ils me paraissaient le plus pertinents, mais je conçois tout à fait qu’on puisse donner d’autres noms aux catégories que j’ai exposées ; en ce sens je ne pense pas « faire dire n’importe quoi » aux résultats que j’ai calculés. Ou alors je vous demande d’expliquer en quoi mes interprétations sont du « n’importe quoi ». Sur ce point je pense que vous pourriez argumenter un peu plus votre critique.

    Il est vrai qu’il y a d’autres axes, (11 en tout), donc potentiellement d’autres catégories d’électeurs de tel ou tel candidat. Mais les huit autres axes que je n’ai pas commentés avaient un pouvoir explicatif trop faible par rapport aux trois que j’ai choisis. J’aurais peut être dû préciser que les trois axes retenus permettent d’expliquer 60 % des résultats de l’élection, les 7 autres se partageant le reste. Pour cette raison je les ai mis de côté, préférant me concentrer sur les aspects les plus marquants de ce scrutin.
    Je comprends mal votre hostilité envers les analyses quantitatives. Si les analyses exclusivement quantitatives produisent parfois de beaux artefacts, inutile de vous dire que les analyses exclusivement qualitatives produisent souvent un beau baratin : on ne tire pas de généralités à partir quelques entretiens. Le but de mon article est justement de permettre aux analyses qualitatives d’être confrontées à la réalité objective à l’échelle de l’ensemble de la France et non à l’échelle de quelques électeurs interrogés à la sortie du métro.

    Savinien

    RépondreSupprimer
  3. Sans doute l'expression "faire dire n'importe quoi" était trop forte, ou du moins indélicate, vous avez raison. Mais le fait est que votre interprétation (et je souligne ce terme) des résultats de scrutins est ambiguë parce qu'elle croise deux approches relativement incompatibles. Vous dites que vous ne faites pas de sociologie, pourtant vous présentez votre analyse statistique comme représentant la réalité objective du fait social "vote". C'est bien de la sociologie, ou alors je ne m'y connais pas. Or la sociologie exige de comprendre avant d'expliquer. Je vous reproche simplement d'aller trop vite en besogne. D'inférer trop rapidement des résultats statistiques les comportements électoraux et leur possible typologie. Car en effet, le vote, avant d'être un résultat statistique est un geste éminemment complexe sur lequel pèsent de nombreuses variables (familiales, sociales etc). Il est loin d'être la simple, pure et directe expression d'une volonté, sur le mode "puisque ma situation est comme ça, je vais/dois voter comme ça". Or votre analyse laisse subodorer une telle systématicité.
    Par ailleurs, je n'ai rien contre l'analyse quantitative (en fait si, j'ai beaucoup :-) mais ce n'est pas l'objet de ce débat), quand elle est combinée à une analyse qualitative. C'est à dire quand les chiffres ne sont pas tributaires des catégories d'analyse qu'on valorise habituellement (notamment dans les journaux), soit celles que vous employez. Mais trêve de bavardage méthodologique, je floode votre sujet :-)

    RépondreSupprimer

Contre-débat est un espace de réflexion et de discussion. Tout le monde peut donc commenter les articles présentés, et ce, même de façon anonyme. Pour assurer la bonne tenue des discussions, les commentaires sont soumis à modération.

Ainsi, il est demandé à nos aimables lecteurs-commentateurs de veiller à l'orthographe de la langue française, ainsi qu'au respect de leurs interlocuteurs.