Le score de fragilité des communes de Christophe Guilluy : bricolage numérologique

Dans « La France périphérique : comment a-t-on sacrifié les classes populaires », Guilluy présente dans son chapitre 2 comment il a classé les 37 000 (environ) communes françaises en deux catégories : les communes « populaires et/ou fragiles » et les autres, qu’il qualifie d’intégrées. Ma critique ne porte pas sur la dénonciation de la « mondialisation heureuse » mais sur la méthodologie descriptive qui sous-tend les statistiques utilisées pour étayer empiriquement cette dénonciation.

La construction de catégories pour décrire les communes françaises est nécessairement arbitraire, comme l’est n’importe quel langage descriptif. Mais on a l’impression que l’auteur a choisi une réduction binaire ad hoc pour soutenir que la France périphérique comporte une majorité de communes fragiles tandis que c’est l’inverse pour la France métropolitaine (voir aussi le compte-rendu de cet ouvrage par Pierre Bergel dans La quinzaine littéraire n° 1126). L’auteur démontre qu’il a été capable de trouver une manière de décrire qui colle avec son idée. Mais il ne dit rien de ce qu’on peut apprendre des données qu’il mobilise et qui sont décrites dans un référentiel de description à huit dimensions (huit types de pourcentages). Pas très convainquant quand on veut faire valoir un souci d’objectivité dans l’analyse. Faire de la science, ce n’est pas s’arranger pour trouver un cadre descriptif qui montre des statistiques à notre goût, ça commence par poser le problème de la description, en l’occurrence des communes françaises, comme un problème de choix à débattre.

Chaque commune est décrite par huit statistiques. La première est la proportion d’ouvriers dans la population active (de la commune) ; c’est un nombre, p1, qui varie dans [0, 1] (ou dans [0%, 100%]). La seconde, p2,  est la proportion d’employés et d’ouvriers dans la population active ; même ensemble d’arrivée : [0, 1]. On remarque immédiatement que p2 est supérieur ou égal à p1 et que ces deux variables, dont l’ensemble de départ est l’ensemble des communes à décrire, sont corrélées. La troisième est la proportion p3 de personnes à temps partiel (la classe de référence n’étant pas précisée). La quatrième, p4, est une proportion d’emplois précaires (la classe de référence n’étant pas précisée). La cinquième, p5, est une proportion de chômeurs (la classe de référence n’étant pas précisée). La sixième, p6, est la proportion de propriétaires occupants précaires (la classe de référence n’étant pas précisée). La septième, p7, est la proportion de revenus inférieurs à 18 749 euros (la classe de référence n’étant pas précisée). La huitième, p8, est la différence de la proportion des ouvriers-employés en 2010 et de la proportion des ouvriers-employés en 1999.

Si bien que chaque commune est décrite par le 8-uplet (p1, p2, …, p8). On peut douter que les quelques 37 000 8-uplets qui résultent de la description des 37 000 communes soient simplement ordonnés : c’est une question empirique. Par exemple, (0,2 ; 0,3 ; 0,04 ; … ; 0,1) et (0,1 ; 0,2 ; 0, 05 ; … ; 0,1) ne sont pas comparables. Si effectivement les communes ne sont pas simplement ordonnées dans ce référentiel de description, la fabrication d’un score de fragilité est une déformation conceptuelle de ce qu’on peut connaître de ces 37 000 communes. La fragilité des communes devient alors une construction évaluative qui permet de classer les communes sur une échelle de valeurs… privées de signification empirique exacte. Si Guilluy revendique la rigueur scientifique, il faut qu’il discute la valeur descriptive de son score de fragilité avant de s’en servir dans sa démonstration.

 

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Time limit is exhausted. Please reload CAPTCHA.