“Le Nombre imaginaire” ou les mathématiques comme terrain de jeu où l’imagination seule fixe les limites.
La semaine dernière, nous avons identifié un mécanisme mental qui peut, même en toute bonne foi, transformer un quart en deux tiers, 25% en 67%, énorme erreur qui doit nous inciter à ne toucher aux pourcentages qu’avec des pincettes. Mais nous n’en avons pas fini avec cette histoire car nous devons maintenant nous colleter avec un autre mécanisme mental, tout aussi insidieux, et que nos politiques utilisent à qui mieux mieux.
En effet, si nous replaçons l’affirmation initiale de Claude Guéant dans son contexte et que nous la corrigeons, elle pourrait maintenant s’écrire “Contrairement à ce qu’on dit, l’intégration ne va pas si bien que ça : […] le quart des échecs scolaires, c’est l’échec d’enfants d’immigrés [qui ne représentent que 10% de la population scolaire].” L’ellipse (la citation complète parle du taux de chômage élevé chez les étrangers non-Européens), la correction et le complément sont bien entendu de mon fait.
Cette phrase utilise un chiffre marquant (et qui le reste même après correction) à l’appui de sa thèse, d’une façon qui semble logique : si les enfants d’immigrés échouent plus souvent que les autochtones, c’est bien la preuve que l’intégration ne marche pas, non ?
Hmmm. Pour en juger, je vous propose de nous exercer tout d’abord sur la théorie suivante : s’appeler Marcel porte malheur ; en effet les Marcel consomment deux fois plus que la moyenne nationale en frais de santé.
Avant tout, laissez-moi vous assurer que le chiffre que je donne à l’appui de ma thèse, s’il est assez approximatif (je l’ai obtenu en croisant rapidement quelques informations), n’en est pas moins parfaitement avéré. Supposons que vous fassiez remplir un questionnaire à un large échantillon de Français des deux sexes, en ne leur posant que deux questions : leur prénom, et le montant annuel de leurs soins de santé (ou plutôt, car ils ont peu de chances de connaître ce chiffre, quelques informations sur leurs traitements, séjours à l’hôpital, etc., vous permettant de le déterminer). Eh bien, vous découvririez d’une part que les Marcel consomment en moyenne bien plus que la population générale ; d’autre part vous observeriez une sur-représentation du prénom Marcel parmi les personnes en traitement de longue durée ou en établissement de santé. Les deux facteurs – prénom et état de santé – sont donc clairement liés (on parle de corrélation). Mais, bien entendu, le fait qu’une personne soit en mauvaise santé ne peut déterminer son prénom ; cela doit donc être l’inverse. Ergo, le prénom Marcel porte la poisse.
Une telle méthodologie à base de questionnaire et d’étude des corrélations est très sérieuse ; c’est d’ailleurs celle suivie par le rapport PISA. Pour autant, souscrivez-vous à ma brillante théorie ? Je suppose (et j’espère bien) que non. Pourquoi ? Parce qu’elle n’explique rien, ne justifie rien, ne prédit rien. Je mets en évidence une corrélation bien réelle entre deux caractéristiques d’une personne – ici son prénom et ses dépenses de santé ; mais vous sentez bien que tenter comme je le fais d’établir une causalité de l’un vers l’autre est absurde. Vous êtes donc piégés : les faits (indiscutables) que je vous donne semblent fortement appuyer une théorie que vous jugez par ailleurs irrecevable. Que serait-ce alors si cette théorie avait ne fût-ce qu’un semblant de vraisemblance ! J’emporterais certainement l’adhésion de plus d’un.
Allez, je vous l’avoue : c’est pure manipulation de ma part. Il se trouve que j’ai des visées politiques à terme, et que mon électorat (potentiel) n’est pas très favorable aux Marcel. Je suis un vrai Machiavel, sachez-le, et bientôt je dominerai le Monde.
Notez que mes chiffres sont justes ; je n’ai pas eu besoin de mentir. Alors, comment ai-je fait ? Tout simplement, je ne vous ai donné que les faits qui m’arrangeaient, et pas les autres. Je ne vous ai parlé que des frais de santé et du prénom. En vérité, mon questionnaire (imaginaire) aux Français leur demandait énormément d’autres informations que j’ai gardées pour moi, dont leur sexe, leur âge, leur profession, leur niveau d’éducation… Bien évidemment les Marcel sont tous des hommes (enfin je suppose) ; mais surtout, il se trouve que ce sont presque tous des personnes âgées ! La vraie raison qui justifie mon affirmation, c’est tout simplement que Marcel est un nom très démodé, populaire dans les années folles (ah, Cerdan et Piaf…) mais qui ne se donne plus guère depuis l’après-guerre. Les Marcel vivants sont donc presque tous septu a- ou octogénaires, et l’on peut comprendre bien naturellement que leurs dépenses de santé soient plus importantes que la moyenne nationale.
Bien sûr il s’agit là d’un exemple extrême, mais il illustre un principe important : le fait que deux événements ou caractéristiques soient liés, corrélés, n’implique pas en lui-même que l’un soit la cause de l’autre. Il est bien sûr possible que ce soit le cas ; il est également possible que ces événements soient tous deux causés par un troisième ; il peut même arriver que ce lien ne soit qu’un hasard (en cherchant des corrélations fortuites, on en trouve toujours). Enfin toutes les possibilités intermédiaires existent ; une caractéristique peut partiellement influencer l’autre sans l’expliquer totalement.
Revenons maintenant à l’énoncé de Claude Guéant. Nous sommes bien sûrs tentés de faire le parallèle, avec un adolescent issu de l’immigration dans le rôle de papy Marcel, et l’échec scolaire au lieu des frais de santé. Le questionnaire, dans le cas de PISA, est bien réel et fort détaillé. Il s’intéresse non seulement à l’origine géographique de la famille de l’élève (et non pas à son “ethnie”, ce qui est par ailleurs interdit en France), mais aussi à sa composition et à sa situation socio-économique ; au sexe, aux habitudes de lecture et aux méthodes de travail de l’adolescent ainsi qu’à son histoire scolaire (redoublements antérieurs) ; à la démographie de l’établissement scolaire fréquenté, à la discipline qui y règne, aux méthodes éducatives utilisées, aux rapports entre l’adolescent et ses professeurs ou ses camarades ; à sa pratique de l’informatique ; et même à la présence d’œuvres d’art au domicile familial. Tous ces facteurs peuvent peu ou prou contribuer à la réussite ou à l’échec scolaire, et le rapport vise à en démêler l’influence.
À la place de l’âge, facteur central qui relie le prénom Marcel et l’état de santé associé, nous choisirons le niveau socio-économique de la famille. En effet, comme le rapport PISA nous l’indique, ce statut – représenté en l’occurrence par un index assez complexe pour permettre la comparaison entre pays – conditionne fortement la réussite ou l’échec scolaire en France (notre pays est malheureusement l’un des plus inégalitaire à cet égard) ; or il se trouve que les familles issues de l’immigration sont plus souvent défavorisées que la moyenne. À ce stade, nous pourrions donc rétorquer au ministre que ce n’est aucunement l’intégration mais bien l’inégalité sociale intrinsèque de notre système éducatif qui est en question.
Tout cela est assez vrai; toutefois l’honnêteté intellectuelle nous obligera à nuancer un peu ce propos. Le parallèle avec la théorie de la malédiction des Marcel a ses limites. Dans cette histoire, il est évident que le prénom d’une personne n’a aucune incidence propre sur son état de santé ; l’âge explique tout (du moins dans le cadre d’analyse simpliste que nous avons adopté). Dans le cas de l’éducation, le fait que des facteur socio-économiques eux-même corrélés à l’origine migratoire interviennent de manière dominante dans les inégalités de résultat n’implique pas que cette origine n’ait aucune influence en elle même, toutes choses égales par ailleurs. Nous n’avons aucune preuve que ce facteur n’intervient pas du tout : ne remplaçons donc pas une manipulation par une autre.
De fait, et fort à propos, les statisticiens ont développé des outils permettant de démêler tout cela : quand plusieurs facteurs (prénom et âge, ou origine migratoire et statut social) sont corrélés entre eux ainsi qu’au résultat étudié (état de santé ou niveau scolaire), on peut démêler l’influence propre de chacun des facteurs sur le résultat final, tout autant que leur influence combinée (avec un niveau de confiance qui, il ne faut jamais l’oublier, dépend de la taille de l’échantillon étudié et de la qualité des données recueillies).
En l’espèce, si nous nous concentrons sur les critères concernant la famille elle-même – sans considérer, par exemple, les spécificités géographiques ou les caractéristiques liées à l’établissement, qui ont bien sûr leur importance –, on trouve qu’en France, le facteur individuel le plus important – et de loin – qui intervient dans la performance en lecture d’un adolescent est la présence d’objets culturels et de livres à la maison. Vient derrière le statut professionnel et éducatif des parents ; et enfin seulement, à peu près ex-aequo, la richesse du foyer et l’origine migratoire ou autochtone. Bien entendu ces différents facteurs sont aussi corrélés entre eux, et leur influence conjuguée est importante.
Venant modérer un peu notre réponse intiale au ministre, ces données nous indiquent donc que si l’origine migratoire ou autochtone de la famille est effectivement un facteur parmi d’autres (on peut par exemple imaginer des différences liées à la langue parlée à la maison), il est très loin d’être dominant. Il reste bien plus préoccupant de constater que la France est en matière d’éducation l’un des pays les plus inégalitaires de l’OCDE, c’est-à-dire l’un de ceux ou le statut socio-économique de la famille explique le plus la variation de performance en lecture.
Non, la théorie de M. Guéant n’est décidément pas étayée par ses chiffres (et encore moins par les nôtres). Mais cela ne veut pas dire que les chiffres ne servent qu’à nous manipuler ou qu’ils soient inaccessibles au profane, bien au contraire. Retenons simplement que corrélation n’est pas raison, et la prochaine fois qu’un politicien voudra nous en imposer par ses chiffres, ayons une pensée émue pour les Marcel de notre entourage… À la semaine prochaine!
Yannick Cras
Le nombre imaginaire
[print_link]
0 commentaires