Élimine 99,9% des arnaques au pourcentage!

“Le Nombre imaginaire” ou les mathématiques comme terrain de jeu où l’imagination seule fixe les limites.

Puisque nous en sommes aux pourcentages et aux probabilités, arrêtons-nous un instant sur ces pourcentages “presque parfaits” dont publicitaires et lobbyistes nous farcissent la tête. Nous avons tous vu ces publicités vous garantissant qu’un filtre à air élimine 99,9% des bactéries, ou qu’un hébergeur informatique vous assure un fonctionnement fiable à 99,5%. Ça en jette ! Jusqu’au moment où vous réalisez que cet hébergeur anticipe en fait 7 minutes de panne par jour, pas loin de 4 heures par mois, ce qui n’est tout de même pas idéal pour votre boutique en ligne (en vérité, les exigences dans ce domaine sont plutôt de 99,999%, soit 5 minutes de panne par an). Tout ça pour dire que les pourcentages, quand ils sont proches de 100%, nous tendent un piège supplémentaire (comme si nous avions besoin de ça !) : nous ne sommes tout simplement pas bien équipés pour compter les zéros ou les 9, et nous sommes vite impressionnés.

Là où cela se complique encore, c’est quand ces pourcentages concernent des tests médicaux ou à usage légal : les implications, dans de tel cas, sont très sérieuses.

Considérons, par exemple, un test de grossesse. Pour mesurer sa performance, on va considérer deux nombres : sa sensibilité et sa spécificité. La sensibilité du test mesure sa capacité à vous dire que vous êtes enceinte si vous l’êtes ; en d’autres termes, la probabilité que le test soit positif si vous êtes enceinte. Si vous êtes enceinte mais que le test vous indique le contraire, ce résultat est un faux négatif. Une sensibilité de 99% indique que, sur 100 femmes enceintes qui passent le test (au bon moment et dans les conditions prescrites), 99 en seront informées et une au plus sera en faux négatif. La spécificité du test, elle, mesure sa capacité à ne pas vous faire croire que vous êtes enceinte si vous ne l’êtes pas. Si un test prétend que êtes enceinte alors que ce n’est pas le cas, c’est un faux positif . Une spécificité de 99% indique que, sur 100 femmes non enceintes qui passent le test, 99 auront effectivement un résultat négatif, et une au plus sera en faux positif.

Pour des tests vitaux tels que ceux du VIH, on  s’assure en premier lieu que la sensibilité est parfaite pour éviter les faux négatifs, quitte à accepter quelques faux positifs qui en seront quitte pour la peur (il est impossible dans ce cas d’avoir également une spécificité parfaite, mais elle est typiquement supérieure à 99,5%).

Bien, il semble que tout cela soit sous contrôle. Les acteurs de la santé savent ce qu’ils font, et visiblement les erreurs restent rares, non ?

Oui. Mais attention tout de même aux pièges de l’intuition. Imaginez par exemple qu’apparaisse une nouvelle maladie infectieuse, grave si elle n’est pas traitée à temps, parfaitement curable dans le cas inverse, mais dont les symptômes ne se présentent que quand il est trop tard. On estime qu’environ un millième de la population française est atteinte ; il est donc urgent de déclencher un dépistage systématique en masse. Un laboratoire développe le test en un temps record. Ce test est sensible à 100% (surtout pas de faux négatifs !) et spécifique à 99,9%. Vous passez ce test comme le reste de la population, et, aïe : résultat positif. Quelle est la probabilité que vous soyez effectivement malade ? Eh bien, contrairement à ce que l’on pourrait penser, c’est du pile ou face : vous avez une chance sur deux.

Pour nous en convaincre, appliquons notre méthode habituelle : il faut compter. 60 millions de personnes passent le test (mazette !). Parmi celles-ci, 60 000 sont malades, et le résultat du test sera toujours positif pour elles. Pour les 59 940 000 personnes restantes, il y aura 0,1% de faux positifs, un sur mille… soit 59940 personnes, c’est-à-dire presque autant que de malades. Vous pourriez être n’importe quel d’entre eux. En d’autres termes, votre probabilité d’être malade est de 50%, une chance sur deux. Vous serez bien entendu traité(e), peut-être pour rien – de fait, la moitié des personnes qui recevront le traitement n’en auront pas besoin. Ce dépistage systématique est certainement la bonne décision à prendre en termes de santé publique, mais il sera peut-être difficile à expliquer et à justifier économiquement pour cette raison. Le souci est qu’une excellente spécificité du test ne fait pas tout : il faut aussi prendre en compte la prévalence de la maladie, c’est-à-dire le pourcentage de la population atteinte. Si la maladie est rare et que les tests sont appliqués à une large population, la proportion de faux positifs sera nécessairement importante. Les acteurs de la santé publique le savent bien ; les politiques et les citoyens que nous sommes, pas toujours. 

Ce paradoxe apparent se manifeste de manière particulièrement spectaculaire dans le cas des tests de paternité par analyse de l’ADN, que l’on peut maintenant effectuer facilement (sinon légalement) à distance et en toute discrétion via des sites web et des laboratoires spécialisés. L’un de ces sites nous explique que son test peut donner deux résultats clairement différenciés : soit il répond 0%, ce qui signifie que l’homme dont l’ADN est testé n’a aucune chance d’être le père de l’enfant ; soit il répond 99,9% (voire 99,99%), indiquant que l’homme testé à 99,9 chances sur cent d’être le père biologique. Pas de milieu, c’est noir ou blanc. Imparable, non ?

Décryptons. Si le test est négatif, alors il n’y a aucune chance d’erreur : il n’y a donc aucun faux négatif, et la sensibilité est de 100%. Bien. Mais, nous dit-on, si le test est positif, il y a 99,9% de chances que le sujet testé soit le père. Diable, comment interpréter cela ? Sur 1000 personnes qui passent le test et qui ont un résultat positif, au moins 999 sont le père de l’enfant ? Heu, il semble que nous ayons un petit problème, car de père à notre connaissance il n’y en a qu’un ! Qui plus est, si deux jumeaux homozygotes passent le même test, on n’en déduira pas pour autant qu’ils sont tous deux pères de l’enfant.

En fait, ce laboratoire part d’une hypothèse implicite (que d’autres, plus scrupuleux, mentionnent très clairement) : vous n’effectuerez ce test que si par ailleurs il y a déjà une bonne chance que la personne testée soit effectivement le père. On suppose au départ que la personne testée a une chance sur deux d’être le père ; disons qu’on a limité l’ensemble des pères potentiels d’un enfant donné à un groupe de deux hommes et qu’on en teste un. On répète ce processus pour un grand nombre d’enfants. Alors effectivement, quand le test est positif, dans 99,9% des cas la personne testée était bien le père de l’enfant ; dans seulement 0,1% des cas, c’était l’autre (ce calcul fait appel à un outil formidable, le théorème de Bayes, sur lequel nous reviendrons). Le test a donc confirmé ou infirmé votre hypothèse initiale en une quasi certitude.

Mais supposez maintenant que ce même test soit appliqué aveuglément à l’ensemble des hommes français en âge d’être le père en question, mettons 10 millions de personnes : quelle est la probabilité qu’un homme pour lequel le test est positif soit réellement le père de l’enfant ? Même avec une spécificité de 99,99% vous auriez 1000 faux positifs… pour un seul vrai !

C’est pourquoi, aussi précis soient-ils (et ceux utilisés par la justice sont en vérité d’une précision extrême), les tests ADN ne sont et ne doivent être utilisés que sur un groupe déjà bien ciblé par ailleurs. Les appliquer à une trop large population serait prendre le risque de faux positifs qui, en matière légale, s’appellent des erreurs judiciaires. Méfions-nous donc sainement des pourcentages pleins de neufs et des probabilités presque certaines, et n’oublions pas de compter : un peu de prudence et de mise en contexte nous protègera de 99,9% des arnaques !

Yannick Cras
Le nombre imaginaire

Imprimer Imprimer