J’balance pas, j’évoque !

“Le Nombre imaginaire” ou les mathématiques comme terrain de jeu où l’imagination seule fixe les limites.

Un exemple très éclairant de résultats de la théorie des jeux dont peuvent s’emparer économistes et philosophes est le fameux dilemme du Prisonnier. L’histoire classique se présente plus ou moins ainsi : Jules et Jim ont prévu de braquer une banque et se retrouvent au jour dit devant l’établissement, armé chacun de ses mauvaises intentions et d’un pistolet. Un jaloux, surprenant leurs conversations, les avait dénoncés. La police est donc sur les lieux et prévoit de les arrêter en flagrant délit ; mais suite à un cafouillage entre services, les deux compères se font embarquer avant même d’avoir mis un pied dans l’agence. Ils sont enfermés dans deux cellules différentes et ne peuvent communiquer.

Bien que convaincu des intentions criminelles des deux lascars, le commissaire – qui est adepte du chiffre – est bien embêté : le flagrant délit n’ayant pas été constaté, il ne dispose que du témoignage peu crédible de son indic, lequel semble de plus s’être mystérieusement évaporé. Aussi cherche-t-il à obtenir des aveux ou, à tout le moins, une dénonciation de l’un ou l’autre des complices, sans quoi il ne pourra retenir contre eux que le port d’arme prohibé.

Le commissaire décide d’interroger séparément les deux hommes. Chacun d’eux peut choisir de témoigner contre son complice ou de se taire. Si seul l’un des deux dénonce l’autre, on le laissera sortir alors que son complice portera le chapeau et en prendra pour dix ans. Si les deux prisonniers se dénoncent mutuellement, ils seront chacun condamnés à cinq ans. S’ils gardent tous deux le silence, ils s’en sortiront, faute de preuves, avec chacun 6 mois pour port d’arme.

Le commissaire interroge Jules et lui met le marché en main. Que devrait faire ce dernier? Il n’est pas né de la dernière pluie ; il sait bien que les affirmations du commissaire (Jim t’a balancé, fais-en autant ou tu porteras le chapeau) ne sont sans doute que de l’intimidation ; pour ce que Jules en sait Jim a pu se taire, ou bien n’a même pas encore été interrogé.

Cependant, même sans savoir ce que Jim fera (ou a déjà fait) de son côté, il est facile de démontrer que Jules doit rationnellement trahir Jim et le dénoncer. En effet, quel que soit le choix passé ou futur de Jim, Jules s’en sortira mieux en trahissant qu’en gardant le silence. Si Jim garde (ou a gardé) le silence, Jules a tout intérêt à le trahir : il sortira libre au lieu de passer six mois en prison s’il se tait également. Et si Jim trahit Jules, Jules a intérêt à le trahir aussi : il ne passera que cinq ans en prison au lieu de dix, ce qui lui arriverait s’il était seul à garder le silence.

L’argument est logiquement imparable : rationnellement, le meilleur choix pour Jules est de trahir Jim en le dénonçant. L’ennui, c’est bien entendu que Jim doit faire la même chose, pour la même raison. La conséquence en est que chacun des deux complices dénoncera l’autre et passera cinq ans en prison, alors qu’en se taisant tous deux il n’y auraient passé que six mois ! En d’autres termes, la stratégie gagnante pour les deux – coopérer et garder le silence – est en conflit avec leurs stratégies individuelles.

Ce résultat d’apparence paradoxale a été largement commenté en termes mathématiques, économiques et philosophiques ; deux aspects en sont à mon sens particulièrement fascinants.

Tout d’abord, le résultat serait différent si Jules supposait que Jim raisonne exactement comme lui. Après tout ce sont deux hommes du même milieu, interrogés dans les mêmes conditions. Si Jules suppose que Jim raisonnera comme lui, il peut se dire en substance : si moi, Jules, je suis tenté de trahir, alors Jim l’est certainement aussi. Il est donc peu vraisemblable que lui ou moi soyons seul à le faire, et l’option de sortir libre n’est réaliste ni pour l’un ni pour l’autre. Reste alors à choisir entre six mois et cinq ans : si Jim raisonne comme moi il se taira en supposant que je fais de même. Si Jim effectue le même raisonnement, les deux hommes peuvent se sortir du paradoxe par la grande porte. Mais seront-ils capables de s’en tenir à cette idée, malgré la tentation qu’exerce sur chacun d’eux la possible récompense de la trahison ?

Nous sommes de fait souvent confrontés à ce type de situation. Bien des gens qui jetteront sans état d’âme un mégot sur un trottoir déjà jonché ne veulent pas être le premier à polluer une rue propre. Nous savons d’une certaine manière que nos actes individuels sont représentatifs du groupe auquel nous appartenons, et en prédisent donc en quelque sorte le comportement global, même sans qu’aucune causalité ne puisse être établie entre nos actions et celles des autres : beaucoup d’entre nous sont influencés par cette voix qui dit “si tout le monde faisait comme vous…”, et agissent comme si le fait, par exemple, de remplir honnêtement sa déclaration d’impôts pouvait aussi encourager les autres à le faire. Ah, si seulement c’était le cas !

Un autre aspect très intéressant dans le dilemme du Prisonnier est qu’il prend une toute autre direction dans le cas où les interactions entre Jules et Jim – et d’autres – sont susceptibles de se reproduire régulièrement, et déterminent non pas un résultat ponctuel mais la capacité de survie des acteurs. Si la trahison est une bonne stratégie individuelle dans une situation unique, ce n’est plus le cas quand les interactions sont fréquentes.

De nombreuses simulations numériques ont été menées sur ce thème. On fait interagir deux à deux, à de multiples reprises, des agents (de petits programmes informatiques) ; chacun a le choix de trahir ou de coopérer avec son partenaire, en se souvenant des actions passées de ce dernier. Chaque agent utilise une stratégie donnée: un Gentil, par exemple, coopère toujours systématiquement ; un J’suis-sympa-mais-faut-pas-m’la-faire commence par coopérer mais répète ensuite systématiquement le dernier choix de son partenaire ; un Fourbe coopère souvent mais trahit de temps en temps au hasard… On laisse ces agents interagir ainsi les uns avec les autres, puis on compte les points, on ajuste la population de chaque espèce d’agents en fonction de ses résultats – plus ses gains individuels sont élevés, plus chaque agent a de “descendants” – et on recommence.

Qu’observe-on sur la durée ? Les Gentils, par exemple, servent initialement de proies aux Méchants (qui trahissent toujours) ; mais à mesure que la population de Gentils se raréfie, les Méchants s’étiolent. En effet, un Méchant ne gagne pas grand-chose contre un autre Méchant et guère plus contre un J’suis-sympa-mais ; ce dernier, lui, gagne beaucoup à fréquenter ses semblables tout comme les Gentils, et ne se débrouille pas si mal face aux Méchants. On constate que les J’suis-sympa-mais s’en sortent très bien sur le long terme, comme en général les stratégies qui ne trahissent jamais d’elles-mêmes (mais seulement en représailles contre une trahison antérieure).

Ce qui nous donne un indice encourageant quant aux capacités de notre espèce (et de bien d’autres d’ailleurs) à utiliser la coopération comme outil de survie collective… sans jamais, hélas, totalement éliminer les profiteurs.

Yannick Cras
Le nombre imaginaire

>

 Imprimer Imprimer