[SON] [AUDIO_VIDE] Bienvenue dans cette séance, où nous allons illustrer la méthode de Monte-Carlo, à travers une expérience très célèbre, qui s'appelle l'expérience des aiguilles de Buffon. Je vais commencer par un petit peu d'histoire, puisque cette expérience a été proposée il y a fort longtemps, et ce qui la rend intéressante, c'est l'avènement des ordinateurs, puisque nous allons à la fin, voir une expérimentation numérique, que vous pourrez utiliser, qui, en fait, fait cette expérience pour vous. Imaginez que vous jetiez sur les lattes d'un parquet des aiguilles, et vous vous intéressez au nombre de fois où les aiguilles ont intersecté la ligne qui sépare deux lattes, ce qu'on appelle une rainure, et ce que je vais expliquer dans un instant, c'est comment, à partir de ce type d'expérience, on a pu avoir l'idée de déterminer le nombre pi. Alors, comment ça s'est déroulé, cette histoire? En 1733, Buffon, s'est posé la question suivante : imaginez que la largeur d'une latte, c'est : l, que la longueur d'une aiguille, c'est : a, donc on va toujours prendre, dans cette séance, une aiguille plus courte que la largeur d'une latte, et il s'est demandé : quelle est la probabilité qu'une aiguille, jetée au hasard sur le parquet, intersecte une rainure? Il a lui-même donné la réponse, et vous avez vu en exercice, que la probabilité qu'une aiguille intersecte une rainure, c'est 2a divisé par pi l. C'est en fait Laplace, en 1812, qui a eu l'idée de, en quelque sorte, d'inverser cette formule, et vous voyez, vous pouvez écrire pi en fonction de a, l, et de cette probabilité, il a proposé de lancer n aiguilles, de compter le nombre k de fois où elles intersectent une rainure, et de calculer pi de cette manière. Pi serait approximé par 2a/l, et ici, on remplace la probabilité qu'une aiguille intersecte une rainure, par k/n. Ce qui serait écrit comme ça. L'idée sous-jacente, c'est que la loi des grands nombres nous dit que, si n est grand, ce rapport devrait avoisiner la probabilité qu'une aiguille intersecte une rainure et en fait, ce que l'on a vu en cours, c'est que c'est vraiment à la limite que c'est vrai. En tous cas, on peut essayer l'estimer comme ça. Alors, de nombreuses personnes ont essayé de faire l'expérience pratique, donc c'était bien avant les ordinateurs, donc de faire l'expérience vraiment sur un vrai parquet, avec de vraies aiguilles, et il y a un certain Lazzarini, qui en 1901, réalise l'expérience. Il a pris des aiguilles de 2,5 cm, des lattes qui font 3 cm de large, il a lancé 3408 aiguilles, il en compte k = 1808 qui interceptent une rainure, pof! Il calcule pi, avec notre formule qui est censée l'approximer, et il trouve 3,141592 etc., et vous constatez qu'il y a 6 chiffres après la virgule, qui sont corrects. Là, vous pouvez vous dire que c'est trop beau pour être vrai, et on se souvient tout-de-suite, que l'estimateur que l'on propose, c'est une variable aléatoire. Donc, quel crédit accorder à un tel résultat? Vous pouvez vous demander : mais, pourquoi il ne nous a pas dit ce qu'il se passait si on lançait plus d'aiguilles? Si il recommençait à jeter des aiguilles nouvelles et voir ce qu'il obtenait? Bref, une fois qu'on a proposé un estimateur, il faudrait peut-être se demander : quelle est la fiabilité du résultat obtenu? C'est ce que nous allons maintenant détailler, nous allons mettre sous forme mathématique cette expérience, et analyser comment on peut quantifier la fiabilité d'une telle estimation. Alors, quelle est l'analyse probabiliste de ce problème? Je vais introduire Ei : l'événement qui est que la i-ème aiguille lancée intercepte une rainure. Et ce qu'on va appeler l'estimateur, qui est censé nous donner pi, je vais le définir de la manière suivante : je compte le nombre de fois où je vois l'événement Ei, donc je mets cette somme d'indicatrices, je divise par n, donc ça me compte le nombre de fois où, en n lancers, j'ai bien intersecté une rainure, et il y a ce préfacteur l/2a. Par la loi des grands nombres, que ce soit presque sûrement ou en probabilités, si j'appelle thêta chapeau n cette chose-là, ça converge, quand n tend vers l'infini, vers l/2a fois la probabilité que la i-ème aiguille intersecte une rainure. Comme je l'ai dit tout à l'heure, vous avez calculé déjà ça en exercice, cette probabilité vaut 2a /pi.l. Donc, thêta n chapeau, quand n tend vers l'infini, presque sûrement, tend vers 1/pi. Voilà ce qui garantit, au moins, que, asymptotiquement, si on estime pi comme ça, on trouve 1/pi. Si on utilise cet estimateur on trouve 1/pi donc, bien sûr, on peut en déduire pi. Allons un petit peu plus loin : la somme des indicatrices des événements qu'une aiguille tombe sur une rainure, ça suit une loi binomiale de paramètre n et de probabilité des Ei, donc, il est facile de vérifier que l'espérance de notre estimateur c'est 1/pi, et que sa variance est égale à ça. Alors c'est composé de deux parties : la partie qui vient du fait qu'on a une binomiale, c'est cette partie, et le préfacteur vient du fait que, il faut diviser ça par n et il y a après ça devant, et comme on calcule une variance, c'est élevé au carré. Ca donne donc cette majoration, si l'on remarque que cette probabilité est toujours entre 0 et 1, ce qui fait que ce produit est toujours plus petit que un quart. En particulier, on a une estimation de la variance qui ne dépend pas de la probabilité qui contient pi, puisque c'est pi qu'on veut précisément déterminer. Petite remarque : vous voyez que, souvenez-vous on a décidé que l'aiguille, pour une longueur plus petite que la largeur d'une latte, on peut quand-même faire tendre a vers l, et on voit que la variance diminue. On reverra l'influence de ça plus tard, mais on voit donc que si on prend des aiguilles qui sont presque aussi grandes que la largeur d'une latte, on s'attend à ce que l'estimateur marche mieux. Alors comme je l'ai dit, quand on a vu ce que prétend avoir trouvé Lazzarini, il faut se demander si l'on peut quantifier la qualité de notre estimateur, et pour ce faire, je vais introduire une notion, que l'on appelle l'intervalle de confiance, sous une forme simple, qui va être basée sur une inégalité que vous avez vue en cours, qui est une inégalité de Bienaymé-Tchebychev, et nous avons déjà utilisé ce genre de raisonnement pour la pluie aléatoire qui servait à déterminer pi. Alors si je me place un instant dans un cas un peu plus général, si vous avez une variable aléatoire X réel, vous avez µ, delta positif, et un nombre alpha entre 0 et 1, vous voulez mesurer de façon probabiliste la distance entre µ et X. Ce que vous pouvez vous demander, c'est si la probabilité que la distance entre µ et X est plus petite que delta, quand est-ce que cette probabilité est plus grande que alpha? Donc, vous voyez que l'intervalle ] X- delta, X + delta [ c'est un intervalle aléatoire, et c'est ce qu'on appelle l'intervalle de confiance pour µ, et alpha est appelé le niveau de confiance. On va essayer de voir ce que ça donne dans notre exemple, pour estimer cette probabilité, on va utiliser, donc, une inégalité de Bienaymé-Tchebychev. Si X est une variable aléatoire réelle, si l'on se donne un delta positif, cette inégalité nous dit, pour une variable aléatoire quelconque réelle, que, la probabilité que X moins son espérance en valeur absolue soit plus grand que delta, c'est borné par la variance, divisé par delta carré. On a envie de regarder la probabilité que cette différence en valeur absolue, soit plus petite que delta, ce qui va conduire à prendre 1 moins cette probabilité, à inverser l'inégalité, et d'autre part, je vais introduire alpha, je vais prendra alpha de cette forme. Donc, si vous faites ce petit calcul d'une ligne, vous déduisez de ça que la probabilité que l'espérance de [X] -X en valeur absolue, soit plus petite que cette quantité, et strictement plus grande que alpha. C'est ce qu'on va appliquer, maintenant, à notre estimateur thêta chapeau n. Si X est thêta n chapeau, on a donc, si on regarde la probabilité que la différence en valeur absolue entre 1/pi et thêta chapeau n soit plus petite que cette quantité, donc j'ai remplacé ce qu'on vient de voir par les valeurs qu'on avait trouvées juste avant, cette probabilité dépasse alpha. On peut exprimer ça d'une manière différente et équivalente, en disant que, avec une probabilité plus grande que alpha, 1/pi est dans cet intervalle, qui est : ]thêta chapeau n- cette valeur, thêta chapeau n + cette valeur[ Il y a une chose à remarquer tout de suite, c'est que comme je vous ai dit tout à l'heure, cet intervalle est un intervalle aléatoire, et un autre phénomène important, est que son rétrécissement se fait en 1/racine de n. Donc si on augmente le nombre de tirages, cet intervalle se rétrécit relativement lentement, mais en 1/racine de n. Voilà comment on peut savoir, si on réalise une expérience avec n aiguilles, si ce qu'on trouve a une chance de contenir la valeur 1/pi, donc la valeur pi. Et estimer quantitativement cette probabilité. Avant de passer à l'expérience numérique, je voudrais faire une remarque sur le nombre de lancers en fonction du niveau de concurrence qu'on veut : je fixe la largeur des lattes et la longueur des aiguilles, on les suppose connues, supposons, par exemple, que le niveau de confiance soit 0.9, disons qu'on a lancé 1 000 aiguilles, je me demande combien il faut tirer d'aiguilles, et j'appelle ça n', pour passer à un niveau de confiance de 0.99. Je veux augmenter de 9 points mon niveau de confiance. Tout en gardant, par exemple, l'écart entre 1/pi et thêta n chapeau. Cela revient à regarder quand est-ce que cette quantité, égale à celle-là, quand j'ai remplacé alpha par alpha', et n par n'. On voit tout de suite que, n' s'écrit comme le rapport de ( 1- alpha ) / ( 1- alpha' ) et on trouve 10 fois n. Autrement dit, en voulant améliorer de 9 points notre niveau de confiance, il faut 10 fois plus d'aiguilles. Il faut lancer 10 fois plus d'aiguilles. Passons maintenant à l'expérience numérique interactive que nous vous proposons, je vais vous montrer brièvement comment elle fonctionne : vous pouvez lancer plus ou moins d'aiguilles, grâce à ce bouton ; vous pouvez régler la longueur des aiguilles, ainsi que la largeur des lattes, tout en maintenant plus petite la longueur des aiguilles par rapport à la largeur des lattes automatiquement. Ici, vous voyez qu'on a lancé 10 aiguilles, on a obtenu ça, pour thêta, pour 1 sur thêta chapeau n, puisque là, c'est l'inverse que l'on calcule, et on trouve ça : si on augmente le nombre d'aiguilles, les choses s'améliorent, on peut aussi relancer toutes les aiguilles d'un coup, ce qui montre le caractère aléatoire des lancers de façon claire : on n'obtient pas exactement la même chose, et alors il y a la possibilité, aussi, de coloriser les aiguilles qui intersectent les rainures. Donc, je vous laisse utiliser cette simulation numérique, et l'explorer vous-mêmes. Ceci clôt cette séance, qui était consacrée à l'expérience des aiguilles de Buffon.