[AUDIO_VIDE] [AUDIO_VIDE] Bienvenue dans cette deuxième séance consacrée à la simulation de l'aléatoire, la dernière fois nous nous étions arrêtés à la simulation des variables aléatoires discrètes, et dans cette séance on va aborder les variables aléatoires continues. Donc, on prend des valeurs réelles. Dans la séance d'aujourd'hui, je vous montrerai ce qui s'appelle la méthode par inversion de la fonction de répartition, et nous verrons dans la séance suivante des méthodes particulières adaptées à des variables aléatoires qui ont des propriétés spécifiques, et dans une autre séance, la méthode du rejet, donc on va vraiment se concentrer là-dessus dans cette séance. Avant de commencer, je voudrais vous rappeler un certain nombre de choses sur les variables aléatoires réelles, donc si je note x une telle variable aléatoire, sa fonction de répartition elle est définie par la relation suivante, on la note F(x), hein c'est la notation traditionnelle, et c'est la probabilité que X est plus petit ou égal à x. En cours vous avez vu qu'elle a des propriétés générales qui sont qu'elle est croissante, continue à droite et limitée à gauche en tout point, et que si vous partez vers moins l'infini cette fonction tend vers zéro, tandis que, si vous partez vers plus l'infini, là il y a une petite erreur, là c'est plus l'infini, vous allez en un. Ça a été abordé donc au cours trois, séance un. Il y a de nombreuses variables aléatoires réelles qui ont en fait ce qu'on appelle une densité, donc je vous rappelle ce que ça signifie, ça a été introduit dans le cours trois séance deux, on la note petit f en général, et la définition c'est que la fonction de répartition est tout simplement l'intégrale de moins l'infini à x de la densité. En particulier, en tout point où la densité est continue, la dérivée de la fonction de répartition est exactement petit f. Je vous montre juste quelques exemples de base de tels objets, donc si vous prenez par exemple x qui distribue uniformément dans l'intervalle zéro, un tiers, sa densité donc c'est trois fois l'indicatrice de l'ensemble zéro un tiers, autrement dit, f vaut zéro jusqu'à zéro, en suite il faut trois, et ensuite elle se met à valoir zéro à nouveau, et si vous intégrez dans cette fonction, de moins l'infini jusqu'à un x donné, vous trouvez la fonction de répartition qui est 3 x fois indicatrice du même intervalle. Donc c'est une fonction qui vaut zéro, et qui est linéaire là, qui est, et ensuite qui devient égale à un, en dehors de un tiers. Un autre exemple important, c'est la loi exponentielle, donc par exemple là j'ai pris une variable x qui suit une loi exponentiel de paramètre 0.25 donc ça signifie que f est zéro, puisque ça décrit les variables aléatoires positives, elle vaut zéro jusqu'à zéro, et ensuite elle décroît, comme ça, dans cet exemple, donc c'est le paramètre qui est devant, exponentiel moins le paramètre fois x. et donc là on a mis l'indicatrice de R plus. Vous pouvez calculer facilement grand F, vous trouvez 1- e (- 0.25x) toujours fois cette indicatrice, et donc ça a cette allure, elle croît très rapidement, vers un. Alors toutes les fonctions de répartitions, par définitions, sont des sont comprises en zéro et un. Un dernier exemple où j'ai pris 3 comme moyenne et 6,25 de pour la variance, donc c'est la fameuse courbe en cloche, la densité a cette allure, c'est une courbe comme ça, et si vous l'intégrez, vous trouvez quelque chose qui effectivement part de moins l'infini où ça tend vers zéro, ça croît, ça croît, ça croît, et après ça se met à tendre vers un à l'infini, et il faut noter que malheureusement on n'a pas d'expression explicite pour F. Donc c'est pour ça que dans beaucoup de livre vous trouvez des tables de valeurs, de cette fonction, et bien sûr les ordinateurs sont capables de les tracer, mais on n'a pas l'expression exacte fermée très simple, avec des fonctions simples. Je vais vous présenter maintenant la méthode dite d'inversion de la fonction de répartition, en fait vous l'avez déjà abordée brièvement dans le cours trois séance trois, et on vous a montré que si vous avez une variable aléatoire uniforme dans zéro un, et si x est une variable aléatoire qui a pour fonction de répartition F, alors, si vous prenez F -1 (U), l'image réciproque de U par F, ça a la même loi que X. Donc je vous rappelle comment on arrive à ce résultat, il y a un cas où c'est vraiment à voir, c'est si la fonction de répartition F elle est continue et strictement croissante sur R. Parce que, à ce moment-là, elle réalise une bijection de R sur l'intervalle zéro un ouvert, et donc vous pouvez parfaitement définir son inverse au sens habituel, sa fonction réciproque, qui va de zéro à un, dans R. Et donc si vous prenez la variable aléatoire que j'appelle Y qui est F-1 (U), ça a la même loi que x. C'est pour ça j'écris juste ce que ça veut dire, la probabilité que cette variable soit plus petite ou égale à x, par définition c'est la probabilité que F-1 (U) soit plus petit ou égale à x, à cause du fait que j'ai une bijection qui va bien de zéro à un en R, c'est exactement égale à la probabilité que U soit plus petit ou égale à F(x) et par définition de la variable aléatoire uniforme, j'obtiens exactement le nombre F(x). Donc ça c'est la situation idéale où on a une fonction de répartition qui est continue et strictement croissante. Malheureusement il existe des exemples où F n'a pas d'inverse à proprement parler au sens où on vous l'a appris en analyse, mais en fait, le résultat reste valable si on fait la convention suivante, F-1 ça va être en fait l'inverse, ce qu'on appelle l'inverse généralisé ou quantile, et donc on regarde le plus petit des x tels que F(x) est plus grand ou égal à u, pour définir cette fonction de u. Donc là j'ai mis schématiquement les trois situations possibles qui peuvent arriver, celle-là c'est celle que nous avons vu précédemment, on n'a aucun problème pour résoudre l'équation F(x) égale u, ici le problème c'est qu'il n'y a pas de solution à cette équation, donc voila comment on détermine F-1(U) avec cette définition, et il y a un troisième cas où carrément cette équation a une infinité de solutions parce qu'on a un endroit où ce n'est plus strictement croissant, où c'est plat, et donc voila graphiquement à quoi correspond cette définition. Ce qu'il faut retenir c'est que, en prenant F moins 1 d'une variable aléatoire uniforme u, dans l'intervalle zéro un, donc, on a quelque chose qui a la même loi que x, si x a comme fonction de répartition F. La seule subtilité, c'est si on a une fonction de répartition qui a ce genre de problème, de prendre cette définition. Alors commençons par un exemple illustrant ce résultat, on va prendre la loi exponentielle et ce que je dis c'est que si vous prenez y comme étant moins le log de u divisé par lambda, ou u, donc tout ce qui suit c'est une variable uniforme dans l'intervalle zéro un, eh ben elle suis une loi exponentielle de paramètre lambda positif. Alors pour le voir, donc, je vous rappelle que la fonction de répartition associé à une loi exponentielle de paramètre lambda, c'est 1- exp(- lambda x), et donc on peut l'inverser, sur les réels positifs, et on trouve exactement ce qu'on annonce, alors la petite observation c'est que un moins u a la même loi que u, donc on peut même remplacer un moins u là par u, tout simplement. Un autre exemple illustratif, c'est la loi de Weibull, cette loi est utilisée en fiabilité, et donc pour, quand on teste la fiabilité d'une machine notamment, on la caractérise de la manière suivante, on appelle ça la fonction de survie, qui est tout simplement un moins la fonction de répartition, imaginez que ce soit tout simplement la probabilité que votre appareil, votre machine fonctionne toujours après le temps x, x est vu comme le temps par exemple, donc on a envie plutôt de regarder G(x), et on la définit par G(x) en posant exp(-x puissance a) où a c'est un paramètre, et cette loi son support c'est les réels positifs. Donc en général, on note ici x suit la loi de Weibull de paramètre a, on note ça comme ça, rappelez vous, ce petit signe c'est pour dire x étant loi, a pour loi Weibull le paramètre a. On vient juste d'observer que u et un moins u ont la même loi, et en faisant exactement la même inversion qu'avant, il y a juste qu'il y a cette puissance maintenant de a, on trouve que y défini par la puissance un sur a de moins log de u suit la loi de Weibull. Regardons maintenant une autre loi très classique qui est la loi de Cauchy, qu'on note souvent comme ça, Cauchy de paramètre a, elle a pour densité 1/pi a / x 2 + a 2, ça c'est un paramètre positif, et par contre x peut prendre toutes les valeurs en R, négatives ou positives, on peut vérifier que sa fonction de répartition c'est 1 / pi arctan (x/a) + un demi, et donc pour appliquer notre résultat général, on se donne u dans zéro un, qui n'est ni zéro ni un, et on cherche x tel que F(x) est égale à u. Donc ça revient à résoudre cette équation en posant Y comme a tan (pi (U- un demi)), on a donc, Y soit une loi de Cauchy de paramètre a. Donc voici un petit résumé sur lequel vous pouvez revenir, le cas échéant, des lois usuelles, hein, donc dans ce tableau U c'est une uniforme dans zéro un, et Ui c'est une suite de variables aléatoires identiquement distribuées qui suit cette loi uniforme dans zéro un, donc on dit comme vous le savez sans doute, on met ça en abrégé hein, v.a.i.i.d., hein, donc on a vi Bernoulli, je l'ai remise, binomiale, géométrique, poisson on l'a pas encore vu on la verra plus tard, on peut faire ça comme ça, donc on s'y attarde pas, l'uniforme, comme vous pouvez vous en douter pour passer de zéro un à un intervalle quelconque, eh ben, on décale de a et on fait cette petite opération, c'est ,un petit changement de variable, l'exponentielle, Cauchy, et on verra ensuite après la loi normale, comment on fait. Donc ça c'est un tableau sur lequel on s'attarde pas, c'est juste qu'on peut y revenir si on veut avoir une vision synthétique, et je termine par deux autres exemples, un peu moins familiers mais qui sont néanmoins assez courants, le premier c'est la loi de la place, alors je prends la version centrée réduite, ou qu'on peut appeler standard, on l'appelle aussi la loi double exponentielle, on la reverra par la suite, elle est définie par la densité un demi e sa fonction de répartition on peut la calculer, donc faut faire attention à cause de la valeur absolue, donc il apparaît, le signe ici, et en appliquant la méthode d'inversion, tout se passe bien et on trouve facilement que si on prend le signe de -sgn(U) ln(1- 2 (valeur absolue de U)), donc on prend ça comme variable Y, Y a la même loi que la loi de la place standard, alors là il faut juste prendre une uniforme dans l'intervalle moins un demi un demi. Voila, c'est tout. Mais sinon on peut aussi modifier ça et prendre une iii uniforme dans zéro un mais ce n'est pas important. Un dernier exemple est celui de la loi de Gumbel, de Gumbel, je prends aussi la version centrée réduite, on peut lui attribuer des paramètres mais ce n'est pas important, cette loi je note juste qu'elle sert pour décrire le maximum d'une série de données, pensez par exemple au niveau d'une rivière, on regarde au cours des années le niveau maximum qu'elle a atteint au temps de l'observation, c'est une valeur aléatoire qui apparaît de façon très naturelle, cette densité elle est un peu particulière parce que c'est une exponentielle moins (x + e(-x)), donc si vous intégrez pour trouver la fonction de répartition, c'est une double exponentielle, comme ça, et c'est très facile en faisant comme on l'a fait pour les autres, pour la loi exponentielle, il y a juste un log qui se rajoute, si on prend moins le log de moins le log de U où U est uniforme dans zéro un, Y, défini comme ça, suit une loi de Gumbel, standard, centrée réduite. Ceci conclut notre deuxième séance de simulation de l'aléatoire.