[SON] [AUDIO_VIDE] Bonjour, bienvenue au cours d'aléatoire de l'École Polytechnique, nous allons faire un exercice qui s'appelle test de moyenne nulle. Soit X k, une suite de variables aléatoires indépendantes identiquement distribuées, i.i.d., et de carré intégrable. Leurs espérance et variance commune sont notées m qui est un réel et sigma carré, qui est supposé strictement positif. L'objectif est de pouvoir tester l'hypothèse m = 0, sans connaître sigma. On va expliquer exactement ce qu'on veut dire par ça. Pour cela, on introduit une variable aléatoire T n indicé par n, qui est la somme de i égal 1 à n de X i divisé par la somme de j égal 1 à n de X j carré. Première question, question auxiliaire dont on aura besoin, montrer que si y est une constante, sous-entendu qu'il dépend pas du hasard, alors si d'un côté, la suite de l'aléatoire Y n converge en loi vers y, d'un autre côté, une suite de variables aléatoires Z n converge en loi vers une variable aléatoire Z, alors le couple, la suite de variables aléatoires Y n, Z n converge en loi vers le couple y, Z. Deuxième question, donner le comportement asymptotique pour n grand de T n, que l'on a défini précédemment, lorsque m est différent de 0 et puis, lorsque m vaut 0. Il y a deux comportements asymptotiques différents. Troisième question, a), pour un seuil de confiance de 95 %, donner une borne a telle que pour n grand, on puisse accepter l'hypothèse m égal 0 si la valeur absolue de T n est inférieure ou égale à 1. Je m'explique. On commence par supposer que m égal à 0, donc on utilise le comportement asymptotique pour n grand de T n lorsque m égal 0. On obtient une variable aléatoire limite et donc, on voit si la probabilité de cette variable aléatoire limite inférieure ou égale à a, on cherche le petit a tel que la probabilité que cette variable aléatoire limite soit inférieure à a est de 95 %. A ce moment-là, on décide d'accepter l'hypothèse m égal à 0, parce qu'on considère que c'est suffisamment probable dans ce sens-là pour qu'on puisse retenir cette hypothèse. Troisième question, b), dans cette situation, on a déterminé un a, on a déterminé cette valeur, et donc, suivant les valeurs de T n, on accepte ou pas l'hypothèse m égal à 0. Donc on veut savoir si lorsqu'on accepte l'hypothèse m égal 0, on fait une erreur importante. Donc dans cette situation, donner le plus petit n tel que, si on accepte l'hypothèse m égal 0, alors selon toute vraisemblance, la valeur absolue de m est inférieure ou égale à 0,05 sigma. Parce qu'évidemment, ce qu'on sera capable de dire, c'est que m est petit ou pas en fonction de l'écart-type sigma. Là évidemment, il s'agira d'utiliser l'autre comportement asymptotique pour voir ce qu'on peut en déduire. Ceci finit l'énoncé. Donc premièrement, on voulait montrer ce résultat de convergence où on avait Y n qui convergeait vers y en loi et Z n converge vers Z en loi, où y est une constante, ne dépend pas du hasard. [AUDIO_VIDE] alors on voulait montrer que le couple Y n Z n convergeait en loi vers y, Z. Pour ça, on va utiliser les fonctions caractéristiques, on va montrer que phi de Y n, Z n converge simplement quand n tend vers l'infini, vers y, Z. Pour montrer ça, on va commencer par prendre la différence, donc on va prendre phi de Y n, Z n 2 U moins phi de y, de u v, puisqu'il y a deux variables, u, v. Donc si Y n Z n de u, v moins phi de y z de u v, 1 pour quel que soit u v qui appartient à R. On va prendre cette différence. Par définition, évidemment, c'est l'espérance [AUDIO_VIDE] donc c'est la différence de ces espérances d'exponentielles [AUDIO_VIDE] donc en utilisant, entre autres, la linéarité et la propriété de l'exponentielle c'est l'espérance de e i u Y n e i v Z n moins e i u y e i v Z. Et donc qu'est-ce qu'on va faire? On va ajouter, retrancher e i u y e i v Z n et donc, en regroupant un petit peu, on obtient que c'est l'espérance de e i u Y n moins e i u y facteur de e i v Z n plus e i u y, qui sort de l'espérance, puisque i ça ne dépend pas du hasard, donc on obtient ça tout simplement en rajoutant et en soustrayant, j'ai souligné en rouge, donc on a rajouté et on a soustrait ces deux choses-là. Ensuite, on utilise les hypothèses, ici on n'a rien à faire, ça, ça tend vers 0 quand n tend vers l'infini puisque Z n converge vers Z. On utilise juste la convergence pour Z. Ici, on va être obligé de travailler un peu plus. On va prendre le module de ça, évidemment, le module de cette espérance, c'est plus petit que l'espérance du module, [AUDIO_VIDE] évidemment, le module de e i v Z n, ça vaut 1. Le module ici. C'est égal à 1. On a juste ce terme-là qui reste, l'espérance, je vais peut-être mettre des crochets pour bien voir qu'est-ce qui est module, qu'est-ce qui est espérance. Donc ça, c'est plus petit que ça et donc ça aussi ça tend vers 0 quand n tend vers l'infini, tout simplement parce que Y n converge vers y en loi. A chaque fois, on est en train d'intégrer les fonctions bornées continues et il suffit de passer à la limite. Ainsi, nous avons effectivement montré le résultat du haut, nous avons montré ça. Donc la même technique, qui est parfois bien utile. La deuxième question, il s'agissait de trouver le comportement asymptotique de T n, qui par définition était un quotient comme ça. [AUDIO_VIDE] Il s'agit de trouver le comportement asymptotique pour n grand, et dans les deux situations où m était différent de 0 et m égal 0. Donc ces deux situations qui vont être différentes. La première chose qu'on peut avoir envie de dire, c'est on a des sommes ici, on va les renormaliser. Il y a une somme de n termes en haut et bas, on va les renormaliser en divisant les sommes par n et on peut réécrire que ça, c'est égal à ici on va garder la racine. 1 sur n somme de j égal 1 à n de X j carré et ici, on va mettre 1 sur n somme de i égal 1 à n de X i. Et puis en fait, comme en bas, il y a une racine, il faut multiplier par racine de n. Il manque, pour qu'il y ait égalité, il faut qu'on multiplie encore tout ça par racine de n. Alors évidemment, lorsque m est différent de 0, par la loi des grands nombres, presque sûrement, quand n tend vers l'infini, ici on va se placer dans l'hypothèse, on va marquer ça en haut, m différent de 0, donc dans cette situation, grâce à la loi forte des grands nombres, je vais peut-être l'écrire aussi, cette chose-là se comporte comme, donc on passe à la limite en haut, c'est limite presque-sûre, il y a aucun problème pour passer à la limite en haut et en bas. En haut, on obtient m, en bas on obtient l'espérance de X 1 au carré, c'est-à-dire sigma carré plus m carré, iii carré en fonction des données. Donc on obtient ça comme équivalent et une autre façon de l'écrire, c'est que c'est équivalent, pour voir un petit peu plus les dépendances peut-être, c'est équivalent au signe de m en divisant par valeur absolue de m en haut et en bas, sur sigma 2 sur m 2 plus 1 racine de n. Donc on voit le comportement en racine de n fois une constante et cette constante, évidemment, si m est très petit devant sigma, cette constante va être petite, puisqu'en bas on aura quelque chose de très grand, et donc ce comportement racine de n ne se sentira pas aussi fort que si m est très différent de sigma. Donc déjà, ça c'est le cas si m est différent de 0. Évidemment, dans le cas m égal 0, on n'a pas l'équivalent. La loi des grands nombres ne nous permet pas d'avoir d'équivalent, on aurait juste le fait que c'est un petit iii de racine de m, c'est tout ce qu'on pourrait obtenir. Mais évidemment, il faut normaliser différemment. Donc ici, je vais peut-être rappeler que, en le mettant clairement ici, m égal 0, m différent de 0. Et ici on va faire m = 0. Donc, en fait on écrit quelque chose de plus simple. T n. En bas, on utilise toujours la même normalisation. Mais en haut, on utilise la normalisation du théorème de limite centrale, et il se trouve que c'est celle qui se normalise correctement par, enfin on divise donc en haut et en bas par racine de n en fait. Et donc, grâce, donc ici on va voir que cela converge en loi quand n tend vers l'infini vers une gaussienne centrée, réduite. Et donc là, il faut utiliser plusieurs résultats. Il faut utiliser la loi forte des grands nombres pour la convergence de ce terme-là. Il faut utiliser le Théorème Centrale Limite pour la convergence de terme-là. Et, il faut utiliser le résultat du premièrement, pour pouvoir faire fonctionner en même temps cette convergence donc presque sûre en bas, mais qui est donc presque sûre, et donc aussi en loi, et la convergence en loi en haut. Donc en bas, on converge presque sûrement vers une constante, donc on converge en loi vers une constante. En haut, on converge en loi vers une variable aléatoire. Et par la propriété précédente, la convergence du couple, on peut justifier le fait qu'on a une convergence en loi, du tout vers le quotient, et il se trouve que cela va être la loi centrée réduite. On a obtenu la limite dans deux comportements de limites différents. Donc je reviens juste très brièvement sur ce que je disais. Évidemment, il y a, la rupture n'est peut-être pas si nette. Ici, il y a une gaussienne, c'est quelque chose de bien contrôlé, ici il y a racine de m évidemment, si m est petit devant sigma, le coefficient devant racine de n va être petit. Le troisièmement, c'était donner un a tel que qu'on pouvait accepter l'hypothèse m = 0, en-dessous, avec 95 % de probabilité. si m est différent de 0, c'est ce qu'on vient de dire tout à l'heure, alors on est, on vient de faire le calcul, en particulier la valeur absolue de tau n qui se comporte comme racine de n sur une constante, explose et donc devient vite grand quand n tend vers l'infini, quand n tend vers l'infini. Alors que si m = 0, alors T n, dans le sens où T n est équivalent, enfin en loi, converge en loi, vers une gaussienne centrée réduite, qui est une variable aléatoire qui est bien, que l'on contrôle bien, et en particulier, il est bien connu que la probabilité, bon je l'écris de façon un peu symbolique, que la valeur absolue d'une gaussienne centrée réduite soit inférieure ou égale à 1,96. Pardon, 96. 1,96. Donc la probabilité, de probabilité-là, c'est 95 %. C'est le fameux seuil de 95 %, c'est 1,96. Donc, on choisit a = 1,96. Le raisonnement derrière tout cela, c'est que si, on commence par supposer que l'hypothèse est vraie. Donc, on connaît la loi limite de T n, donc on sait qu'avec 95 % de chance, la valeur de T n sera plus petite que 1,96. On accepte le fait que m = 0, dans ces circonstances-là. Sinon, on se dit, eh bien non, T n est trop grand pour accepter cette hypothèse, comme dans le cas contraire où m est différent de 0, on sait de toute façon que T n va exploser. On se dit, eh bien on refuse l'hypothèse m = 0, et on peut faire un raisonnement de test d'hypothèse assez simple, pour accepter ou refuser l'hypothèse m = 0. Donc, la question 3 petit b, c'était d'évaluer un petit n, tel que si on accepte l'hypothèse, donc si on considère sur l'échantillon que m = 0, alors on peut dire que en fait, on a au moins, on peut au moins contrôler m par 0,05 sigma. Donc, faire cela. En fait, il faut chercher le plus petit n. Donc, on se place cette fois-ci dans l'hypothèse où m est différent de 0, donc avec l'autre comportement asymptotique, on cherche le plus petit n, tel que le module, enfin la valeur absolue de T n soit, donc tau n évidemment, je vous rappelle, dans ce cas-là, où m est différent de 0, c'est équivalent à cela, presque sûr. Donc soit plus grand que a. Donc, à partir du moment où n sera assez grand pour que valeur absolue de T n, qui est équivalent à cela, ou plutôt son équivalent soit plus grand que a, si on accepte l'hypothèse, on a une forte vraisemblance qu'on n'est pas dans cette situation-là, où m est différent de 0. Donc, pour cela, on a, donc cela, cela fait calculer n de l'ordre de a 2 sur ((sigma 2 / n 2) + 1. Donc, on résout. Donc, à partir du moment où n est de cet ordre-là, on pourra dire que valeur absolue de T n > a, et donc on aura une bonne certitude que m est proche de 0. Et donc précisément, donc ici il faut trouver avec les valeurs données, donc ici, on va prendre donc 1,96 carré, c'est la valeur de a 2. Ensuite, il faut prendre 1 / 0,03 au carré. Je pense qu'il y avait une petite imprécision dans l'énoncé, on prend m plus petit que 0,03 sigma. Pardon. C'était, en tous cas, le calcul est fait pour 0,03 sigma, pour bien différencier le 0,03 sigma d'ici du 0,05, du 5 % de tout à l'heure. Donc, 0,03 carré, plus 1. Donc voilà le calcul qu'on fait, et donc cela, un petit calcul nous montre que c'est 4 272. Voilà, donc nous, à partir du moment où n est plus grand 4 272, si on accepte l'hypothèse m = 0, on pourra au moins dire, eh bien peut-être qu'on s'est trompé, mais en tout cas, on a valeur absolue de m qui est plus petit que 0,03 sigma, ainsi qui termine la solution du troisième b, et l'exercice.