Alors dans la deuxième partie de ce cours, nous allons définir la dérivation des distributions. Evidemment, c’est vraiment le cœur de la théorie puisque le calcul des distributions, comme nous l’avons dit, c’est un calcul différentiel généralisé qui va permettre de dériver systématiquement toutes les fonctions et même toutes les distributions sans jamais avoir à vérifier que les objets que l’on dérive sont dérivables. Tous les objets, toutes les distributions, auront des dérivées de manière naturelle, comme on va le voir. Plus généralement, on va chercher à définir, sur les distributions, les mêmes opérations que sur les fonctions, au-delà de la dérivation, il y aura bien sûr l’addition, la multiplication dans certaines conditions, le changement de variables, plus d'autres opérations que nous découvrirons dans la suite de ce cours. Dans le cadre de l’analyse des fonctions, toutes ces opérations ont des propriétés de continuité qui sont bien connues. Et ces propriétés de continuité sont évidemment essentielles en analyse. Et donc, avant de définir les opérations sur les distributions qui sont analogues aux opérations connues dans le cadre des fonctions, il est naturel de commencer par définir la convergence des suites de distributions. Et cette notion de convergence des suites de distributions, en réalite, c’est la notion de convergence la plus simple que l'on puisse imaginer, puisqu’il s’agit tout simplement de la notion de convergence simple. En effet, soit oméga ouvert de R N. On dit qu’une suite Tn de distributions sur oméga converge vers T distributions sur oméga si pour tout phi fonction de classe C infini à super compact dans oméga, Tn appliqué à phi est une suite de nombres qui converge lorsque N tend vers l'infini vers la distribution T appliquée à phi. C'est donc bien la notion de convergence simple de la suite de distributions vue comme des formes linéaires donc des fonctions évaluées sur des fonctions tests phi qui sont vues comme des points. La convergence ponctuelle de suite de formes linéaires sur C infini à support compact dans oméga. Donc dans la suite, on notera la convergence au sens des distributions de la manière naturelle, Tn converge vers T dans D prime de oméga lorsque N tend vers l'infini. Donnons quelques exemples de suites convergentes au sens des distributions et le premier exemple c'est la convergence vers une masse de Dirac en un point x zéro. Alors soit fn suite de fonctions mesurables sur un ouvert oméga de R N. et nous allons supposer que cette suite de fonctions vérifie les trois propriétés suivantes: D'une part, fn est positive ou nulle presque partout sur oméga, Ensuite fn est à support dans la boule fermée de centre x zéro et de rayon R N incluse dans oméga, R N assez petit. Et enfin nous supposerons que l'intégral de fn de x dx tend vers 1 lorsque R tend vers l'infini. Alors si la suite Rn, la suite des rayons des boules centrées en x zéro si la suite des Rn tend vers zéro, la suite des distributions T indice fn, la suite des distributions définies par la fonction localement intégrable fn converge vers la masse de Dirac au point x zéro au sens des distributions dans oméga. Voici un exemple un petit peu plus sophistiqué qui conduit à la notion de valeurs principales de Cauchy. Dans ce deuxième exemple on va partir de la fonction définie sur R étoile qui à x associe 1 sur x. Alors on sait bien que cette fonction n'est pas localement intégrable sur R parce qu'elle n'est pas intégrable sur un compact qui serait voisinage de zéro. Mais on sait définir une distribution à partir de cette fonction x donne 1 sur x, bien que cette fonction ne soit pas localement intégrable. Cette distribution s'appelle la valeur principale de 1 sur x et elle est définie par la formule suivante: Pour tout phi de classe C infini à support compact dans R on définit vp de 1 sur x appliqué à phi comme étant l'intégral de zéro à l'infini de phi de x moins phi de moins x divisé par x, dx. Proposition : d'une part la distribution valeur principale de 1 sur x est une distribution d'ordre 1 sur R mais d'autre part, on peut obtenir cette distribution comme limite d'une suite très naturelle de fonctions localement intégrables sur R. À savoir que pour toute suite épsilon n de réels strictement positifs tendant vers zéro, si on considère la suite de fonctions indicatrices de valeur absolue de x appartenant à l'intervalle épsilon n plus l'infini divisée par x, cette suite de fonctions localement intégrables sur R convergent au sens des distributions dans R lorsque n tend vers l'infini vers la distribution valeur principale de 1 sur x. C'est cette définition qui correspond à la notion de valeur principale d'une intégrale qui avait été introduite par Cauchy vers le milieu du dix-neuvième siècle. Ici ce qui est fondamental bien sûr c'est que la fonction x donne 1 sur x est impaire. Et donc c'est la symétrie de la quantité phi de x moins phi de moins x dans la définition de vp de 1 sur x qui permet de corriger la divergence en zéro de la fonction 1 sur x. La démonstration de cette proposition sera traitée en exercice. Maintenant que nous avons en main la notion de convergence de suites de distributions, nous pouvons définir la notion de dérivation des distributions, et cette notion de dérivation des distributions correspond vraiment au calcul, calcul de l'idée clef de la définition des distributions que nous avons fait à la fin du cours numéro 1. Voici la définition : soit oméga ouvert de R N, et T une distribution sur oméga. La distribution dérivée partielle de T par rapport la i-ème variable, sera la distribution notée d rond i T qui sera définie par la formule suivante: d rond i T appliqué a phi égal moins T appliqué à d rond i phi où i égal 1, 2, et cetera, jusqu'à N et pour tout phi de classe C infini à support compact sur oméga. ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ Alors on vérifie sans peine que pour tout compact K inclus dans oméga tout phi de classe C infini à support dans k. Si on sait que T appliqué à phi en valeur absolue est inférieur ou égale à C K, phi en norme pK, K, alors la dérivée partielle de T par rapport à la i-ème variable évaluée sur phi en valeur absolue sera contrôlée par définition par C K, la norme pKK de D i phi, mais cette norme est évidemment inférieure ou égale à la norme de phi d'indice pK plus 1 dans K, et donc la valeur absolue de DiT évaluée sur phi sera contrôlée par C K norme de phi d'indice pK plus 1 dans K. En particulier cette inégalité montre que si T est une distribution d'ordre fini forcément l'ordre de la dérivée partielle de T par rapport à la i-ième variable sera inférieure ou égale à l'ordre de T plus 1. Donc nous allons maintenant donner quelques exemples de calcul de dérivées de distribution. Evidemment le premier exemple que nous devons considérer c'est le cas des fonctions de classe C1 parce que nous définissons une notion de dérivée de distribution, les distributions elles-mêmes généralisent le cas des fonctions et donc il faut vérifier que la notion de dérivation des distributions qui a été introduite coincide bien avec la notion de dérivation des fonctions que nous connaissons déjà lorsqu'on la restreint au cas des distributions qui sont définies par des fonctions. Nous allons faire ça dans le cadre des fonctions d'une seule variable. Donc soient a et b deux réels avec a strictement plus petit que b. Alors si je prends petit f une fonction de classe C 1 sur l'intervalle ouvert a b si je considère la distribution T indice f qui est définie par f puisque f étant de classe C 1 sur l'intervalle a b, elle y est localement intégrable, eh bien, la dérivée de la distribution définie par f, la dérivée de la distribution T f n'est rien d'autre que la distribution définie par la fonction f prime. Nouveau: comme f est de classe C 1 sur l'intervalle a b, f prime est continu sur l'intervalle a b et donc en particulier elle y est localement intégrable. On vérifie donc ainsi que la dérivation au sens des distributions coïncide avec la distri, avec la dérivation usuelle pour les fonctions de classe C 1. Comme cet exemple est fondamental, on va faire la petite démonstration qui ne présente aucune difficulté. En effet pour tout phi fonction de classe C infini à support compact sur l'intervalle ouvert a b, on a par définition que la dérivée de la distribution T f appliquée à phi est égale à moins la distribution T f appliquée à la dérivée phi prime. Et si on écrit ce que ça vaut, ça vaut moins l'intégrale de a et b et de f de x phi prime de x dx. Intégrons par parties cet intégrale. L'intégrale lorsqu'on la calcule par parties fait intervenir moins le produit f phi évalué entre les bornes a et b, plus l'intégrale de a à b de f prime de x de phi de x dx. Mais le terme tout intégré f phi évalué entre a et b est identiquement nulle car phi comme elle est à support compact dans l'intervalle ouvert a b, elle est identiquement nulle en a et en b mais même au voisinage de a et de b. Par conséquent, T f dérivé au sens des distributions appliquées à phi est égale à l'intégralle de a à b de f prime de x phi de x, dx chose qui par définition est égale à la distribution définie par f prime appliquée à phi, autrement dit, à T indice f prime appliqué à phi. Alors maintenant que nous avons vérifié que sur les fonctions de classe C 1 la notion de dérivée des distributions coïncide avec la notion usuelle de dérivation, nous allons essayer de dériver des fonctions plus générales et par exemple des fonctions ayant des discontinuités. Alors le premier exemple auquel on pense c'est la fonction dite de Heaviside qui est la fonction indicatrice de R plus dans n, c'est-à-dire la fonction discontinue qui est définie par la formule: H de x égale 1 si x est positif ou nul et H de x égale zéro si x est strictement négatif. Alors cette fonction H est évidemment localement intégrable sur R, si j'identifie cette fonction localement intégrable à la distribution T indice H qu'elle définit, eh bien je vois que H prime donc ce que je devrais noter T H prime mais après l'identification c'est H prime dérivé de la fonction H vue comme distribution au sens des distributions. Cette dérivée c'est la masse de Dirac en zéro au sens des distributions dans R. On a ainsi notre premier calcul de dérivées au sens des distributions d'une fonction qui n'est pas dérivable puisqu'elle est discontinue, discontinue ici en zéro. Alors faisons la démonstration. À nouveau c'est une démonstration tout à fait élémentaire. Soit phi de classe C infini à support compact sur R, alors comme phi est à support compact dans R, eh bien il existe un réel grand R strictement positif assez grand tel que le support de phi soit inclus dans l'ouvert moins grand R grand R. Calculons maintenant la distribution H prime appliquée à phi. Par définition, ce sera la distribution définie par H appliquée à moins phi prime, et maintenant la distribution définie par H appliquée à moins phi prime, ça n'est rien d'autre que moins l'intégrale de zéro à R de phi prime de x, dx que l'on calcule, qui vaut phi de zéro moins phi de R, mais cela est égal à phi zéro parce que phi de R est nul puisque phi est à support dans l'intervalle ouvert moins R, R, de sorte que ce que l'on trouve c'est bien la masse de Dirac en zéro appliquée à phi. Maintenant que nous avons défini la notion de dérivée partielle d'ordre 1 pour une distribution quelconque sur oméga, nous allons itérer cette opération et parler de dérivée partielle d'ordre supérieur à 1 pour des distributions. Alors nous allons commencer par un petit lemme, qui est une propriété fondamentale de la dérivée des distributions et qui est hérité de la propriété analogue sur les fonctions de classe C infini. Alors le lemme porte sur la symétrie des dérivées secondes et dans le cadre des fonctions de classe C 2, ce lemme porte le nom de lemme de Schwarz. Alors pour toute distribution T sur un ouvert oméga de R N, je peux considérer d'une part la dérivée de T par rapport à la j N variable, c'est une distribution que je peux dériver à nouveau par rapport à la i N variable, et je peux considérer d'autre part la dérivée de T par rapport à la i N variable qui est une distribution et que je dérive à nouveau par rapport à la j N variable. Donc je considère les deux distributions d rond i de d rond j T et d rond j de d rond i T pour i et j quelconque allant de 1 jusqu'à N. Eh bien ces deux distributions sont toujours égales quels que soient i et j. Sont égales, évidemment au sens des distributions dans oméga. Alors faisons la démonstration qui ne présente aucune difficulté. Pour toute fonction test phi de classe C infini à support compact dans oméga, on sait d'après le lemme de Schwarz du calcul différentiel classique que les dérivées secondes croisées de phi sont symétriques. Autrement dit, d rond i de d rond j phi est égal à d rond j de d rond i phi précisément parce que phi est de classe C infini sur oméga. En réalité il suffirait que phi soit de classe C 2 sur oméga. Par conséquent, lorsque je calcule d rond i de d rond j T appliqué à la fonction test phi par définition, c'est moins d rond j T appliqué à la fonction test d rond i phi, qui par définition est donc égale à la distribution T appliquée à la fonction test d rond j de d rond i phi. Mais maintenant cette expression, d'après ce que l'on sait de la symétrie des dérivées partielles croisées d'ordre 2 pour les fonctions de classe C infini, d'après ce qu'on vient de dire, cette expression, elle est symétrique en i et j. Et donc, par conséquent, on trouve que d rond i de d rond j T appliqué à phi, comme c'est symétrique en i et en j, doit être égal à d rond j de d rond i T appliqué à phi, ce qui achève la démonstration. Avec cette formule on définit par récurrence les dérivées partielles successives de T sans avoir à se préoccuper de l'ordre dans lequel on opère ces dérivations. Et donc, pour tout T distribution sur oméga ouvert de R N je vais pouvoir définir la distribution d rond alpha T où d rond alpha est un monôme différentiel quelconque par la formule suivante : d rond alpha T appliqué à une fonction test phi de classe C infini à support compact dans oméga quelconque, sera égale à moins 1 à la puissance la longueur du monôme différentiel d rond alpha, fois T appliqué à d rond alpha phi. Maintenant on peut commenter cette définition en expliquant d'où vient le moins 1 à la puissance la longueur du monôme de dérivation moins 1 à la puissance valeur absolue de alpha ou longueur du multiindice alpha. Comme on a vu dans le cas particulier des distributions qui sont définies par des fonctions de classe C 1, la définition de la notion de dérivée d'ordre 1 d'une distribution correspond dans le cas des fonctions de classe C 1 à l'intégration par parties. Pour commencer chaque fois que l'on intégre par parties, lorsque on échange la dérivation en la faisant passer de l'une des fonction sur l'autre, eh bien, la formule met en jeu un signe moins. C'est pour ça que chaque fois que l'on dérive une distribution, lorsque le monôme différentiel passe sur la fonction test, passe de la distribution à la fonction test, la formule qui donne la définition de la dérivée des distributions, formule qui imite l'intégration par parties, met en jeu la multiplication par moins 1, met en jeu un changement de signe. Et donc, lorsqu'on a un monôme différentiel de longueur alpha, eh bien la définition de d rond alpha T appliquée à phi, il est naturel qu'elle mette en jeu la multiplication de T appliquée à d rond alpha phi, par moins 1 puissance la longueur du monôme différentiel alpha. Autrement dit, chaque fois qu'on a fait passer une dérivée partielle d'ordre un de T sur phi, on a changé le signe dans l'égalité, et c'est pour ça qu'à l'arrivée, on a moins 1 à la puissance la longueur de alpha. Alors, donnons quelques exemples de dérivées d'ordre supérieur pour des distributions. Pour tout p entier naturel strictement positif, on vérifie sans peine que la dérivée p-ième de la masse de Dirac au point x zéro de R au sens des distributions dans R, c'est la distribution de Dirac d'ordre p en x zéro. Autrement dit, dp sur dx p de delta en x zéro, c'est la distribution de Dirac en x zéro d'ordre p dans D prime de R. On rappelle que cette distribution de Dirac d'ordre p en x zéro, elle est définie par la formule suivante: delta en x zéro d'ordre p appliqué a phi est égal à moins 1 puissance p, phi dérivé p fois calculé en x zéro pour toute fonction phi de classe C infini à support compact dans R. Alors maintenant, nous avons la notion de dérivée des distributions. Nous avons la notion de convergence des suites de distributions, et nous allons établir une propriété qui est vraie pour les distributions, qui est très simple à vérifier pour les distributions, mais qui évidemment, dans le cadre des fonctions, est beaucoup moins agréable, qui n'est, qui n'est même pas vraie, en général. Qui consiste à dire que si j'ai un ouvert oméga de R N, et une suite de distributions Tn sur oméga qui converge au sens des distributions vers une distribution T dans D prime de oméga. Alors, pour tout multiindice de longueur grand N, pour tout monôme différentiel d rond alpha, eh bien, d rond alpha de Tn converge vers d rond alpha de T dans D prime de oméga. Démonstration. À nouveau, il s'agit d'une démonstration très simple. Pour toute fonction test de classe C infini à support compact sur oméga, eh bien, on a d rond alpha de Tn appliqué à phi, pour tout N qui est égal, par définition, de la dérivation des distributions, à moins 1, à la puissance longueur de alpha que multiplie la distribution Tn évaluée sur d rond alpha phi. Or puisque Tn converge vers T, Tn appliqué à d rond alpha phi converge vers T appliqué à d rond alpha phi. Ainsi, moins 1 puissance longueur de alpha, Tn appliqué à d rond alpha phi, converge vers moins 1 puissance longueur de alpha, T appliqué à d rond alpha phi. Mais cela, ce n'est rien d'autre que d rond alpha de T appliqué à phi. Ce qui conclut la démonstration. Alors, voyons maintenant ce que cette propriété de, de continuité séquentielle de la dérivation des distributions implique lorsqu'on l'applique au cas particulier des distributions qui sont définies par des fonctions, et même, des fonctions régulières sur un ouvert oméga. Donc, je prends fn, une suite de fonctions de classe C infini sur oméga, et je suppose que pour tout compact K de oméga, l'intégrale de valeur absolue de fn de x dx converge vers zéro. Alors, pour tout multiindice alpha à grand N composante, je peux regarder la distribution d rond alpha fn, ou plus exactement, la distribution qui est définie par la fonction continue, et donc, localement intégrable sur oméga d rond alpha fn. À savoir, T indice d rond alpha fn, que j'identifie, donc, à la fonction d rond alpha fn qui la définit. Eh bien, T indice d rond alpha fn, comme on l'a vu dans le cas des fonctions de classe C 1, plus généralement, de classe C infini sur oméga. T indice d rond alpha fn, ça n'est rien d'autre que d rond alpha de la distribution T de fn. Or, la condition que l'on a mise sur la suite fn, à savoir, que l'intégrale de fn sur tout compact K en valeur absolue, converge vers zéro. Cette condition entraîne que T indice fn converge vers zéro au sens des distributions sur oméga. Par continuité séquentielle des, de la dérivation au sens des distributions, on en déduit que d rond alpha de la distribution T indice fn converge vers zéro dans D prime de oméga. On a donc un énoncé qui est un petit peu surprenant, puisque d rond alpha de fn s'identifie donc à une distribution qui converge vers zéro au sens des distributions sur oméga lorsque n tend vers l'infini. Bien qu'en général, en tant que fonction, d rond alpha de fn ne converge même pas simplement sur oméga. Alors, un exemple classique de cette situation, consiste à prendre oméga égal à la droite réelle, et à considérer fn de x égal, par exemple, sinus de nx sur n. Évidemment, on a là une suite de fonctions de classe C infini sur R. Évidemment, fn de x est majorée en valeur absolue par 1 sur n. Donc, si je l'intègre sur tout compact de la droite réelle, j'obtiens une suite de nombres qui tend vers zéro. Mais si je considère la suite des dérivées d'ordre 1, f prime n de x, c'est égal à cosinus de nx. Et on sait bien que c'est une suite qui n'est simplement convergente sur aucun intervalle ouvert non-vide de R. Donc, cet exemple montre que dans la propriété de continuité séquentielle de la dérivation des distributions, eh bien, on a obtenu une notion de convergence, pour les dérivées. Convergence au sens des distributions qui est une notion de convergence beaucoup plus lâche, beaucoup plus faible que la convergence simple des fonctions. Voyons maintenant un deuxième exemple qui va nous ramener à nos préoccupations du cours numéro 1. Et dans ce deuxième exemple, nous allons montrer que le formalisme du, des distributions, du calcul différentiel des distributions, permet de vérifier que la formule fournie par la méthode des caractéristiques, formule qui, comme on l'a déjà dit, garde un sens lorsque la donnée initiale pour la, pour l'équation de transport n'est pas une fonction dérivable. Pourtant, cette formule, on a envie de dire qu'elle continue à définir une solution en un sens généralisé de l'équation de transport. Alors, voyons comment cela fonctionne, dans le cas des distributions. Donc, soit f in, une fonction continue sur R périodique, de période 1, pour simplifier les choses. Et on sait, d'après le théorème de Weierstrass, qu'il existe une suite fn in de polynômes trigonométriques sur R qui converge uniformément vers F in sur R. Maintenant, je pose f de t et de x égal f in de x moins tv, où v est un réel non nul. Et de la même manière, je pose fn de t et de x égal fn in de x moins tv. Alors comme fn in est une fonction de classe C 1, pour tout n supérieur ou égal à un, eh bien, on sait bien que d rond sur d rond t, plus v d rond sur d rond x de fn évaluée au point tx vaut zéro, pour tout tx appartenant à R 2. Eh bien, en passant à la limite au sens des distributions dans cette égalité, on va voir que la fonction f de t et de x qui, a priori, est simplement une fonction continue, pas forcément dérivable, va être une solution au sens des distributions de l'équation de transport. Donc, on démontre ce résultat. On sait que d rond t plus v d rond x de fn est égal à zéro. Mais ça, ça s'identifie à la distribution t indice d rond t plus v d rond x de fn. Chose qui est égale à d rond t plus v d rond x, de la distribution T indice fn. Maintenant, la distribution T indice fn, elle converge vers la distribution T indice f. Donc, par continuité séquentielle de la dérivation au sens des distributions, d rond t plus d rond x de T indice fn converge au sens des distributions vers d rond t plus v d rond x de T de f. Mais toutes ces distributions, lorsque n est supérieur ou égal à 1, valent zéro. Donc, leur limite est nulle. On a démontré ainsi que d rond t plus v d rond x de la distribution Tf égale à zéro. Cet argument permet donc de vérifier sans le moindre calcul que pour toute fonction f in continue sur R, et périodique de période 1, la fonction qui est définie par la même formule que celle qu'on trouve par la méthode des caractéristiques, à savoir, f de t et de x égal à f in de x moins tv. Bien que non dérivable, en général, pour une fonction continue, définit une solution de l'équation de transport au sens des distributions sur R croix R. À savoir que au sens des distributions, d rond t plus v d rond x de la distribution Tf, définie par f est égale à zéro dans D prime de R croix R.