« Fonction caractéristique (probabilités) » : différence entre les versions
m →Pour une variable réelle : relecture |
|||
(26 versions intermédiaires par 19 utilisateurs non affichées) | |||
Ligne 1 : | Ligne 1 : | ||
{{Homon|Fonction caractéristique}} |
|||
En [[théorie des probabilités]] et en [[statistique]], la '''fonction caractéristique''' d'une [[variable aléatoire]] réelle {{formule|''X''}} détermine de façon unique sa [[loi de probabilité]]. Si cette variable aléatoire a une [[Densité de probabilité|densité]], alors la fonction caractéristique est la [[transformée de Fourier]] de la densité. Les valeurs en zéro des dérivées successives de la fonction caractéristique permettent de calculer les [[moment (mathématiques)|moments]] de la variable aléatoire. |
En [[théorie des probabilités]] et en [[statistique]], la '''fonction caractéristique''' d'une [[variable aléatoire]] réelle {{formule|''X''}} détermine de façon unique sa [[loi de probabilité]]. Si cette variable aléatoire a une [[Densité de probabilité|densité]], alors la fonction caractéristique est la [[transformée de Fourier]] de la densité. Les valeurs en zéro des dérivées successives de la fonction caractéristique permettent de calculer les [[moment (mathématiques)|moments]] de la variable aléatoire. |
||
est parfois appelée première fonction caractéristique alors que la seconde fonction caractéristique est la [[ ]]. |
|||
Le [[théorème de Bochner]] et le [[théorème de Khintchine]] donnent des conditions nécessaires et suffisantes pour qu’une fonction soit la fonction caractéristique d’une variable aléatoire. |
|||
⚫ | |||
== Définitions == |
|||
=== Pour une variable réelle === |
|||
La fonction caractéristique d'une variable aléatoire réelle {{formule|''X''}} est la fonction à valeurs [[Nombre complexe|complexes]] définie sur <math>\R</math> par |
La fonction caractéristique d'une variable aléatoire réelle {{formule|''X''}} est la fonction à valeurs [[Nombre complexe|complexes]] définie sur <math>\R</math> par |
||
: |
:<math>\begin{align} |
||
\ |
\(t)&=\mathbb E\left[\operatorname e^{\mathrm itX}\right]\\ |
||
&=\mathbb E\left[\cos(tX)\right]+\mathrm i\ \mathbb E\left[\sin(tX)\right]. |
&=\mathbb E\left[\cos(tX)\right]+\mathrm i\ \mathbb E\left[\sin(tX)\right]. |
||
\end{align} |
\end{align} |
||
</math> |
</math> |
||
⚫ | |||
: <math> |
|||
\phi_X(t)=\int_{\R}f_X (x)\operatorname e^{\mathrm itx} \,\mathrm dx. |
|||
</math> |
|||
⚫ | Ainsi, dans le cas d'une variable aléatoire à densité, la fonction caractéristique est la [[ |
||
⚫ | |||
⚫ | |||
:<math>\ |
:<math>\()=\\\operatorname e^{\mathrm ,\</math> |
||
⚫ | Ainsi, dans le cas d'une variable aléatoire à densité, la fonction caractéristique est la [[ de Fourier|transformée de Fourier]] inverse (à un facteur {{formule|2π}} près dans l'exponentielle suivant la convention) de la densité. Probablement pour cette raison, il arrive que l'on choisisse une convention différente, à savoir <math>\(t)=\mathbb E[\operatorname e^{2\mathrm i\pi tX}]</math>. On notera que bien que l'usage dans la communauté des probabilistes soit de parler de transformée de Fourier, il s'agit en toute rigueur de la [[Transformation de Fourier#Transformation de Fourier inverse|transformation de Fourier inverse]]. |
||
*Si cette variable est à valeurs dans l'ensemble des [[Entier naturel|entiers naturels]] alors |
|||
::<math>\varphi_X(t)=\sum_{k=0}^\infty \mathbb{P}(X=k){\rm e}^{\mathrm itk} = G_X({\rm e}^{\mathrm it})</math> |
|||
:où {{mvar|G<sub>X</sub>}} désigne sa [[fonction génératrice des probabilités]] généralisée à un paramètre complexe. |
|||
=== Pour une variable d'un espace euclidien === |
|||
⚫ | |||
⚫ | |||
où <math>\langle u,X\rangle</math> est le [[produit scalaire]] de {{formule|''u''}} avec {{formule|''X''}}. |
où <math>\langle u,X\rangle</math> est le [[produit scalaire]] de {{formule|''u''}} avec {{formule|''X''}}. |
||
=== Pour une fonction de répartition === |
|||
Lorsque la variable aléatoire {{formule|''X''}} est discrète, on définit sa [[fonction génératrice]] par |
|||
La fonction caractéristique d'une [[fonction de répartition]] {{formule|''F''}} est la fonction à valeurs [[Nombre complexe|complexes]] définie sur <math>\R</math> par |
|||
:<math>G(z)=\mathbb E\left[z^X\right]</math> |
|||
:<math>\varphi_F(t) = \int_{-\infty}^{+\infty} \textrm{e}^{\mathrm itz}\,\mathrm{d}F(z)</math> |
|||
avec {{formule|''z''}} complexe (quand cela a un sens). Avec les notations précédentes, on a donc |
|||
où l'intégrale est une [[intégrale de Stieltjes]]. |
|||
⚫ | |||
cette fonction {{formule|''G''}} est donc en fait un prolongement de {{formule|φ<sub>''X''</sub>}}. |
|||
== Interprétation == |
|||
La fonction caractéristique est une manière de décrire une [[variable aléatoire]]. La fonction caractéristique détermine complètement le comportement et les propriétés de la distribution de probabilité de la variable aléatoire {{formule||§=''X''}}. |
|||
=== Relation avec la fonction de distribution cumulative === |
|||
La fonction caractéristique est similaire à la [[fonction de distribution cumulative]] :<math>F_X(x) = \operatorname{E} \left [\mathbf{1}_{\{X\leq x\}} \right]</math> (où '''1'''<sub>{''X ≤ x''}</sub> est la [[Fonction caractéristique (théorie des ensembles)|fonction indicatrice]] — elle est égale à 1 lorsque {{nowrap|''X'' ≤ x}}'', et'' zéro sinon), qui détermine également complètement le comportement et les propriétés de la distribution de probabilité de la variable aléatoire {{formule|''X''}}. |
|||
Les deux approches sont équivalentes dans le sens où connaissant l’une des fonctions, il est toujours possible de trouver l’autre, mais elles fournissent des informations différentes pour comprendre les caractéristiques de la variable aléatoire. De plus, dans des cas particuliers, il peut y avoir des différences quant à savoir si ces fonctions peuvent être représentées comme des expressions impliquant des fonctions standards simples. |
|||
== Propriétés == |
== Propriétés == |
||
* |
* détermine de façon unique la [[Loi de probabilité|loi]] d'une variable aléatoire au sens où «{{formule|φ<sub>''X''</sub> {{=}} φ<sub>''Y''</sub>}}» (égalité de fonctions) équivaut à « {{formule|''X''}} et {{formule|''Y''}} ont la même loi » |
||
* Si {{formule|''X''}} et {{formule|''Y''}} sont deux variables aléatoires [[Indépendance (probabilités)|indépendantes]], {{formule|φ<sub>''X''+''Y''</sub> {{=}} φ<sub>''X''</sub>φ<sub>''Y''</sub>}}. Plus généralement, si {{formule|''X''<sub>1</sub>,...,''X''<sub>''n''</sub>}} sont des variables aléatoires indépendantes |
* Si {{formule|''X''}} et {{formule|''Y''}} sont deux variables aléatoires [[Indépendance (probabilités)|indépendantes]], {{formule|φ<sub>''X''+''Y''</sub> {{=}} φ<sub>''X''</sub>φ<sub>''Y''</sub>}}. Plus généralement, si {{formule|''X''<sub>1</sub>,...,''X''<sub>''n''</sub>}} sont des variables aléatoires indépendantes, alors {{formule|φ<sub>''X''<sub>1</sub>+...+''X''<sub>''n''</sub></sub> {{=}} φ<sub>''X''<sub>1</sub></sub>...φ<sub>''X''<sub>''n''</sub></sub>}}. |
||
⚫ | |||
*:En appliquant alors la transformée de Fourier à {{formule|φ<sub>''X''+''Y''</sub>}}, cela permet de retrouver la loi de {{formule|''X''+''Y''}}. |
|||
*:<math>\varphi_X(t)=\sum_{k=0}^{\infty}\frac{\mathrm i^k \mathbb{E}[X^k]}{k!}t^k~~~\forall t\in \left] -R,R \right[</math>. |
|||
⚫ | |||
*:<math>\phi_X(t)=\sum_{k=0}^{\infty}\frac{\mathrm i^km_k(X)}{k!}t^k</math> où {{math|''m{{ind|k}}''(''X'')}} est le moment d'ordre {{formule|''k''}} de {{formule|''X''}}. |
|||
{{Démonstration | |
{{Démonstration | |
||
<math>\ |
<math>\(t)=\mathbb E\left[\operatorname e^{\mathrm itX}\right]=\mathbb E\left[\sum_{k=0}^\infty\frac{(\mathrm itX)^k}{k!}\right]=\sum_{k=0}^\infty\frac{\mathrm i^k}{k!}t^k\mathbb E\left[X^k\right]</math>. |
||
Pour justifier l'inversion entre la somme et l'espérance il suffit de montrer que <math>\sum_{k=0}^\infty\frac{\mathbb{E}[|X|^k]}{k!}t^k</math> est finie et d'appliquer le théorème de Fubini. On remarque que pour tout <math>k\geq 0</math> : |
|||
L'inversion de l'ordre de sommation devant être justifiée pour une variable aléatoire et une certaine valeur de {{mvar|t}} par l'existence des moments et l'étude du [[rayon de convergence]] de la [[série entière]]. |
|||
<center><math>\mathbb{E}[|X|^{2k+1}] = \mathbb{E}[|X|^{2k+1}\mathbf{1}_{|X|\leq 1}]+\mathbb{E}[|X|^{2k+1}\mathbf{1}_{|X| > 1}] \leq 1+\mathbb{E}[X^{2k+2}]</math>.</center> |
|||
}} |
|||
⚫ | |||
<center><math>\sum_{k=0}^\infty \frac{\mathbb{E}[|X|^k]}{k!}t^k \leq \mathrm{e}^t + 2\sum_{k=0}^\infty \frac{\mathbb{E}[X^{2k}]}{(2k)!}t^{2k}\leq \mathrm{e}^t + 2\sum_{k=0}^\infty \frac{|\mathbb{E}[X^{k}]|}{k!}t^{k}<+\infty</math>.</center> |
|||
La dernière somme est bien convergente car on sait qu'une série entière est absolument convergente dans l'intérieur de son disque de convergence. On procède ensuite de même pour <math>t \in \left]-R,0\right]</math>.}} |
|||
* Cette relation sert parfois |
* Cette relation sert parfois calculer l'[[Espérance mathématique|espérance]] (moment d'ordre 1) et la [[Variance (statistiques et probabilités)|variance]] d'une variable aléatoire. Plus explicitement : |
||
*::<math>\ |
*::<math>\^{(k)}(0)=\mathrm i^k X</math> |
||
*:donc : |
*:donc : |
||
*::<math>\mathbb{E}[X]=-\mathrm i\ |
*::<math>\mathbb{E}[X]=-\mathrm i\^{\prime}_X(0)</math> |
||
*::<math>\mathbb{E}\left[X^2\right]=-\,\ |
*::<math>\mathbb{E}\left[X^2\right]=-\,\^{\prime\prime}_X(0)</math> |
||
*::<math>\textrm{Var}(X)=-\,\ |
*::<math>\textrm{Var}(X)=-\,\^{\prime\prime}_X(0)+\left(\^{\prime }_X(0)\right)^2</math>. |
||
* La relation suivante sert, par exemple, à calculer la fonction caractéristique d'une [[variable centrée réduite]], à partir de la fonction caractéristique de la variable de départ : |
* La relation suivante sert, par exemple, à calculer la fonction caractéristique d'une [[variable centrée réduite]], à partir de la fonction caractéristique de la variable de départ : |
||
*:<math>\ |
*:<math>\{aX+b}(t)=\(at)\,\operatorname e^{\mathrm itb}</math>. |
||
*Le [[théorème de convergence de Lévy]] dit que la [[convergence en loi]] est équivalente à la [[convergence simple]] de la fonction caractéristique en tout point. |
|||
== Seconde fonction caractéristique == |
|||
⚫ | |||
La seconde fonction caractéristique d'une variable aléatoire réelle {{formule|''X''}} est la fonction à valeurs [[Nombre complexe|complexes]] définie par |
|||
:<math>\psi_X(t) = \text{Log } \varphi_X(t) = \text{Log } \mathbb{E}[e^{\mathrm itX}]</math> |
|||
où Log désigne la [[Branche principale (mathématiques)|branche principale du logarithme]] qui est définie et holomorphe sur le plan complexe privé de la demi-droite des réels négatifs ou nuls et qui vaut 0 en 1. |
|||
Puisque la fonction caractéristique est toujours continue et vaut 1 en 0 la seconde fonction caractéristique est toujours bien définie sur un voisinage de 0. |
|||
=== Lien avec la fonction génératrice des cumulants === |
|||
* La seconde fonction caractéristique est parfois appelée la [[fonction génératrice des cumulants]]. Le mathématicien Eugène Lukacz, dans son livre ''Characteristic functions''<ref>{{Ouvrage|langue=anglais|auteur1=Eugene Lukacz|titre=Characteristic functions|passage=27|lieu=London|éditeur=Griffin|date=1970}}.</ref>, observe l'utilisation malheureuse du terme « fonction génératrice des cumulants » car la seconde fonction génératrice existe toujours au voisinage de 0 tandis que les [[Cumulant (statistiques)|cumulants]] et les [[Moment (probabilités)|moments]] de {{formule|''X''}} pourraient très bien ne pas exister. Il ajoute également que le terme « seconde fonction caractéristique » vient de la littérature mathématique française. |
|||
* La fonction génératrice des cumulants peut également désigner le [[logarithme népérien]] de la [[fonction génératrice des moments]]. |
|||
== Références == |
|||
<references /> |
|||
== Article connexe == |
== Article connexe == |
||
[[Fonction génératrice des moments]] |
[[Fonction génératrice des moments]] |
||
== Liens externes == |
|||
{{Mathworld |nom_url=CharacteristicFunction |titre=Characteristic Function}} |
|||
{{Portail|probabilités}} |
{{Portail|probabilités}} |
||
[[Catégorie: |
[[Catégorie:]] |
||
[[Catégorie:Fonction associée|Caracteristique probabilites]] |
[[Catégorie:Fonction associée|Caracteristique probabilites]] |
Dernière version du 10 avril 2024 à 11:14
En mathématiques et plus particulièrement en théorie des probabilités et en statistique, la fonction caractéristique d'une variable aléatoire réelle X est une quantité qui détermine de façon unique sa loi de probabilité. Si cette variable aléatoire a une densité, alors la fonction caractéristique est la transformée de Fourier inverse de la densité. Les valeurs en zéro des dérivées successives de la fonction caractéristique permettent de calculer les moments de la variable aléatoire.
La fonction caractéristique est parfois appelée première fonction caractéristique alors que la seconde fonction caractéristique (ou encore deuxième fonction caractéristique) en est la transformée logarithmique.
Le théorème de Bochner et le théorème de Khintchine donnent des conditions nécessaires et suffisantes pour qu’une fonction soit la fonction caractéristique d’une variable aléatoire.
Définitions
[modifier | modifier le code]Pour une variable réelle
[modifier | modifier le code]La fonction caractéristique d'une variable aléatoire réelle X est la fonction à valeurs complexes définie sur par
- Si cette variable aléatoire possède une densité, disons fX, alors
- Ainsi, dans le cas d'une variable aléatoire à densité, la fonction caractéristique est la transformée de Fourier (probabiliste) inverse (à un facteur 2π près dans l'exponentielle suivant la convention) de la densité. Probablement pour cette raison, il arrive que l'on choisisse une convention différente[réf. nécessaire], à savoir . On notera que bien que l'usage dans la communauté des probabilistes soit de parler de transformée de Fourier, il s'agit en toute rigueur de la transformation de Fourier inverse.
- Si cette variable est à valeurs dans l'ensemble des entiers naturels alors
- où GX désigne sa fonction génératrice des probabilités généralisée à un paramètre complexe.
Pour une variable d'un espace euclidien
[modifier | modifier le code]Plus généralement, la fonction caractéristique d'une variable aléatoire X à valeurs dans est la fonction à valeurs complexes définie sur par
où est le produit scalaire de u avec X.
Pour une fonction de répartition
[modifier | modifier le code]La fonction caractéristique d'une fonction de répartition F est la fonction à valeurs complexes définie sur par
où l'intégrale est une intégrale de Stieltjes.
Interprétation
[modifier | modifier le code]La fonction caractéristique est une manière de décrire une variable aléatoire. La fonction caractéristique détermine complètement le comportement et les propriétés de la distribution de probabilité de la variable aléatoire X.
Relation avec la fonction de distribution cumulative
[modifier | modifier le code]La fonction caractéristique est similaire à la fonction de distribution cumulative : (où 1{X ≤ x} est la fonction indicatrice — elle est égale à 1 lorsque X ≤ x, et zéro sinon), qui détermine également complètement le comportement et les propriétés de la distribution de probabilité de la variable aléatoire X.
Les deux approches sont équivalentes dans le sens où connaissant l’une des fonctions, il est toujours possible de trouver l’autre, mais elles fournissent des informations différentes pour comprendre les caractéristiques de la variable aléatoire. De plus, dans des cas particuliers, il peut y avoir des différences quant à savoir si ces fonctions peuvent être représentées comme des expressions impliquant des fonctions standards simples.
Propriétés
[modifier | modifier le code]- La fonction caractéristique détermine de façon unique la loi d'une variable aléatoire au sens où « φX = φY » (égalité de fonctions) équivaut à « X et Y ont la même loi ».
- Si X et Y sont deux variables aléatoires indépendantes, φX+Y = φXφY. Plus généralement, si X1,...,Xn sont des variables aléatoires mutuellement indépendantes, alors φX1+...+Xn = φX1...φXn. En appliquant alors la transform��e de Fourier à φX+Y, cela permet de retrouver la loi de X+Y.
- Il y a une relation entre les moments et la fonction caractéristique d'une variable aléatoire. Lorsque les moments de tout ordre existent et que leur série génératrice exponentielle a un rayon de convergence non nul R alors :
- .
- Cette relation sert parfois à calculer l'espérance (moment d'ordre 1) et la variance d'une variable aléatoire. Plus explicitement, en évaluant en 0 :
- donc :
- .
- La relation suivante sert, par exemple, à calculer la fonction caractéristique d'une variable centrée réduite, à partir de la fonction caractéristique de la variable de départ :
- .
- Le théorème de convergence de Lévy dit que la convergence en loi est équivalente à la convergence simple de la fonction caractéristique en tout point.
Seconde fonction caractéristique
[modifier | modifier le code]Définition
[modifier | modifier le code]La seconde fonction caractéristique d'une variable aléatoire réelle X est la fonction à valeurs complexes définie par
où Log désigne la branche principale du logarithme qui est définie et holomorphe sur le plan complexe privé de la demi-droite des réels négatifs ou nuls et qui vaut 0 en 1.
Puisque la fonction caractéristique est toujours continue et vaut 1 en 0 la seconde fonction caractéristique est toujours bien définie sur un voisinage de 0.
Lien avec la fonction génératrice des cumulants
[modifier | modifier le code]- La seconde fonction caractéristique est parfois appelée la fonction génératrice des cumulants. Le mathématicien Eugène Lukacz, dans son livre Characteristic functions[1], observe l'utilisation malheureuse du terme « fonction génératrice des cumulants » car la seconde fonction génératrice existe toujours au voisinage de 0 tandis que les cumulants et les moments de X pourraient très bien ne pas exister. Il ajoute également que le terme « seconde fonction caractéristique » vient de la littérature mathématique française.
- La fonction génératrice des cumulants peut également désigner le logarithme népérien de la fonction génératrice des moments.
Références
[modifier | modifier le code]- (en) Eugene Lukacz, Characteristic functions, London, Griffin, , p. 27.
Article connexe
[modifier | modifier le code]Fonction génératrice des moments
Liens externes
[modifier | modifier le code](en) Eric W. Weisstein, « Characteristic Function », sur MathWorld