IUT de ROUEN - Marc HAUCHEMAILLE
Version AcrobatReader(pdf)Une densité de probabilité est une fonction définie et intégrable sur R telle que :
L'ensemble des valeurs possibles d'une variable continue est un intervalle ou une réunion d'intervalles.
est appelée fonction de répartition de la variable aléatoire X. Dans le cas où on réalise un grand nombre de mesures de la même variable dans les conditions de répétabilité, la fonction de réartition est la proportion de valeurs qui tomberont à gauche de la valeur x.
La dérivée de la fonction de répartition est la densité de probabilité.
Graphiquement, il s'agit de l'aire délimitée par la courbe, l'axe des abscisses et à gauche de la droite d'abscisse x parallèlle à l'axe des ordonnées.
Dans le cas d'une variable aléatoire X admettant la densité de probabilité de Cauchy, la probabilité de tomber à gauche de 1 est :
Sa dérivée est positive puisque c'est la densité
de probabilité. Elle est donc continue et croissante
sur
. Elle tend vers 0 au voisinage de
et elle tend vers 1 au voisinage de
.
Elle est égale à
.
C'est l'aire située sous la courbe, à droite de l'abscisse x. Elle est fournie par les calculateurs HP48G pour certaines densités fréquemment utilisées.
La probabilité pour que X tombe dans
l'intervalle
est donnée par :
X admettant la densité de probabilité f, on appelle espérance mathématique de X l'intégrale :
ATTENTION : Si l'intégrale diverge alors l'espérance n'est plus définie. C'est le cas des variables aléatoires admettant la densité de Cauchy.
On peut dire que c'est en quelque sorte le centre de
gravité de l'ensemble des valeurs possibles de
,
chacune étant pondérée par la densité
de probabilité.
X admettant la densité de probabilité f, et en appelant m l'espérance, on appelle variance de X l'intégrale :
On peut dire que c'est le moment d'inertie de l'ensemble des valeurs possibles, calculé par rapport au centre de gravité. Plus la courbe de densité est étalée, plus grande est la variance.
Ecart type ou déviation standard. C'est la racine carrée positive de la variance.
On n'abordera pas ici la densité d'une somme, d'un produit de deux variables aléatoires.
X et Y étant deux variables aléatoires, a et b deux constantes, on a :
étant réel pris dans
, on
appelle intervalle au niveau de confiance
tout
intervalle de probabilité
.
Si la courbe de densité admet un axe de symétrie à l'abscisse m, alors l'espérance vaut m.
On a en effet :
quel que soit t.
Donc :
L'interprétation géométrique est évidente :
les aires situées à gauche et à droite des abscisses
et
sont les mêmes en raison de la symétrie
par rapport à la droite verticale d'abscisse m.
Cherchons maintenant le niveau de confiance (c'est sa
probabilité) de l'intervalle
.
Pour une variable de densité paire,
, donc :
L'axe de symétrie de la courbe et
un calcul d'intégrationélémentaire montrent
que l'espérance m et l'écart type
valent respectivement :
Elle est disponible dans Microsoft Excel par la fonction ALEA() qui renvoit une valeur aléatoire uniforme de paramètres 0,5 et 0,5.
Soit T une variable de Student à n degrés de liberté. La densité étant paire, l'espérance est nulle.
On démontre que la variance, pour
, est :
La courbe a ététracée pour des valeurs positives ou
nulles de la variable puisque la densité est nulle à gauche
de 0. Les paramètres sont
.
On notera
l'abscisse à
droite de laquelle l'aire située sous la courbe
a une valeur
. En d'autres termes, si la
variable aléatoire X si la loi de F à
m et n degrés de liberté, on
aura :
C'est l'inverse de la fonction de répartition
droite d'une variable de Fisher.
On y accède avec EXCEL par la fonction INVERSE.LOI.F et avec las calculatices HP48G, HP48GX par la fonction UTPF.
Pour
, on obtient la densité suivante :
On démontre que, si X est une variable
de
à n degrés de liberté,
Cela montre que la courbe de densité est d'autant plus étalée que le nombre de degrés de liberté est plus élevé.
On y accède avec EXCEL par la fonction KHIDEUX.INVERSE et avec las calculatices HP48G, HP48GX par la fonction UTPC. Attention à la documentation Microsoft des fonctions statistique, elle est souvent incompréhensible et parfois entachée d'erreur mathématique comme la confusion entre densité et fonction de répartition.
Un tel intervalle est qualifié d'intervalle de confiance au
risque
. On peut rapprocher cette notion de l'incertitude
relative qui est le rapport de la demi longueur de l'intervalle
de confiance à la valeur centrale.
Le mot confiance n'a pas la signification qu'on lui donne
habituellement. Quand on dit que
est un intervalle
de confiance á 10%, cela veut seulement dire que, sur une
série de n mesures, 10% d'entre elles tomberont
dans cet intervalle. Cela est d'autant plus vrai que n
est plus grand.
ont pour espérances respectives
Une variable aléatoire X suit la loi
.
Déterminer l'intervalle au niveau de confiance
centré sur l'espérance. On prendra
Réponse : La densité de la loi
possède une courbe
symétrique par rapport á la droite verticale d'équation
. On a donc un intervalle de la forme
tel
que l'aire situé entre les bornes soit égale á
et les deux aires situées de part et d'autre soient égales
à
.
Si on appelle F la fonction de répartition gauche de notre variable, on a :
On peut utiliser un tableur (StarCalc ou Excel) pour résoudre cette équation.
La fonction LOI.NORMALE.INVERSE(<esperance>,<ecartype>,<aire>) renvoit l'abscisse à gauche de laquelle la surface située sous la courbe est égale à aire : c'est la réciproque de la fonction de répartition gauche.
On obtient, pour
, l'intervalle
On obtient, pour
, l'intervalle
Les deux bornes sont symétriques par rapport á l'espérance.
On veut construire une table de la fonction de répartition de la loi
normale
pour des valeurs de x comprises entre
-3 et +3.