Responsive image

La distribution normale

"Je veux connaître la loi normale"

Mise à jour le 7 octobre 2018

Avant de commencer

Si vous êtes novice en statistique ou si vous voulez parfaire vos connaissances, vous trouverez sur ce site un programme complet vous permettant de vous approprier les notions fondamentales en statistique en suivants les liens suivant classés dans l'ordre logique d'apprentissage :

La loi normale en question

La distribution normale c'est quoi ?

A la différence de la loi de Poisson ou de la la loi binomiale qui sont des distributions de probabilité discrète, la distribution normal est une distribution de probabilité continue.

On peut parler également de distribution Gaussienne. On notera que son graphique est aussi appelé courbe en cloche.

Pourquoi la loi normale est si intéressante ?

La loi normale est remarquable dans le fait qu'elle décrit une grande partie des phénomènes naturels. (science physique, sociale, medecine, agriculture, Business...)

Quel est sa formule

La variable utilisée est continue, c'est à dire qu'elle peut prendre un nombre indéfini de valeurs. La coube normale a la particularité d'être symétrique. Cette courbe a deux paramètres : μ et σ.

Son équation d'apparence compliquée est finalement très simple puisque ces 2 seuls parametres suffisent.

Responsive image

Loi normale centrée réduite

Pourquoi utiliser la loi normale centrée réduite ?

Parce qu'il y a un nombre illimité de loi normale, les mathématiciens ont simplifier les choses pour nous en calculant les aires sous une loi normale spéciale de μ=0 et de σ=1. Cette distribution est connue sous le nom de loi normale centrée réduite.

Elle est spéciale car ses valeurs en abscisse représente des unités d'écart type.

Interprêtation de l'écart type

Sur l'axes des abscisses on trouve des valeurs allant de -6σ à +6σ. Le centre de la courbe est positionné au dessus de 0.

Responsive image

Aires sous la courbe

Responsive image

On peut ici faire une première affirmation :

  • entre le 0 et ±1σ vous aurez 68.2% de vos observations.
  • entre le 0 et ±2σ vous aurez 95.4% de vos observations.
  • entre le 0 et ±1σ vous aurez 99.8.% de vos observations.

Comment faire pour savoir combien d'obervations sont comprises entre (par exmple) 0± 1.8σ ?
Combien d'observations vont tomber entre ces 2 limites ?

Le Z-score

Pourquoi utiliser le Z-score

La variable aléatoire pour une loi normale centrée réduite est représenté par le symbole z.

L'idée ici est de convertir les valeurs de l'unité de mesure original en une nouvelle unité  appelé le Z-score (ou cote Z). La Cote Z correspond au nombre d'écarts types séparant un résultat de la moyenne.

Prenons l'exemple ci-dessous d'une distribution quelquonque centré sur μ et d'écart type σ.

Responsive image

La formule est la suivante :

Responsive image

Autrement formulé le Z score défini de combien d'écart types je suis éloigné de la moyenne.

Avec ce calcul on déplace la distribution sur "0" en retirant la valeur de la moyenne μ et on obtient un écart type égale à "1" en divisant par l'écart type de la population.
Toutes les distributions normales de moyenne 0 et d'écart type de 1 sont appelées des distribution normale standard.

Le Z score deviendra votre coordonnée. Vous n'aurez plus à soustraire μcar la moyenne sera déjà de 0 et vous n'aurez pas à diviser par sigma σ car l'écart type sera déjà de 1.

Utilisation de la table de probabilité de la loi normale

Pour commencer suivez le lien suivant qui vous amènera vers la table de la loi normale centré réduite.

Table de la loi normale centré réduite

Dans ce document vous remarquer un schéma et un tableau.

Le shéma indique de quel coté de la moyenne se trouve le z et la zone de la courbe dans laquelle se trouve l'aire correspondant à la probabilité.

Responsive image

Vous pouvez identifier deux pages. Remarquez un deuxième shémas en haut de la seconde page. Soyez attenztif à ces shéma qui indique précisément les zone de probabilité considérés.

Responsive image

Le Tableau à 2 zones.  On retrouve notre variable z qui est notre donnée d'entrée.(en marron) et notre probabilité (en bleu).

Le z trouve sont unité avec le permier chiffre après la virgule dans la première colonne. Le second chiffre se trouve sur la première ligne.

La zone centrale indique les probabilité associé. Ainsi pour un z donné on trouvera une probabilité. 

Responsive image

La valeur Z commence à -3.4 et atteint zéro en bas du tableau. Ainsi cette première page concerne que les valeur négatives de z.

Lecture

On lit le tableau de la façon suivante :

Responsive image

Pour un Z de 2.51 seul 0.6% des valeurs sont en dessous de ce seuil.

Prenons cette fois-ci une valeur positive de z = 1.65

Responsive image

Pour un Z de 1.65 seul 95.05% des valeurs sont en dessous de ce seuil.

Responsive image

Utilisation de la loi normale (Exemples)

Rappel : Si l'on considère l'aire total sous la courbe elle est égale à 1. La probabilité est directement associé à l'aire et est également égale à 1.

Responsive image

A la différence des cas ci-dessus, il faut considérer l'aire sous la courbe entre 2 valeurs, par exemple a=20 et b=25 qui seront placé en abscisse.

Courbe n°1

Responsive image

Pour déterminer la probabilité, il faut déterminer l'aire sous la coube. Pour ce faire on utilise la loi normale centrée réduite dont on extrapolera les résultats pour chaque distribution normale étudiée.

Elle est disponible en suivant le lien : Table de la loi normale centré réduite .

Cette table fonctionne en prenant comme point de repère la moyenne μ de la distribution. La table nous donne l'aire sous la courbe entre la moyenne et un nombre donné d'écart type à partir de la moyenne. Ce nombre d'écarts type est désigné sous la lettre Z et se calcule comme suit : 

Responsive image

Z représente le nombre d'écart type entre une valeur x(ex: x=25) et la moyenne μ (ex μ =20) en connaissant la valeur de σ (σ=2).

  Responsive image

On sait grâce à ce calcul qu'il y a 2.5 σ entre 25 et 20. Si le signe de Z est positif cela signifie que l'on se situe à 2.5 σ à droite de la moyenne.

Si on lit la valeur sur la table correspondantà 2.5 sur la duxième page ont trouvera une probabilité de 0.9938. La valeur de 0.9938 correspond à la probabilité associèe à toutes les valeurs inférieurs à 25. Pour obtenir la probabilité associé à l'intervalle de [20-25]. Il faut retrancher les probabilités associées à toute la partie gauche de la courbe soit 0.5. Ainsi la probilité est égale à 0.9938-0.5 = 0.498.

Comme nous allons le voir dans les 2 exemples suivants, l'aire sous la courbe ne dépend pas toujours de un seul z, il peut dépendre de plusieurs z comme cela est représenté dans les intervals étudiés suivants constitué de deux valeurs z spécifique.

  • 26 et 28 dans le premier cas
  • 24 et 26 dans le second

Courbe n°2

Responsive image

  • μ=20
  • σ=2
  • Limite inférieure = 26
  • Limite supérieure = 28
  • Interval = 2

Courbe n°3

Responsive image

  • μ=20
  • σ=2
  • Limite inférieure = 24
  • Limite supérieure =26
  • Interval = 2

Comme on le remarque les courbes n°2 et n°3 ont les mêmes paramètres : μ et σ
L'interval est pour les deux courbes égales à 2 unités. Cependant l'aire sous la courbe est visiblement différente.

Afin de faciliter le calcul, vous trouverez dans le tableau de synthèse ci-dessous. Il intègre les calculs de correspondance pour 4 situations. Les valeurs z sont caculés de la même manière pour l'exemple 1.

Responsive image

Pour obtenir la probabilité de l'aire entre les z spécifiques, on procède par soustraction des probabilités associés aux 2 z.

En conséquence la probabilité de la situation de la courbe 2 est égale à 1-0.999 = 0.001.

En conséquence la probabilité de la situation de la coube 3 est égale à 0.999-0.977 = 0.021. 

Le processus est le suivant :
  1. Nous identifions les valeurs z de chaque limites.
  2. Depuis la table nous trouvons les aires pour chaque valeur z.
  3. En fonction de chaque situation nous ajoutons ou soustrayons les probabilités.
Etes-vous curieux ? Alors je vous conseille...

Livre très pratique pour faire des statistiques avec excel rapidement. Cette page a été inspirée de méthodes décrites dans ce livre.
Dans le top 10 des livres que je recommande !


Pour aller plus loin consulter également le site qui constitue une importante source de connaissance : http://onlinestatbook.com/

Partagez votre expérience avec moi pour améliorer le site : commentprogresser@gmail.com
Card image

Restons en contact !






Ce site doit aussi progresser pour combler au mieux vos attentes, alors je suis à votre écoute si vous souhaitez me communiquer vos commentaires à l'adresse : commentprogresser@gmail.com.