Responsive image

Les statistiques de base

1 - INTRODUCTION : La découverte des variables

Qu'est-ce qu'une variable ?

On appelle variable, une caractéristique commune à l'ensemble des individus d'une étude. La valeur de cette caractéristique varie entre les individus c'est pour cela que nous parlons de variable.

 

Responsive image

Exemple : Si les individus de votre étude sont des "êtres humains", la taille est une caractéristique commune à tous les êtres humains. Chaque humain a une taille et cette taille est différente d'un individu à l'autre. Il s'agit donc d'une variable.

 

 

Certaines variables s'expriment par un nombre. C'est le cas pour la taille ( exemple l'individu mesure 1.78m). D'autres variables s'expriment par des qualités, comme c'est le cas pour la couleur des yeux. ( Exemple ses yeux sont vert ). On peut donc avoir des variables de natures différentes. C'est ce que nous allons voir ci-dessous.

 

2 - Les variables quatitatives

Responsive image

Le premier type de variable est la variable qualitative.

Ses particularités

  • Ne s'exprime pas par une valeur numérique
  • S'exprime par une qualité
  • Il est possible de les répartir en classe ou catégories

Exemple : Situation familiale : Marié, célibataire, veuf, divorcé...

 

On ne peut pas les exploiter mathématiquement. Il est par exemple impossible d'additionner la valeur "marié" et la valeur "divorcé" que peut prendre la variable situation familiale.

Si on ne peut pas faire de calcul, on peut cependant les dénombrer, c'est à dire compter combien de personnes sont dans chaque classe. Par exemple compter combien de personnes sont "Mariées".

Les variables qualitatives nominales

  • Elles ne peuvent pas être hiérarchisées. Aucune valeur n'est supérieure à une autre.

Responsive image

Les variables qualitatives ordinales

  • Elle peuvent être classées les unes par rapport aux autres. Il existe un gradiant qui permet de les classer dans un ordre logique selon une échelle de valeur.

Les variables qualitatives binaires

  • Elles ne peuvent pas être hiérarchisées
  • Elles ne possèdent que 2 modalités ( 2 classes) possibles.

Responsive image

 

3 - Les variables quantitatives

Responsive image

Particularités

  • S'exprime par un nombre
  • Peuvent être exploité mathématiquement

Variable quantitatives continue

  • Elles peuvent prendre n'importe quelle valeur numérique entière ou décimale.

La seul limite à ce continuum est la précision de la mesure. ( précision de la balance au dixème (0.1) dans l'exemple ci-dessous pour les poids de 10 individus )

Responsive image

 

Variable quantitatives discrète

  • Elles peuvent prendre que des valeurs numériques entières. Ces variables.
  • Elles se distinguent par le fait que le passage d'une valeur à une autre est discontinue.

Par exemple, il est impossible d'avoir 3.4 frères

Responsive image

 

4 - Les variables temporelles

 

Responsive image

Particularités

  • S'exprime par un nombre
  • Elles peuvent être de deux types :
    • Type date : 31 octobre 1983
    • Type horaire : 23 heure 55
  • Elles peuvent être exploitées mathématiquement
    • Il est possible d'en faire la soustraction uniquement
Les dates

Responsive image

 

Les heures

Responsive image

 

 

 

5 - Synthèse

Tableau avec une illustration de chaque type de variable

Vous trouverez un tableau ci-dessous dans lequel est présent chaque type de variable, à vous de les retrouver !

 

Responsive image

1 - Le tableau de recueil de données

A quoi sert t-il ?

Ce type de tavbleau permet de recuillir l'ensemble des données brutes obtenues dans le cadre d'une étude.

Comment est il structuré ?

Le tableau de receuil de donnée est structuré de la façon suivante

  • LIGNES : On trouve les unités statistiques qui sont les plus petis élément décris par une enquète.
  • COLONNE : On trouve les variables.
  • AU CENTRE : On trouve les valeurs différentes que prennnent les variables pour chacune des unités statistiques.

 

Responsive image

Inconvénient

Ce tableau n'est pas exploitable en tant que tel, il doit être résumé, c'est ce que nous allons voir par la suite.

 

2 - Le tableau résumé

A quoi sert t-il ?

Ce type de tableau permet de présenter les données sous une forme concise afin de pouvoir interprêter son contenue.

Le tableau résumé

Les variables qualitatives peuvent être résumées en dénombrant les effectifs de chaque classe. Par exemple on peut dénombrere le nombre de femmes et d'homme du tableau.

Responsive image

Le tableau résumé d'une variable qualitative binaire

Interprêter le poids de chaque classe avec un pourcentage.

Afin de mieux se représenter le poids réel de chaque classe il est judicieux de donner une proportion pour chaque effectif. Dans l'exemple nous prendrons une proportion exprimée en pourcentage. ( Nous aurions pu prendre une proportion exprimé en pour mille)

Responsive image

Voici le résultat obtenu.

Responsive image

Note : pour que l'interprêtation des résultats se fasse sans ambguité, il est important de faire apparaître les totaux des poucentages.

Application

Ce type de tableau peux être utilisé pour :

  • Les variables qualitatives nominales,
  • Les variables qualitatives binaires
  • Les variables qualitatives ordinales,
  • Les variables quantitatives discrètes,

 

 

ASTUCE : Comptabiliser les effectifs avec Excel

Votre besoin

Vous souhaitez compter le nombre de fois qu'une valeur apparait dans un tableau.

Télécharger le fichier exemple

Lien : tableauresume.xlsx

Préparer la liste

1) Créer un second tableau

En dessous du tableau de donnée, créer un second tableau avec une colonne appelée effectif.

Responsive image

 
2) Utiliser la formule "NB.SI()"

Dans la première partie de la cellule, renseigner la plage dans laquelle vous souhaitez faire la comptabilisation, dans la seconde renseigner la valeur recherchée. N'oubliez pas de mettre des guillemets. Vous devez avoir une saisie telle que : =NB.SI(H3:H12;"Homme")

Responsive image

 

Faîtes de même avec la seconde cellule.

Responsive image

Vous obtenez le résultat suivant :

Responsive image

 

3 - Le tableau résumé pour les variables quantitatives continues

A quoi sert t-il ?

il est aussi possible de créer un tableau avec dénomnrement d'effectif pour des variables quantitatives continues.

Il faut pour cela au préalable, définir des classes. Il s'agit alors de discrétiser les valeurs.

Discrétiser les valeurs

Il faut définir des bornes entre-lesquelles se trouvent les valeurs observées

Par exemple de regrouper les valeurs dans des classes de 5 en 5 kg.

Responsive image

ASTUCE : Comptabiliser les effectifs d'une classe avec Excel

Votre besoin

Vous souhaitez compter le nombre de fois qu'une valeur comprise dans une fourchette de valeurs apparait dans un tableau.

Télécharger le fichier exemple

Lien : tableauavecdiscretisation.xlsx

Préparer un tableau résumé

 

Responsive image

 

 

1) Sélectionner la première cellule

Responsive image

 

2) Appuyer sur le bouton formule

Responsive image

3) Sélectionner la formule "NB.SI.ENS()"

Responsive image

4) Saisissez la plage de cellule contenant vos valeurs brutes

Responsive image

5) Saisisser votre critère n°1

Responsive image

6) Saisissez de nouveau la plage de cellule puis saississer votre critère n°2

Responsive image

8) Appuyer sur entrer

Vous devez obtenir un résultat proche de celui-ci :

Responsive image

 

Vous pouvez alors reproduire la même logique pour les 2 lignes suivantes et ajouter les pourcentages relatifs dans une nouvelle colonne :

Responsive image

 

 

4 - Le tableau avec effectifs cumulés

Fréquence relative / Fréquence cumulée

Fréquence relative : Correspond à la proportion relative à chacune des classes

Fréquence cumulée : Les fréquences cumulées permettent de représenter l'accroissement relatif des effectifs au fur et à mesure de l'augmentation des valeurs de la variable.

 

Responsive image

On notera que les fréquences peuvent être exprimées en effectif (n) ou en proportion ( en % dans l'exemple ci-dessus)

 

ASTUCE : Calculer les effectifs cumulés

Votre besoin

Vous souhaitez cumuler des effectifs avec Excel

Télécharger le fichier exemple

Lien : effectifcumule.xlsx

Préparer un tableau résumé

 
1) Sélectionner la première cellule

Responsive image

2) Ajouter la formule

Responsive image

La première cellule du tableau doit être égal à l'effectif de la première fréquence relative.

3) Sélectioner la seconde ligne et ajouter la formule

Responsive image

4) Utiliser la poignée de recopie

Responsive image

Utiliser la poignée de recopie jusqu'au bas du tableau.

Responsive image

5) Vous pouvez compléter votre tableau avec les proportions

Responsive image

 

 

 

 

1 - Les graphiques simples à une variable

A quoi sert t-il ?

Ce type de tableau permet de recuillir l'ensemble des données brutes obtenues dans le cadre d'une étude.

Le graphique camembert

Le graphique camembert encore appelé "secteur" ou"pie chart" se présente sous cette forme :

Responsive image

Ce graphique correspond au tableau de données ci-dessous.

Responsive image

Règles d'usages :

Il convient, si possible de respecter les règles suivante :

  • Le premier secteur commence à midi
  • Dans le sens horaire
  • On commence par les classe les plus grandes
  • On ne représentera un maximum de 8 classes
Quand l'utiliser ?
  • Pour montrer l'effet relatif d'un ou 2 secteurs prédominants
Inconvénient
  • Peu précis
  • Ne permet pas une comparaison facile avec d'autres graphiques

Responsive image

Le graphique en barreaux à 100%

Le graphique appelé "en barreau 100%" ou "histogramme emplié 100%" se présentent sous cette forme :

Responsive image

Quand l'utiliser ?
  • Bien adatpté pour comparer un grand nombre de classes
  • Permet de comparer plusieurs distributions

Responsive image

 

Il possible de relier les classes avec des traits afin de mieux voir les différences des catégories entre elles.

Responsive image

 

Le graphique en barres horizontales

Le graphique en barres horizontales se présente sous cette forme :

Responsive image

Quand l'utiliser ?
  • Bien adapté pour comparer un grand nombre de classes
  • Bien adapté pour représenter les distribution d'une variable nominale
  • Permet d'inscrire des libélés relativement long

Le graphique en bâtons verticaux

Le graphique "en bâtons verticaux" se présente sous cette forme :

Responsive image

Quand l'utiliser ?
  • Bien adapté pour comparer représenter des variables ordinales

L'histogramme

Le graphique de type histogramme, se présente sous cette forme :

Responsive image

 

  • Chaque surface de chaque barre a une surface proportionnelle à l'effectif.
  • Les barres sont de largeur identiques
  • La surface totale représente 100% des valeurs
  • En ordonnée, on trouve soit les effectifs, soit les fréquences
  • En abscisse, on trouve les classes
  • L'axe des abscisses est une échelle de valeur.
Quand l'utiliser ?
  • Bien adapté pour comparer représenter des variables quantitatives discrètes
  • Si les données sont des variables quantitatives discrètes, les barres sont disjointes

Responsive image

  • Si les données sont des variables quantitatives continue, les barres sont contiguës

Responsive image

Le polygone de fréquence

Le polygone de fréquence est un graphique linéaire, adapté pour représenter des variables quantitatives continue.

Responsive image

 

  • En ordonnée, on trouve soit les effectifs, soit les fréquences
  • En abscisse, on trouve les classes
  • Chaque point du polygne représente la fréquence pour le point central de a classe de la variable.
  • Le trait reliant 2 point suggère les fréquences possibles entre 2 valeurs centales.
  • Les 2 extrémités du polygone de fréquence doivent rejoindre l'axe des absisses
  • La surface comprise sous le polygone de fréquence reèrésente 100% des observations.

Le graphique de fréquence cumulées

Le polygone de fréquence cumulée est également un graphique linéaire, adapté pour représenter des variables quantitatives continue.

 

Responsive image

 

Responsive image

Ce graphique pourra être exploiter en faisant la lecture suivante :

57% des sujet pèsent mois de 35Kg. ( voir représentation en pointillé ci-dessus )

 

Responsive image

 

 

2 - Les graphiques à 2 variables - bidimensionnels

Le graphique à barres multiples

ce graphique seprésente de la façon suivante :

Responsive image

Responsive image

Les barres d'une même classe sont juxtaposées sur un seul et même graphique.

Cela permet de façilité la comparaison entre les catégories.

 

Le graphique à nuage de point

Il permet de visualiser la relation etre 2 variables positionnée l'une en abscisse, l'autre en ordonnée.

 

Responsive image

La question habutuellement posée est : Y a t'il une reation entre le variable 1 et la variable 2.

 

Le fichier exemple

Télécharger le fichier exemple

Lien : distributionfrequence.xlsx

ETATE 1 - Préparer votre feuille

Pour réaliser un tableau de fréquence nous avons besoin d'un tableau de donnée brutes.

 

 

Responsive image

Un tri des données et une suppression des valeurs en double permet d'obtenir la liste des Xi que l'on peut observer.

Responsive image

 

 

1) Les fréquences absolues

La fréquence absolue est le nombre de fois ni (effectif) qu'une valeur xi de X est observée.

 

Responsive image

On pourra visualiser ces valeur à l'aiide de l'histogramme suivant :

 

Responsive image

 

1) Les fréquences relatives

La fréquences relatives correspond à la fréquence absolue exprimé en pourcentage.

 

Responsive image

 

 

 

1) Les fréquences cumulées

La fréquence cumulé correspond à l'addition des fréquences d'une valeur xi avec les fréquences des valeurs xi inférieures.

Responsive image

Responsive image