Les statistiques en Première
Dans tout ce chapitre, on considère une série statistique représentée par le tableau :
Valeurs | ... | Total | |||
Effectifs | ... |
1. Paramètres de position
Définition
La moyenne d'une série statistique est le nombre :
Exemple
Les âges des élèves d'un lycée sont donnés par le tableau :
Ages | 14 | 15 | 16 | 17 | 18 | 19 | 20 | Total |
Effectifs | 2 | 52 | 78 | 75 | 81 | 25 | 2 | 315 |
La moyenne des âges vaut:
à près.
Définition
La médiane d'une série statistique est la valeur du caractère qui partage la population en deux classes de même effectif.
Remarque
En pratique pour trouver la médiane d'une série statistique d'effectif global :
On ordonne les valeurs du caractère dans l'ordre croissant.
Si est pair, la médiane sera la moyenne des valeurs du terme de rang et du terme de rang .
Si est impair, la médiane sera la valeur du terme de rang .
Lorsque l'effectif global est élevé, il est souvent utile de calculer les effectifs cumulés pour trouver cette valeur.
Exemple
On lance 10 fois un dé à six faces. Les résultats obtenus sont : 1 ; 5 ; 6 ; 6 ; 3 ; 2 ; 3 ; 1 ; 4 ; 1
On trie ces valeurs par ordre croissant : 1 ; 1 ; 1 ; 2 ; 3 ; 3 ; 4 ; 5 ; 6 ; 6
N=10 étant pair on effectue la moyenne du cinquième et du sixième terme (3 et 3) et on obtient donc 3.
Remarque
Voir la fiche de Statistiques en seconde pour un exemple plus détaillé.
2. Paramètres de dispersion
Définitions
La variance d'une série statistique est le nombre :
L'écart-type est la racine carrée de la variance :
Propriété
La variance d'une série statistique est égale à :
Définitions
Le premier quartile Q1 d'une série statistique est la plus petite valeur des termes de la série pour laquelle au moins un quart des données sont inférieures ou égales à Q1.
Le troisième quartile Q3 d'une série statistique est la plus petite valeur des termes de la série pour laquelle au moins trois quarts des données sont inférieures ou égales à Q3.
Le premier décile D1 d'une série statistique est la plus petite valeur des termes de la série pour laquelle au moins 10% des données sont inférieures ou égales à D1.
Le neuvième décile D9 d'une série statistique est la plus petite valeur des termes de la série pour laquelle au moins 90% des données sont inférieures ou égales à D9
Définition
L'écart interquartile est la différence entre le troisième et le premier quartile .
Remarque
L'écart interquartile mesure la dispersion autour de la médiane.
3. Diagramme en boîte
On peut résumer un certain nombre d'informations relatives à une série statistique grâce à un diagramme en boîte (aussi appelé boîte à moustache) qui fait apparaître (voir figure ci-dessus) :
les valeurs minimum et maximum
le premier et le troisième quartile (Q1 et Q3)
la médiane
Exemple
Le figure ci-dessus représente une série statistique de valeurs extrêmes 3 et 20, de premier quartile 6, de troisième quartile 14 et de médiane 9,5.
Remarque
Parfois, notamment lorsqu'on étudie des séries dont certaines valeurs peuvent être erronées, on remplace les valeurs minimum et maximum par les premier et neuvième déciles afin d'éliminer les valeurs aberrantes.