Maths-cours

COURS & EXERCICES DE MATHÉMATIQUES

Close

Les statistiques en Première

Dans tout ce chapitre, on considère une série statistique représentée par le tableau :

Valeurs x1x_{1} x2x_{2} ... xpx_{p} Total
Effectifs n1n_{1} n2n_{2} ... npn_{p} NN

1. Paramètres de position

Définition

La moyenne d'une série statistique est le nombre :

x=n1x1+n2x2+...+npxpN\overline x=\frac{n_{1}x_{1}+n_{2}x_{2}+. . .+n_{p}x_{p}}{N}=1Nk=1pnkxk=\frac{1}{N}\sum_{k=1}^{p}n_{k}x_{k}

Exemple

Les âges des élèves d'un lycée sont donnés par le tableau :

Ages 14 15 16 17 18 19 20 Total
Effectifs 2 52 78 75 81 25 2 315

La moyenne des âges vaut:

x=1315(2×14+52×15\overline x=\frac{1}{315}\left(2\times 14+52\times 15\right.+78×16+75×17+81×18+25×19+2×20)\left.+78\times 16+75\times 17+81\times 18+25\times 19+2\times 20\right)

x=530431516,84\overline x=\frac{5304}{315} \approx 16,84 à 102 10^{ - 2} près.

Définition

La médiane d'une série statistique est la valeur du caractère qui partage la population en deux classes de même effectif.

Remarque

En pratique pour trouver la médiane d'une série statistique d'effectif global NN :

  • On ordonne les valeurs du caractère dans l'ordre croissant.

  • Si NN est pair, la médiane sera la moyenne des valeurs du terme de rang N2\frac{N}{2} et du terme de rang N2+1\frac{N}{2}+1.

  • Si NN est impair, la médiane sera la valeur du terme de rang N+12\frac{N+1}{2}.

  • Lorsque l'effectif global est élevé, il est souvent utile de calculer les effectifs cumulés pour trouver cette valeur.

Exemple

On lance 10 fois un dé à six faces. Les résultats obtenus sont : 1 ; 5 ; 6 ; 6 ; 3 ; 2 ; 3 ; 1 ; 4 ; 1

On trie ces valeurs par ordre croissant : 1 ; 1 ; 1 ; 2 ; 3 ; 3 ; 4 ; 5 ; 6 ; 6

N=10 étant pair on effectue la moyenne du cinquième et du sixième terme (3 et 3) et on obtient donc 3.

Remarque

Voir la fiche de Statistiques en seconde pour un exemple plus détaillé.

2. Paramètres de dispersion

Définitions

La variance d'une série statistique est le nombre :

V=1NV=\dfrac{1}{N}(n1(x1x)2+n2(x2x)2+...\left(n_{1}\left(x_{1} - \overline x\right)^{2}+n_{2}\left(x_{2} - \overline x\right)^{2}+. . .\right.+np(xpx)2)\left.+n_{p}\left(x_{p} - \overline x\right)^{2}\right)
V=1Nk=1pnk(xkx)2\phantom{V}=\frac{1}{N}\sum_{k=1}^{p}n_{k}\left(x_{k} - \overline x\right)^{2}

L'écart-type est la racine carrée de la variance :

σ=V\sigma =\sqrt{V}

Propriété

La variance d'une série statistique est égale à :

V=n1x12+n2x22+...+npxp2Nx2V=\dfrac{n_{1}x_{1}^{2}+n_{2}x_{2}^{2}+. . .+n_{p}x_{p}^{2}}{N} - \overline x^{2}=x2x2=\overline{x^{2}} - \overline x^{2}

Définitions

  • Le premier quartile Q1 d'une série statistique est la plus petite valeur des termes de la série pour laquelle au moins un quart des données sont inférieures ou égales à Q1.

  • Le troisième quartile Q3 d'une série statistique est la plus petite valeur des termes de la série pour laquelle au moins trois quarts des données sont inférieures ou égales à Q3.

  • Le premier décile D1 d'une série statistique est la plus petite valeur des termes de la série pour laquelle au moins 10% des données sont inférieures ou égales à D1.

  • Le neuvième décile D9 d'une série statistique est la plus petite valeur des termes de la série pour laquelle au moins 90% des données sont inférieures ou égales à D9

Définition

L'écart interquartile est la différence entre le troisième et le premier quartile Q3Q1Q_{3} - Q_{1}.

Remarque

L'écart interquartile mesure la dispersion autour de la médiane.

3. Diagramme en boîte

boite à moustaches

On peut résumer un certain nombre d'informations relatives à une série statistique grâce à un diagramme en boîte (aussi appelé boîte à moustache) qui fait apparaître (voir figure ci-dessus) :

Exemple

exemple diagramme boite à moustaches

Le figure ci-dessus représente une série statistique de valeurs extrêmes 3 et 20, de premier quartile 6, de troisième quartile 14 et de médiane 9,5.

Remarque

Parfois, notamment lorsqu'on étudie des séries dont certaines valeurs peuvent être erronées, on remplace les valeurs minimum et maximum par les premier et neuvième déciles afin d'éliminer les valeurs aberrantes.

Dans ce chapitre :