Botanique appliquée
Déterminer des indicateurs de tendance centrale
1. Vocabulaire
Population : ensemble représentatif de l’étude à mener
Echantillon : c’est une partie représentative de la population
Individu : c’est celui qui compose l’échantillon. Il possède des caractéristiques qui seront étudiées.
Caractère étudié est appelé variable statistique. Les réponses obtenues sont des modalités.
Variable statistique : elle peut être qualitative ou quantitative
Série statistique est le recueil des données. L’analyse de la série statistique permet de présenter, de comparer la population.
Indicateurs : il servent à synthétiser la série statistique
2. Les indicateurs
Les indicateurs de tendance centrale
La moyenne :
ou encore,

La moyenne : la valeur « moyenne » est égale au quotient de la somme de toutes les valeurs de la série par l’effectif total.
Exemple: La moyenne de la série 4, 1, et 7 est (4+1+7)/3 = 12/3 = 4
La médiane : c’est la valeur centrale d’une série statistique dont les valeurs observées ont été rangées dans l’ordre croissant, est la valeur qui partage la population étudiée en deux sous-ensembles de même effectif (si le nombre d’observations n est pair, la médiane est la demi-somme des termes de rang n et n + 1).
Exemple : La médiane de la série : 4, 1, et 7 est 4 car, lorsqu’on ordonne les valeurs de la série dans l’ordre croissant (1, 4, 7),4 est la valeur qui divise la série en deux moitiés égales.
Le mode : La valeur la plus fréquente d’une série statistique — C’est la (ou les) valeur(s) du caractère dont l’effectif est le plus grand.
Exemple : le mode de la série (4, 2, 4, 3, 2, 2), est 2 car il apparaît trois fois. 2 est la valeur qui a le plus grand nombre d’occurrences.
3. Les indicateurs de dispersion
L’étendue d’une série statistique est la différence entre la valeur la plus grande et la valeur la plus petite de cette série.
Exemple : Dans une classe de 25 élèves, on a répertorié le nombre de frères et sœurs de chaque élève dans un tableau :
Nombre de frères et soeurs | 0 | 1 | 2 | 3 | 4 |
Effectifs | 2 | 8 | 9 | 5 | 1 |
Etendue = 4 – 0 = 4.
L’étendue de cette série statistique est donc de 4. L’étendue est indépendante des effectifs.
L’écart type
L’écart type, habituellement noté s lorsqu’on étudie un échantillon et σ lorsqu’on étudie une population, est défini comme étant une mesure de dispersion des données autour de la moyenne.

Exemple :
Une poule pond huit œufs. Voici les poids en grammes (g) des œufs :
60 g, 56 g, 6l g, 68 g, 51 g, 53 g, 69 g, 54 g.
- Premièrement, calculez la moyenne :
- Maintenant, trouvez l’écart-type.
Tableau 1. Poids des œufs, en grammes

À l’aide de l’information tirée du tableau ci-dessus, nous pouvons voir que :

Pour calculer l’écart-type, on doit utiliser la formule qui suit :

Les quartiles
La médiane divise les données en deux ensembles égaux. (Pour plus de renseignements sur la médiane, consultez le chapitre sur les Mesures de tendance centrale) :
- Le quartile inférieur est la valeur du milieu du premier ensemble, dans lequel 25 % des valeurs sont inférieures à Q1 et 75 % lui sont supérieures. Le premier quartile prend la notation Q1.
- Le quartile supérieur est la valeur du milieu du deuxième ensemble, dans lequel 75 % des valeurs sont inférieures à Q3 et 25 % lui sont supérieures. Le troisième quartile prend donc la notation Q3.
Il convient de noter que la médiane, dans lequel 50 % des valeurs sont inférieures, prend la notation Q2, c’est-à-dire le deuxième quartile.
Exemple :
Données brutes (12 valeurs) : 34, 47, 1, 15, 57, 24, 20, 11, 19, 50, 28, 37.
Données ordonnées (12 valeurs) : 1, 11, 15, 19, 20, 24, 28, 34, 37, 47, 50, 57.
a – Médiane (Q2) :
Quelle valeur prendre pour la médiane Q2= (12e + 1er) ÷ 2 = 6,5e valeur = (6e + 7e observations) ÷ 2 = (24 + 28) ÷ 2 = 26
b- Quartile supérieur (Q3):
Quelle valeur du milieu de la seconde moitié des données Q3 = la médiane de 28, 34, 37, 47, 50, 57 = (3e + 4e observations) ÷ 2
= (37 + 47) ÷ 2 = 42
b- Quartile inférieur (Q1):
Quelle valeur du milieu de la première moitié des données Q1 = la médiane de 1, 11, 15, 19, 20, 24 = (3e + 4e observations) ÷ 2
= (15 + 19) ÷ 2 = 17
c- Ecart interquartile
C’est la différence entre le 3ème quartile (Q3) et le 1er quartile (Q1) = Q3 – Q1 = 42 – 17 = 25
Nous pouvons synthétiser les résultats comme représentés ci-dessous :

Interprétation des indicateurs
Les indicateurs sont des valeurs qui s’associent en couple : (médiane, écart interquartile) ou (moyenne, écart type).
Le couple médiane, écart interquartile donne à la fois :
– Un indicateur de tendance centrale de la série : la médiane
– Un indicateur de dispersion : la longueur de l’intervalle interquartile qui contient la moitié centrale des valeurs de la série.
Plus l’écart interquartile est petit, plus les valeurs centrales de la série se concentrent autour de la médiane.
Il est facile à interpréter.
Il a l’avantage d’être très peu sensible aux valeurs extrême (parfois suspectes).
Le couple moyenne, écart type donne à la fois :
– Un indicateur de la tendance centrale de la série : la moyenne
– Un indicateur de dispersion faisant intervenir les carrés des écarts à la moyenne de toutes les valeurs de la série.
Plus l’écart type est petit, plus les valeurs se concentrent autour de la moyenne.
Cependant l’écart type tient compte des écarts de toutes les valeurs à la moyenne. Il donne ainsi beaucoup de poids aux valeurs extrêmes, et son choix n’est pertinent que lorsque le diagramme qui représente la série est assez symétrique et évoque la forme d’une « courbe en cloche »
Le diagramme en boîte ou (boîte à moustaches) est une représentation graphique d’indicateurs permettant de comparer et d’interpréter plusieurs séries statistiques.
Le diagramme en boîte met en évidence cinq des paramètres d’une série statistique : le minimum, le quartile inférieur (Q1), la médiane (Q2), le quartile supérieur (Q3) et le maximum. voici comment :

Exemple :
On donne la série des masses de 10 caisses de raisin : 25, 28, 29, 29, 30, 34, 35, 35, 37, 38
Construire le diagramme en boîte de cette série.
1 – On ordonne les valeurs de la série dans l’ordre croissant.
La série est déjà ordonnée dans l’ordre croissant. 25, 28, 29, 29, 30, 34, 35, 35, 37, 38
2 – On détermine la médiane. La médiane est la demi-somme des deux valeurs du milieu :

La médiane est égale à 32
3 – On détermine les quartiles.
Le premier quartile est la médiane des valeurs strictement inférieures à la médiane de la série.

Le troisième quartile est la médiane des valeurs strictement supérieures à la médiane de la série.

4 – On détermine le minimum et le maximum.
Le minimum de la série est 25. Le maximum de la série est 38.
Les cinq paramètres utiles sont 25, 29, 32, 35, 38.
Je construit mon diagramme en boîte
1 – On choisit la partie utile de la droite graduée et une unité.

2 – On trace le corps de la boîte et le trait vertical qui marque la médiane.

3 – On trace les “moustaches” avec Min =25 et Max =38.

Lire un diagramme en boîte
Le minimum, les quartiles, la médiane et le maximum, partagent la série en quatre groupes constitués chacun d’environ 25%, de ses valeurs.

Que déduire des valeurs des quartiles ? Quel est environ le pourcentage des caisses de raisin qui ont une masse strictement supérieure à 29 g ?
Q1=29, donc environ 25%, des masses des caisses sont strictement inférieures à 29 g, et environ 75%, des masses des caisses sont strictement supérieures à 29 g.