L’écart type est un concept omniprésent dans les mathématiques, notamment en statistique. Il est utilisé pour mesurer la dispersion des données autour de la moyenne, autrement dit, quantifier à quel point les valeurs d’un ensemble sont disséminées. Dans cet article, nous allons explorer les fondamentaux de l’écart type et voir comment le calculer.
Menu de l'article
ToggleQu’est-ce que l’écart type ?
L’écart type est une valeur qui indique la dispersion ou la variabilité des données dans un ensemble. Plus l’écart type est grand, plus les valeurs sont dispersées et moins elles sont homogènes. À l’inverse, si l’écart type est faible, cela signifie que les valeurs sont regroupées autour de la moyenne. L’écart type est parfois appelé la « racine carrée de la variance » car il s’agit du résultat de la racine carrée de cette dernière.
Pourquoi l’utiliser ?
En statistique, l’écart type a plusieurs utilités :
- Mesure de dispersion : il permet de comparer différents ensembles de données et de déterminer lequel présente la plus grande variabilité
- Analyse des écarts :il aide à identifier les outliers, c’est-à-dire les valeurs anormalement éloignées de la moyenne
- Qualité des résultats :il est souvent utilisé pour déterminer l’incertitude ou la précision d’une mesure expérimentale
Calcul de l’écart type
Il existe deux types d’écart type : l’écart type d’une population et l’écart type d’un échantillon. Le premier concerne les mesures effectuées sur l’ensemble des éléments d’une population, tandis que le second s’intéresse à un sous-ensemble représentatif de cette population. La méthode de calcul diffère légèrement entre ces deux cas.
Écart type d’une population
Pour calculer l’écart type d’une population, il faut suivre les étapes suivantes :
- Calculer la moyenne de l’ensemble des données
- Calculer la différence entre chaque valeur et la moyenne, puis élever cette différence au carré
- Additionner toutes les valeurs obtenues à l’étape précédente
- Diviser le résultat par le nombre total de données
- Prendre la racine carrée du quotient obtenu à l’étape précédente
Cela donne :
Écart type (population) = √(Σ(xi – μ)² / N )
Où xi représente chaque valeur de l’ensemble, μ la moyenne de l’ensemble et N le nombre total de données.
Écart type d’un échantillon
Pour calculer l’écart type d’un échantillon, il faut procéder de manière similaire, en remplaçant le nombre total de données N par (N-1), soit :
- Calculer la moyenne de l’ensemble des données
- Calculer la différence entre chaque valeur et la moyenne, puis élever cette différence au carré
- Additionner toutes les valeurs obtenues à l’étape précédente
- Diviser le résultat par (le nombre total de données – 1)
- Prendre la racine carrée du quotient obtenu à l’étape précédente
Cela donne :
Écart type (échantillon) = √(Σ(xi – μ)² / (N-1) )
Exemple de calcul d’écart type
Imaginons que nous avons un ensemble de données composé des valeurs suivantes : 4, 6, 9, 10, 12. Nous souhaitons calculer l’écart type de cet ensemble.
- Moyenne : (4+6+9+10+12)/5 = 8,2
- Différences au carré : (4-8,2)² = 17,64 ; (6-8,2)² = 4,84 ; (9-8,2)²=0,64 ; (10-8,2)² = 3,24 ;(12-8,2)² = 14,44
- Addition : 17.64+4.84+0.64+3.24+14.44 = 40,8
- Division : 40,8/5 = 8,16
- Racine carrée : √8,16 ≈ 2,86
Donc l’écart type de cet ensemble de données est d’environ 2,86.
Garder à l’esprit les limites de l’écart type
Bien qu’il soit un outil précieux pour mesurer la dispersion des données, l’écart type présente certaines limites :
- Sensibilité aux valeurs extrêmes : l’écart type est affecté par les outliers ou les valeurs particulièrement éloignées de la moyenne, ce qui peut fausser le résultat;
- Non-normalité des données : lorsque les données ne suivent pas une distribution normale (en forme de cloche), l’écart type peut être moins représentatif de la dispersion réelle des valeurs;
- Unités de mesure : l’écart type est exprimé dans la même unité que les données, ce qui limite les comparaisons entre différentes échelles de mesure.
Pour pallier ces limitations, d’autres mesures de dispersion peuvent être utilisées, telles que l’écart interquartile, la variance ou le coefficient de variation.