Les indicateurs de dispersion dans les statistiques

· 22 avril 2019
Les mesures de dispersion sont importantes parce qu'elles nous renseignent sur la variabilité que nous trouvons dans un échantillon ou une population donnée. Lorsque nous parlons d'un échantillon, cette dispersion est importante parce qu'elle conditionne l'erreur que nous allons commettre en faisant des inférences pour des mesures de tendance centrale, comme la moyenne.

Dans une distribution de données, les indicateurs de dispersion jouent un rôle très important. Ces mesures complètent celles de la position centrale, caractérisant la variabilité des données.

Ainsi, les indicateurs des tendances centrales indiquent les valeurs par rapport auxquelles les données semblent se regrouper. Ils sont recommandés pour déduire le comportement des variables dans les populations et les échantillons. Quelques exemples sont la moyenne arithmétique, la mode ou la médiane (1).

Les indicateurs de dispersion complètent ces mesures de tendance centrales. De plus, ils sont essentiels dans une distribution de données. C’est parce qu’ils caractérisent la variabilité des données. Leur pertinence dans la formation statistique a été soulignée par Wild et Pfannkuch (1999).

Dans ces mesures, la perception de la variabilité des données est l’une des composantes fondamentales de la pensée statistique. La perception de la variabilité des données nous renseigne sur la dispersion des données par rapport à une moyenne ou une médiane.
La moyenne arithmétique est largement utilisée dans la pratique, mais peut souvent être mal interprétée. Cela se produit lorsque les valeurs de la variable sont très dispersées. C’est dans ces cas-là qu’il est nécessaire d’accompagner la moyenne des indicateurs de dispersion (2).

Dans les indicateurs de dispersion, il y a trois composantes importantes liées à la variabilité aléatoire (2) :

  • La perception de son ubiquité dans le monde qui nous entoure
  • La compétence pour son explication
  • La capacité de le quantifier (ce qui implique de comprendre et de savoir comment appliquer le concept de dispersion)
statistiques et indicateurs de dispersion

A quoi servent les indicateurs de dispersion ?

Dans une étude statistique, lors de la généralisation des données d’un échantillon d’une population, les indicateurs de dispersion sont très importants car ils conditionnent directement l’erreur avec laquelle nous travaillons. Ainsi, plus nous recueillons de dispersion dans un échantillon, plus nous avons besoin de taille pour travailler avec la même erreur.

D’autre part, ces indicateurs nous aident à déterminer si nos données sont trop éloignées de la valeur centrale. Ce faisant, ils nous indiquent si cette valeur centrale est suffisante pour représenter la population à l’étude. Ceci est très utile pour comparer les distributions et comprendre les risques dans la prise de décision (1).

Ces mesures sont très utiles pour comparer les distributions et comprendre les risques dans la prise de décision. Plus la dispersion est grande, moins la valeur centrale est représentative. Voici les indicateurs les plus utilisés :

  • L’étendue
  • L’écart moyen
  • La variance
  • L’écart-type
  • Le coefficient de variation

Les fonctions de chacune des mesures de dispersion

L’étendue

Premièrement, l’étendue est recommandée pour une comparaison primaire. Ainsi, elle ne prend en compte que les deux observations extrêmes. Elle n’est donc recommandée que pour de petits échantillons (1). Elle est définie comme la différence entre la dernière valeur de la variable et la première (3).

L’écart moyen

L’écart moyen, en revanche, indique où les données seraient concentrées si elles étaient toutes à la même distance de la moyenne arithmétique (1). Nous considérons l’écart d’une valeur variable comme la différence en valeur absolue entre cette valeur variable et la moyenne arithmétique de la série. Il est donc considéré comme la moyenne arithmétique des écarts (3).

La variance

La variance est une fonction algébrique de toutes les valeurs, appropriée aux tâches statistiques inférentielles (1). Elle peut être défini comme la moyenne des carrés des écarts (3).

L’écart-type

Pour les échantillons prélevés dans la même population, l’écart-type est l’un des plus couramment utilisés (1). C’est la racine carrée de la variance (3)

Le coefficient de variation

Il s’agit d’une mesure utilisée principalement pour comparer la variation entre deux ensembles de données mesurées dans des unités différentes. Par exemple, la taille et le poids des élèves d’un échantillon. Ainsi, il est utilisé pour déterminer dans quelle distribution les données sont plus groupées et la moyenne est plus représentative (1).

indicateurs de dispersion et coefficient de variation

Le coefficient de variation est une mesure de dispersion plus représentative que les précédentes, car il s’agit d’un nombre abstrait. En d’autres termes, il est indépendant des unités dans lesquelles les valeurs de la variable apparaissent. En général, ce coefficient de variation s’exprime en pourcentage (3).

Ainsi, ces indicateurs de dispersion indiqueront, d’une part, le degré de variabilité de l’échantillon. D’autre part, ils indiqueront la représentativité de la valeur centrale, car si on obtient une petite valeur, cela signifie que les valeurs se concentrent autour de ce centre.

Cela signifierait qu’il y a peu de variabilité dans les données et que le centre représente bien tout le monde. Par contre, si on obtient une valeur élevée, cela signifie que les valeurs ne se concentrent pas, mais se dispersent. Cela signifie qu’il y aura beaucoup de variabilité et que le centre ne sera pas très représentatif. D’autre part, pour faire des inférences, nous aurons besoin d’un échantillon de plus grande taille si nous voulons réduire l’erreur, augmentée précisément par la hausse de la variabilité.

 

  1. Graus, M. E. G. (2018). Estadística aplicada a la investigación educativa. Dilemas Contemporáneos: Educación, Política y Valores, 5(2).
  2. Batanero, C., González-Ruiz, I., del Mar López-Martín, M., & Miguel, J. (2015). La dispersión como elemento estructurador del currículo de estadística y probabilidad. Epsilon, 32(2), 7-20.
  3. Folgueras Russell, P. Medidas de Dispersión. Retrieved from https://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=2&ved=2ahUKEwixgPLvw_XgAhVDAmMBHW02AesQFjABegQIBRAC&url=http%3A%2F%2Fwww.educaguia.com%2FBiblioteca%2Fapuntesde%2Fmatematicas%2FESTADISTICAYPROBABILIDAD%2FMEDIDASDEDISPERSION.pdf&usg=AOvVaw0DCZ9Ej1YvX7WNEu16m2oF
  4. Wild, C. J. y Pfannkuch, M. (1999). Statistical thinking in empirical enquiry. International
    Statistical Review, 67(3), 223-263.