Les concepts de base de la statistique descriptive

6 octobre 2019
La population est un ensemble bien défini sur lequel une certaine caractéristique est observée ou peut être observée. Cette caractéristique peut être finie ou infinie.

tComme nous l’avons vu précédemment, la statistique est la branche des mathématiques qui étudie la variabilité, ainsi que le processus qui la génère selon des lois et des modèles de probabilité. Nous savons qu’il est nécessaire de faire de la recherche et de comprendre comment la recherche se fait actuellement, au-delà des conclusions de toute étude. Mais quels sont les concepts de base de la statistique ?

Ainsi, pour se concentrer sur les concepts de base en statistique, il faut avoir recours à des statistiques descriptives. Il s’agit de la description de données expérimentales. Plus précisément de la collecte, de l’organisation et de l’analyse de données sur certaines caractéristiques de certains individus appartenant à une population donnée. (1)

 

Selon le professeur Ignacio Cascos, de l’Université Carlos III de Madrid, voici quelques-uns des concepts de base en statistique que nous devons connaître.

1. La population

La population correspond à un ensemble bien défini sur lequel on peut observer une certaine caractéristique.

Cette caractéristique peut être finie ou infinie. Ainsi, la taille de la population est le nombre d’individus qu’elle compte, indiqué par N. (1).

Si la population est très importante, cela devient très coûteux de la mesurer et, dans certains cas, impossible de tenir compte de chaque individu et une sélection appelée échantillon est faite.

2. L’individu

Chacun des éléments de la population est appelé un individu. Ces éléments ne doivent pas nécessairement être des personnes, bien qu’en psychologie c’est le cas le plus courant.

3. L’échantillon et sa taille

Un échantillon est un ensemble d’individus de la population qui reflète au mieux les caractéristiques de la population. Si les caractéristiques sont bien reflétées, l’échantillon est dit représentatif. La taille de l’échantillon est le nombre d’individus qu’il recense. Il est représenté sous le symbole n.

Si l’échantillon et la population coïncident, il s’agit alors d’un recensement.

4. Les variables et les données

Une variable (X) est un symbole qui représente une caractéristique à étudier dans la population. Nous appelons données (r) la valeur (numérique ou non) que la variable prend sur un individu spécifique de l’échantillon.

statistique descriptive et variables

Les types de variables

Il est important de garder à l’esprit dans les statistiques qu’il existe plusieurs types de variables.

Les variables qualitatives

Ce type de variable concerne des valeurs qui correspondent aux qualités non quantifiables des individus. On ne peut pas dire qu’une catégorie est supérieure ou inférieure à une autre.

Le sexe est un exemple de ce type de variable. On dit qu’elles sont qualitatives parce que les différences entre les catégories sont précisément qualitatives.

Les variables ordinales

Il s’agit de variables qui sont susceptibles d’être divisées en catégories. Contrairement à une variable purement qualitative, dans ce type de variable, on pourrait ordonner les catégories.

Pensons aux notes scolaires, par exemple. Un « A » est supérieur à un « B » et un « B » à un « C ».

Les variables quantitatives

La variable quantitative concerne des valeurs dans un ensemble standard de valeurs numériques. Cela signifie que l’on peut la mesurer. La variable quantitative comprend deux types de variables :

  • Discrète. L’ensemble est fini ou dénombrable. Par exemple, le nombre d’enfants dans une famille.
  • Continue. L’ensemble est infini et ne peut être numéroté. Cela signifie qu’il contient un certain intervalle. Un exemple pourrait être le temps.

Les mesures de position

En statistique, nous pouvons déterminer la position de nos données à partir des mesures de position. En voici quelques-unes :

Les mesures de la tendance centrale

Les moyennes ou mesures des tendances centrales sont des valeurs typiques ou représentatives d’un ensemble de données. Ainsi, elles se destinent à comprimer toutes les données en une seule valeur.

Il s’agit de concepts très élémentaires en statistique et voici les trois les plus fréquemment utilisées : la mode (variables qualitatives), la médiane (variables catégorielles) et la moyenne (variables quantitatives).

faire de la statistique descriptive

  • La mode. C’est la valeur de la plus grande fréquence, celle qui se répète le plus. S’il y a plus d’une de ces valeurs, on qualifie la variable de « multimodale » et on peut la calculer pour tout type de variable.
  • La médiane. On la calcule pour les variables catégorielles. C’est un nombre tel qu’au moins 50 % des données sont inférieures ou égales à la médiane et au moins 50 % sont supérieures ou égales à celle-ci. Ainsi, s’il y a plus d’une médiane, nous prenons le point médian entre la médiane la plus grande et la plus petite. Il s’agit donc des données qui apparaissent dans l’échantillon et qui servent de médianes.
  • La moyenne. Il s’agit de la statistique la plus couramment utilisée. On la calcule pour les variables quantitatives. C’est, pour ainsi dire, le centre de gravité géométrique des données. Ce qui est étrange, c’est qu’avec la moyenne se produit un phénomène assez intéressant. Il se peut qu’elle ne représente pas l’échantillon, voire qu’elle ne représente personne dans cet échantillon. Par conséquent, il est possible que personne n’ait cette valeur dans la variable.

Il y a beaucoup d’autres concepts que l’on utilise dans les statistiques, mais ceux que nous venons de vous présenter sont peut-être les plus fondamentaux. Ainsi, à l’aide de ces concepts, les statistiques descriptives sont chargées d’épurer, d’organiser et de calculer les statistiques et les représentations des données afin d’offrir au chercheur, et par extension à la communauté scientifique, une carte complète de ce qui s’est passé dans son étude.

 

  • de Datos, A. E. (1983). Estadística Descriptiva.
  • Fernández, S. F., Sánchez, J. M. C., Córdoba, A., Cordero, J. M., & Largo, A. C. (2002). Estadística descriptiva. Esic Editorial.
  • García Pérez, A. (2008). Estadística aplicada: Conceptos básicos.