Statistique descriptive en psychologie

La statistique est la branche des mathématiques qui étudie la variabilité et le processus qui la génère en suivant des lois de probabilités. Elle est nécessaire pour mener des recherches et pour comprendre comment ces dernières sont réalisées, au-delà des conclusions de n’importe quelle étude. Cette branche nous permettra donc de connaître la qualité d’une étude et le degré de fiabilité de ses conclusions.

La statistique descriptive, de son côté, est cette partie de la statistique qui se charge de collecter, de présenter et de caractériser un ensemble de données. En d’autres termes, la statistique descriptive essaye de savoir ce qu’il s’est passé, au contraire de l’inférence statistique qui essaye de prédire ce qu’il se passera dans le futur en fonction de différentes conditions.

Ces conditions peuvent par exemple se spécifier à travers des variables comme l’âge, le climat ou le degré d’anxiété. Ainsi, la statistique descriptive en psychologie a pour but de résumer de façon utile pour le chercheur et le lecteur ce qu’il s’est passé dans une étude déterminée.

Comme nous l’avons dit, les variables sont l’un des axes centraux de la statistique descriptive – et de la non descriptive également -. Une variable englobe un ensemble de valeurs et, en fonction du type de valeurs que nous rencontrons, nous pouvons parler de :

Variables quantitatives : elles peuvent avoir une valeur numérique (âge, prix d’un produit, revenus annuels).
Variables catégoriques ou qualitatives : elles ne peuvent pas être mesurées de façon numérique (comme le sexe, la nationalité ou la couleur de peau).

Les variables peuvent aussi se classer en :

Variables unidimensionnelles. Elles ne reprennent que des informations sur une caractéristique d’une partie de la population. Par exemple, la taille des élèves dans une école.
Variables bidimensionnelles. Elles reprennent des informations sur deux caractéristiques d’une partie de la population. Par exemple, la taille et l’âge des élèves dans une école.
Variable multidimensionnelles. Elles reprennent des informations sur trois caractéristiques ou plus d’une partie de la population. Par exemple, la taille, l’âge et le poids des élèves dans une école.

Ainsi, les données (chiffres ou mesures collectés à partir de l’observation) peuvent être de natures différentes :

Données discrètes. Ce sont des réponses numériques qui surgissent d’un processus de comptage.
Données continues. Ce sont des réponses numériques qui surgissent d’un processus de mesure.

Échelles de mesure en statistique descriptive

Mesurer est le processus qui consiste à lier des concepts abstraits à des indicateurs empiriques. Le résultat est la mesure.

Il existe quatre échelles de mesure possibles, qui s’utilisent pour classer les variables. Ainsi, les propriétés de fiabilité et de validité sont très importantes en statistique descriptives car elles nous parlent de la qualité de la mesure. Car à quoi nous serviraient des données qui ont été mal mesurées ?

Echelle nominale

Avec cette échelle, on assigne des numéros à des catégories qui n’ont pas besoin d’ordre (nous ne pouvons pas dire qu’une catégorie est supérieure à une autre). Par ailleurs, ces catégories sont mutuellement exclusives. Un exemple de cela peut être le genre ou la couleur.

Cette échelle est assignée aux variables qualitatives ou catégoriques.

Echelle ordinale

Ici, on établit des catégories avec deux niveaux ou plus, qui impliquent un ordre entre elles. Comme pour l’échelle antérieure, il s’agit de catégories mutuellement exclusives, mais nous pouvons désormais situer les valeurs des variables dans un ordre précis. Par exemple, cette échelle pourrait se trouver dans les réponses d’un questionnaire :

Pas du tout d’accord
En désaccord
Indifférent
D’accord
Totalement d’accord

Ces options de réponse peuvent se codifier à travers des numéros qui vont de un à cinq et suggèrent un ordre préétabli. Cependant, nous ne pouvons pas connaître la distance qu’il y a entre deux catégories, à moins d’utiliser des procédés statistiques avancés et d’essayer de l’estimer. Nous pouvons donc dire que l’objet de la recherche possède plus ou moins quelque chose, mais nous ne pouvons pas mesurer ce quelque chose (intelligence, mémoire, anxiété, etc.).

Cette échelle s’assigne aussi aux variables qualitatives.

Echelle d’intervalle

Avec cette échelle, on quantifie la distance entre les valeurs. La mesure de l’intervalle possède en outre les caractéristiques des deux mesures antérieures. Elle établit donc la distance entre une mesure et une autre.

L’échelle d’intervalle s’applique à des variables continues. Cependant, le zéro absolu n’est pas possible avec cette échelle. Un exemple clair de ce type de mesure est un thermomètre. Lorsque ce dernier affiche zéro degrés, cela n’est pas synonyme d’absence de température.

Cette échelle s’applique à des variables quantitatives.

Echelle de raison

Pour terminer, cette échelle reprend les caractéristiques des précédentes. Elle détermine la distance exacte entre les intervalles d’une catégorie. Par ailleurs, elle a un point de zéro absolu qui détermine l’inexistence d’une caractéristique ou d’un attribut. Par exemple, le nombre d’enfants : zéro enfants signifie absence d’enfants.

Cette échelle s’applique à des variables quantitatives.

Fréquences dans la statistique descriptive

Une distribution de fréquences est une liste des valeurs possibles (ou intervalles) que prend une variable, en plus du nombre d’observations pour chaque valeur.

La fréquence absolue enregistre le nombre de fois où apparaît une certaine valeur parmi les observations.
La fréquence relative enregistre la proportion ou le pourcentage de survenance d’une valeur parmi les observations.

Cette distribution de fréquences est normalement représentée par des tableaux. Ces derniers doivent inclure toutes les valeurs possibles d’une variable. Par ailleurs, on doit y indiquer le total d’observations (n) qui ont été faites. Lorsque nous avons une grande quantité de données et que certaines ont des fréquences très faibles, il convient de les regrouper dans des intervalles.

Indicateurs

Enfin, les indicateurs en statistique s’utilisent pour décrire un ensemble de données à travers un nombre. Ce nombre résume une caractéristique de la distribution des données analysées. Certains de ces indicateurs sont :

Des indicateurs de la tendance centrale (moyenne, mode)
Des indicateurs de dispersions (variance, minimum/maximum, rang)

Ainsi, avec l’aide de ces concepts, la statistique descriptive se charge de dépurer, d’organiser et de calculer des statistiques et représentations de données pour offrir au chercheur (et par extension à la communauté scientifique) une carte complète de ce qu’il s’est passé lors de son étude.