L'inférence statistique en psychologie

26 avril, 2020
La statistique inférentielle s'intéresse à l'extrapolation des données d'une population. On pourrait dire que c'est comme faire des généralisations sur celle-ci.
 

Quand nous voulons étudier une population, deux choses peuvent se passer. Le plus courant est que nous ne connaissions pas le modèle théorique de celle-ci. Néanmoins, nous pourrons sûrement l’observer, prendre un échantillon et le décrire. Et la question est la suivante : en utilisant les informations obtenues d’une petite partie de la population, peut-on déduire le comportement de l’ensemble de celle-ci ? C’est là qu’intervient l’inférence statistique.

Ainsi, l’inférence statistique en psychologie permet de valider ou de réfuter les hypothèses de la statistique descriptive. Cela est à la fois pour valider un modèle possible pour la population comme pour estimer les paramètres de ce modèle.

De cette manière, nous pourrions dire que l’inférence statistique est la partie de la statistique qui se charge de généraliser les résultats obtenus à partir d’un échantillon. On se base pour cela sur des distributions de probabilité. Cela favorise une erreur que nous pouvons interpréter comme une mesure de confiance, associée aux résultats.

 

L’objectif de l’inférence statistique n’est autre que de générer des modèles et prédictions associés aux phénomènes en prenant en compte que les observations sont aléatoires. Son utilisation se centre sur la création de modèles sur les données d’un côté, et sur l’extraction des inférences autour de la population de l’autre côté.

Ces inférences peuvent prendre plusieurs formes :

  • Réponses oui/non (preuve d’hypothèse)
  • Estimations des caractéristiques numériques (estimation)
  • Pronostics de futures observations
  • Descriptions d’association (corrélation)
  • Modélisation des relations entre variables de Sam ou Statistique Apprentissage Machine (analyse de régression)
Une tablette avec des statistiques

Caractéristiques de l’inférence statistique

Extrapolation et généralisation

 

L’inférence statistique se charge d’extrapoler les informations d’une population. Sa méthode d’action consiste à prendre des données sur un échantillon d’une population. En effet, prendre des données de toute la population serait très coûteux. Le problème est que de l’échantillon apparaît l’erreur.

Ainsi, l’inférence statistique établit des conclusions sur lesquelles on peut compter jusqu’à un certain point en lien avec la population qui appartient audit échantillon. Il s’agit de conclusions associées à une marge de confiance. Cette marge dépendra de différentes variables telles que la relation qui existe entre la taille de l’échantillon et de population ou la variabilité qui existe dans la population des variables étudiées.

Inférence statistique : validité et réalisme dans les observations

On considère qu’il s’agit du type de statistique le plus valide et le plus réaliste pour l’échange des informations entre les chercheurs.

Deux personnes en train d'étudier l'inférence statistique
 

Parties de l’inférence statistique

Tel que nous l’avons évoqué auparavant, l’inférence statistique agit via la stimulation de paramètres et le contraste d’hypothèse.

L’estimation de paramètres

L’estimation de paramètres consiste à chercher les valeurs les plus probables d’un paramètre dans la population -par exemple, la moyenne. En ne connaissant pas la population dans sa totalité, on ne peut pas non plus préciser une valeur au-delà d’un intervalle (intervalle de confiance).

Cet intervalle sera accompagné de la probabilité que le paramètre s’y trouve, autrement dit, le niveau de confiance. Ou bien, sa complémentaire (probabilité d’erreur). En outre, à l’intérieur de cet intervalle de confiance, l’une des valeurs est considérée comme l’estimation optimale. C’est la meilleure estimation possible.

Admettons que nous voulons estimer la moyenne de la population dans une variable comme par exemple, l’indice de masse corporelle. Nous obtenons un échantillon de la population dans lequel la valeur sera semblable à celle de l’échantillon. Néanmoins, plus l’échantillon de la population est important, plus il est sûr que la valeur obtenue corresponde à celle de la population.

 

Ainsi, si d’une population de 100 000 habitants, nous obtenons un échantillon de 500 personnes, nous obtiendrons une moyenne de l’IMC qui se rapprochera plus de la moyenne de la population que si nous obtenions un échantillon de 200 personnes (loi des grands nombres). En outre, il est intéressant de noter qu’il est aussi probable que la valeur de la population soit plus grande ou plus faible que celle de l’échantillon. Cela s’explique par le fait que nous considérons que la variable se dessine tout au long du continu « IMC » en suivant une distribution normale.

Comment répondons-nous à la question : quelle est la valeur d’un paramètre ?

Pour estimer la valeur de -par exemple- la moyenne dans une population, dans la statistique descriptive, on ne définira qu’un seul nombre. Néanmoins, l’inférence statistique utilisera trois nombres. Les voici :

  • L’estimation optimale
  • L’erreur d’estimation
  • Le niveau de confiance (ou la marge d’erreur)

Ces trois nombres formeront l’intervalle de confiance. Il s’agit d’un intervalle dans lequel nous avons un certain niveau de sécurité (« niveau de confiance ») qui inclut la valeur réelle de la population. Ses limites supérieure et inférieure sont obtenues quand on se réfère à la moyenne, en additionnant et soustrayant l’erreur d’estimation à la valeur de l’estimation optimale.

 

Le contraste d’hypothèse

Le deuxième partie de l’inférence statistique consiste au contraste d’hypothèse. Cela permet de déterminer si une affirmation est vraie ou non dans la population, en termes probabilistes. Les types de contraste les plus courants sont :

  • Comparaison d’échantillons : par exemple, notre hypothèse peut être que les grandes personnes possèdent un IMC moindre que les petites personnes
  • Association entre variables : par exemple, notre hypothèse peut être que l’IMC et la taille sont deux variables liées

Ainsi, le besoin de l’inférence statistique semble évident dans le domaine de la psychologie. Nous pouvons par exemple changer l’IMC par l’intelligence, la mémoire, l’attention, etc. En réalisant des inférences, nous estimons d’une manière générale les caractéristiques d’une population. Cela permet aux chercheurs de parvenir à des conclusions sur les populations. Ce qui peut être très important, par exemple, pour déterminer quelles mesures prendre au niveau social.

 

 

  • Casanova, J. La Estadística inferencial. Retrieved from http://www.uam.es/personal_pdi/medicina/casanova/EstadInferencial.pdf.
  • Espejo Miranda, I. (2015). Inferencia estadística. Cádiz: UCA, Servicio de Publicaciones.
  • Estadística Inferencial – EcuRed. Retrieved from https://www.ecured.cu/Estadística_Inferencial