Corrélation et régression avec JASP
Autoformation
S’autoformer en statistique via des tutoriels et des capsules vidéo
Corrélation & régression avec JASP
Dans ce tutoriel, nous produisons des corrélations et des régressions linéaires et logistiques à l’aide du logiciel gratuit JASP.
Pour vous pratiquer, vous pouvez télécharger les données (fichier CSV) utilisées dans ce tutoriel !
Étape 1 : Chargez et vérifiez vos données
JASP vous permet d’ouvrir de charger des données à partir de différent type de fichiers. Un des formats qui est commode et souvent facile à exporter à partir d’autres logiciels est le format CSV (comma-separated value).
Le menu de JASP se trouve en haut à gauche. Cliquez dessus, puis cliquez sur « Ouvrir », avant de sélectionner votre fichier CSV contenant les données.
Vous devriez instantanément voir apparaître un tableau semblable à un chiffrier Excel. Avant de commencer vos analyses, jetez un coup d’œil rapide à vos données. Assurez-vous que les libellés de vos valeurs sont bien retranscrits et que toutes vos variables et vos participants sont là.
Si vous devez apporter des modifications à vos variables, vous pouvez le faire en cliquant sur le haut de la colonne appropriée.
- Cliquer sur l’icône vous permet de modifier la nature de la variable (échelle, ordinale ou catégorielle).
- Cliquer sur le nom de la variable vous permet d’attribuer des étiquettes à certaines valeurs.

Étape 2 : Observer les données
Commençons par observer nos données de manière descriptive. En séparant nos données en deux catégories basées sur le type d’emploi (Technicien et Gestionnaire) nous observerons le salaire, la satisfaction et le stress au travail.
- Cliquez sur « Descriptives » dans le menu du haut.
- Insérez les variables d’intérêt dans la case « Variables ». Vous verrez alors apparaitre un tableau vous présentant les analyses descriptives de bases pour chacune de ces variables.
- Par la suite, insérez la variable « Job » dans la case « split ». Vous verrez alors que le tableau de résultats vous présentera les analyses par type d’emplois.
Référez-vous au tutoriel d’analyses descriptives pour plus de détails et d’options.

Étape 3 : Choisir l'analyse
Corrélation
La corrélation indique la force et la direction de la relation linéaire entre deux variables. Les corrélations sont utiles, car elles peuvent indiquer une relation prédictive facile à interpréter.
Dans notre exemple, nous nous intéressons à savoir s’il existe une corrélation entre nos trois variables à l’étude : le salaire, le stress et la satisfaction.
Régression linéaire
La régression linéaire permet de modéliser la relation entre une variable dépendante et une ou plusieurs variables indépendantes. Notez que la variable dépendante doit être continue (numérique). Cette analyse permet d’obtenir un modèle pouvant prédire des réponses à venir.
Dans notre exemple, nous nous intéressons à savoir si la satisfaction au travail et le salaire des employés sont de bons prédicteurs de leur stress au travail.
Régression logistique
La régression logistique est très similaire à la régression linéaire, car elle permet également de modéliser la relation entre une variable dépendante et une ou plusieurs variables indépendantes. Toutefois, elle est utilisée lorsque la variable dépendante est de nature nominale (catégorielle) et inclut deux classes (groupes). Ce type d’analyse permet d’obtenir un modèle pouvant prédire l’appartenance à un groupe.
Dans notre exemple, nous nous intéressons à savoir la satisfaction au travail, le salaire des employés et leur stress au travail permettent de prédire les chances d’appartenance à l’un de ces deux types d’emplois : technicien ou gestionnaire.

Étape 4 : Corrélation
Après avoir cliqué sur l’onglet « Regression », choisissez « Correlation ».
Parmi les variables disponibles, sélectionnez vos variables à l’étude et insérez-les dans la boîte « Variables ». Vous pouvez également cliquer sur la case « Heatmap » pour obtenir un graphique résumant les corrélations. Dans notre exemple, nous nous intéressons au salaire, à la satisfaction et au stress des participants et nous voulons savoir si ces trois variables sont corrélées.
Les résultats suggèrent que nos trois variables sont corrélées de façon significative (p < 0.001). (Rappel : par convention, nous concluons qu’un test est significatif lorsque la valeur p est inférieure à .05)
Plus spécifiquement, la satisfaction au travail semble positivement corrélée avec le salaire (r = +.513). C’est-à-dire qu’un salaire plus élevé est un indicateur d’une satisfaction au travail plus élevée.
Toutefois, le stress est négativement corrélé au salaire (r = -.517) et à la satisfaction au travail (r = -.392). C’est-à-dire que chez les employés qui vivent un stress plus élevé, on peut s’attendre à un salaire plus faible et une moins bonne satisfaction au travail.
Note : un lien de corrélation n’est pas un lien de causalité !

Étape 5 : Régression linéaire
Après avoir cliqué sur l’onglet « Regression », choisissez « Linear Regression ».
Parmi les variables disponibles, sélectionnez votre variable d’intérêt et insérez-les dans la boîte « Dependant Variable ».
Par la suite, choisissez les variables indépendantes et insérez-les dans la boîte « Covariate » s’il s’agit de variables continues (le symbole d’échelle) ou dans la case « Factors » s’il s’agit de variable nominale (le symbole des cercles).
Dans notre exemple, nous nous intéressons aux variables qui peuvent prédire le stress de nos participants. Ainsi, le stress sera notre variable dépendante, alors que le salaire et la satisfaction seront nos variables indépendantes.
Les résultats montrent que le salaire est un prédicteur du stress au travail (p < .001), mais pas la satisfaction rapportée par les employés (p > .050). Dans notre exemple, la relation entre le stress et le salaire est négative. Autrement dit, un salaire plus faible semble être un indicateur d’un stress au travail plus élevé.

Étape 6 : Régression logistique
Après avoir cliqué sur l’onglet « Regression », choisissez « Logistic Regression ».
Parmi les variables disponibles, sélectionnez votre variable d’intérêt et insérez-les dans la boîte « Dependant Variable ». Vous pouvez également cliquer sur l’onglet « Statistics » puis cocher la case « Odds ratio » afin de vous aider à interpréter les résultats de l’analyse.
Dans notre exemple, nous voulons observer si le type d’emploi occupé (technicien ou gestionnaire) peut être prédit par nos trois variables. La variable « job » sera donc notre variable dépendante, alors que le salaire, la satisfaction et le stress seront nos variables indépendantes.
Les résultats montrent que les trois variables sont des prédicteurs significatifs (p < .050) du poste occupé par l’employé.

Odds Ratios
Voyons comment utiliser les « Odds Ratios » pour interpréter nos résultats. Il suffit de soustraire 1 au nombre propre à chaque variable. Le nombre obtenu à la suite de cette soustraction est le pourcentage de chance d’appartenir au groupe 1 (tel qu’indiqué dans la sortie de JASP; dans notre cas : les gestionnaires).
- Si le Odds Ratio est plus élevé que 1.00: (Odds ratio – 1) x 100%
- Si le Odds Ratio est plus petit que 1.00: ((1 / Odds ratio) – 1) x 100%
Un salaire plus élevé permet de prédire l’appartenance au poste de gestionnaire:
1.103 – 1 = 10.3%
Pour chaque 1000$ supplémentaire, un employé à 10.3% plus de chance d’être un gestionnaire.
Une satisfaction élevée permet de prédire l’appartenance au poste de gestionnaire.
1.099 – 1 = 9.9%
Pour chaque « point de satisfaction » supplémentaire, un employé a 9.9% plus de chance d’être un gestionnaire.
Un stress plus faible permet de prédire l’appartenance au poste de gestionnaire.
(1/ 0.888) - 1 = 12.6%
Pour chaque « point de stress » en moins, un employé à 12.6% de chance d’être un gestionnaire.
j ai deux variable ordinale et je veux savoir est ce que a variable 1 influe sur 2 comment fair sur jasp
Bonjour Merym, dans l’analyse de corrélation tu peux cliquer sur « Kendall’s tau-b » (si tes variables n’ont pas beaucoup de valeurs distinctes) ou « Spearman’s rho ». Sinon dans plusieurs cas tu peux aussi simplement regarder le coefficient de Pearson.