Lorsque nous posons des questions telles que «est-X liée à Y? Il fait tellement chaud que les gens ne vont pas près de la boutique, et les ventes commencent à baisser. L`étendue de la corrélation entre deux variables, par Convention, est notée r, et la corrélation entre la variable X et la variable Y est indiquée par rXY. Plus la taille de l`échantillon est petite, plus il est probable que nous observons une corrélation qui est plus loin de 0, même si la vraie corrélation (obtenue si nous avions des données pour l`ensemble de la population) était 0. Il existe d`autres façons de calculer un coefficient de corrélation, tel que «coefficient de corrélation du rang de Spearman». Apprenez à visualiser la corrélation avec une matrice de corrélation! Dans ce cas, la faible aberrante donne une «illusion» d`une relation linéaire positive, alors qu`en réalité, il n`y a pas de relation linéaire entre X et Y. La relation est non linéaire (parfois appelée curvilinéaire), mais la corrélation r = 0. Par conséquent, cet exemple fournit une motivation pour la nécessité de compléter le nuage de dispersion avec une mesure numérique qui mesurera la force de la relation linéaire entre deux variables quantitatives. La variable indépendante (IV) (prédicteur) est placée sur l`axe X et la variable dépendante (DV) est placée sur l`axe Y. Mais nous pouvons voir les données suit une belle courbe qui atteint un pic autour de 25 ° C. La valeur de la corrélation que nous trouvons entre les deux variables est r = 0.

Nos données décrivent une relation assez simple non linéaire (parfois appelée curviligne): la quantité de carburant consommée diminue rapidement à un minimum pour une voiture conduisant 60 kilomètres par heure, puis augmente graduellement pour des vitesses dépassant 60 kilomètres par heure. Ces variables partagent une certaine variation. À peu près tous les problèmes communs qui peuvent rendre l`analyse statistique dénuée de sens peuvent survenir avec des corrélations. Pour voir comment les variables sont connectées, nous utiliserons la formule. La valeur de corrélation calculée est 0 (je l`ai travaillé out), ce qui signifie «pas de corrélation». Dans l`activité précédente, nous avons vu un exemple où il y avait une relation linéaire positive entre les deux variables, et y compris l`aberrante juste “renforcé” il. Mais le calcul de corrélation n`est pas assez “intelligent” pour voir cela. Les outils statistiques qui seront introduits ici ne sont appropriés que pour l`examen des relations linéaires, et comme nous le verrons, quand ils sont utilisés dans des situations non linéaires, ces outils peuvent conduire à des erreurs dans le raisonnement. Par conséquent, la corrélation à elle seule n`indique pas si une relation est linéaire ou non. Si vous voyez ce message, cela signifie que nous avons du mal à charger des ressources externes sur notre site Web.

Lorsqu`un coefficient de corrélation (r) est au carré (R2), cela donne le coefficient de détermination qui est le pourcentage de variance partagée entre les deux variables. Lorsque la valeur d`une variable est élevée, la valeur d`une autre variable tend à être élevée (corrélation positive) ou faible (corrélation négative). Notez que les valeurs Y ont changé, mais les corrélations sont les mêmes.