La corrélation des données est une mesure de l'influence d'une variable sur une autre. Ainsi, si pour une variable x donnée, la variable y peut être prédite dans une sorte de relation linéaire, on peut dire qu'elles sont corrélées.
Pour les données normalement distribuées, on utilise le coefficient de corrélation de Pearson, r, dont la valeur est comprise entre -1 et 1. Zéro signifie qu'il n'y a pas de corrélation ; un nombre négatif signifie que l'augmentation de x diminue y. Plus la valeur est proche de 1 (ou -1), meilleure est la corrélation.
Notez que pour une équation linéaire donnée, y=mx + c, où m est la pente et c l'ordonnée à l'origine de l'axe des y, le coefficient de corrélation n'est pas le même que la pente.
Pour les données qui ne sont pas normalement distribuées, on utilise les corrélations de Spearmans ou de Kendalls.
Ajoutez à cette page des informations qu'il serait utile d'avoir à portée de main lors d'une consultation, telles qu'une adresse web ou un numéro de téléphone. Ces informations seront toujours affichées lorsque vous visiterez cette page.