Calculatrice de coefficient de corrélation R d'échantillon

Auteur: Neo Huang
Révisé par: Nancy Deng
Dernière Mise à jour: 2025-01-23 19:54:24
Usage Total: 6629
Powered by @Calculator Ultra
Partager
Intégrer

Convertisseur d'Unités

  • {{ unit.name }}
  • {{ unit.name }} ({{updateToValue(fromUnit, unit, fromValue)}})

Citation

Utilisez la citation ci-dessous pour l’ajouter à votre bibliographie:

{{ citationMap[activeStyle] }}

Find More Calculator

Le coefficient de corrélation linéaire (R) est une mesure statistique utilisée pour déterminer la force et la direction de la relation linéaire entre deux variables. Il varie de -1 à 1, où -1 indique une corrélation négative parfaite, 1 indique une corrélation positive parfaite et 0 indique l'absence de corrélation.

Contexte historique

Le concept de corrélation a été introduit pour la première fois par Sir Francis Galton à la fin du XIXe siècle. Il cherchait à mesurer la relation entre différentes variables, ce qui a conduit au développement du coefficient de corrélation par Karl Pearson, son élève. Le coefficient de corrélation de Pearson est largement utilisé aujourd'hui comme "coefficient de corrélation linéaire".

Formule de calcul

Le coefficient de corrélation linéaire (R) entre deux ensembles de données \(X\) et \(Y\) est calculé à l'aide de la formule suivante :

\[ R = \frac{n\sum{XY} - \sum{X}\sum{Y}}{\sqrt{\left(n\sum{X^2} - (\sum{X})^2\right) \left(n\sum{Y^2} - (\sum{Y})^2\right)}} \]

Où :

  • \(n\) est le nombre de points de données.
  • \(\sum{X}\) et \(\sum{Y}\) sont les sommes des valeurs \(X\) et \(Y\) respectivement.
  • \(\sum{XY}\) est la somme des produits des valeurs \(X\) et \(Y\) correspondantes.
  • \(\sum{X^2}\) et \(\sum{Y^2}\) sont les sommes des carrés des valeurs \(X\) et \(Y\).

Exemple de calcul

Considérons deux ensembles de données :

  • \(X = [1, 2, 3, 4]\)
  • \(Y = [2, 4, 6, 8]\)

Calcul étape par étape :

  1. \(\sum{X} = 1 + 2 + 3 + 4 = 10\)
  2. \(\sum{Y} = 2 + 4 + 6 + 8 = 20\)
  3. \(\sum{XY} = (1 \times 2) + (2 \times 4) + (3 \times 6) + (4 \times 8) = 60\)
  4. \(\sum{X^2} = 1^2 + 2^2 + 3^2 + 4^2 = 30\)
  5. \(\sum{Y^2} = 2^2 + 4^2 + 6^2 + 8^2 = 120\)
  6. Appliquez la formule :

\[ R = \frac{4(60) - (10)(20)}{\sqrt{(4(30) - (10)^2) \cdot (4(120) - (20)^2)}} = 1 \]

Ceci indique une corrélation positive parfaite.

Importance et scénarios d'utilisation

  • Analyse de données : Il est couramment utilisé pour mesurer les relations entre différentes variables dans des domaines tels que la finance, la biologie et les sciences sociales.
  • Modélisation prédictive : Dans l'analyse prédictive, la corrélation permet d'évaluer quelles variables pourraient avoir un pouvoir prédictif sur d'autres.
  • Recherche expérimentale : Aide les scientifiques à déterminer la force des relations entre les variables dans les expériences contrôlées.

FAQ courantes

  1. Quelle est une bonne valeur pour R ? Une valeur proche de 1 ou -1 indique une corrélation forte, tandis que les valeurs proches de 0 suggèrent une corrélation faible ou nulle.

  2. R peut-il être supérieur à 1 ou inférieur à -1 ? Non, R est toujours compris entre -1 et 1.

  3. Une corrélation élevée implique-t-elle une causalité ? Non, la corrélation n'implique pas la causalité. Elle indique seulement que deux variables évoluent ensemble.