Coeficient de correlació de Pearson

De la Viquipèdia, l'enciclopèdia lliure

Dins l'entorn de l'estadística, el coeficient de correlació de Pearson és un índex que mesura la relació lineal entre dues variables quantitatives.[1][2] A diferència de la covariància, la correlació de Pearson és independent de l'escala de mesura de les variables.

Definició[modifica]

El coeficient de correlació entre dues variables aleatòries X i Y és el quocient de la seva covariància pel producte de les seves desviacions estàndard:

on és la covariància de i i les desviacions típiques de les distribucions marginals.

El valor de l'índex de correlació varia en l'interval [-1,+1]:[3][4][5]

  • Si r = 1, hi ha una correlació positiva perfecta. L'índex indica una dependència total entre les dues variables anomenada relació directa: quan una d'elles augmenta, l'altra també ho fa en proporció constant.
  • Si 0 <r <1, hi ha una correlació positiva.
  • Si r = 0, no existeix relació lineal. Però això no necessàriament implica que les variables són independents: poden existir encara relacions no lineals entre les dues variables.
  • Si -1 <r <0, hi ha una correlació negativa.
  • Si r = -1, hi ha una correlació negativa perfecta. L'índex indica una dependència total entre les dues variables anomenada relació inversa: quan una d'elles augmenta, l'altra disminueix en proporció constant.

Referències[modifica]

  1. Correlation Coefficient. MathWorld. (anglès)
  2. «Chegg.com» (en anglès). [Consulta: 27 gener 2022].
  3. «What Is the Pearson Coefficient?» (en anglès). [Consulta: 27 gener 2022].
  4. «Pearson Correlation Coefficient» (en anglès americà), 18-09-2019. [Consulta: 27 gener 2022].
  5. «What is the Pearson Correlation Coefficient? - Definition | Meaning | Example» (en anglès americà). [Consulta: 27 gener 2022].

Vegeu també[modifica]