Com es calcula el coeficient de correlació lineal

Autora: Eric Farmer
Data De La Creació: 7 Març 2021
Data D’Actualització: 1 Juliol 2024
Anonim
Ecuación de correlación lineal y coeficiente de correlación (Ejercicio 1)
Vídeo: Ecuación de correlación lineal y coeficiente de correlación (Ejercicio 1)

Content

El coeficient de correlació (o coeficient de correlació lineal) es denota com a "r" (en casos rars com a "ρ") i caracteritza la correlació lineal (és a dir, la relació que dóna algun valor i direcció) de dues o més variables. El valor del coeficient se situa entre -1 i +1, és a dir, la correlació pot ser positiva i negativa. Si el coeficient de correlació és -1, hi ha una correlació negativa perfecta; si el coeficient de correlació és +1, hi ha una correlació positiva perfecta. En cas contrari, hi ha una correlació positiva entre les dues variables, una correlació negativa o cap correlació. El coeficient de correlació es pot calcular manualment, amb calculadores en línia gratuïtes o amb una bona calculadora gràfica.

Passos

Mètode 1 de 4: càlcul manual del coeficient de correlació

  1. 1 Recopilar dades. Abans de començar a calcular el coeficient de correlació, estudieu aquests parells de nombres. Millor escriure-les en una taula que es pot disposar verticalment o horitzontalment. Etiqueu cada fila o columna amb "x" i "y".
    • Per exemple, es donen quatre parells de valors (nombres) de les variables "x" i "y". Podeu crear la taula següent:
      • x || y
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  2. 2 Calculeu la mitjana aritmètica "x". Per fer-ho, suma tots els valors x i, a continuació, divideix el resultat pel nombre de valors.
    • En el nostre exemple, hi ha quatre valors per a la variable "x". Per calcular la mitjana aritmètica "x", afegiu aquests valors i, a continuació, dividiu la suma per 4. Els càlculs s'escriuen de la següent manera:
    • μx=(1+2+4+5)/4{ displaystyle mu _ {x} = (1 + 2 + 4 + 5) / 4}
    • μx=12/4{ displaystyle mu _ {x} = 12/4}
    • μx=3{ displaystyle mu _ {x} = 3}
  3. 3 Cerqueu la mitjana aritmètica "y". Per fer-ho, seguiu els mateixos passos, és a dir, sumeu tots els valors y i, a continuació, dividiu la suma pel nombre de valors.
    • En el nostre exemple, es donen quatre valors de la variable "y". Afegiu aquests valors i, a continuació, dividiu la suma per 4. Els càlculs s’escriuran de la següent manera:
    • μy=(1+3+5+7)/4{ displaystyle mu _ {y} = (1 + 3 + 5 + 7) / 4}
    • μy=16/4{ displaystyle mu _ {y} = 16/4}
    • μy=4{ displaystyle mu _ {y} = 4}
  4. 4 Calculeu la desviació estàndard "x". Després de calcular les mitjanes de "x" i "y", busqueu les desviacions estàndard d'aquestes variables. La desviació estàndard es calcula mitjançant la fórmula següent:
    • σx=1n1Σ(xμx)2{ displaystyle sigma _ {x} = { sqrt {{ frac {1} {n-1}} Sigma (x- mu _ {x}) ^ {2}}}}
    • En el nostre exemple, els càlculs s’escriuran així:
    • σx=141((13)2+(23)2+(43)2+(53)2){ displaystyle sigma _ {x} = { sqrt {{ frac {1} {4-1}} * ((1-3) ^ {2} + (2-3) ^ {2} + ( 4-3) ^ {2} + (5-3) ^ {2})}}}
    • σx=13(4+1+1+4){ displaystyle sigma _ {x} = { sqrt {{ frac {1} {3}} * (4 + 1 + 1 + 4)}}}
    • σx=13(10){ displaystyle sigma _ {x} = { sqrt {{ frac {1} {3}} * (10)}}}
    • σx=103{ displaystyle sigma _ {x} = { sqrt { frac {10} {3}}}}
    • σx=1,83{ displaystyle sigma _ {x} = 1,83}
  5. 5 Calculeu la desviació estàndard "y". Seguiu els passos descrits al pas anterior. Utilitzeu la mateixa fórmula, però connecteu els valors y.
    • En el nostre exemple, els càlculs s’escriuran així:
    • σy=141((14)2+(34)2+(54)2+(74)2){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {4-1}} * ((1-4) ^ {2} + (3-4) ^ {2} + ( 5-4) ^ {2} + (7-4) ^ {2})}}}
    • σy=13(9+1+1+9){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {3}} * (9 + 1 + 1 + 9)}}}
    • σy=13(20){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {3}} * (20)}}}
    • σy=203{ displaystyle sigma _ {y} = { sqrt { frac {20} {3}}}}
    • σy=2,58{ displaystyle sigma _ {y} = 2,58}
  6. 6 Anoteu la fórmula bàsica per calcular el coeficient de correlació. Aquesta fórmula inclou les mitjanes, les desviacions estàndard i el nombre (n) de parells de nombres de les dues variables. El coeficient de correlació es denota com a "r" (en casos rars com a "ρ"). Aquest article utilitza una fórmula per calcular el coeficient de correlació de Pearson.
    • ρ=(1n1)Σ(xμxσx)(yμyσy){ displaystyle rho = left ({ frac {1} {n-1}} right) Sigma left ({ frac {x- mu _ {x}} { sigma _ {x}} } right) * left ({ frac {y- mu _ {y}} { sigma _ {y}}} right)}
    • Aquí i en altres fonts, les quantitats es poden indicar de diferents maneres. Per exemple, algunes fórmules contenen "ρ" i "σ", mentre que altres contenen "r" i "s". Alguns llibres de text ofereixen fórmules diferents, però són contrapartides matemàtiques a la fórmula anterior.
  7. 7 Calculeu el coeficient de correlació. Heu calculat les mitjanes i les desviacions estàndard d’ambdues variables, de manera que podeu utilitzar la fórmula per calcular el coeficient de correlació. Recordeu que "n" és el nombre de parells de valors de les dues variables. Altres valors s'han calculat anteriorment.
    • En el nostre exemple, els càlculs s’escriuran així:
    • ρ=(1n1)Σ(xμxσx)(yμyσy){ displaystyle rho = left ({ frac {1} {n-1}} right) Sigma left ({ frac {x- mu _ {x}} { sigma _ {x}} } right) * left ({ frac {y- mu _ {y}} { sigma _ {y}}} right)}
    • ρ=(13){ displaystyle rho = left ({ frac {1} {3}} right) *}[(131,83)(142,58)+(231,83)(342,58){ displaystyle left ({ frac {1-3} {1.83}} right) * left ({ frac {1-4} {2.58}} right) + left ({ frac {2 -3} {1.83}} right) * left ({ frac {3-4} {2.58}} right)}
         +(431,83)(542,58)+(531,83)(742,58){ displaystyle + left ({ frac {4-3} {1.83}} right) * left ({ frac {5-4} {2.58}} right) + left ({ frac { 5-3} {1.83}} right) * left ({ frac {7-4} {2.58}} right)}]
    • ρ=(13)(6+1+1+64,721){ displaystyle rho = left ({ frac {1} {3}} right) * left ({ frac {6 + 1 + 1 + 6} {4.721}} right)}
    • ρ=(13)2,965{ displaystyle rho = left ({ frac {1} {3}} right) * 2.965}
    • ρ=(2,9653){ displaystyle rho = left ({ frac {2,965} {3}} right)}
    • ρ=0,988{ displaystyle rho = 0.988}
  8. 8 Analitzeu el resultat. En el nostre exemple, el coeficient de correlació és de 0,988. Aquest valor caracteritza d'alguna manera un determinat conjunt de parells de nombres. Fixeu-vos en el signe i la magnitud del valor.
    • Com que el valor del coeficient de correlació és positiu, hi ha una correlació positiva entre les variables "x" i "y". És a dir, a mesura que augmenta el valor de "x", també augmenta el valor de "y".
    • Com que el valor del coeficient de correlació és molt proper a +1, els valors de les variables "x" i "y" estan molt correlacionats. Si col·loqueu punts al pla de coordenades, es situaran a prop d’alguna línia recta.

Mètode 2 de 4: utilitzar calculadores en línia per calcular el coeficient de correlació

  1. 1 Cerqueu una calculadora a Internet per calcular el coeficient de correlació. Aquest coeficient es calcula sovint a les estadístiques. Si hi ha molts parells de nombres, és gairebé impossible calcular manualment el coeficient de correlació. Per tant, hi ha calculadores en línia per calcular el coeficient de correlació. En un motor de cerca, introduïu "calculadora del coeficient de correlació" (sense cometes).
  2. 2 Introduïu dades. Consulteu les instruccions del lloc web per introduir les dades correctes (parells de números). És imprescindible introduir els parells de nombres adequats; en cas contrari, obtindreu un resultat equivocat. Recordeu que diferents llocs web tenen diferents formats d’entrada.
    • Per exemple, a http://ncalculators.com/statistics/correlation-coefficient-calculator.htm, els valors de les variables x i y s’introdueixen en dues línies horitzontals. Els valors estan separats per comes. És a dir, en el nostre exemple, els valors "x" s'introdueixen així: 1,2,4,5 i els valors "y" així: 1,3,5,7.
    • En un altre lloc, http://www.alcula.com/calculators/statistics/correlation-coefficient/, les dades s’introdueixen verticalment; en aquest cas, no confongueu els parells de números corresponents.
  3. 3 Calculeu el coeficient de correlació. Després d’introduir les dades, només cal que feu clic al botó "Calcula", "Calcula" o similar per obtenir el resultat.

Mètode 3 de 4: utilitzar una calculadora gràfica

  1. 1 Introduïu dades. Agafeu una calculadora gràfica, aneu al mode de càlcul estadístic i seleccioneu l'ordre "Edita".
    • Les diferents calculadores requereixen prémer tecles diferents. En aquest article es parla de la calculadora Texas Instruments TI-86.
    • Premeu [2n] - Estadística (a sobre de la tecla +) per entrar al mode de càlcul estadístic. A continuació, premeu F2 - Edita.
  2. 2 Suprimiu les dades desades anteriorment. La majoria de calculadores conserven les estadístiques que introduïu fins que les esborreu. Per evitar confondre les dades antigues amb les noves, primer suprimiu la informació emmagatzemada.
    • Utilitzeu les tecles de fletxa per moure el cursor i ressalteu l'encapçalament "xStat". A continuació, premeu Esborra i Retorn per esborrar tots els valors introduïts a la columna xStat.
    • Utilitzeu les tecles de fletxa per ressaltar l'encapçalament "yStat". A continuació, premeu Esborra i Retorn per esborrar tots els valors introduïts a la columna yStat.
  3. 3 Introduïu les dades inicials. Utilitzeu les tecles de fletxa per moure el cursor a la primera cel·la sota el títol "xStat". Introduïu el primer valor i premeu Retorn. A la part inferior de la pantalla, es mostra "xStat (1) = __", i el valor introduït substitueix un espai. Després de prémer Retorn, el valor introduït apareixerà a la taula i el cursor es desplaçarà a la línia següent; apareixerà "xStat (2) = __" a la part inferior de la pantalla.
    • Introduïu tots els valors de la variable "x".
    • Després d’introduir tots els valors de x, utilitzeu les tecles de fletxa per anar a la columna yStat i introduïu els valors de y.
    • Després d’introduir tots els parells de números, premeu Surt per esborrar la pantalla i sortir del mode d’agregació.
  4. 4 Calculeu el coeficient de correlació. Caracteritza la proximitat de les dades a una determinada línia recta. La calculadora gràfica pot determinar ràpidament la recta adequada i calcular el coeficient de correlació.
    • Feu clic a Estadística - Calc. Al TI-86, premeu [2n] - [Estadística] - [F1].
    • Seleccioneu la funció de regressió lineal. Al TI-86, premeu [F3], que porta l'etiqueta "LinR". La pantalla mostrarà la línia "LinR _" amb un cursor parpellejant.
    • Ara introduïu els noms de dues variables: xStat i yStat.
      • A TI-86, obriu la llista de noms; per fer-ho, premeu [2n] - [Llista] - [F3].
      • Les variables disponibles es mostren a la línia inferior de la pantalla. Seleccioneu [xStat] (probablement haureu de prémer F1 o F2 per fer-ho), introduïu una coma i, a continuació, seleccioneu [yStat].
      • Premeu Retorn per processar les dades introduïdes.
  5. 5 Analitzeu els resultats. En prémer Retorn, la pantalla mostrarà la informació següent:
    • y=a+bx{ displaystyle y = a + bx}: aquesta és la funció que descriu la línia. Tingueu en compte que la funció no està escrita en forma estàndard (y = kx + b).
    • a={ displaystyle a =}... Aquesta és la coordenada y de la intersecció de la recta amb l'eix y.
    • b={ displaystyle b =}... Aquest és el pendent de la línia.
    • corr={ displaystyle { text {corr}} =}... Aquest és el coeficient de correlació.
    • n={ displaystyle n =}... Aquest és el nombre de parells de números que s’han utilitzat en els càlculs.

Mètode 4 de 4: explicació dels conceptes bàsics

  1. 1 Comprendre el concepte de correlació. La correlació és la relació estadística entre dues quantitats. El coeficient de correlació és un valor numèric que es pot calcular per a qualsevol conjunt de dades. El valor del coeficient de correlació sempre es troba entre -1 i +1 i caracteritza el grau de relació entre dues variables.
    • Per exemple, donada l’alçada i l’edat dels nens (uns 12 anys). El més probable és que hi hagi una forta correlació positiva, perquè els nens augmenten amb l’edat.
    • Un exemple de correlació negativa: segons de penalització i temps dedicat a l’entrenament de biatló, és a dir, com més entreni un atleta, menys segons es concediran.
    • Finalment, de vegades hi ha molt poca correlació (positiva o negativa), com ara entre la mida de les sabates i les puntuacions matemàtiques.
  2. 2 Recordeu com calcular la mitjana aritmètica. Per calcular la mitjana (o mitjana) aritmètica, heu de trobar la suma de tots aquests valors i després dividir-la pel nombre de valors. Recordeu que la mitjana aritmètica és necessària per calcular el coeficient de correlació.
    • El valor mitjà d’una variable s’indica amb una lletra amb una barra horitzontal a sobre. Per exemple, en el cas de les variables "x" i "y", els seus valors mitjans es denoten de la següent manera: x̅ i y̅. De vegades, la mitjana es denota amb la lletra grega "μ" (mu). Per escriure la mitjana aritmètica dels valors de la variable "x", utilitzeu la notació μx o μ (x).
    • Per exemple, tenint en compte els valors següents per a la variable "x": 1,2,5,6,9,10. La mitjana aritmètica d’aquests valors es calcula de la següent manera:
      • μx=(1+2+5+6+9+10)/6{ displaystyle mu _ {x} = (1 + 2 + 5 + 6 + 9 + 10) / 6}
      • μx=33/6{ displaystyle mu _ {x} = 33/6}
      • μx=5,5{ displaystyle mu _ {x} = 5.5}
  3. 3 Tingueu en compte la importància de la desviació estàndard. En estadístiques, la desviació estàndard caracteritza el grau de dispersió dels nombres en relació amb la seva mitjana. Si la desviació estàndard és petita, els números són propers a la mitjana; si la desviació estàndard és gran, les xifres estan lluny de la mitjana.
    • La desviació estàndard s'indica amb la lletra "s" o la lletra grega "σ" (sigma). Per tant, la desviació estàndard dels valors de la variable "x" es denota de la següent manera: sx o σx.
  4. 4 Recordeu el símbol de l’operació de suma. El símbol de suma és un dels símbols més comuns en matemàtiques i indica la suma de valors. Aquest símbol és la lletra grega "Σ" (majúscula sigma).
    • Per exemple, si es donen els valors següents de la variable "x": 1,2,5,6,9,10, llavors Σx significa:
      • 1 + 2 + 5 + 6 + 9 + 10 = 33.

Consells

  • El coeficient de correlació de vegades es denomina "coeficient de correlació de Pearson" després del seu desenvolupador Carl Pearson.
  • En la majoria dels casos, quan el coeficient de correlació és superior a 0,8 (positiu o negatiu), hi ha una forta correlació; si el coeficient de correlació és inferior a 0,5 (positiu o negatiu), s’observa una correlació feble.

Advertiments

  • La correlació caracteritza la relació entre els valors de dues variables. Però recordeu que la correlació no té res a veure amb la causalitat. Per exemple, si compareu l'alçada i la mida de les sabates de les persones, és probable que trobeu una forta correlació positiva. En general, com més gran sigui la persona, més gran serà la mida de la sabata. Però això no vol dir que un augment d’alçada condueixi a un augment automàtic de la mida de les sabates, o que els peus més grans comportin un creixement més ràpid. Aquestes quantitats estan simplement interrelacionades.