Determineu el coeficient de correlació

Autora: Morris Wright
Data De La Creació: 28 Abril 2021
Data D’Actualització: 19 Juny 2024
Anonim
Determine if u is in the subspace of R^4 generated by {v1, v2, v3}
Vídeo: Determine if u is in the subspace of R^4 generated by {v1, v2, v3}

Content

El coeficient de correlació, denotat r o ρ, és la mesura de la correlació lineal (la relació, tant en força com en direcció) entre dues variables. Va des de -1 fins a +1, utilitzant signes més i menys per representar la correlació positiva i negativa. Si el coeficient de correlació és exactament -1, la relació entre les dues variables és completament negativa; si el coeficient de correlació és exactament +1, la relació és completament positiva. Dues variables poden tenir una correlació positiva, una correlació negativa o cap correlació. Podeu calcular la correlació a mà, mitjançant alguns dels càlculs de correlació gratuïts disponibles en línia o mitjançant les funcions estadístiques d’una bona calculadora gràfica.

Per trepitjar

Mètode 1 de 4: Calculeu el coeficient de correlació a mà

  1. Primer recopileu les vostres dades. Per començar a calcular una correlació eficient, primer examineu els parells de dades. És útil posar-los en una taula, tant vertical com horitzontalment. Etiqueta cada fila o columna xey.
    • Per exemple, suposem que teniu quatre parells de dades per X i y. La taula pot tenir aquest aspecte:
      • x || y
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  2. Calculeu la mitjana de X. Per calcular la mitjana, necessiteu tots els valors de X afegir i després dividir pel nombre de valors.
    • Amb l'exemple anterior, observeu que teniu quatre valors per X. Per calcular la mitjana, suma tots els valors X i dividiu-lo per 4. El càlcul té aquest aspecte:
    • μX=(1+2+4+5)/4{ displaystyle mu _ {x} = (1 + 2 + 4 + 5) / 4}Cerqueu la mitjana de y. A la mitjana de y Per trobar-lo, seguiu els mateixos passos, afegint tots els valors de y junts i dividint pel nombre de valors.
      • A l'exemple anterior, també teniu quatre valors per a y. Afegiu tots aquests valors i dividiu-los per 4. Els càlculs seran així:
      • μy=(1+3+5+7)/4{ displaystyle mu _ {y} = (1 + 3 + 5 + 7) / 4}Determineu la desviació estàndard de X. Un cop tingueu els vostres mitjans, podreu calcular la desviació estàndard. Per fer-ho, utilitzeu la fórmula:
        • σX=1n1Σ(XμX)2{ displaystyle sigma _ {x} = { sqrt {{ frac {1} {n-1}} Sigma (x- mu _ {x}) ^ {2}}}}Calculeu la desviació estàndard de y. Mitjançant els mateixos passos bàsics, busqueu la desviació estàndard de y. Utilitzarà la mateixa fórmula amb els punts de dades de y.
          • Amb les dades de mostra, els càlculs seran així:
          • σy=141((14)2+(34)2+(54)2+(74)2){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {4-1}} * ((1-4) ^ {2} + (3-4) ^ {2} + ( 5-4) ^ {2} + (7-4) ^ {2})}}}Reviseu la fórmula bàsica per determinar un coeficient de correlació. La fórmula per calcular un coeficient de correlació utilitza mitjanes, desviacions estàndard i el nombre de parells d’un conjunt de dades (representat per n). El mateix coeficient de correlació està representat per la lletra minúscula r o la lletra grega ρ (rho). Per a aquest article, utilitzarem la fórmula coneguda com a coeficient de correlació de Pearson, tal com es mostra a continuació:
            • ρ=(1n1)Σ(XμXσX)(yμyσy){ displaystyle rho = left ({ frac {1} {n-1}} right) Sigma left ({ frac {x- mu _ {x}} { sigma _ {x}} } right) * left ({ frac {y- mu _ {y}} { sigma _ {y}}} right)}Determineu el coeficient de correlació. Ara teniu les mitjanes i les desviacions estàndard per a les vostres variables, de manera que podeu passar a la fórmula del coeficient de correlació. Recorda que n representa el nombre de valors que teniu. Ja heu elaborat l’altra informació rellevant als passos anteriors.
              • Utilitzant les dades de mostra, podeu introduir les dades a la fórmula del coeficient de correlació i calcular-les de la manera següent:
              • ρ=(1n1)Σ(XμXσX)(yμyσy){ displaystyle rho = left ({ frac {1} {n-1}} right) Sigma left ({ frac {x- mu _ {x}} { sigma _ {x}} } right) * left ({ frac {y- mu _ {y}} { sigma _ {y}}} right)}Interpretar el resultat. Per a aquest conjunt de dades, el coeficient de correlació és de 0,988. Aquest número us indica dues coses sobre les dades. Mireu el signe del número i la mida del número.
                • Com que el coeficient de correlació és positiu, es pot dir que hi ha una correlació positiva entre les dades x i les dades y. Això significa que si augmenten els valors x, espereu que també augmentin els valors y.
                • Com que el coeficient de correlació és molt proper a +1, les dades x i y estan molt relacionades. Si representéssiu gràficament aquests punts, veureu que són una molt bona aproximació a la línia recta.

Mètode 2 de 4: utilitzar calculadores de correlació en línia

  1. Cerqueu en línia calculadores de correlació. La mesura de la correlació és un càlcul bastant estàndard per als estadístics. El càlcul pot ser molt tediós per a conjunts de dades grans si es fa manualment. Per tant, moltes fonts han fet que els càlculs de correlació comuns estiguin disponibles en línia. Utilitzeu qualsevol motor de cerca i introduïu el terme de cerca "calculadora de correlacions".
  2. Introduïu les dades. Llegiu atentament les instruccions del lloc web perquè pugueu introduir les dades correctament. És important que els parells de dades es mantinguin en ordre o obtindreu un resultat de correlació incorrecte. Diferents llocs web utilitzen diferents formats per introduir dades.
    • Per exemple, al lloc web http://ncalculators.com/statistics/correlation-coefficient-calculator.htm trobareu un quadre horitzontal per introduir x valors i un segon quadre horitzontal per introduir valors y. Introduïu els termes, separats només per comes. Per tant, el conjunt de dades x calculat anteriorment en aquest article s'hauria d'introduir com a 1,2,4,5. El conjunt de dades y s'introdueix com a 1,3,5,7.
    • En un altre lloc, http://www.alcula.com/calculators/statistics/correlation-coefficient/, podeu introduir dades horitzontalment o verticalment, sempre que mantingueu els punts de dades en ordre.
  3. Calculeu els resultats. Aquests llocs de càlcul són populars, ja que després d’introduir les dades generalment només cal que feu clic al botó "Calcula"; el resultat apareixerà automàticament.

Mètode 3 de 4: utilitzar una calculadora gràfica

  1. Introduïu les vostres dades. A la calculadora gràfica, activeu la funció estadística i seleccioneu l'ordre "Edita".
    • Cada calculadora té ordres de tecla lleugerament diferents. Aquest article proporciona les instruccions específiques per al Texas Instruments TI-86.
    • Per accedir a la funció Stat, premeu [2n] -Stat (a sobre de la tecla "+") i després premeu F2-Edita.
  2. Suprimiu totes les dades emmagatzemades antigues. La majoria de calculadores conservaran les dades estadístiques fins que s’esborren. Per assegurar-vos de no confondre les dades antigues amb les noves, primer heu d'esborrar tota la informació desada prèviament.
    • Utilitzeu les tecles de fletxa per moure el cursor per ressaltar la categoria "xStat". A continuació, premeu "Esborra" i "Retorn". Això hauria d'esborrar tots els valors de la columna xStat.
    • Utilitzeu les tecles de fletxa per ressaltar la categoria "yStat". Premeu "Esborra" i "Retorn" per esborrar també les dades d'aquesta columna.
  3. Introduïu els valors de les vostres dades. Utilitzeu les tecles de fletxa per moure el cursor al primer espai sota la capçalera xStat. Escriviu el primer valor de dades i premeu Retorn. Hauríeu de veure l'espai a la part inferior de la pantalla "xStat (1) = __", on el vostre valor omple l'espai buit. Quan premeu Retorn, les dades ompliran la taula, el cursor passarà a la línia següent i la línia de la part inferior de la pantalla hauria de llegir "xStat (2) = __".
    • Continueu introduint tots els valors x.
    • Quan hàgiu introduït els valors x, utilitzeu les tecles de fletxa per anar a la columna yStat i introduïu els valors y.
    • Quan s'hagin introduït totes les dades, premeu Surt per esborrar la pantalla i sortir del menú Stat.
  4. Calculeu les estadístiques de regressió lineal. El coeficient de correlació és una mesura de fins a quin punt les dades s’aproximen a una línia recta. Una calculadora gràfica amb funcions estadístiques pot calcular molt ràpidament la millor línia d’ajust i el coeficient de correlació.
    • Introduïu la funció Stat i, a continuació, premeu el botó Calc. Al TI-86, aquest és el [2n] [Stat] [F1].
    • Trieu els càlculs de regressió lineal. Al TI-86, es tracta de [F3], amb l'etiqueta "LinR". La pantalla gràfica mostrarà la línia "LinR _" amb un cursor parpellejant.
    • Ara heu d'introduir els noms de les dues variables que voleu calcular. Aquests són xStat i yStat.
      • Al TI-86, seleccioneu la llista de noms ("Noms") prement [2n] [Llista] [F3].
      • La línia inferior de la pantalla ara hauria de mostrar les variables disponibles. Trieu [xStat] (probablement es tracta del botó F1 o F2), després introduïu una coma i, a continuació, [yStat].
      • Premeu Retorn per calcular les dades
  5. Interpretar els resultats. Quan premeu Retorn, la calculadora calcularà immediatament la informació següent per a les dades que heu introduït:
    • y=a+bX{ displaystyle y = a + bx}Comprendre el concepte de correlació. La correlació es refereix a la relació estadística entre dues magnituds. El coeficient de correlació és un nombre únic que podeu calcular per a dos conjunts de punts de dades. El nombre és sempre entre -1 i +1, i indica fins a quin punt es troben els dos conjunts de dades.
      • Per exemple, si mesureu l’alçada i l’edat dels nens fins als 12 anys, esperareu trobar una forta correlació positiva. A mesura que els nens creixen, tendeixen a ser més alts.
      • Un exemple de correlació negativa és comparar el temps que algú passa practicant golf amb la puntuació de golf d’aquesta persona. A mesura que avança la pràctica, la puntuació hauria de baixar.
      • En última instància, s’espera que hi hagi poca correlació, positiva o negativa, entre la mida de les sabates d’una persona, per exemple, i les notes de l’examen.
    • Calculeu la mitjana. La mitjana aritmètica o "mitjana" d'un conjunt de dades es calcula afegint tots els valors de les dades i dividint-la pel nombre de valors del conjunt. Per determinar el coeficient de correlació de les vostres dades, heu de calcular la mitjana de cada conjunt de dades.
      • La mitjana d’una variable s’indica amb la variable amb una línia horitzontal a sobre. Sovint es coneix com "barra x" o "barra y" per als conjunts de dades de x i y. Alternativament, la mitjana es pot denotar amb la lletra grega minúscula μ (mu). Per exemple, per indicar la mitjana dels punts de dades de x, podeu utilitzar μX o μ (x).
      • Per exemple, si teniu un conjunt de x (1,2,5,6,9,10), la mitjana d'aquestes dades es calcula de la següent manera:
        • μX=(1+2+5+6+9+10)/6{ displaystyle mu _ {x} = (1 + 2 + 5 + 6 + 9 + 10) / 6}Conèixer la importància de la desviació estàndard. En estadístiques, la desviació estàndard mesura la variació, mostrant la dispersió dels nombres de la mitjana. Un grup de nombres amb una desviació estàndard baixa és força proper entre si. Un grup de nombres amb una desviació estàndard elevada està més dispers.
          • Com a símbol, la desviació estàndard s’expressa mitjançant la lletra minúscula s o la lletra grega σ (sigma). Per tant, la desviació estàndard de les dades x s’escriu com sX o σX.
        • Reconeix la notació de suma. L'operador de suma és un dels operadors més comuns en matemàtiques i indica una suma de valors. Es representa amb la majúscula grega, sigma o ∑.
          • Per exemple, si teniu una col·lecció de punts de dades x (1,2,5,6,9,10), llavors ∑x significa:
            • 1+2+5+6+9+10 = 33

Consells

  • De vegades, el coeficient de correlació es denomina "coeficient de correlació producte-moment de Pearson" en honor de Karl Pearson, el seu desenvolupador.
  • En general, un coeficient de correlació superior a 0,8 (positiu o negatiu) representa una forta correlació; un coeficient de correlació inferior a 0,5 (positiu o negatiu de nou) representa un coeficient de correlació feble.

Advertiments

  • La correlació mostra que dos conjunts de dades estan connectats d'alguna manera. Tanmateix, tingueu cura de no interpretar això com una relació causal. Per exemple, si compareu la mida de les sabates de les persones i la seva alçada, és probable que trobeu una forta correlació positiva. Les persones més grans solen tenir els peus més grans. Tanmateix, això no vol dir que augmentar-se et faci créixer els peus o que els peus grans et facin créixer. Simplement passen junts.