Calcula la covariància

Autora: Judy Howell
Data De La Creació: 2 Juliol 2021
Data D’Actualització: 1 Juliol 2024
Anonim
Calcula la covariància - Consells
Calcula la covariància - Consells

Content

La covariància és un càlcul estadístic per fer més transparent la relació entre dos conjunts de dades. Per exemple, suposem que els antropòlegs estudien l’altura i el pes d’una població dins d’una cultura en particular. Per a cada persona de l'estudi, es poden mostrar l'alçada i el pes amb un parell de dades (x, y). Aquests valors es poden utilitzar en una fórmula estàndard per calcular la relació de covariància. Aquest article explica en primer lloc els càlculs per determinar la covariància d’un conjunt de dades. A continuació, es parlaran de dues altres maneres automatitzades de determinar el resultat.

Per trepitjar

Mètode 1 de 4: Calculeu la covariància a mà mitjançant la fórmula estàndard

  1. Apreneu la fórmula estàndard de covariància i les seves parts. La fórmula estàndard per calcular la covariància és Σ(XjoXmitjana)(yjoymitjana)/(n1){ displaystyle Sigma (x_ {i} -x _ { text {avg}}) (y_ {i} -y _ { text {avg}}) / (n-1)}Construïu la vostra taula de dades. Abans de començar, és útil recopilar les vostres dades. Creeu una taula formada per cinc columnes. Heu de declarar cada columna de la següent manera:
    • X{ displaystyle x}Calculeu la mitjana dels x punts de dades. Aquest conjunt de dades de mostra conté 9 números. Per trobar la mitjana, suma-les i divideix la suma per 9. Això dóna el resultat 1 + 3 + 2 + 5 + 8 + 7 + 12 + 2 + 4 = 44. Quan es divideix per 9, obtindrà la mitjana 4,89. Aquest és el valor que utilitzarà com a x (mitjana) per als propers càlculs.
    • Calculeu la mitjana dels punts de dades y. Aquesta columna y també ha de constar de 9 punts de dades que coincideixin amb els x punts de dades. Determineu-ne la mitjana. Per a aquest conjunt de dades de mostra, es converteix en 8 + 6 + 9 + 4 + 3 + 3 + 2 + 7 + 7 = 49. Divideix aquest total per 9 per obtenir una mitjana de 5,44. Utilitzarà 5,44 com a valor de y (mitjana) per als propers càlculs.
    • Calculeu els valors (XjoXmitjana){ displaystyle (x_ {i} -x _ { text {avg}})}Calculeu els valors (yjoymitjana){ displaystyle (y_ {i} -y _ { text {avg}})}Calculeu els productes per a cada fila de dades. Empleneu les files de la darrera columna multiplicant els números que heu calculat a les dues columnes anteriors de (XjoXmitjana){ displaystyle (x_ {i} -x _ { text {avg}})}Cerqueu la suma dels valors de la darrera columna. Aquí és on entra el símbol Σ. Després de fer tots els càlculs fins ara, afegiu els resultats. Per a aquest conjunt de dades de mostra, ara hauríeu de tenir nou valors a la darrera columna. Sumeu aquests nou números. Presteu molta atenció a si un número és positiu o negatiu.
      • La suma d’aquest conjunt de dades de mostra hauria de sumar -64,57. Escriviu aquest total a l’espai situat a la part inferior de la columna. Aquest és el valor del numerador de la fórmula de covariància estàndard.
    • Calculeu el denominador de la fórmula de covariància. El numerador de la fórmula estàndard de covariància és el valor que acabeu de calcular. El denominador està representat per (n-1) i és un menys que el nombre de parells de dades del vostre conjunt de dades.
      • En aquest problema d’exemple, hi ha nou parells de dades, de manera que n és 9. Per tant, el valor de (n-1) és igual a 8.
    • Dividiu el numerador pel denominador. L’últim pas del càlcul de la covariància és dividir el numerador, Σ(XjoXmitjana)(yjoymitjana){ displaystyle Sigma (x_ {i} -x _ { text {avg}}) (y_ {i} -y _ { text {avg}})}Fixeu-vos en quins càlculs repetitius hi ha. La covariància és un càlcul que heu de fer a mà unes quantes vegades per entendre el significat del resultat. Tanmateix, si utilitzeu rutinàriament la covariància per interpretar les dades, necessiteu una manera més ràpida i automatitzada d’obtenir els resultats. A hores d’ara ja s’haureu adonat que amb el nostre conjunt de dades relativament petit de només nou parells de dades, els càlculs consistien en dos mitjans, divuit restes separades, nou multiplicacions, una suma i, finalment, una altra divisió. Són 31 càlculs relativament petits per trobar la solució. Al llarg del camí, corre el risc de perdre signes negatius o copiar els resultats de manera incorrecta, de manera que la resposta ja no sigui correcta.
    • Creeu un full de càlcul per calcular la covariància. Si coneixeu Excel (o un altre programa de càlcul), podeu crear fàcilment una taula per determinar la covariància. Etiqueu els encapçalaments de les cinc columnes tal i com heu fet per als càlculs manuals: x, y, (x (i) -x (avg)), (y (i) -y (avg)) i Producte.
      • Per simplificar el nom, truqueu a la tercera columna com a "diferència x" i a la quarta columna "diferència y", sempre que recordeu el significat de les dades.
      • Si la taula comença a l'extrem superior esquerre del full de treball, la cel·la A1 s'etiquetarà x, mentre que les altres etiquetes continuen fins a la cel·la E1.
    • Introduïu els punts de dades. Introduïu els valors de les dades a les dues columnes xey. Recordeu que l’ordre dels punts de dades és important, de manera que heu de fer coincidir cada y amb el valor corresponent de x.
      • Els valors x comencen a la cel·la A2 i continuen fins al nombre de punts de dades que necessiteu.
      • Els valors y comencen a la cel·la B2 i continuen fins al nombre de punts de dades que necessiteu.
    • Determineu les mitjanes dels valors x i y. Excel calcula les mitjanes molt ràpidament. A la primera cel·la en blanc que hi ha a sota de cada columna de dades, escriviu la fórmula = MITJANA (A2: A ___). Empleneu l’espai buit amb el número de la cel·la que correspon al vostre darrer punt de dades.
      • Per exemple, si teniu 100 punts de dades, s'omplen les cel·les A2 a A101, de manera que a la cel·la escriviu = AVERAGE (A2: A101).
      • Per a les dades y, escriviu la fórmula = MITJANA (B2: B101).
      • Recordeu que una fórmula a Excel comença amb un signe "=".
    • Escriviu la fórmula de la columna (x (i) -x (avg)). A la cel·la C2, introduïu la fórmula per calcular la primera resta. Aquesta fórmula es converteix en: = A2 -___. Ompliu l’espai en blanc amb l’adreça de la cel·la que conté la mitjana de les dades x.
      • Per exemple, dels 100 punts de dades, la mitjana serà a la cel·la A103, de manera que la vostra fórmula es convertirà en: = A2-A103.
    • Repetiu la fórmula dels punts de dades (y (i) -y (avg)). Seguint el mateix exemple, entra a la cel·la D2. La fórmula es converteix en: = B2-B103.
    • Escriviu la fórmula de la columna "Producte". A la cinquena columna, escriviu a la cel·la E2 la fórmula per calcular el producte de les dues cel·les anteriors. Això es converteix en: = C2 * D2.
    • Copieu les fórmules per omplir la taula. Fins ara, només heu programat els primers punts de dades de la fila 2. Amb el ratolí, marqueu les cel·les C2, D2 i E2. Col·loqueu el cursor a la casella petita de l'extrem inferior dret fins que aparegui el signe més. Feu clic i manteniu premut el botó del ratolí i arrossegueu el ratolí cap avall per ampliar la selecció i omplir tota la taula de dades. Aquest pas copiarà automàticament les tres fórmules de les cel·les C2, D2 i E2 a tota la taula. La taula s’ha d’omplir automàticament amb tots els càlculs.
    • Programa la suma de l'última columna. Necessiteu la suma dels articles de la columna "Producte". A la cel·la en blanc situada immediatament a sota de l'últim punt de dades d'aquesta columna, escriviu la fórmula: = SUM (E2: E ___). Empleneu l’espai en blanc amb l’adreça de la cel·la de l’últim punt de dades.
      • A l'exemple amb 100 punts de dades, aquesta fórmula entra a la cel·la E103. Tipus: = SUM (E2: E102).
    • Determineu la covariància. També podeu fer que Excel realitzi el càlcul final per vosaltres. L’últim càlcul de la cel·la E103 del nostre exemple representa el numerador de la fórmula de covariança. Just a sota d’aquesta cel·la, escriviu la fórmula: = E103 / ___. Ompliu l’espai buit amb el nombre de punts de dades que teniu. En el nostre exemple, aquest és 100. El resultat és la covariància de les vostres dades.

Mètode 3 de 4: utilitzar calculadores de covariància en línia

  1. Cerqueu en línia calculadores de covariància. Diverses escoles, empreses o altres fonts tenen llocs web que calculen els valors de covariància molt fàcilment per a vosaltres. Utilitzeu el terme de cerca "calculadora de covariança" en un motor de cerca.
  2. Introduïu les vostres dades. Llegiu atentament les instruccions del lloc web per assegurar-vos que introduïu la informació correctament. És important que els vostres parells de dades es mantinguin en ordre, en cas contrari el resultat generat serà una covariància incorrecta. Els llocs web tenen diferents estils d’entrada de dades.
    • Per exemple, al lloc web http://ncalculators.com/statistics/covariance-calculator.htm, hi ha un quadre horitzontal per introduir els valors x i un segon quadre horitzontal per introduir els valors y. Heu d'introduir les vostres dades separades per comes. Per tant, el conjunt de dades x calculat anteriorment en aquest article s'hauria d'introduir com a 1,3,2,5,8,7,12,2,4. Les dades de y són 8,6,9,4,3,3,2,7,7.
    • En un altre lloc, https://www.thecalculator.co/math/Covariance-Calculator-705.html, se us demanarà que introduïu les dades x al primer quadre. Les dades s’introdueixen verticalment, amb un element per línia. Per tant, l'entrada d'aquest lloc té el següent aspecte:
    • 1
    • 3
    • 2
    • 5
    • 8
    • 7
    • 12
    • 2
    • 4
  3. Calculeu els resultats. L’interessant d’aquests càlculs en línia és que, després d’introduir les dades, normalment només cal que feu clic al botó "Calcula" i els resultats apareixeran automàticament. La majoria dels llocs us proporcionaran els càlculs intermedis de x (mitjana), y (mitjana) i n.

Mètode 4 de 4: Interpretació dels resultats de la covariància

  1. Busqueu una relació positiva o negativa. La covariància és un número estadístic únic que indica la relació entre un conjunt de dades i un altre. En l'exemple esmentat a la introducció, es mesuren l'alçada i el pes. S'esperava que a mesura que la gent creixi, el seu pes també augmentarà, cosa que conduirà a una visió de covariància positiva. Un altre exemple: suposem que es recopilen dades que indiquen el nombre d'hores que algú practica golf i la puntuació que aconsegueix. En aquest cas, s’espera una covariància negativa, cosa que significa que a mesura que augmenti el nombre d’hores d’entrenament, la puntuació de golf disminuirà. (En el golf, millor puntuació és millor).
    • Penseu en el conjunt de dades de mostra calculat anteriorment. La covariància resultant és -8,07. El signe menys significa que a mesura que augmenten els valors x, els valors y tendeixen a disminuir. Podeu veure que això és cert observant alguns dels valors. Per exemple, els valors x de 1 i 2 corresponen als valors y de 7, 8 i 9. Els valors x de 8 i 12 estan units als valors y de 3 i 2, respectivament. .
  2. Interpretar la magnitud de la covariància. Si el nombre de puntuació de covariància és gran, ja sigui un gran nombre positiu o un gran nombre negatiu, podeu interpretar-ho com dos elements de dades fortament connectats, ja sigui de manera positiva o negativa.
    • La covariància -8,07 del conjunt de dades de mostra és força gran. Tingueu en compte que les dades oscil·len entre l’1 i el 12. Per tant, 8 és un nombre força gran. Això indica una relació força forta entre els conjunts de dades xey.
  3. Comprendre la manca d’una relació. Si el resultat és una covariància igual o molt propera a 0, podeu concloure que els punts de dades no estan relacionats. És a dir, un augment d’un valor pot, però no ha de resultar, en un augment de l’altre. Els dos termes estan enllaçats gairebé aleatòriament.
    • Suposem que relacioneu la mida de les sabates amb les notes dels exàmens. Com que hi ha tants factors que influeixen en les notes dels exàmens d’un estudiant, es pot esperar una puntuació de covariança propera a 0. Això indica que gairebé no hi ha relació entre els dos valors.
  4. Veure gràficament la relació. Per entendre visualment la covariància, podeu representar els vostres punts de dades en un gràfic x, y. Quan ho feu, hauríeu de veure amb força facilitat que els punts, tot i que no es troben exactament en línia recta, tendeixen a apropar-se a un cúmul en línia diagonal de dalt a esquerra a baix a la dreta. Aquesta és la descripció d’una covariància negativa. També podeu veure que el valor de la covariància és igual a -8,07. Es tracta d’un nombre força gran en comparació amb els punts de dades. L’elevat nombre suggereix que la covariància és força forta, cosa que es pot deduir a partir de la forma lineal dels punts de dades.
    • Per tornar a passar per això, llegiu articles sobre dibuix de punts en un sistema de coordenades a wikiHow.

Advertiments

  • La covariància té una aplicació limitada en estadístiques. Sovint és un pas cap al càlcul de coeficients de correlació o altres conceptes. Aneu amb compte amb les interpretacions massa atrevides basades en una puntuació de covariància.