Maneres de calcular la variació

Autora: Robert Simon
Data De La Creació: 21 Juny 2021
Data D’Actualització: 1 Juliol 2024
Anonim
Coeficiente de variación | Ejercicios resueltos
Vídeo: Coeficiente de variación | Ejercicios resueltos

Content

La variació mesura la dispersió del conjunt de dades. És molt útil per construir models estadístics: la baixa variància pot ser una indicació que descriviu un error o un soroll aleatori en lloc de la relació subjacent de les dades. Amb aquest article, wikiHow us ensenya a calcular la variància.

Passos

Mètode 1 de 2: calculeu la variància d’una mostra

  1. Escriviu el conjunt de dades de mostra. En la majoria dels casos, els estadístics només tenen informació sobre una mostra o subconjunt de la població que estudien. Per exemple, en lloc de fer una anàlisi general del "cost de cada cotxe a Alemanya", un estadístic pot trobar el cost d'una mostra aleatòria d'alguns milers de vehicles. L'estadístic pot utilitzar aquesta mostra per obtenir una bona estimació del cost dels cotxes a Alemanya. No obstant això, és més probable que no coincideixi exactament amb les xifres reals.
    • Per exemple: En analitzar el nombre de magdalenes venudes al dia en una cafeteria, vau prendre una mostra aleatòria de sis dies i vau obtenir els resultats següents: 38, 37, 36, 28, 18, 14, 12, 11, 10.7, 9.9. Aquesta és una mostra, no una població, perquè no teniu dades per a cada dia que la botiga està oberta.
    • Si cada Punts de dades del màster, aneu al mètode següent.

  2. Anoteu la fórmula de la variància de la mostra. La variància d’un conjunt de dades indica el grau de dispersió dels punts de dades. Com més propera és la variació a zero, més a prop s’agrupen els punts de dades. Quan treballeu amb conjunts de dades de mostra, utilitzeu la fórmula següent per calcular la variància:
    • = /(n - 1)
    • és la variància. La variació sempre es calcula en unitats quadrades.
    • representa un valor al vostre conjunt de dades.
    • ∑, que significa "suma", us indica que cal calcular els paràmetres següents per a cada valor i, a continuació, afegir-los junts.
    • x̅ és la mitjana de la mostra.
    • n és el nombre de punts de dades.

  3. Calculeu la mitjana de la mostra. El símbol x̅ o "x-horizontal" s'utilitza per indicar la mitjana de la mostra. Calculeu com faríeu amb qualsevol mitjana: sumeu tots els punts de dades i dividiu-los pel nombre de punts.
    • Per exemple: En primer lloc, sumeu els vostres punts de dades: 17 + 15 + 23 + 7 + 9 + 13 = 84
      A continuació, dividiu el resultat pel nombre de punts de dades, en aquest cas sis: 84 ÷ 6 = 14.
      Mitjana de mostra = x̅ = 14.
    • Podeu pensar en la mitjana com el "punt central" de les dades. Si les dades se centren al voltant de la mitjana, la variància és baixa. Si es dispersen lluny de la mitjana, la variància és elevada.

  4. Resteu la mitjana de cada punt de dades. Ara és el moment de calcular - x̅, on es troba cada punt del vostre conjunt de dades. Cada resultat indicarà una desviació de la mitjana de cada punt corresponent o, per dir-ho simplement, la distància que hi ha des de la mitjana.
    • Per exemple:
      - x̅ = 17-14 = 3
      - x̅ = 15-14 = 1
      - x̅ = 23-14 = 9
      - x̅ = 7-14 = -7
      - x̅ = 9-14 = -5
      - x̅ = 13-14 = -1
    • És molt fàcil comprovar els vostres càlculs, ja que els resultats han de sumar-se a zero, ja que per la mitjana de la mitjana són els resultats negatius (la distància de la mitjana als nombres petits). els resultats positius (distància de la mitjana a un nombre més gran) s’eliminen completament.
  5. Quadra tots els resultats. Com es va assenyalar anteriorment, la llista de desviacions actual (- x̅) té una suma de zero. Això significa que la "desviació mitjana" també serà sempre zero i no es pot dir res sobre la dispersió de les dades. Per resoldre aquest problema, trobem el quadrat de cada desviació. Gràcies a això, tots són nombres positius, els valors negatius i els valors positius ja no es cancel·len i donen la suma zero.
    • Per exemple:
      (- x̅)
      - x̅)
      9 = 81
      (-7) = 49
      (-5) = 25
      (-1) = 1
    • Ara teniu (- x̅) per a cada punt de dades de la mostra.
  6. Trobeu la suma dels valors quadrats. Ara és el moment de calcular tot el numerador de la fórmula: ∑. El ciclo gran, ∑, requereix que afegiu el valor següent de l'element per a cada valor. Heu calculat (- x̅) per a cada valor de la mostra, de manera que només heu de sumar els resultats.
    • Per exemple: 9 + 1 + 81 + 49 + 25 + 1 = 166.
  7. Divideix per n - 1, on n és el nombre de punts de dades. Fa molt temps, quan es calculava la variància de la mostra, els estadístics només dividien entre n. Aquesta divisió us proporcionarà la mitjana de la desviació al quadrat, que coincideix exactament amb la variància d'aquesta mostra. Tot i això, tingueu en compte que la mostra només és una estimació d’una població més gran. Si feu una altra mostra aleatòria i feu el mateix càlcul, obtindreu un resultat diferent. Com resulta, dividir per n-1 en lloc de n us proporciona una millor estimació de la variància d’una població més gran, que realment us interessa. Aquesta correcció és tan comuna que ara és la definició acceptada de la variància de la mostra.
    • Per exemple: Hi ha sis punts de dades a la mostra, de manera que n = 6.
      Variància de la mostra = 33,2
  8. Comprendre la variància i la desviació estàndard. Tingueu en compte que, atès que hi ha potències a la fórmula, la variància es mesura al quadrat de les unitats de les dades originals. Això és visualment confús. En canvi, sovint la desviació estàndard és força útil. Però no té sentit perdre cap esforç, ja que la desviació estàndard ve determinada per l’arrel quadrada de la variància. És per això que la variància de la mostra s’escriu com i la desviació estàndard d’una mostra és.
    • Per exemple, la desviació estàndard de la mostra anterior = s = √33,2 = 5,76.
    publicitat

Mètode 2 de 2: calcular la variància d’una població

  1. Començant pel conjunt de dades mestres. El terme "població" s'utilitza per referir-se a totes les observacions rellevants. Per exemple, si esteu investigant l'edat dels residents de Hanoi, la vostra població global inclourà l'edat de totes les persones que viuen a Hanoi. Normalment, creeu un full de càlcul per a un conjunt de dades gran com aquest, però aquí teniu un exemple de conjunt de dades més petit:
    • Per exemple: A la sala d’un aquari, hi ha exactament sis aquaris. Aquests sis tancs contenen el nombre següent de peixos:





  2. Anoteu la fórmula de la variància global. Com que una població conté totes les dades que necessitem, aquesta fórmula ens proporciona la variància exacta de la població. Per distingir-lo de la variància de la mostra (que només és una estimació), els estadístics utilitzen altres variables:
    • σ = /n
    • σ = variància de la mostra. Es tracta de la salsitxa normalment quadrada. La variació es mesura en unitats quadrades.
    • representa un element del vostre conjunt de dades.
    • L'element de ∑ es calcula per a cada valor i, a continuació, es suma.
    • μ és la mitjana global.
    • n és el nombre de punts de dades de la població.
  3. Cerqueu la mitjana de la població. En analitzar una població, el símbol μ ("mu") representa la mitjana aritmètica. Per trobar la mitjana, sumeu tots els punts de dades i, a continuació, dividiu-los pel nombre de punts.
    • Podeu considerar la mitjana com a "mitjana", però aneu amb compte, perquè la paraula té moltes definicions matemàtiques.
    • Per exemple: valor mitjà = μ = = 10,5
  4. Resteu la mitjana de cada punt de dades. Els punts de dades més propers a la mitjana tenen una diferència més propera a zero. Repetiu el problema de la resta per a tots els punts de dades i probablement començareu a sentir la dispersió de les dades.
    • Per exemple:
      - μ = 5 – 10,5 = -5,5
      - μ = 5 – 10,5 = -5,5
      - μ = 8 – 10,5 = -2,5
      - μ = 12 - 10., = 1,5
      - μ = 15 – 10,5 = 4,5
      - μ = 18 – 10,5 = 7,5
  5. Quadra cada rètol. En aquest moment, alguns resultats obtinguts del pas anterior seran negatius i alguns seran positius.Si visualitzeu les dades en una línia isomorfa, aquests dos elements representen els números a l'esquerra i a la dreta de la mitjana. Això no serviria de res per calcular la variància, ja que aquests dos grups es cancel·larien mútuament. En lloc d’això, quadreu-los tots perquè siguin positius.
    • Per exemple:
      (- μ) per a cada valor de jo va de l'1 al 6:
      (-5,5) = 30,25
      (-5,5) = 30,25
      (-2,5) = 6,25
      (1,5) = 2,25
      (4,5) = 20,25
      (7,5) = 56,25
  6. Cerqueu la mitjana dels vostres resultats. Ara teniu un valor per a cada punt de dades, relacionat (no directament) amb la distància que té aquest punt de dades de la mitjana. Mitjana sumant-los i dividint pel nombre de valors que tingueu.
    • Per exemple:
      Variància global = 24,25
  7. Recepta de contacte. Si no esteu segur de com s’adapta a la fórmula descrita al principi del mètode, escriviu tot el problema a mà i no abrevieu:
    • Després de trobar la diferència de la mitjana i el quadrat, obteniu (- μ), (- μ), etc. fins a (- μ), on es troba l'últim punt de dades. al conjunt de dades.
    • Per trobar la mitjana d’aquests valors, sumeu-los i divideix-los per n: ((- μ) + (- μ) + ... + (- μ)) / n
    • Després de reescriure el numerador amb notació sigmoide, teniu /n, variant de la fórmula.
    publicitat

Consells

  • Com que la variància és difícil d’interpretar, aquest valor es calcula sovint com a punt de partida per trobar la desviació estàndard.
  • L’ús de "n-1" en lloc de "n" al denominador és una tècnica anomenada correcció de Bessel. La mostra només és una estimació d'una població completa i la mitjana de la mostra té un cert biaix que coincideix amb aquesta estimació. Aquesta correcció elimina el biaix anterior. Es refereix al fet que un cop s'han enumerat n - 1 punts de dades, l'últim punt n era una constant, perquè només es van utilitzar certs valors per calcular la mitjana de la mostra (x̅) a la fórmula de la variància.