Com es calculen les emissions

Autora: Janice Evans
Data De La Creació: 23 Juliol 2021
Data D’Actualització: 1 Juliol 2024
Anonim
GHGSat – un succès du Programme de développement des technologies spatiales
Vídeo: GHGSat – un succès du Programme de développement des technologies spatiales

Content

A les estadístiques, els valors atípics són valors que difereixen bruscament d'altres valors del conjunt de dades recopilats. Un valor atípic pot indicar anomalies en la distribució de dades o errors de mesura, de manera que els valors atípics sovint s’exclouen del conjunt de dades. En eliminar els valors atípics del conjunt de dades, podeu arribar a conclusions inesperades o més precises. Per tant, és necessari poder calcular i estimar valors atípics per garantir una comprensió adequada de les estadístiques.

Passos

  1. 1 Apreneu a reconèixer possibles valors atípics. Cal identificar els valors atípics possibles abans d’excloure els valors atípics del conjunt de dades. Els valors atípics són valors molt diferents de la majoria dels valors del conjunt de dades; en altres paraules, els valors atípics queden fora de la tendència de la majoria de valors. Això és fàcil de trobar a les taules de valors o (especialment) als gràfics. Si es representen els valors del conjunt de dades, els valors atípics estaran lluny de la majoria dels altres valors. Si, per exemple, la majoria dels valors es situen en una línia recta, els valors atípics es situen a banda i banda d’aquesta línia recta.
    • Per exemple, penseu en un conjunt de dades que representi les temperatures de 12 objectes diferents d'una habitació. Si 11 objectes tenen aproximadament 70 graus, però el dotzè objecte (possiblement un forn) és de 300 graus, llavors una mirada ràpida als valors pot indicar que el forn és una explosió probable.
  2. 2 Ordeneu les dades en ordre ascendent. El primer pas per determinar els valors atípics és calcular la mediana del conjunt de dades. Aquesta tasca es simplifica enormement si els valors del conjunt de dades s’ordenen en ordre ascendent (del més petit al més gran).
    • Continuant amb l'exemple anterior, tingueu en compte el conjunt de dades següent que representa les temperatures de diversos objectes: {71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69}. Aquest conjunt s’ha d’ordenar de la següent manera: {69, 69, 70, 70, 70, 70, 71, 71, 71, 72, 73, 300}.
  3. 3 Calculeu la mediana del conjunt de dades. La mediana d’un conjunt de dades és el valor situat al centre del conjunt de dades. Si el conjunt de dades conté un nombre senar de valors, la mediana és el valor abans i després del qual hi ha el mateix nombre de valors al conjunt de dades. Però si el conjunt de dades conté un nombre parell de valors, haureu de trobar la mitjana aritmètica dels dos mitjans. Tingueu en compte que quan es calculen valors atípics, la mediana se sol anomenar Q2, ja que es troba entre Q1 i Q3, els quartils inferior i superior, que definirem més endavant.
    • No tingueu por de treballar amb conjunts de dades que tinguin un nombre parell de valors: la mitjana aritmètica dels dos mitjans serà un número que no es troba al conjunt de dades; això és normal. Però si els dos valors mitjans són el mateix nombre, la mitjana aritmètica és igual a aquest nombre; això també està en l'ordre de les coses.
    • A l'exemple anterior, els 2 valors mitjans són 70 i 71, de manera que la mediana és ((70 + 71) / 2) = 70,5.
  4. 4 Calculeu el quartil inferior. Aquest valor, anomenat Q1, és inferior al 25% dels valors del conjunt de dades. En altres paraules, és la meitat dels valors fins a la mediana. Si hi ha un nombre parell de valors del conjunt de dades abans de la mediana, haureu de trobar la mitjana aritmètica de les dues mitjanes per tal de calcular Q1 (això és similar al càlcul de la mediana).
    • En el nostre exemple, 6 valors es localitzen després de la mediana i 6 valors - abans. Això vol dir que, per calcular el quartil inferior, hem de trobar la mitjana aritmètica de les dues mitjanes dels sis valors que hi ha abans de la mediana. Aquí els valors mitjans són 70 i 70. Per tant, Q1 = ((70 + 70) / 2) = 70.
  5. 5 Calculeu el quartil superior. Aquest valor, anomenat Q3, és superior al 25% dels valors del conjunt de dades. El procés per calcular Q3 és similar al procés per calcular Q1, però aquí es tenen en compte els valors després de la mediana.
    • A l'exemple anterior, les dues mitjanes dels sis posteriors a la mediana són 71 i 72. Per tant, Q3 = ((71 + 72) / 2) = 71,5.
  6. 6 Calculeu l'interval intercuartil. Un cop calculats Q1 i Q3, és necessari trobar la distància entre aquests valors. Per fer-ho, resteu Q1 de Q3. El valor de l’interval intercuartil és extremadament important per determinar els límits de valors que no són atípics.
    • En el nostre exemple, Q1 = 70 i Q3 = 71,5. El rang intercuartil és de 71,5 - 70 = 1,5.
    • Tingueu en compte que això també s'aplica als valors Q1 i Q3 negatius. Per exemple, si Q1 = -70, l'interval interquartil és de 71,5 - (-70) = 141,5.
  7. 7 Cerqueu els "límits interns" dels valors del conjunt de dades. Els valors atípics es determinen analitzant els valors, ja siguin o no dins dels anomenats "límits interns" i "límits externs". Un valor fora dels "límits interns" es classifica com a "valor atípic menor", mentre que un valor fora dels "límits externs" es classifica com a "valor atípic significatiu". Per trobar els límits interns, heu de multiplicar l’interval intercuartil per 1,5; el resultat s'ha d'afegir a Q3 i restar de Q1. Els dos números trobats són els límits interns del conjunt de dades.
    • En el nostre exemple, l’interval interquartil és (71,5 - 70) = 1,5. A més: 1,5 * 1,5 = 2,25. Aquest número s'ha d'afegir a Q3 i restar de Q1 per trobar els límits interns:
      • 71,5 + 2,25 = 73,75
      • 70 - 2,25 = 67,75
      • Així, els límits interns són 67,75 i 73,75.
    • En el nostre exemple, només la temperatura del forn (300 graus) es troba fora d’aquests límits i es pot considerar una emissió insignificant. Però no salteu a conclusions: hem de determinar si aquesta temperatura és significativa.
  8. 8 Cerqueu els "límits externs" del conjunt de dades. Això es fa de la mateixa manera que per als límits interiors, excepte que l'interval intercuartil es multiplica per 3 en lloc d'1,5. El resultat s'ha d'afegir a Q3 i restar de Q1. Els dos números trobats són els límits externs del conjunt de dades.
    • Al nostre exemple, multiplica l'interval interquartil per 3: 1,5 * 3 = 4,5. Calculeu els límits externs:
      • 71,5 + 4,5 = 76
      • 70 - 4,5 = 65,5
      • Per tant, els límits exteriors són 65,5 i 76.
    • Els valors que queden fora dels límits exteriors es consideren emissions significatives. En el nostre exemple, una temperatura del forn de 300 graus es considera un esclat significatiu.
  9. 9 Utilitzeu una estimació qualitativa per determinar si s’han d’excloure els valors atípics del conjunt de dades. El mètode descrit anteriorment permet determinar si alguns valors són atípics (menors o significatius). No us equivoqueu, però: un valor que es classifica com a valor atípic només és un "candidat" a una excepció, és a dir, que no haureu d'excloure'l. La causa del valor atípic és el principal factor que influeix en la decisió d’excloure el valor atípic. Com a regla general, s’exclouen els valors atípics que es produeixen a causa d’errors (en mesures, enregistraments, etc.). D'altra banda, els valors atípics associats no a errors, sinó a informació nova o tendència, normalment es deixen al conjunt de dades.
    • És igualment important avaluar l’efecte dels valors atípics sobre la mediana del conjunt de dades (tant si ho distorsionen com si no). Això és especialment important quan treieu conclusions de la mediana d’un conjunt de dades.
    • En el nostre exemple, és extremadament improbable que el forn s’escalfi fins a una temperatura de 300 graus (tret que tinguem en compte les anomalies naturals). Per tant, es pot concloure (amb un alt grau de certesa) que aquesta temperatura és un error de mesura que cal excloure del conjunt de dades. A més, si no descarteu el valor atípic, la mediana del conjunt de dades serà (69 + 69 + 70 + 70 + 70 + 70 + 71 + 71 + 71 + 72 + 73 + 300) / 12 = 89,67 graus, però si excloeu el valor atípic, la mediana serà (69 + 69 + 70 + 70 + 70 + 70 + 71 + 71 + 71 + 72 + 73) / 11 = 70,55 graus.
      • Els valors atípics solen ser el resultat d’un error humà, de manera que cal excloure els valors atípics dels conjunts de dades.
  10. 10 Comprendre la importància dels valors atípics (de vegades) que queden al conjunt de dades. Alguns valors atípics s’han d’excloure del conjunt de dades, ja que es deuen a errors i problemes tècnics; s'han de deixar altres valors atípics al conjunt de dades. Si, per exemple, un valor atípic no és el resultat d'un error i / o proporciona una nova comprensió del fenomen sotmès a prova, s'hauria de deixar al conjunt de dades. Els experiments científics són especialment sensibles als valors atípics: si elimineu erròniament un valor atípic, és possible que estigueu perdent alguna nova tendència o descobriment.
    • Per exemple, estem desenvolupant un nou medicament per augmentar la mida dels peixos a la pesca. Utilitzarem el conjunt de dades antic ({71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69}), però aquesta vegada cada valor representarà el pes del peix (en grams) després de la ingestió de fàrmac experimental. En altres paraules, el primer fàrmac condueix a un augment del pes dels peixos fins a 71 g, el segon fàrmac - fins a 70 g, etc. En aquesta situació, 300 són un valor atípic significatiu, però no hem de descartar-ho; si suposem que no hi va haver errors de mesura, aquest valor atípic és un èxit significatiu a l’experiment. El medicament, que va augmentar el pes del peix fins als 300 grams, funciona molt millor que altres medicaments; per tant, 300 és el valor més important del conjunt de dades.

Consells

  • Quan es trobin valors atípics, intenteu explicar la seva presència abans d'excloure'ls del conjunt de dades. Poden indicar errors de mesura o anomalies de distribució.

Què necessites

  • Calculadora