Varians og standardavvik for et utvalg

Studerer du Statistikk og lurer på hva varians og standardavvik er for noe? Da er du kommet til rett sted! I dette blogginnlegget vil du lære om hva varians og standardavvik for et utvalg er for noe, og hvordan du kan regne det ut.

Hva er varians og standardavvik for et utvalg?

For å vite hva varians og standardavvik for et utvalg er for noe, må vi først forklare hva et utvalg er. Et utvalg er rett og slett noen utvalgte objekter eller tall fra en populasjon/gruppe. Et enkelt eksempel er å velge 8 tilfeldige studenter ved NTNU og spørre dem hvor mange timer i uka de ser på serier. Tallene de svarer er utvalget vårt, og dette kan vi bruke til å finne varians og standardavvik for utvalget. Dette kalles også empirisk varians og empirisk standardavvik (empirisk = «erfaringsmessig»).

La oss si de 8 studentene svarer:

95784763

De fleste av tallene ligger rundt 6 og det er ingen som ser veldig mye eller veldig lite på serier. Det er altså litt variasjon i tallene, men ikke veldig mye.
La oss heller si at de 8 studentene svarer:

1048901562

I dette tilfellet er det mye større variasjon, og det er tall helt fra 0 til 15. For å forklare variasjon i hverdagen så fungerer utrykkene “stor variasjon” og “lite variasjon” helt greit. I statistikk derimot, er det ofte behov for å sette tall på hvor stor denne variasjonen er. Til dette brukes begrepene varians og standardavvik!

Regne ut varians

Utvalgsvarians kalles ofte for S2S^2. Formelen for å regne det ut er

S2=1n1i=1n(xixˉ)2S^2=\frac{1}{n-1}\sum_{i=1}^{n}\left(x_i-\bar{x}\right)^2

I denne formelen så er

  • nn antall tall i utvalget, og kalles ofte antall observasjoner
  • xix_i er hvert av tallene, altså hver observasjon
  • xˉ\bar{x} er gjennomsnittet av alle observasjonene

Eksempel 1

I det første eksempelet fra i stad svarte de 8 studentene
9, 5, 7, 8, 4, 7, 6, 3
La oss regne ut variansen for dette utvalget. Først så må vi finne gjennomsnittet xˉ\bar{x}:

xˉ=1ni=1nxi=18(9+5+7+8+4+7+6+3)=498=6,125\begin{aligned} \bar{x}&=\frac{1}{n}\sum_{i=1}^{n} x_i \\ &=\frac{1}{8}\cdot\left(9+5+7+8+4+7+6+3\right) \\ &=\frac{49}{8} \\ &=6,125 \end{aligned}

Før vi regne ut variansen, så kan vi studere dette i et koordinatsystem. Hver av de 8 observasjonene er plassert i et koordinatsystem, og gjennomsnittet er den blå linjen. Det som summeres opp i variansen er avstanden mellom observasjonene og linjen for gjennomsnittet, opphøyd i andre.

Nå er det bare å regne ut variansen:

S2=1n1i=1n(xixˉ)2=17((96,125)2+(56,125)2+(76,125)2+(86,125)2+(46,125)2+(76,125)2+(66,125)2+(36,125)2)=4,125\begin{aligned} S^2=&\frac{1}{n-1}\sum_{i=1}^{n}\left(x_i-\bar{x}\right)^2 \\ =&\frac{1}{7}\big((9-6,125)^2+(5-6,125)^2+(7-6,125)^2 \\ &+(8-6,125)^2+(4-6,125)^2+(7-6,125)^2 \\ &+(6-6,125)^2+(3-6,125)^2\big) \\ =&4,125 \end{aligned}

Den empiriske variansen, eller variansen til utvalget, er altså 4,125.
La oss se hva den blir i det andre tilfellet.

Eksempel 2

De alternative svarene fra de 8 studentene var
10, 4, 8, 9, 0, 15, 6, 2
La oss regne ut variansen for dette utvalget. Først så må vi igjen finne gjennomsnittet xˉ\bar{x}:

xˉ=1ni=1nxi=18(10+4+8+9+0+15+6+2)=548=6,75\begin{aligned} \bar{x}&=\frac{1}{n}\sum_{i=1}^{n} x_i \\ &=\frac{1}{8}\cdot\left(10+4+8+9+0+15+6+2\right) \\ &=\frac{54}{8} \\ &=6,75 \end{aligned}

Vi kan skissere dette grafisk igjen, og hvis man ser på de to grafene er det tydelig at avstandene mellom gjennomsnittet og observasjonene er mye større i dette eksempelet, og dermed blir variansen også mye større!

Gjennomsnittet er ikke så langt fra hva det var i eksempel 1, men la oss se hva variansen blir:

S2=1n1i=1n(xixˉ)2=17((106,75)2+(46,75)2+(86,75)2+(96,75)2+(06,75)2+(156,75)2+(66,75)2+(26,75)2)23,071\begin{aligned} S^2=&\frac{1}{n-1}\sum_{i=1}^{n}\left(x_i-\bar{x}\right)^2 \\ =&\frac{1}{7}\big((10-6,75)^2+(4-6,75)^2+(8-6,75)^2 \\ &+(9-6,75)^2+(0-6,75)^2+(15-6,75)^2 \\ &+(6-6,75)^2+(2-6,75)^2\big) \\ \approx & 23,071 \end{aligned}

Variansen i dette tilfellet er mye større!

Benevning for varians

Når variansen regnes ut så bruker man kvadratet (opphøyd i 2) av differansen mellom observasjoner (xix_i) og gjennomsnitt (xˉ\bar{x}). Siden det er opphøyd i to blir også benevningen til variansen opphøyd i 2. I disse eksemplene ser vi på antall timer studenter bruker på serier. Benevningen til tallene i utvalget er altså timer. Benevningen til variansen er derfor timer2. I siste eksempelet er variansen 23,071 timer223,071~timer^2. Timer opphøyd i 2 gir lite mening, men heldigvis så har man utrykket standardavvik der dette problemet forsvinner.

Regne ut standardavvik

Det å regne ut standardavviket er veldig lett hvis du allerede har regnet ut variansen. Definisjonen av et utvalgs standardavvik er

S=S2S=\sqrt{S^2}

Standardavviket er kvadratroten av variansen, og dermed blir benevningen til standardavvik det samme som benevningen til utvalget vårt (f.eks. timer). En annen måte å definere standardavviket er: Gjennomsnittlig avvik fra gjennomsnittet.
Når variansen regnes ut så tar man avviket mellom observasjoner og gjennomsnitt og opphøyer i andre, for alle observasjonene. Siden standardavviket er kvadratroten av variansen, så blir dette det gjennomsnittlige avviket for alle observasjonene.

Med mindre man får oppgitt variansen, så er det ingen måte å regne ut standardavviket uten å først regne ut variansen og deretter ta kvadratroten av dette. La oss se på hva standardavviket er i de to tidligere eksemplene.

Eksempel 1

I det første eksempelet fra i stad svarte de 8 studentene
9, 5, 7, 8, 4, 7, 6, 3
Variansen til dette utvalget er S2=4,125S^2=4,125.
Standardavviket er

S=S2=4,1252,03  timerS=\sqrt{S^2}=\sqrt{4,125} \approx 2,03 ~~timer

Eksempel 2

I det andre eksempelet fra i stad svarte studentene
10, 4, 8, 9, 0, 15, 6, 2
Variansen fant vi at er S2=23,071S^2=23,071.
Standardavviket er

S=S2=23,0714,80  timerS=\sqrt{S^2}=\sqrt{23,071} \approx 4,80~~timer

Notasjon for varians og standardavvik

I dette blogginnlegget har vi brukt notasjonene

  • Empirisk varians: S2S^2
  • Empirisk standardavvik: SS

Hvilken notasjon som brukes varierer litt, og noen bruker små s-er slik som dette:

  • Empirisk varians: s2s^2
  • Empirisk standardavvik: ss

Med subskriptx,y

I noen tilfeller har du kanskje en rekke observasjoner kalt xix_i og noen andre kalt yiy_i. Hvis du skal regne ut variansen til x-ene og y-ene er det lurt å skille mellom hvilken S2S^2 som tilhører xx og hvilken som tilhører yy. Da brukes ofte en subskript på variansen og standardavviket. For xx ville man i så fall skrevet noe som dette

  • Empirisk varians: Sx2S^2_x
  • Empirisk standardavvik: SxS_x

Varians og standardavvik for en stokastisk variabel

I forbindelse med statistikk har du kanskje hørt om stokastiske variabler? I så fall er det naturlig å møte på utrykkene:

  • Var[X]Var[X]
  • Std[X]Std[X]

Dette er henholdsvis varians og standardavvik til en stokastisk variabel XX. Disse størrelse er noe annet enn S2S^2 og SS. Du kan lære mer om slike stokastiske variabler og deres varians i våre statistikk-kurs på enkeleksamen.no.

enkeleksamen.no finner du en rekke fag i Statistikk og Statistikk for økonomer tilpasset skoler og universiteter rundt om i Norge. I kursene har du mulighet til å se videoer, gjøre quizzer og få hjelp av våre supre nettlærere!

Finn ditt Statistikk for økonomer-fag tilpasset ditt studiested

Statistikk for økonomer

MET 2920

Statistikk for økonomer

Statistikk for økonomer - NHH

MET2

Statistikk for økonomer – NHH

Statistikk

MET 3431

Statistikk

Statistikk (siviløkonom)

MET 1190

Statistikk (siviløkonom)

Statistikk for økonomer - Høgskolen i Innlandet

ØKA1026, 3MET130, SMET130, HMET130

Statistikk for økonomer – Høgskolen i Innlandet

Statistikk for økonomer - HVL

BØA115

Statistikk for økonomer – HVL

Statistikk for økonomer - Kristiania

SFO1100

Statistikk for økonomer – Kristiania

Statistikk for økonomer - NTNU

SØK1004, REA1154, AR100219, MET1002

Statistikk for økonomer – NTNU

Statistikk for økonomer - USN

MET1010

Statistikk for økonomer – USN

Statistikk - NLA Høgskolen

HSM103

Statistikk – NLA Høgskolen

Statistikk - OsloMet

ØAMET1100

Statistikk – OsloMet