VARIJANCA - Excel i Google tablice

Ovaj vodič prikazuje kako se koristi Excel VARIANCE funkcija u Excelu za procjenu varijance na temelju danog uzorka.

VARIANCE Pregled funkcije

Funkcija VARIANCE Izračunava varijantu procjene na temelju danog uzorka.

Da biste koristili VARIANCE Excel radnu tablicu, odaberite ćeliju i upišite:

(Obratite pažnju na to kako se pojavljuju unosi formule)

Funkcija VARIANCE Sintaksa i ulazi:

1 = VAR (broj1, [broj2],…)

brojevima- Vrijednosti za dobivanje varijacije

Kako izračunati varijancu u Excelu

Varijansa vam govori koliko su vrijednosti raspoređene u skupu podataka iz prosjeka. Matematički gledano, varijacija je prosjek kvadrata razlike svakog rezultata od srednje vrijednosti (no do toga ćemo doći uskoro).

Excel vam nudi niz funkcija za izračunavanje varijance - VAR.S, VAR.P, VARA, VARPA i dvije starije funkcije, VAR i VARP.

Prije nego što se pozabavimo ovim funkcijama i naučimo kako ih koristiti, razgovarajmo o varijanci i načinu njenog izračunavanja.

Što je varijacija?

Prilikom analize podataka uobičajen prvi korak je izračun srednje vrijednosti. Ovo je, naravno, korisna statistika za izračun, ali ne daje potpunu sliku o tome što se događa s vašim podacima.

Uzmite sljedeći skup podataka, koji bi mogao biti skupina rezultata ispitivanja od ukupno 100:

1 48,49,50,51,52

Srednja vrijednost ovog raspona je 50 (zbrojite brojeve i podijelite s n, gdje je n broj vrijednosti).

Zatim uzmite sljedeći skup rezultata ispitivanja:

1 10,25,50,75,90

Srednja vrijednost ovog raspona je također 50 - ali očito ovdje imamo dva vrlo različita raspona podataka.

Samo po sebi, prosjek vam ne može ništa reći o tome koliko su rezultati raspodijeljeni. Ne govori vam jesu li sve vrijednosti skupljene kao u prvim primjerima ili su međusobno razmaknute poput drugog. Varijansa vam može pomoći da to naučite.

Varijansa se također koristi kao polazna točka za niz složenijih statističkih postupaka.

Kako se varijacija izračunava

Obradimo osnovni primjer i ručno izračunajmo varijancu. Na taj ćete način znati što se događa iza kulisa kada zapravo počnete provoditi Excelove funkcije varijance.

Recimo da imamo skup podataka koji predstavlja tri karte za igru, 4, 6 i 8.

Za izračun varijance radite kroz ovaj postupak:

1) Izračunajte srednju vrijednost

Prvo izračunavamo srednju vrijednost. Znamo da je naš raspon podataka 4, 6, 8, pa će prosjek biti:

1 (6 + 4 + 8) / 3 = 6

To sam dolje potvrdio funkcijom Excel PROSJEK <>:

1 = PROSJEČNO (C4: C6)

2) Oduzmite srednju vrijednost od svake vrijednosti u skupu podataka

Zatim od svake vrijednosti oduzimamo srednju vrijednost.

Učinio sam to sa sljedećom formulom:

1 = C4- $ H $ 4

Srednja vrijednost pohranjena je u H4, pa to samo oduzimam od svake vrijednosti u tablici. Znakovi dolara ovdje samo "zaključavaju" referencu ćelije na H4, tako da kad je prepišem u stupac, ona ostaje ista.

Rezultati:

Imamo:

123 4 - 6 = -26 - 6 = 08 - 6 = 2

Moramo dobiti prosjek ovih razlika iz srednje vrijednosti, ali srednja vrijednost ove tri vrijednosti je nula! Stoga moramo naglasiti razlike, što činimo tako da ih kvadriramo.

3) Izravnajte razlike

Dodajmo novi stupac i kvadriramo brojeve u stupcu D:

1 = D4*D4

U redu, tako je bolje. Sada kada razlike nisu prosječne do nule, možemo izračunati varijansu.

4) Izračunajte prosjek kvadrata razlika

Ovdje nailazimo na račvanje ceste. Postoje dva načina za izračunavanje varijance, a onaj koji koristite ovisi o vrsti podataka koje imate.

  • Ako koristite podaci o stanovništvu, jednostavno uzimate srednju vrijednost kao normalnu (zbrojite vrijednosti i podijelite s n)
  • Ako koristite uzorci podataka, zbrojite vrijednosti i podijelite s n-1

Podaci o stanovništvu znače da imate sve potrebne podatke, na primjer, ako želite prosječnu dob nastavnika u određenoj školi, a imate podatke o dobi za svakog učitelja u toj školi, imate podatke o broju stanovnika.

Uzorci podataka znače da nemate sve svoje podatke, samo uzorak uzet iz veće populacije. Dakle, ako želite prosječnu dob nastavnika u cijeloj zemlji, a imate podatke samo o nastavnicima u jednoj školi, imate uzorke podataka.

U našem primjeru imamo podatke o populaciji. Zanimaju nas samo naše tri kartice - to je populacija i nismo uzeli uzorak s njih. Dakle, možemo samo uzeti prosjek kvadrata razlika na uobičajen način:

1 = PROSJEČNO (E4: E8)

Dakle, varijansa našeg stanovništva je 2.666.

Ako ovo bio uzorci podataka (možda smo ove tri kartice izvukli iz većeg skupa), izračunali bismo prosjek na sljedeći način:

1 Uzorka varijance = (4 + 0 + 4) / (3 - 1)

Ili:

1 Varijansa uzorka = 8 /2 = 4

Zašto dijeliti s n-1 uzorkovnim podacima, umjesto samo n?

Kratak odgovor na ovo pitanje je "Zato što daje pravi odgovor". Ali zamišljam da ćete htjeti malo više od toga! Ovo je složena tema pa ću ovdje dati samo kratak pregled.

Zamislite to ovako: ako uzmete uzorak podataka iz populacije, te će vrijednosti biti bliže srednjoj vrijednosti uzorak nego što su oni do sredine populacija.

To znači da ako samo podijelite s n, malo ćete podcijeniti varijancu populacije. Dijeljenje s n-1 ovo malo ispravlja.

S našim setom od tri karte na dobrom smo mjestu za provjeru ove teorije. Budući da postoje samo tri kartice, postoji mali broj uzoraka koje možemo uzeti.

Uzmimo uzorke dviju kartica. Odabrat ćemo jednu kartu, vratiti je, miješati i zatim odabrati drugu. To znači da postoji devet kombinacija dviju karata koje možemo odabrati.

Sa samo devet mogućih uzoraka, možemo izračunati svaku moguću varijansu uzorka pomoću obje metode (podijeliti s n i podijeliti s n-1), uzeti njihov prosjek i vidjeti koja nam daje pravi odgovor.

U donjoj tablici sve sam iznio. Svaki red tablice je drugačiji uzorak, a stupci B i C prikazuju dvije kartice koje su odabrane u svakom uzorku. Zatim sam dodao još dva stupca: jedan u kojem sam izračunao varijancu tog uzorka dviju kartica dijeljenjem sa n, a drugi u kojem sam podijelio s n - 1.

Pogledaj:

Desno od tablice prikazao sam prosjeke stupaca D i E.

Prosjek stupca D, podijeljen s n, daje nam varijaciju od 1.333.

Prosjek stupca E, podijeljen s n-1, daje nam varijaciju od 2.666.

Već iz našeg prethodnog primjera znamo da je varijansa populacije 2.666. Dakle, dijeljenje s n-1 pri korištenju uzoraka daje nam točnije procjene.

Excel funkcije za izračunavanje varijance

Sada kada ste vidjeli primjer izračunavanja varijance, prijeđimo na Excel funkcije.

Ovdje imate nekoliko mogućnosti:

  • P vraća varijansu za podatke o populaciji (pomoću metode podijeli po n)
  • S vraća varijansu za uzorke podataka (podijeljeno s n-1)
  • VAR je starija funkcija koja radi na potpuno isti način kao i VAR.S
  • VARA je isto što i VAR.S, samo što uključuje tekstualne ćelije i logičke vrijednosti
  • VARPA je isto što i VAR.P, osim što uključuje tekstualne ćelije i Booleove vrijednosti

Prođimo kroz ove jedan po jedan.

Excel VAR.P funkcija

VAR.P izračunava varijancu za podatke o populaciji (koristeći metodu podijeli po n). Koristite ga ovako:

1 = VAR.P (C4: C6)

U VAR.P -u definirate samo jedan argument: raspon podataka za koji želite izračunati varijancu. U našem slučaju, to su vrijednosti kartica u C4: C6.

Kao što vidite gore, VAR.P vraća 2.666 za naš set od tri karte. To je ista vrijednost koju smo ručno izračunali.

Imajte na umu da VAR.P potpuno zanemaruje ćelije koje sadrže tekst ili logičke (TRUE/FALSE) vrijednosti. Ako ih trebate uključiti, umjesto toga upotrijebite VARPA.

Excel VAR.S funkcija

VAR.S izračunava varijancu podataka uzorka (dijeli se s n-1). Koristiš ga ovako:

1 = VAR.S (C4: C6)

Opet, postoji samo jedan argument - vaš raspon podataka.

U ovom slučaju VAR.S vraća 4. Dobili smo istu brojku u koraku 4 kada smo gore izvršili ručni izračun.

VAR.S potpuno zanemaruje ćelije koje sadrže tekst ili Booleove (TRUE/FALSE) vrijednosti. Ako ih trebate uključiti, umjesto toga upotrijebite VARA.

Excel VAR funkcija

VAR je potpuno ekvivalentan VAR.S-u: izračunava varijance za podatke uzorka (pomoću metode n-1). Evo kako ga koristiti:

1 = VAR (C4: C6)

VAR je "funkcija kompatibilnosti". To znači da je Microsoft u postupku uklanjanja ove funkcije iz programa Excel. Trenutačno je još uvijek dostupan za upotrebu, ali umjesto toga trebate koristiti VAR.S kako bi vaše proračunske tablice ostale kompatibilne s budućim verzijama programa Excel.

Excel VARA funkcija

VARA također vraća varijancu uzorkovanih podataka, ali ima neke ključne razlike u odnosu na VAR i VAR.S. Naime, u svoj izračun uključuje logičke i tekstualne vrijednosti:

  • VRIJEDNOSTI se računaju kao 1
  • Vrijednosti FALSE računaju se kao 0
  • Tekstualni nizovi broje se kao 0

Evo kako ga koristite:

1 = VARA (C4: C11)

U tablicu smo dodali još pet redaka: J, Q, K, TRUE i FALSE. Stupac D prikazuje kako VARA tumači ove vrijednosti.

Budući da sada u našoj tablici imamo novu skupinu niskih vrijednosti, varijansa se povećala na 10.268.

Excel VARPA funkcija

VARPA izračunava varijancu za podatke o populaciji. Sličan je VAR.P -u, samo što u izračun uključuje i Booleove vrijednosti i tekstualne nizove:

  • VRIJEDNE vrijednosti se računaju kao 1
  • Vrijednosti FALSE računaju se kao 0
  • Tekstualni nizovi broje se kao 0

Koristite ga ovako:

1 = VARPA (C4: C12)

U tablicu smo dodali još pet redaka: J, Q, K, TRUE i FALSE. Stupac D prikazuje kako VARPA tumači te vrijednosti.

Kao rezultat dodavanja ove skupine nižih vrijednosti podacima, varijansa se povećala na 8,984.

Funkcija VARIANCE u Google tablicama

Funkcija CORREL radi potpuno isto u Google tablicama kao i u Excelu:

Vi ćete pomoći u razvoju web stranice, dijeljenje stranicu sa svojim prijateljima

wave wave wave wave wave