Preuzmite primjer radne knjige
Ovaj vodič prikazuje kako se koristi Excel CORREL funkcija u Excelu za izračunavanje korelacije.
CORREL Pregled funkcije
Funkcija CORREL Izračunava korelaciju dva niza brojeva.
Da biste koristili funkciju CORREL Excel radnog lista, odaberite ćeliju i upišite:
(Obratite pažnju na to kako se pojavljuju unosi formule)
CORREL funkcija Sintaksa i ulazi:
1 | = CORREL (niz1, niz2) |
niz1 - Nizovi brojeva.
Što je funkcija CORREL?
Excel CORREL funkcija vraća koeficijent korelacije (Pearsonov r) od dva raspona podataka.
Što je koeficijent korelacije?
Koeficijent korelacije, koji se obično naziva Pearsonovim r (nazvan po Karlu Pearsonu, osobi koja ga je razvila), statistika je koja vam govori koliko su dvije varijable snažno povezane.
Pearsonova r je brojka između -1 i 1, što može dovesti do tri moguća tumačenja: pozitivna korelacija, negativna korelacija i bez korelacije.
Pozitivna korelacija
Pozitivna korelacija (r > 0) znači da kada su dvije varijable u tandemu - kada promatrate visoku ocjenu u jednoj varijabli, skloni ste promatrati i visoku ocjenu u drugoj. Slično, kada je jedna varijabla niska, i druga je niska.
Na primjer, visina i težina imaju pozitivnu korelaciju. Pogledajte donji grafikon koji prikazuje visinu i težinu malog uzorka bejzbol igrača:
The r ovog malog uzorka iznosi 0,73 - vrlo jaka pozitivna korelacija. To logično ima smisla - viši ljudi u prosjeku su teži, budući da se ta dodatna visina sastoji od kostiju i mišića te drugog tkiva koje sve nešto teži.
No korelacija nije savršena (u savršenoj korelaciji s r od 1, svi bi rezultati pali na liniju trenda). Neki niži ljudi mogu biti teži - možda imaju malo više masti ili vježbaju u teretani. Isto tako, neki visoki ljudi mogu biti vrlo mršavi i zapravo imaju manju težinu od mnogih nižih ljudi.
Ovdje je korelacija vjerojatno toliko visoka jer imamo posla sa sportašima, bila bi niža u ukupnoj populaciji. Ne zaboravite to imati na umu kada koristite CORREL - r što dobijete nije konačno - morate razmišljati o tome koji su vaši podaci i kako ste ih dobili prilikom tumačenja.
Negativna korelacija
Negativna korelacija (r <0) znači da kada promatrate visoku ocjenu u jednoj varijabli, obično ćete primijetiti nisku ocjenu u drugoj varijabli, i obrnuto.
Na primjer, rezultati učenika na testu i broj izostanaka iz škole negativno su povezani. Odnosno, što više dana propuštaju, to su njihovi rezultati niži. Što manje dana propuštaju, to su bodovi viši:
Opet, korelacija nije savršena (kao što gotovo nikada nisu). Ovdje imamo jednog učenika koji je propustio 5 dana, ali je ipak uspio postići 85%. Imamo i jednog koji je osvojio 52%, unatoč tome što su mu nedostajala samo dva dana.
Još uvijek imamo jasan negativan trend. No, još uvijek postoji mnogo varijacija u rezultatima ispitivanja koje se ne mogu objasniti samo odsutnošću. To može biti posljedica drugih varijabli, poput sposobnosti, motivacije, zdravlja i mnogih drugih potencijalnih čimbenika.
Stoga, kad koristite CORREL, imajte na umu da postoji veća slika koju vaši podaci možda ne objašnjavaju u potpunosti.
Nema korelacije
Nema korelacije (r = 0 ili je blizu 0) znači da ne možete predvidjeti rezultat jedne varijable na temelju druge. Ako iscrtate podatke, nećete vidjeti uočljiv trend, a linija trenda bit će ravna ili gotovo ravna.
Evo nekoliko podataka o duljini prstena i IQ -u:
Kao što vidite, u ovom uzorku nema veze između ove dvije varijable, pa možemo pretpostaviti da nisu povezane.
U praksi je malo vjerojatno da ćete ga dobiti r od točno 0. Upamtite da pri prikupljanju podataka često dolazi do varijacija zbog pogreške, možda u mjerenju ili izvješćivanju. Dakle samo zato što si ti r nije točno 0, ne znači da ste nešto pronašli.
Korelacija nije uzročnost
Ključno je imati na umu da vam CORREL ne može reći koja varijabla utječe na drugu - ili čak postoji li uopće uzročna veza između varijabli. Na primjer, pronađena je korelacija između sljedećih varijabli:
- Količina prodanog sladoleda i količina nasilnog kriminala
- Koliko ste sretni i koliko ste uspješni u svojoj karijeri
- Broj ljudi koji su se utopili u bazenu i broj filmova u kojima se pojavio Nicolas Cage godišnje
Prvi primjer je problem treće varijable. Naravno, sladoled ne čini ljude nasilnima, niti nasilje ne izaziva želju za smrznutim mlijekom i šećerom. Treća varijabla je vrijeme. Po vrućem vremenu ljudi jednostavno više izlaze - više je kontakata među ljudima, a time i veće šanse da dođe do sukoba. Po vrućem vremenu ljudi kupuju i više sladoleda. Dakle, prodaja sladoleda i nasilni zločin koreliraju samo zato što su oboje povezani s trećom varijablom.
Drugi bi mogao biti primjer dvostruka uzročnost. Uspjeh na poslu može biti dobar za vašu sreću - zaradit ćete više novca i općenito ćete imati veću kontrolu nad poslom koji obavljate i s kim ga obavljate. No sreća bi također mogla biti korisna za uspjeh, možda se sretniji ljudi lakše slažu i razvijaju jače radne odnose, ili su možda mentalno otporniji na zastoje. U ovom slučaju obje varijable utječu jedna na drugu.
Treći je jednostavno a lažna korelacija. To što dvije varijable koreliraju u vašim podacima, ne znači da ionako stupaju u interakciju u stvarnom životu.
Zaključak je da vam korelacija ne može reći jesu li dvije varijable uzročno povezane.
Kako koristiti CORREL
Koristite funkciju Excel CORREL na ovaj način:
1 | = CORREL (B3: B15, C3: C15) |
Pomoću CORREL -a definirate dva argumenta - dva raspona podataka koje želite povezati.
Evo nekoliko ključnih točaka koje morate imati na umu kod CORREL -a:
- Tekst, logička vrijednost (TRUE/FALSE) i prazne ćelije se zanemaruju.
- Oba raspona podataka moraju imati jednak broj podatkovnih točaka, inače ćete dobiti pogrešku #N/A
- Ako je jedan od raspona podataka prazan, ili ako uopće nema promjena u podacima (tj. Ako su sve podatkovne točke isti broj), dobit ćete #DIV/0! Pogreška
CORREL funkcija u Google tablicama
Funkcija CORREL radi potpuno isto u Google tablicama kao i u Excelu:
dodatne napomene
CORREL Primjeri u VBA
Također možete koristiti funkciju CORREL u VBA. Tip:application.worksheetfunction.correl (niz1, niz2)
Za argumente funkcije (niz1 itd.) Možete ih unijeti izravno u funkciju ili definirati varijable koje ćete umjesto toga koristiti.
Povratak na popis svih funkcija u Excelu