7.GAIA. ESTATISTIKA DESKRIBATZAILEA · Populazio edo lagin baten behaketa egiterakoan ondorengo...

23
7.GAIA. ESTATISTIKA DESKRIBATZAILEA 1. Orokortasunak. 2. Datuen antolaketa. Aldagai estatistiko baten banaketak. 2.1. Definizioak. 2.2. Maiztasun-taulak. 2.2.1. Tartetan elkartuta ez dagoen aldagai estatistiko baten maiztasun-taula. 2.2.2. Tartetan elkartuta dagoen aldagai estatistiko baten maiztasun-taula. 3. Adierazpide grafikoak. 3.1. Tartetan elkartuta ez dauden datuak. 3.2. Tartetan elkartuta dauden datuak. 4. Zentro-joeraren neurriak. 5. Posizioko neurriak edo posizioko indizeak. 6. Sakabanatze-neurriak. 7. Asimetri eta zapaltasun-zorroztasun neurriak. 7.1. Banaketa simetrikoak. 7.2. Banaketa asimetrikoak. 7.3. Asimetri koefizienteak. 1

Transcript of 7.GAIA. ESTATISTIKA DESKRIBATZAILEA · Populazio edo lagin baten behaketa egiterakoan ondorengo...

7.GAIA. ESTATISTIKA DESKRIBATZAILEA

1. Orokortasunak.

2. Datuen antolaketa. Aldagai estatistiko baten banaketak.

2.1. Definizioak.

2.2. Maiztasun-taulak.

2.2.1. Tartetan elkartuta ez dagoen aldagai estatistiko baten

maiztasun-taula.

2.2.2. Tartetan elkartuta dagoen aldagai estatistiko baten

maiztasun-taula.

3. Adierazpide grafikoak.

3.1. Tartetan elkartuta ez dauden datuak.

3.2. Tartetan elkartuta dauden datuak.

4. Zentro-joeraren neurriak.

5. Posizioko neurriak edo posizioko indizeak.

6. Sakabanatze-neurriak.

7. Asimetri eta zapaltasun-zorroztasun neurriak.

7.1. Banaketa simetrikoak.

7.2. Banaketa asimetrikoak.

7.3. Asimetri koefizienteak.

1

7.GAIA. ESTATISTIKA DESKRIBATZAILEA

Estatistikari buruz hitz egitean, kontzeptu-mailan, bi arlo handi bereizi behar ditugu:

ESTATISTIKA DESKRIBATZAILEA

ESTATISTIKA INFERENTZIALA

Estatistika deskribatzaileak, elementu-multzo bati dagozkion datuak bildu, laburtu eta des-

kribatzea du helburu.

Estatistika inferentzialak, lagin batean lortutako emaitzak ikertuko den populaziora orokortzea

du helburu. Orokorpen hau egiteko probabilitatearen teoria erabiltzea beharrezkoa izango da.

Bien arteko ezberdintasuna garbia da, hauteskundeetako inkesten adibidea hartzen badugu.

Hauteskundeen aurretik eginiko galdeketa guztiak estatistika inferentzialaren barruan sartuko

lirateke, hauteskundeen hurrengo egunean aztertutako emaitzak, estatistika deskribatzailea-

ren barruan sartuko genituzkeen bitartean.

Estatistika deskribatzaileaz ari garenean, azterketa-gai diren elementu guztien datuak edukitzeko

egoeran gaude.Estatistika inferentzialaz ari garenean, berriz, ez da hau gertatzen. Ondorioz,

beti POPULAZIOA eta LAGINA bereizi beharko ditugu.

1. OROKORTASUNAK

Populazio estatistikoa edo kolektiboa.

Azterketa estatistikoaren helburuak diren elementuen multzoari populazioa deituko diogu.

Populazioa ondo definitzeko edozein elementu partikular populaziokoa den ala ez jakin ahal

izatea beharrezkoa zaigu. Populazioak finituak ala infinituak izan daitezke populazioa osatzen

duten elementuen arabera.

Unitate estatistikoa edo indibiduoa.

Populazioa osatzen duen elementu bakoitzari unitate estatistiko edo indibiduo deitzen diogu.

Indibiduo izena, estatistika deskribatzailearen jatorri demografikoari zor diogu.

2

Lagina.

Populazioaren azpimultzo bat da. Populazioko elementu guztien behaketa zaila edo garestia

denean, lagin bat hartzen da. Lagina osatzen duten elementuen kopuruari laginaren tamaina

deritzo.

Errolda edo Zentsua.

Populazio estatistikoaren elementu guztiak behatzen direnean errolda bat egiten dugula esa-

ten da. Adibidez, botazio edo hauteskunde bat egiten denean, gero errolda edo zentsu bat

egiten dugu emaitza aztertzeko.

Ezaugarriak.

Aztertzen den populazioaren elementuen propietateak dira. Ezaugarri batzuk neurtu dai-

tezke, adibidez, pertsonen adina, pisua eta altuera. Baina beste ezaugarri batzuk ezin dira

neurtu, adibidez, sexua, profesioa edo begien kolorea. Lehenengoei ezaugarri kuantitatiboak

esaten zaie eta bigarrenei ezaugarri kualitatiboak.

Modalitateak.

Ezaugarri batek aurkez ditzakeen erak edo egoerak dira. Adibidez, “egoera zibila” ezaugarri

kualitatiboak ondorengo modalitateak aurkezten ditu: ezkondua, ezkongabea, alarguna, ...

“Pisua” ezaugarri kuantitatiboak, aldiz, ondorengo modalitateak har ditzake: 50 kilo, 65 kilo

eta abar.

Aldagai estatistikoak.

Ezaugarri kuantitatibo baten modalitate desberdinek hartzen duten zenbakizko balioei alda-

gai estatistikoa esaten zaie. Aldagai estatistikoak modu honetan sailka daitezke:

a)Aldagai estatistiko diskretuak. Modalitateek hartzen dituzten balioak zenbaki diskretuak

dira. Beti balio batek bere hurrengoa edukiko du. Hau da, ondoz ondoko bi balioren ar-

tean ezin du tarteko baliorik egon. Adibidez, kurtso baten ikasgai-kopurua edo ikastegi baten

ikasle-kopurua.

3

b) Aldagai estatistiko jarraituak. Tarte batean infinitu balio har ditzakeenean. Hau da, bi

edozein balioren artean, nahiz eta oso hurbilak izan, tarteko infinitu balio daude. Adibidez,

denboraren neurketa, pertsonen pisua, eta abar.

2. DATUEN ANTOLAKETA. ALDAGAI ESTATISTIKO BATEN BANA-

KETAK

2.1. DEFINIZIOAK

Populazio edo lagin baten behaketan lortutako datuen zenbakizko multzoak antolatu eta

egituratuko ditugu.

X aldagai estatistiko batek x1, x2, ..., xk balio desberdin har ditzake baina hauetariko ba-

koitza behin baino gehiagotan ager daiteke. x1, x2, ..., xk balioak txikienetik handienera

ordenaturik kontsideratuko dira. Hots: x1 < x2 < ... < xi < ... < xk.

Ibiltartea.

Aldagaiak hartzen dituen balio handienaren eta txikienaren arteko diferentzia da. Adibidez,

gaixo baten tenperatura 35o eta 42o graduen artean aldatzen dela suposatzen badugu, ibil-

tartea 42− 35 = 7 izango litzateke.

Maiztasun absolutua (ni).

X aldagai estatistikoaren xi balioaren maiztasun absolutua, sinbolikoki ni ikurraren bidez

adieraziko dugu, xi balioa hartzen duten indibiduoen kopurua da.

Populazioaren edo laginaren tamaina N bada, ondokoa bete behar da:

k∑i=1

ni = n1 + n2 + ... + nk = N.

Maiztasun erlatiboa (fi).

X aldagai estatistikoaren xi balioaren maiztasun erlatiboa, sinbolikoki fi ikurraren bidez

adieraziko dugu, maiztasun absolutuaren eta egindako behaketa-kopuruaren arteko zatidura

4

da. fi =ni

N.

Maiztasun hauek ondoko propietateak betetzen dituzte:

•k∑

i=1

fi = f1 + f2 + ... + fk =n1

N+

n2

N+ ... +

nk

N=

1

N

k∑i=1

ni =N

N= 1.

• Aldagaiaren xi balio bati dagokion portzentaia, maiztasun erlatiboa 100 zenbakiaz bi-

derkatuz lortzen da: (%)xi= fi × 100.

Maiztasun absolutu metatua (Ni).

xi balioaren maiztasun absolutu metatua, sinbolikoki Ni, xi baino txikiagoak edo berdinak

diren balioen maiztasun absolutuen batura da. Hots, Ni = n1 + n2 + ... + ni.

xi balioak txikienetik handienera ordenaturik daudenez, azkenengo balioaren maiztasun ab-

solutu metatua N izango da. Hots, Nk = n1 + n2 + ... + nk = N . Ondoko hau ere betetzen

da: Ni = Ni−1 + ni , beraz, ni = Ni −Ni−1.

Maiztasun erlatibo metatua (Fi).

xi balioaren maiztasun absolutu metatua, sinbolikoki Fi, maiztasun absolutu metatuaren eta

egindako behaketa-kopuruaren arteko zatidura da:

Fi =Ni

N=

n1 + n2 + ... + ni

N=

n1

N+

n2

N+ ... +

ni

N= f1 + f2 + ... + fi.

Nabaria da Fk =Nk

N=

N

N= 1 betetzen dela.

2.2. MAIZTASUN-TAULAK

Populazio edo lagin baten behaketa egiterakoan ondorengo kasuak ager daitezke:

1) Behaketa gutxi egin dira, beraz, aldagai estatistikoak balio gutxi hartzen ditu.

2) Behaketa asko egin dira, hala ere, aldagai estatistikoak balio desberdin gutxi hartzen ditu.

Kasu honetan balioen errepikapen asko daude.

3) Behaketa asko egin dira eta aldagai estatistikoak balio desberdin asko hartzen ditu, beraz,

aldakortasun-eremua oso zabala da.

5

Lehenengo bi kasuak tartetan elkartuta ez dagoen aldagai estatistiko baten azterketan

sartuko ditugu, baina hirugarren kasuan aldagai estatistikoaren balioak ahal den informazio

gutxien galtzeko helburuaz, aukeratutako tartetan elkartuko ditugu.

2.2.1. Tartetan elkartuta ez dagoen aldagai estatistiko baten maiztasun-taula.

Suposa dezagun N behaketa ditugula. Izan bedi x1, x2, ..., xk k balio desberdin hartzen

dituen X aldagai estatistikoa eta x1 < x2 < ... < xi < ... < xk.

Aldagai estatistikoa tartetan elkartuta ez dagoenean, bere maiztasun-taula aldagaiaren balio

desberdinak eta ni, fi, Ni, Fi maiztasunak adieraziz lortzen da.

xi ni fi Ni Fi

x1 n1 f1 N1 F1

x2 n2 f2 N2 F2

......

......

...

xk nk fk Nk Fk

ADIBIDEA. Ikasle-talde batean lortutako puntuazio finalak, 0 eta 5 puntuen artean, on-

dokoak izan dira: 0, 0, 5, 3, 0, 1, 3, 3, 4, 5, 5, 0, 3, 0, 4, 4, 2, 1, 2, 5. Datu hauek maiztasun-taula

batean adierazi.

xi ni fi Ni Fi

0 5 5/20 5 5/20

1 2 2/20 7 7/20

2 2 2/20 9 9/20

3 4 4/20 13 13/20

4 3 3/20 16 16/20

5 4 4/20 20 20/20 = 1

2.2.2. Tartetan elkartuta dagoen aldagai estatistiko baten maiztasun-taula.

Aldagaiak hartzen dituen balioen kopurua handia denean balioak tartetan elkartuko ditugu

eta tarte bakoitzean sartzen diren balioen kontaketa egingo dugu. Azterketaren unitateak

bezala tarteak kontsideratzen baditugu eta ez aldagaiaren balioak, argi dago gure lanaren

6

sinplifikazio bat lortzen dugula baina zoritxarrez informazioa ere galtzen dugu. Horregatik,

bi alde hauek orekatzen dituen tarte-kopuru bat aukeratu behar dugu. Tarte bakoitzean goi-

muturraren eta behe-muturraren arteko diferentziari tartearen zabalera esaten zaio. Honen

arabera bi kasu bereiztuko ditugu:

a) zabalera berdineko tarteak.

b) zabalera desberdineko tarteak.

Normalean tarteak zabalera berdinekoak hartzen dira, hala ere batzuetan problemaren bal-

dintza orokorrak direla eta, komenigarria izan daiteke zabalera desberdineko tarteak kontsi-

deratzea, horrela datuen adierazpena argiagoa izatea lortzen badugu. (Adibidez, tarte txikiak

maiztasunak handiak direnean eta tarte handiagoak maiztasunak txikiagoak direnean).

Tarteen aukera.

Tarte bakoitzarako zabalera bat aukeratuko dugu eta aldagaiaren ibiltarte ososa estaltzeko

behar diren tarte gainjarriak kontsideratuko dira. Tarteak erdiirekiak, hau da [a, b) mota-

koak, izango dira eta [a, b) tarteari dagozkion datuak a baino handiagoak edo berdinak eta b

baino txikiagoak izango dira. Horregatik, azken tartearen goi-muturrak aldagaiaren baliorik

handiena baino handiagoa izan behar du.

Adibidea. 26 haurren adinak hartu ditugu eta lortutako datuak ondokoak dira:

3, 7, 10, 10, 6, 5, 4, 12, 11, 10, 15, 10, 6, 2, 10, 9, 10, 8, 15, 13, 14, 12, 7, 10, 6, 8

tarteak barruan dauden balioak ni maiztasunak

[2− 6) 3, 5, 4, 2 4

[6− 10) 7, 6, 6, 9, 8, 7, 6, 8 8

[10− 14) 10, 10, 12, 11, 10, 10, 10, 10, 13, 12, 10 11

[14− 16) 15, 15, 14 3

Tarte-ordezkariak.

Tarte baten tarte-ordezkaria tartearen erdiko puntua bezala definitzen dugu, eta tarte horrek

duen informazioa adierazten digun balioa da.

Horrela, tarte bakoitza balio batera (tarte-ordezkaria) mugatzen dugu. Tarte bakoitzean

sartzen diren balioen kopurua bakarrik hartzen dugu kontuan eta ez balioen kokapena. Beste

7

modu batean esanda, balioen banaketa tartearen barruan homogeneoa dela suposatzen dugu

eta honek informazio-galera bat ekartzen digu.

0r2

r4

r5 8.2

r8.3

r8.4r8.5

r8.9

r9.5

r9.7

rr9 10

Irudian ikusten dugu 2, 4, 5, 8.2, 8.3, 8.4, 8.5, 8.9, 9, 9.5, 9.7 balioak elkartzen baditugu, gu-

retzat 0 eta 10 bitartean dauden 11 balio izango direla eta horrela horietariko 8 10-etik oso

hurbil daudelako informazioa galdu egiten dugula.

Tarteen kopurua, zabalera berdinekoak hartu ala ez, ... azterketa bakoitzean erabaki beha-

rreko gauzak dira.

Maiztasun-taula.

Tarteak Tarte-ordezkariak

xi ni fi Ni Fi

[a0 − a1) x1 n1 f1 N1 F1

[a1 − a2) x2 n2 f2 N2 F2

......

......

......

[al−1 − al) xl nl fl Nl Fl

ADIBIDEA. Ondoko maiztasun-taulak enpresa bateko 65 langileren asteko soldatak, eurotan

neurtuta, adierazten digu.

Tarteak Tarte-ordezkariak

xi ni fi Ni Fi

[250− 260) 255 8 0.123 8 0.123

[260− 270) 265 10 0.154 18 0.277

[270− 280) 275 16 0.246 34 0.523

[280− 290) 285 14 0.215 48 0.738

[290− 300) 295 10 0.154 58 0.892

[300− 310) 305 5 0.077 63 0.969

[310− 320) 315 2 0.031 65 1.000

8

3. ADIERAZPIDE GRAFIKOAK

Lortutako informazio guztia grafikoki adierazteak asko lagunduko digu datuak ikusarazten

eta ulertzen.

3.1 TARTETAN ELKARTUTA EZ DAUDEN DATUAK

Barra-diagrama.

Abzisa-ardatzean aldagaiaren balio desberdinak ezarriko ditugu eta balio bakoitzean lerro

elkartzut bat marrazten da, non lerro honen altuera balioaren maiztasuna (absolutua edo

erlatiboa den). Horrela lerro bertikalen multzo bat lortzen dugu non lerroen luzeren batura

N edo 1 den, adierazitako maiztasunak absolutuak ala erlatiboak diren arabera.

-

6Maiz. absolutua

xi

ni

-

6Maiz. erlatiboa

xi

fi

Maiztasun-poligonoa edo maiztasun-diagrama.

Maiztasun-poligonoa barra-diagraman barren goi-muturrak lotuz lortzen da.

-

6

����HHHH

JJJJ

Maiz. absolutuak

x-

6

����HHHH

JJJJ

Maiz. erlatiboak

x

9

Maiztasun metatuen poligonoa edo maiztasun metatuen diagrama.

Abzisa-ardatzean aldagaiaren balio desberdinak ezarriko ditugu eta balio bakoitzean lerro el-

kartzut batmarrazten da, non lerro honen altuera balioaren maiztasun metatua (absolutua

edo erlatiboa den). Hau da, xi abzisak Ni (Fi) ordenatua izango du. Modu honetan barra-

diagrama gorakor bat agertuko da. Barra-mutur bakoitzetik marra horizontal bat egiten da

eskuinean dagoen barra ebaki arte.

-

6Maiz. abs. metatuak

aldagaia

Ni

-

6Maiz. erl. metatuak

aldagaia

Fi

3.2. TARTETAN ELKARTUTA DAUDEN DATUAK

Histograma.

Aldagaiak tartetan elkartuta daudenean maiztasunak azaleren bidez adieraziko ditugu. Tarte

bakoitza oinarritzat harturik, laukizuzen bat eraikitzen da non laukizuzenaren azalera tar-

tearen maiztasuna (absolutua edo erlatiboa) den. Beraz, laukizuzenaren altuera maiztasun

(absolutua edo erlatiboa) zabaleraz zatituz kalkulatuko dugu.

-

6

ni

h = nc

tarteakci

-

6

fi

h = fc

tarteakci

10

Maiztasun-poligonoa edo maiztasun-diagrama.

Maiztasun-poligonoa histograman laukizuzenen goiko oinarriko erdiko puntuak marra batez

lotuz eraikitzen da. Lehenengo puntua lehenengo tartearen behe-muturrarekin lotzen da. Az-

kenengo puntua azkenengo goi-muturrarekin lotzen da, goi-muturra eta behe-muturra abzisa-

ardatzean kontsideratuz.

-

6h = n

c

tarteak��������HH

@@@@@ -

6h = f

c

tarteak��������HH

@@@@@

Maiztasun metatuen poligonoa edo maiztasun metatuen diagrama.

Abzisa-ardatzean gainjarriak diren tarte desberdinak adieraziko ditugu. Tarte bakoitzaren

goi-muturrean lerro elkartzut bat marrazten da, non lerro honen altuera tarte horren maiz-

tasun metatua (absolutua edo erlatiboa) den. Modu honetan barra-diagrama gorakor bat

lortzen da eta bere muturrak lotuz maiztasun metatuen poligonoa edo maiztasun metatuen

diagrama lortuko dugu.

Poligonoa maiztasun absolutu metatuen poligonoa baldin bada bere altuera maximoa az-

ken errektangeluan lortuko da eta N izango da. Aldiz, poligonoa maiztasun erlatiboen poli-

gonoa baldin bada, bere altuera maximoa azken errektangeluan ere lortuko da eta 1 izango da.

-

6

��������

��

Ni

Maiz. abs. metatua

Tarteakai−1 ai

-

6

��������

��

Fi

Maiz. erl. metatua

Tarteakai−1 ai

11

4. ZENTRU-JOERAREN NEURRIAK

Neurri hauei sarritan ezartzen zaien funtzioetako bat, aztertzen ari garen aldagaia ordez-

katzea da, hau da, aztertzen ari garen aldagaiaren ordezkari izan nahi luketen balioak dira.

Baina laburketa guztiei informazio-galtze bat dagokie eta hau kontuan izan beharko dugu

neurri bakoitza aztertzerakoan. Horregatik, zentru-joeraren neurriak edo estatistikoak beste

estatistiko batzuekin (sakabanatzearenak, ...) osatzen dira, aztertzen ari garen populazio edo

laginaren ideia errealagoa nahi baldin badugu.

Suposa dezagun X aldagai estatistikoak x1, x2, ..., xk balioak hartzen dituela eta n1, n2, ..., nk

aurreko balioei dagozkien maiztasun absolutuak direla, hurrenez hurren.

Batezbesteko aritmetikoa (x̄).

x̄ =x1n1 + x2n2 + ... + xknk

N=

k∑i=1

xini

N=

k∑i=1

xifi.

Aldagaiak hartzen dituen balio guztiak desberdinak badira, aldagaiaren balio bakoitza behin

bakarrik agertuko da, x1, x2, ..., xk.

x̄ =x1 + x2 + ... + xk

k=

k∑i=1

xi

k.

Batezbesteko geometrikoa (x̄G).

x̄G = N

√xn1

1 xn22 ...xnk

k

Kalkulu hau korapilatsu samar denez, logaritmoak hartuz kalkulatzen da:

x̄G = (xn11 xn2

2 ...xnkk )1/N ⇒ ln x̄G = ln(xn1

1 xn22 ...xnk

k )1/N

ln x̄G =1

N[ln(x1)

n1 + ln(x2)n2 + ... + ln(xk)

nk ] =1

N

k∑i=1

ni ln xi

eta esponentzialak hartuz ondokoa lortzen da

x̄G = e

k∑i=1

ni ln xi

N .

12

Aldagaiaren balioren bat zero baldin bada batezbesteko geometrikoa zero izango da eta ez da

adierazgarria izango.

Batezbesteko koadratikoa.

x̄Q =

√x2

1n1 + x22n2 + ... + x2

knk

N=

k∑

i=1

x2i ni

N

1/2

.

Batezbesteko harmonikoa.

x̄A =N

n1

x1

+n2

x2

+ ... +nk

xk

=N

k∑i=1

ni

xi

.

Aldagaiaren balioren bat zero baldin bada, batezbesteko harmonikoak ez du zentzurik.

Emandako batezbestekoen arteko erlazioa ondokoa da:

x̄A ≤ x̄G ≤ x̄ ≤ x̄Q.

Mediana (Me).

Aldagaiaren balio-multzoa txikienetik handienera ordenatzen badugu, mediana baino txikia-

goak eta mediana baino handiagoak diren balioen kopuruak berdinak dira.

Balio bakoitzaren maiztasuna 1 baldin bada, medianaren kalkulua oso erraza da. Adibidez,

X = 1, 3, 8, 15, 17, 25, 29 baldin bada, orduan medianaren balioa 15 da.

Balioen kopurua bikoitia baldin bada, adibidez X = 1, 3, 8, 15, 17, 25 bada, orduan media-

na bezala bi balio zentralen batezbesteko aritmetikoa kontsideratuko dugu. Hau da,

Me =8 + 15

2= 11.5.

Orain medianaren kalkulua aztertuko dugu kasu orokorrean eta horretarako aldagaia tar-

tetan elkartuta dagoenean eta tartetan elkartuta ez dagoenean bereiztuko dugu.

13

Tartetan elkartuta ez dagoen aldagai estatistiko baten medianaren kalkulua.

• N behaketa-kopurua zati 2 egiten dugu.

• Lortutako N/2 balioa maiztasun absolutu metatuen taulako Ni balio bat den ala ez

aztertuko dugu.

• N/2 maiztasun absolutu metatuen taulako Ni balio bat bada, orduan N/2 ordenatua

(xi, xi+1) tarteko infinitu puntuei dagokie. Medianak puntu bat izan behar duenez,

aipaturiko tartearen erdiko puntua izango da.

Me =xi + xi+1

2

-

6Maiz.abs.metatuak

X

N/2

xi xi+1

Me

• Taularen balio bat ez bada, taularen bi balioren artean egongo da, hau da N/2 ∈ (Ni, Ni+1)

eta mediana N/2 balioari dagokion abzisa izango da.

-

6Maiz.abs.metatuak

x

Ni+1

Ni

N/2

xi xi+1

Me

Tartetan elkartuta dagoen aldagai estatistiko baten medianaren kalkulua.

• N behaketa-kopurua zati 2 egiten dugu.

• Lortutako N/2 balioa maiztasun absolutu metatuen taulako Ni balio bat den ala ez

aztertuko dugu.

14

• N/2 maiztasun absolutuen taularen Ni balio bat bada, N/2 = Ni, orduan [ai−1, ai) tarte

baten maiztasun absolutu metatua izango da eta mediana tartearen goi-muturra izango

da, Me = ai.

-

6

���������

��

N/2

Maiz.abs.metatuak

Xai−1 ai

• N/2 maiztasun absolutuen taularen Ni balio bat ez bada, [ai−1, ai) eta [ai, ai+1) bi tarteei

dagozkien Ni eta Ni+1 maiztasun absolutu metatuen artean egongo da, beraz mediana

[ai, ai+1) tartean egongo da.

-

6

���������

��

N/2Ni

Ni+1

Maiz.abs.met.

Xai ai+1

-

6

����#####

←→x

N/2

Ni

Ni+1

Maiz.abs.met.

Xai ai+1Me

Medianaren balio zehatza lortzeko interpolazio bat egingo dugu ondoko moduan :

Ni+1 −Ni

ai+1 − ai

=N/2−Ni

x=⇒ x =

N/2−Ni

Ni+1 −Ni

(ai+1 − ai)

eta Me = ai + x izango da.

Moda.

Moda maiztasun handiena duen aldagaiaren balioa da. Banaketak ez du moda bakar bat

izan behar, honela bi moda badaude banaketa bimodala deitzen da, hiru moda badaude

hirumodala, ... orokorki moda anitza deitzen da. Aldagaia tartetan elkartuta dagoenean tarte

modalak erabiliko ditugu. Aldagai baten tarte modala, histograman oinarri unitatearekiko

azalera handiena duen errektangelua dagokion tartea izango da.

15

-

6Maiztasunak

Md aldagaia-

6azalera = maiztasuna

tarte modala

Tarte modalean kokatuko da moda. Tarte modala [a, b) izanez, balio modala estimatzeko

ondoko prozesua jarraituko dugu:

• Tarte modalaren eta aurreko eta ondoko tarteen altueren arteko diferentziak neurtzen

dira. Horrela δ1 eta δ2 balioak lortuko ditugu.

• Hurrengo irudian ikusten da x balioa ezagutuz gero, modaren balioa ezagutuko dugula.

x = (b− a)δ1

δ1 + δ2

=⇒ Moda = a + (b− a)δ1

δ1 + δ2

.

-

6hi = ni

ci

tarteaka b

p p p p p p p p pp p p p p pp p p p pδ1

δ2

Md

←→x

5. POSIZIOKO NEURRIAK EDO POSIZIOKO INDIZEAK

Kuartilak.

Kuartilak aldagaiaren balioak lau zati berdinetan zatitzen dituzten hiru balio dira.

P1/4 P2/4 P3/4

Lehenengo kuartila (P1/4).

Aldagaiaren balioen laurdenak P1/4 baino txikiagoak edo berdinak dira eta hiru laurdenak

bera baino handiagoak. P1/4 kalkulatzeko mediana kalkulatzeko jarraitu ditugun pausoak

16

egingo ditugu baina hasieran N/2 kontsideratu beharrean N/4 kontsideratuko dugu.

Bigarren kuartila (P2/4).

Aldagaiaren balioen bi laurdenak, hau da behaketen erdia P2/4 baino txikiagoak edo berdinak

dira eta hiru laurdenak bera baino handiagoak. P2/4 = Mediana betetzen da.

Hirugarren kuartila (P3/4).

Aldagaiaren balioen hiru laurdenak P3/4 baino txikiagoak edo berdinak dira eta laurden bat

bera baino handiagoak. P3/4 kalkulatzeko mediana kalkulatzeko jarraitu ditugun pausoak

egingo ditugu baina hasieran N/2 kontsideratu beharrean3N

4kontsideratuko dugu.

Dezilak.

Aldagaiaren K-garren dezila, Dk, honela definitzen da: Dk balio bat da non aldagaiaren ba-

lioen hamarreko K bera baino txikiagoak edo berdinak diren, K = 1, 2, 3, ..., 9 izanik. Dk

kalkulatzeko mediana kalkulatzeko jarraitu ditugun pausoak egingo ditugu baina hasieran

N/2 kontsideratu beharrean KN

10kontsideratuko dugu.

Zentilak edo pertzentilak.

Aldagaiaren K-garren zentila edo pertzentila, Pk, honela definitzen da: Pk balio bat da non

aldagaiaren balioen ehuneko K bera baino txikiagoak edo berdinak diren, K = 1, 2, 3, ..., 99

izanik. Pk kalkulatzeko mediana kalkulatzeko jarraitu ditugun pausoak egingo ditugu baina

hasieran N/2 kontsideratu beharrean KN

100kontsideratuko dugu.

6. SAKABANATZE-NEURRIAK

Datu-multzoaren ideia orokorra ematen ziguten zentru-joeraren neurriek. Ideia hau osatzeko,

zentru-joeraren inguruan datu-multzoa guztiz bilduta edo oso sakabanatuta dagoen adieraz-

ten diguten estatistiko batzuk ere behar ditugu.

Adibidea. Talde baten soldataren batezbestekoa 2000 eurokoa dela esaten bada, honek gutxi

17

balio dezake askok gutxi eta gutxik asko irabazten badute, beste gauza bat litzateke denek

berdin irabaziko balute. Nola jakin denek berdintsu edo askok gutxi eta gutxik asko ira-

bazten duten? Sakabanatze-neurriak erabiliz. Hau da, gure datuak uniformeak zenbateraino

diren edo beraien artean oso hurbil dauden edo oso berezituak dauden ikusi nahi badugu,

sakabanatze-neurriak erabiliko ditugu.

Suposa dezagun X aldagai estatistikoak x1, x2, ..., xk balioak hartzen dituela eta n1, n2, ..., nk

aurreko balioei dagozkien maiztasun absolutuak direla, hurrenez hurren.

Bariantza.

X aldagai estatistikoaren bariantza honela definitzen da.

σ2 =

k∑i=1

(xi − x̄)2ni

N.

σ2 karraturen batura denez, beti positibooa edo nulua izango da. σ2 = 0 baldin bada, orduan

batugai guztiak nuluak dira eta xi guztiak x̄ balioa hartzen dute; beraz, sakabanatze txikiena

izango dugu (nulua), behaketa guztiak puntu batean konzentratuta baitaude.

Desbideratze tipikoa edo estandarra.

Desbideratze tipikoa edo estandarra bariantzaren karratu positiboa bezala definitzen dugu.

σ = +√

σ2 =

√√√√√√k∑

i=1

(xi − x̄)2ni

N.

Batez besteko desbideratzea.

p batez besteko batekiko batez besteko desbideratzea honela definitzen dugu,

DMp =

k∑i=1

| xi − p | ni

N.

Honela, Batezbesteko aritmetikoarekiko batez besteko desbideratzea ondokoa izango da

DMx̄ =

k∑i=1

| xi − x̄ | ni

N.

18

Eta, Medianarekiko batez besteko desbideratzea

DMMe=

k∑i=1

| xi −Me | ni

N.

Neurri hauek indibiduoen homogeneotasuna adierazten digute, hau da, desbideratzeak txikiak

badira, batez besteko desbideratzea txikia izango da eta, alderantziz, handiak badira batez

besteko desbideratzea handia izango da. Sakabanatze-neurri hauek aldagaia neurtuta dagoen

unitateetan agertzen dira, hortaz, bi aldagairen konparaketa egin nahi badugu ez dira balia-

garriak aldagaiak unitate desberdinetan adierazita badaude. Beraz, zenbaki abstraktuetan

adierazitako sakabanatze-neurriak behar ditugu.

Pearson-en aldakuntza-koefizientea.

C.V. =σ

| x̄ |.

x̄ = 0 denean, koefiziente honek ez du zentzurik. Batzuetan, koefiziente hau 100 zenbakiaz

biderkatuta agertzen da eta horrela lana portzentaiekin egingo dugu.

Batez besteko aldakuntza-koefizientea (C.V.M).

p batez besteko batekiko batez besteko aldakuntza-koefizientea honela definitzen da

C.V.M.p =DMp

| p |.

p = x̄ edo p = Me baldin bada, honela geratzen da

C.V.M.x̄ =DMx̄

| x̄ |eta C.V.M.Me =

DMMe

|Me |.

Ibiltartea.

X aldagai batek hartzen dituen balio maximo eta minimoaren arteko diferentziari ibiltartea

deritzogu. Hots, R = max(x)−min(x).

Kuartil arteko ibiltartea. RI = P3/4 − P1/4.

19

Kuartil arteko ibiltarte-erdia.

RSI =P3/4 − P1/4

2=

RI

2.

Momentuak.

p parametroarekiko r ordenako momentua honela definitzen dugu

Mr(p) =

k∑i=1

(xi − p)rni

N.

Bi motatako momentu aztertuko ditugu

• Jatorriarekiko momentuak.

p = 0 denean, jatorriarekiko momentuak lortzen dira

ar =

k∑i=1

(xi − 0)rni

N=

k∑i=1

xri ni

N.

• Batezbestekoarekiko momentuak.

p = x̄ denean, batezbestekoarekiko momentuak edo momentu zentralak lortzen dira

mr =

k∑i=1

(xi − x̄)rni

N.

Momentu partikular batzuk aipatuko ditugu

a0 =

k∑i=1

x0i ni

N= 1, m0 =

k∑i=1

(xi − x̄)0ni

N= 1,

a1 =

k∑i=1

xini

N= x̄, m1 =

k∑i=1

(xi − x̄)ni

N=

0

1= 0,

a2 =

k∑i=1

x2i ni

N, m2 =

k∑i=1

(xi − x̄)2ni

N= σ2.

Beti aurki ditzakegu momentu zentratuak eta jatorriarekiko momentuak erlazionatzen

dituzten erlazioak. Nahikoa da Newton-en binomioa erabiltzea.

20

7. ASIMETRI ETA ZAPALTASUN-ZORROZTASUN NEURRIAK.

Aztertzen ari garen aldagaiaren datu-multzoa zentrurako joeraren eta sakabanatze balioen

bidez nahiko argi geratu bada ere, itxuraren balio tipikoak aztertzean gehiago osa daiteke;

hauen artean asimetri koefizientea eta kurtosi koefizientea ikusiko ditugu.

7.1. BANAKETA SIMETRIKOAK

Maiztasun-banaketa bat simetrikoa dela esango dugu balio zentral batekiko distantzikide diren

aldagaiaren balioek maiztasun berdinak dituztenean.

Banaketa bat moda batekoa eta simetrikoa baldin bada, batezbesteko aritmetikoa, moda eta

mediana balio berean daude x̄ = Moda = Me.

-

6

Barra-diagrama

-

6

Histograma

7.2. BANAKETA ASIMETRIKOAK

Maiztasun-banaketa bat simetrikoa ez denean asimetrikoa dela esango dugu.

Eskuinerantz asimetrikoa edo asimetri positiboa.

Maiztasunak eskuinetik polikiago jaisten dira. Kasu honetan honako hau betetzen da:

x̄ ≥Me ≥Moda.

.

-

6

Barra-diagrama

-

6

Histograma21

Ezkerrerantz asimetrikoa edo asimetri negatiboa.

Maiztasunak ezkerretik polikiago jaisten dira. Kasu honetan honako hau betetzen da:

x̄ ≤Me ≤Moda.

.

-

6

Barra-diagrama

-

6

Histograma

7.3. ASIMETRI KOEFIZIENTEAK

Ondorengo asimetri koefizienteak erabiltzen baditugu, banaketaren simetria edo asimetria

ezagutu dezakegu adierazpen grafikoa egin gabe.

• Pearson-en asimetri koefizientea.

Ap =x̄−Md

σ

Ap > 0 Eskuinerantz asimetrikoa

Ap = 0 Simetrikoa

Ap < 0 Ezkerrerantz asimetrikoa

Koefiziente honek banaketa baten asimetriaren maila emango digu. Nabaria denez moda

bakarra duten banaketetan erabiliko dugu.

• Fisher-en asimetri koefizientea.

Koefiziente hau honela definitzen da

AF =m3

σ3

AF > 0 Eskuinerantz asimetrikoa

AF = 0 Simetrikoa

AF < 0 Ezkerrerantz asimetrikoa

22

• Kurtosi koefizientea edo zapaltasun-zorroztasun koefizientea.

X, Y eta Z banaketen grafikak aztertzen baditugu, hirurek mugatzen duten azalera bat

da baina itxuraren aldetik oso desberdinak dira.

-

6Leptokurtikoa

Mesokurtikoa

Platikurtikoa

g2 kurtosi koefizientea aztertzen ari garen banaketaren zapaltasunaren adierazle bezala

erabiliko dugu, eta banaketaren zapaltasuna emango digu banaketa normalaren zapal-

tasunarekin konparatuz.

g2 =m4

σ4.

Eta horrela,

g2 > 3 Banaketa normala baino zorrotzagoa: leptokurtikoa,

g2 = 3 Banaketa normalaren zapaltasuna: mesokurtikoa,

g2 < 3 Banaketa normala baino zapalagoa: platikurtikoa.

23