7.GAIA. ESTATISTIKA DESKRIBATZAILEA · Populazio edo lagin baten behaketa egiterakoan ondorengo...

of 23 /23
7.GAIA. ESTATISTIKA DESKRIBATZAILEA 1. Orokortasunak. 2. Datuen antolaketa. Aldagai estatistiko baten banaketak. 2.1. Definizioak. 2.2. Maiztasun-taulak. 2.2.1. Tartetan elkartuta ez dagoen aldagai estatistiko baten maiztasun-taula. 2.2.2. Tartetan elkartuta dagoen aldagai estatistiko baten maiztasun-taula. 3. Adierazpide grafikoak. 3.1. Tartetan elkartuta ez dauden datuak. 3.2. Tartetan elkartuta dauden datuak. 4. Zentro-joeraren neurriak. 5. Posizioko neurriak edo posizioko indizeak. 6. Sakabanatze-neurriak. 7. Asimetri eta zapaltasun-zorroztasun neurriak. 7.1. Banaketa simetrikoak. 7.2. Banaketa asimetrikoak. 7.3. Asimetri koefizienteak. 1

Embed Size (px)

Transcript of 7.GAIA. ESTATISTIKA DESKRIBATZAILEA · Populazio edo lagin baten behaketa egiterakoan ondorengo...

  • 7.GAIA. ESTATISTIKA DESKRIBATZAILEA

    1. Orokortasunak.

    2. Datuen antolaketa. Aldagai estatistiko baten banaketak.

    2.1. Definizioak.

    2.2. Maiztasun-taulak.

    2.2.1. Tartetan elkartuta ez dagoen aldagai estatistiko baten

    maiztasun-taula.

    2.2.2. Tartetan elkartuta dagoen aldagai estatistiko baten

    maiztasun-taula.

    3. Adierazpide grafikoak.

    3.1. Tartetan elkartuta ez dauden datuak.

    3.2. Tartetan elkartuta dauden datuak.

    4. Zentro-joeraren neurriak.

    5. Posizioko neurriak edo posizioko indizeak.

    6. Sakabanatze-neurriak.

    7. Asimetri eta zapaltasun-zorroztasun neurriak.

    7.1. Banaketa simetrikoak.

    7.2. Banaketa asimetrikoak.

    7.3. Asimetri koefizienteak.

    1

  • 7.GAIA. ESTATISTIKA DESKRIBATZAILEA

    Estatistikari buruz hitz egitean, kontzeptu-mailan, bi arlo handi bereizi behar ditugu:

    ESTATISTIKA DESKRIBATZAILEA

    ESTATISTIKA INFERENTZIALA

    Estatistika deskribatzaileak, elementu-multzo bati dagozkion datuak bildu, laburtu eta des-

    kribatzea du helburu.

    Estatistika inferentzialak, lagin batean lortutako emaitzak ikertuko den populaziora orokortzea

    du helburu. Orokorpen hau egiteko probabilitatearen teoria erabiltzea beharrezkoa izango da.

    Bien arteko ezberdintasuna garbia da, hauteskundeetako inkesten adibidea hartzen badugu.

    Hauteskundeen aurretik eginiko galdeketa guztiak estatistika inferentzialaren barruan sartuko

    lirateke, hauteskundeen hurrengo egunean aztertutako emaitzak, estatistika deskribatzailea-

    ren barruan sartuko genituzkeen bitartean.

    Estatistika deskribatzaileaz ari garenean, azterketa-gai diren elementu guztien datuak edukitzeko

    egoeran gaude.Estatistika inferentzialaz ari garenean, berriz, ez da hau gertatzen. Ondorioz,

    beti POPULAZIOA eta LAGINA bereizi beharko ditugu.

    1. OROKORTASUNAK

    Populazio estatistikoa edo kolektiboa.

    Azterketa estatistikoaren helburuak diren elementuen multzoari populazioa deituko diogu.

    Populazioa ondo definitzeko edozein elementu partikular populaziokoa den ala ez jakin ahal

    izatea beharrezkoa zaigu. Populazioak finituak ala infinituak izan daitezke populazioa osatzen

    duten elementuen arabera.

    Unitate estatistikoa edo indibiduoa.

    Populazioa osatzen duen elementu bakoitzari unitate estatistiko edo indibiduo deitzen diogu.

    Indibiduo izena, estatistika deskribatzailearen jatorri demografikoari zor diogu.

    2

  • Lagina.

    Populazioaren azpimultzo bat da. Populazioko elementu guztien behaketa zaila edo garestia

    denean, lagin bat hartzen da. Lagina osatzen duten elementuen kopuruari laginaren tamaina

    deritzo.

    Errolda edo Zentsua.

    Populazio estatistikoaren elementu guztiak behatzen direnean errolda bat egiten dugula esa-

    ten da. Adibidez, botazio edo hauteskunde bat egiten denean, gero errolda edo zentsu bat

    egiten dugu emaitza aztertzeko.

    Ezaugarriak.

    Aztertzen den populazioaren elementuen propietateak dira. Ezaugarri batzuk neurtu dai-

    tezke, adibidez, pertsonen adina, pisua eta altuera. Baina beste ezaugarri batzuk ezin dira

    neurtu, adibidez, sexua, profesioa edo begien kolorea. Lehenengoei ezaugarri kuantitatiboak

    esaten zaie eta bigarrenei ezaugarri kualitatiboak.

    Modalitateak.

    Ezaugarri batek aurkez ditzakeen erak edo egoerak dira. Adibidez, “egoera zibila” ezaugarri

    kualitatiboak ondorengo modalitateak aurkezten ditu: ezkondua, ezkongabea, alarguna, ...

    “Pisua” ezaugarri kuantitatiboak, aldiz, ondorengo modalitateak har ditzake: 50 kilo, 65 kilo

    eta abar.

    Aldagai estatistikoak.

    Ezaugarri kuantitatibo baten modalitate desberdinek hartzen duten zenbakizko balioei alda-

    gai estatistikoa esaten zaie. Aldagai estatistikoak modu honetan sailka daitezke:

    a)Aldagai estatistiko diskretuak. Modalitateek hartzen dituzten balioak zenbaki diskretuak

    dira. Beti balio batek bere hurrengoa edukiko du. Hau da, ondoz ondoko bi balioren ar-

    tean ezin du tarteko baliorik egon. Adibidez, kurtso baten ikasgai-kopurua edo ikastegi baten

    ikasle-kopurua.

    3

  • b) Aldagai estatistiko jarraituak. Tarte batean infinitu balio har ditzakeenean. Hau da, bi

    edozein balioren artean, nahiz eta oso hurbilak izan, tarteko infinitu balio daude. Adibidez,

    denboraren neurketa, pertsonen pisua, eta abar.

    2. DATUEN ANTOLAKETA. ALDAGAI ESTATISTIKO BATEN BANA-

    KETAK

    2.1. DEFINIZIOAK

    Populazio edo lagin baten behaketan lortutako datuen zenbakizko multzoak antolatu eta

    egituratuko ditugu.

    X aldagai estatistiko batek x1, x2, ..., xk balio desberdin har ditzake baina hauetariko ba-

    koitza behin baino gehiagotan ager daiteke. x1, x2, ..., xk balioak txikienetik handienera

    ordenaturik kontsideratuko dira. Hots: x1 < x2 < ... < xi < ... < xk.

    Ibiltartea.

    Aldagaiak hartzen dituen balio handienaren eta txikienaren arteko diferentzia da. Adibidez,

    gaixo baten tenperatura 35o eta 42o graduen artean aldatzen dela suposatzen badugu, ibil-

    tartea 42− 35 = 7 izango litzateke.

    Maiztasun absolutua (ni).

    X aldagai estatistikoaren xi balioaren maiztasun absolutua, sinbolikoki ni ikurraren bidez

    adieraziko dugu, xi balioa hartzen duten indibiduoen kopurua da.

    Populazioaren edo laginaren tamaina N bada, ondokoa bete behar da:

    k∑i=1

    ni = n1 + n2 + ... + nk = N.

    Maiztasun erlatiboa (fi).

    X aldagai estatistikoaren xi balioaren maiztasun erlatiboa, sinbolikoki fi ikurraren bidez

    adieraziko dugu, maiztasun absolutuaren eta egindako behaketa-kopuruaren arteko zatidura

    4

  • da. fi =niN

    .

    Maiztasun hauek ondoko propietateak betetzen dituzte:

    •k∑

    i=1

    fi = f1 + f2 + ... + fk =n1N

    +n2N

    + ... +nkN

    =1

    N

    k∑i=1

    ni =N

    N= 1.

    • Aldagaiaren xi balio bati dagokion portzentaia, maiztasun erlatiboa 100 zenbakiaz bi-

    derkatuz lortzen da: (%)xi = fi × 100.

    Maiztasun absolutu metatua (Ni).

    xi balioaren maiztasun absolutu metatua, sinbolikoki Ni, xi baino txikiagoak edo berdinak

    diren balioen maiztasun absolutuen batura da. Hots, Ni = n1 + n2 + ... + ni.

    xi balioak txikienetik handienera ordenaturik daudenez, azkenengo balioaren maiztasun ab-

    solutu metatua N izango da. Hots, Nk = n1 + n2 + ... + nk = N . Ondoko hau ere betetzen

    da: Ni = Ni−1 + ni , beraz, ni = Ni −Ni−1.

    Maiztasun erlatibo metatua (Fi).

    xi balioaren maiztasun absolutu metatua, sinbolikoki Fi, maiztasun absolutu metatuaren eta

    egindako behaketa-kopuruaren arteko zatidura da:

    Fi =NiN

    =n1 + n2 + ... + ni

    N=

    n1N

    +n2N

    + ... +niN

    = f1 + f2 + ... + fi.

    Nabaria da Fk =NkN

    =N

    N= 1 betetzen dela.

    2.2. MAIZTASUN-TAULAK

    Populazio edo lagin baten behaketa egiterakoan ondorengo kasuak ager daitezke:

    1) Behaketa gutxi egin dira, beraz, aldagai estatistikoak balio gutxi hartzen ditu.

    2) Behaketa asko egin dira, hala ere, aldagai estatistikoak balio desberdin gutxi hartzen ditu.

    Kasu honetan balioen errepikapen asko daude.

    3) Behaketa asko egin dira eta aldagai estatistikoak balio desberdin asko hartzen ditu, beraz,

    aldakortasun-eremua oso zabala da.

    5

  • Lehenengo bi kasuak tartetan elkartuta ez dagoen aldagai estatistiko baten azterketan

    sartuko ditugu, baina hirugarren kasuan aldagai estatistikoaren balioak ahal den informazio

    gutxien galtzeko helburuaz, aukeratutako tartetan elkartuko ditugu.

    2.2.1. Tartetan elkartuta ez dagoen aldagai estatistiko baten maiztasun-taula.

    Suposa dezagun N behaketa ditugula. Izan bedi x1, x2, ..., xk k balio desberdin hartzen

    dituen X aldagai estatistikoa eta x1 < x2 < ... < xi < ... < xk.

    Aldagai estatistikoa tartetan elkartuta ez dagoenean, bere maiztasun-taula aldagaiaren balio

    desberdinak eta ni, fi, Ni, Fi maiztasunak adieraziz lortzen da.

    xi ni fi Ni Fi

    x1 n1 f1 N1 F1

    x2 n2 f2 N2 F2...

    ......

    ......

    xk nk fk Nk Fk

    ADIBIDEA. Ikasle-talde batean lortutako puntuazio finalak, 0 eta 5 puntuen artean, on-

    dokoak izan dira: 0, 0, 5, 3, 0, 1, 3, 3, 4, 5, 5, 0, 3, 0, 4, 4, 2, 1, 2, 5. Datu hauek maiztasun-taula

    batean adierazi.

    xi ni fi Ni Fi

    0 5 5/20 5 5/20

    1 2 2/20 7 7/20

    2 2 2/20 9 9/20

    3 4 4/20 13 13/20

    4 3 3/20 16 16/20

    5 4 4/20 20 20/20 = 1

    2.2.2. Tartetan elkartuta dagoen aldagai estatistiko baten maiztasun-taula.

    Aldagaiak hartzen dituen balioen kopurua handia denean balioak tartetan elkartuko ditugu

    eta tarte bakoitzean sartzen diren balioen kontaketa egingo dugu. Azterketaren unitateak

    bezala tarteak kontsideratzen baditugu eta ez aldagaiaren balioak, argi dago gure lanaren

    6

  • sinplifikazio bat lortzen dugula baina zoritxarrez informazioa ere galtzen dugu. Horregatik,

    bi alde hauek orekatzen dituen tarte-kopuru bat aukeratu behar dugu. Tarte bakoitzean goi-

    muturraren eta behe-muturraren arteko diferentziari tartearen zabalera esaten zaio. Honen

    arabera bi kasu bereiztuko ditugu:

    a) zabalera berdineko tarteak.

    b) zabalera desberdineko tarteak.

    Normalean tarteak zabalera berdinekoak hartzen dira, hala ere batzuetan problemaren bal-

    dintza orokorrak direla eta, komenigarria izan daiteke zabalera desberdineko tarteak kontsi-

    deratzea, horrela datuen adierazpena argiagoa izatea lortzen badugu. (Adibidez, tarte txikiak

    maiztasunak handiak direnean eta tarte handiagoak maiztasunak txikiagoak direnean).

    Tarteen aukera.

    Tarte bakoitzarako zabalera bat aukeratuko dugu eta aldagaiaren ibiltarte ososa estaltzeko

    behar diren tarte gainjarriak kontsideratuko dira. Tarteak erdiirekiak, hau da [a, b) mota-

    koak, izango dira eta [a, b) tarteari dagozkion datuak a baino handiagoak edo berdinak eta b

    baino txikiagoak izango dira. Horregatik, azken tartearen goi-muturrak aldagaiaren baliorik

    handiena baino handiagoa izan behar du.

    Adibidea. 26 haurren adinak hartu ditugu eta lortutako datuak ondokoak dira:

    3, 7, 10, 10, 6, 5, 4, 12, 11, 10, 15, 10, 6, 2, 10, 9, 10, 8, 15, 13, 14, 12, 7, 10, 6, 8

    tarteak barruan dauden balioak ni maiztasunak

    [2− 6) 3, 5, 4, 2 4

    [6− 10) 7, 6, 6, 9, 8, 7, 6, 8 8

    [10− 14) 10, 10, 12, 11, 10, 10, 10, 10, 13, 12, 10 11

    [14− 16) 15, 15, 14 3

    Tarte-ordezkariak.

    Tarte baten tarte-ordezkaria tartearen erdiko puntua bezala definitzen dugu, eta tarte horrek

    duen informazioa adierazten digun balioa da.

    Horrela, tarte bakoitza balio batera (tarte-ordezkaria) mugatzen dugu. Tarte bakoitzean

    sartzen diren balioen kopurua bakarrik hartzen dugu kontuan eta ez balioen kokapena. Beste

    7

  • modu batean esanda, balioen banaketa tartearen barruan homogeneoa dela suposatzen dugu

    eta honek informazio-galera bat ekartzen digu.

    0r2

    r4

    r5 8.2

    r8.3

    r8.4r8.5

    r8.9

    r9.5

    r9.7

    rr9 10

    Irudian ikusten dugu 2, 4, 5, 8.2, 8.3, 8.4, 8.5, 8.9, 9, 9.5, 9.7 balioak elkartzen baditugu, gu-

    retzat 0 eta 10 bitartean dauden 11 balio izango direla eta horrela horietariko 8 10-etik oso

    hurbil daudelako informazioa galdu egiten dugula.

    Tarteen kopurua, zabalera berdinekoak hartu ala ez, ... azterketa bakoitzean erabaki beha-

    rreko gauzak dira.

    Maiztasun-taula.

    Tarteak Tarte-ordezkariak

    xi ni fi Ni Fi

    [a0 − a1) x1 n1 f1 N1 F1

    [a1 − a2) x2 n2 f2 N2 F2...

    ......

    ......

    ...

    [al−1 − al) xl nl fl Nl Fl

    ADIBIDEA. Ondoko maiztasun-taulak enpresa bateko 65 langileren asteko soldatak, eurotan

    neurtuta, adierazten digu.

    Tarteak Tarte-ordezkariak

    xi ni fi Ni Fi

    [250− 260) 255 8 0.123 8 0.123

    [260− 270) 265 10 0.154 18 0.277

    [270− 280) 275 16 0.246 34 0.523

    [280− 290) 285 14 0.215 48 0.738

    [290− 300) 295 10 0.154 58 0.892

    [300− 310) 305 5 0.077 63 0.969

    [310− 320) 315 2 0.031 65 1.000

    8

  • 3. ADIERAZPIDE GRAFIKOAK

    Lortutako informazio guztia grafikoki adierazteak asko lagunduko digu datuak ikusarazten

    eta ulertzen.

    3.1 TARTETAN ELKARTUTA EZ DAUDEN DATUAK

    Barra-diagrama.

    Abzisa-ardatzean aldagaiaren balio desberdinak ezarriko ditugu eta balio bakoitzean lerro

    elkartzut bat marrazten da, non lerro honen altuera balioaren maiztasuna (absolutua edo

    erlatiboa den). Horrela lerro bertikalen multzo bat lortzen dugu non lerroen luzeren batura

    N edo 1 den, adierazitako maiztasunak absolutuak ala erlatiboak diren arabera.

    -

    6Maiz. absolutua

    xi

    ni

    -

    6Maiz. erlatiboa

    xi

    fi

    Maiztasun-poligonoa edo maiztasun-diagrama.

    Maiztasun-poligonoa barra-diagraman barren goi-muturrak lotuz lortzen da.

    -

    6

    ����HH

    HH

    JJJJ

    Maiz. absolutuak

    x-

    6

    ����HH

    HH

    JJJJ

    Maiz. erlatiboak

    x

    9

  • Maiztasun metatuen poligonoa edo maiztasun metatuen diagrama.

    Abzisa-ardatzean aldagaiaren balio desberdinak ezarriko ditugu eta balio bakoitzean lerro el-

    kartzut batmarrazten da, non lerro honen altuera balioaren maiztasun metatua (absolutua

    edo erlatiboa den). Hau da, xi abzisak Ni (Fi) ordenatua izango du. Modu honetan barra-

    diagrama gorakor bat agertuko da. Barra-mutur bakoitzetik marra horizontal bat egiten da

    eskuinean dagoen barra ebaki arte.

    -

    6Maiz. abs. metatuak

    aldagaia

    Ni

    -

    6Maiz. erl. metatuak

    aldagaia

    Fi

    3.2. TARTETAN ELKARTUTA DAUDEN DATUAK

    Histograma.

    Aldagaiak tartetan elkartuta daudenean maiztasunak azaleren bidez adieraziko ditugu. Tarte

    bakoitza oinarritzat harturik, laukizuzen bat eraikitzen da non laukizuzenaren azalera tar-

    tearen maiztasuna (absolutua edo erlatiboa) den. Beraz, laukizuzenaren altuera maiztasun

    (absolutua edo erlatiboa) zabaleraz zatituz kalkulatuko dugu.

    -

    6

    ni

    h = nc

    tarteakci-

    6

    fi

    h = fc

    tarteakci

    10

  • Maiztasun-poligonoa edo maiztasun-diagrama.

    Maiztasun-poligonoa histograman laukizuzenen goiko oinarriko erdiko puntuak marra batez

    lotuz eraikitzen da. Lehenengo puntua lehenengo tartearen behe-muturrarekin lotzen da. Az-

    kenengo puntua azkenengo goi-muturrarekin lotzen da, goi-muturra eta behe-muturra abzisa-

    ardatzean kontsideratuz.

    -

    6h = n

    c

    tarteak��������HH

    @@@@@ -

    6h = f

    c

    tarteak��������HH

    @@@@@

    Maiztasun metatuen poligonoa edo maiztasun metatuen diagrama.

    Abzisa-ardatzean gainjarriak diren tarte desberdinak adieraziko ditugu. Tarte bakoitzaren

    goi-muturrean lerro elkartzut bat marrazten da, non lerro honen altuera tarte horren maiz-

    tasun metatua (absolutua edo erlatiboa) den. Modu honetan barra-diagrama gorakor bat

    lortzen da eta bere muturrak lotuz maiztasun metatuen poligonoa edo maiztasun metatuen

    diagrama lortuko dugu.

    Poligonoa maiztasun absolutu metatuen poligonoa baldin bada bere altuera maximoa az-

    ken errektangeluan lortuko da eta N izango da. Aldiz, poligonoa maiztasun erlatiboen poli-

    gonoa baldin bada, bere altuera maximoa azken errektangeluan ere lortuko da eta 1 izango da.

    -

    6

    ��������

    ��

    Ni

    Maiz. abs. metatua

    Tarteakai−1 ai-

    6

    ��������

    ��

    Fi

    Maiz. erl. metatua

    Tarteakai−1 ai

    11

  • 4. ZENTRU-JOERAREN NEURRIAK

    Neurri hauei sarritan ezartzen zaien funtzioetako bat, aztertzen ari garen aldagaia ordez-

    katzea da, hau da, aztertzen ari garen aldagaiaren ordezkari izan nahi luketen balioak dira.

    Baina laburketa guztiei informazio-galtze bat dagokie eta hau kontuan izan beharko dugu

    neurri bakoitza aztertzerakoan. Horregatik, zentru-joeraren neurriak edo estatistikoak beste

    estatistiko batzuekin (sakabanatzearenak, ...) osatzen dira, aztertzen ari garen populazio edo

    laginaren ideia errealagoa nahi baldin badugu.

    Suposa dezagun X aldagai estatistikoak x1, x2, ..., xk balioak hartzen dituela eta n1, n2, ..., nk

    aurreko balioei dagozkien maiztasun absolutuak direla, hurrenez hurren.

    Batezbesteko aritmetikoa (x̄).

    x̄ =x1n1 + x2n2 + ... + xknk

    N=

    k∑i=1

    xini

    N=

    k∑i=1

    xifi.

    Aldagaiak hartzen dituen balio guztiak desberdinak badira, aldagaiaren balio bakoitza behin

    bakarrik agertuko da, x1, x2, ..., xk.

    x̄ =x1 + x2 + ... + xk

    k=

    k∑i=1

    xi

    k.

    Batezbesteko geometrikoa (x̄G).

    x̄G =N

    √xn11 x

    n22 ...x

    nkk

    Kalkulu hau korapilatsu samar denez, logaritmoak hartuz kalkulatzen da:

    x̄G = (xn11 x

    n22 ...x

    nkk )

    1/N ⇒ ln x̄G = ln(xn11 xn22 ...xnkk )

    1/N

    ln x̄G =1

    N[ln(x1)

    n1 + ln(x2)n2 + ... + ln(xk)

    nk ] =1

    N

    k∑i=1

    ni ln xi

    eta esponentzialak hartuz ondokoa lortzen da

    x̄G = e

    k∑i=1

    ni ln xi

    N .

    12

  • Aldagaiaren balioren bat zero baldin bada batezbesteko geometrikoa zero izango da eta ez da

    adierazgarria izango.

    Batezbesteko koadratikoa.

    x̄Q =

    √x21n1 + x

    22n2 + ... + x

    2knk

    N=

    k∑

    i=1

    x2i ni

    N

    1/2

    .

    Batezbesteko harmonikoa.

    x̄A =N

    n1x1

    +n2x2

    + ... +nkxk

    =N

    k∑i=1

    nixi

    .

    Aldagaiaren balioren bat zero baldin bada, batezbesteko harmonikoak ez du zentzurik.

    Emandako batezbestekoen arteko erlazioa ondokoa da:

    x̄A ≤ x̄G ≤ x̄ ≤ x̄Q.

    Mediana (Me).

    Aldagaiaren balio-multzoa txikienetik handienera ordenatzen badugu, mediana baino txikia-

    goak eta mediana baino handiagoak diren balioen kopuruak berdinak dira.

    Balio bakoitzaren maiztasuna 1 baldin bada, medianaren kalkulua oso erraza da. Adibidez,

    X = 1, 3, 8, 15, 17, 25, 29 baldin bada, orduan medianaren balioa 15 da.

    Balioen kopurua bikoitia baldin bada, adibidez X = 1, 3, 8, 15, 17, 25 bada, orduan media-

    na bezala bi balio zentralen batezbesteko aritmetikoa kontsideratuko dugu. Hau da,

    Me =8 + 15

    2= 11.5.

    Orain medianaren kalkulua aztertuko dugu kasu orokorrean eta horretarako aldagaia tar-

    tetan elkartuta dagoenean eta tartetan elkartuta ez dagoenean bereiztuko dugu.

    13

  • Tartetan elkartuta ez dagoen aldagai estatistiko baten medianaren kalkulua.

    • N behaketa-kopurua zati 2 egiten dugu.

    • Lortutako N/2 balioa maiztasun absolutu metatuen taulako Ni balio bat den ala ez

    aztertuko dugu.

    • N/2 maiztasun absolutu metatuen taulako Ni balio bat bada, orduan N/2 ordenatua

    (xi, xi+1) tarteko infinitu puntuei dagokie. Medianak puntu bat izan behar duenez,

    aipaturiko tartearen erdiko puntua izango da.

    Me =xi + xi+1

    2

    -

    6Maiz.abs.metatuak

    X

    N/2

    xi xi+1

    Me

    • Taularen balio bat ez bada, taularen bi balioren artean egongo da, hau da N/2 ∈ (Ni, Ni+1)

    eta mediana N/2 balioari dagokion abzisa izango da.

    -

    6Maiz.abs.metatuak

    x

    Ni+1

    Ni

    N/2

    xi xi+1

    Me

    Tartetan elkartuta dagoen aldagai estatistiko baten medianaren kalkulua.

    • N behaketa-kopurua zati 2 egiten dugu.

    • Lortutako N/2 balioa maiztasun absolutu metatuen taulako Ni balio bat den ala ez

    aztertuko dugu.

    14

  • • N/2 maiztasun absolutuen taularen Ni balio bat bada, N/2 = Ni, orduan [ai−1, ai) tarte

    baten maiztasun absolutu metatua izango da eta mediana tartearen goi-muturra izango

    da, Me = ai.

    -

    6

    ���������

    ��

    N/2

    Maiz.abs.metatuak

    Xai−1 ai

    • N/2 maiztasun absolutuen taularen Ni balio bat ez bada, [ai−1, ai) eta [ai, ai+1) bi tarteei

    dagozkien Ni eta Ni+1 maiztasun absolutu metatuen artean egongo da, beraz mediana

    [ai, ai+1) tartean egongo da.

    -

    6

    ���������

    ��

    N/2Ni

    Ni+1

    Maiz.abs.met.

    Xai ai+1-

    6

    ����#####

    ←→x

    N/2

    Ni

    Ni+1

    Maiz.abs.met.

    Xai ai+1Me

    Medianaren balio zehatza lortzeko interpolazio bat egingo dugu ondoko moduan :

    Ni+1 −Niai+1 − ai

    =N/2−Ni

    x=⇒ x = N/2−Ni

    Ni+1 −Ni(ai+1 − ai)

    eta Me = ai + x izango da.

    Moda.

    Moda maiztasun handiena duen aldagaiaren balioa da. Banaketak ez du moda bakar bat

    izan behar, honela bi moda badaude banaketa bimodala deitzen da, hiru moda badaude

    hirumodala, ... orokorki moda anitza deitzen da. Aldagaia tartetan elkartuta dagoenean tarte

    modalak erabiliko ditugu. Aldagai baten tarte modala, histograman oinarri unitatearekiko

    azalera handiena duen errektangelua dagokion tartea izango da.

    15

  • -

    6Maiztasunak

    Md aldagaia-

    6azalera = maiztasuna

    tarte modala

    Tarte modalean kokatuko da moda. Tarte modala [a, b) izanez, balio modala estimatzeko

    ondoko prozesua jarraituko dugu:

    • Tarte modalaren eta aurreko eta ondoko tarteen altueren arteko diferentziak neurtzen

    dira. Horrela δ1 eta δ2 balioak lortuko ditugu.

    • Hurrengo irudian ikusten da x balioa ezagutuz gero, modaren balioa ezagutuko dugula.

    x = (b− a) δ1δ1 + δ2

    =⇒ Moda = a + (b− a) δ1δ1 + δ2

    .

    -

    6hi =

    nici

    tarteaka b

    p p p p p p p p pp p p p p pp p p p pδ1 δ2

    Md

    ←→x

    5. POSIZIOKO NEURRIAK EDO POSIZIOKO INDIZEAK

    Kuartilak.

    Kuartilak aldagaiaren balioak lau zati berdinetan zatitzen dituzten hiru balio dira.

    P1/4 P2/4 P3/4

    Lehenengo kuartila (P1/4).

    Aldagaiaren balioen laurdenak P1/4 baino txikiagoak edo berdinak dira eta hiru laurdenak

    bera baino handiagoak. P1/4 kalkulatzeko mediana kalkulatzeko jarraitu ditugun pausoak

    16

  • egingo ditugu baina hasieran N/2 kontsideratu beharrean N/4 kontsideratuko dugu.

    Bigarren kuartila (P2/4).

    Aldagaiaren balioen bi laurdenak, hau da behaketen erdia P2/4 baino txikiagoak edo berdinak

    dira eta hiru laurdenak bera baino handiagoak. P2/4 = Mediana betetzen da.

    Hirugarren kuartila (P3/4).

    Aldagaiaren balioen hiru laurdenak P3/4 baino txikiagoak edo berdinak dira eta laurden bat

    bera baino handiagoak. P3/4 kalkulatzeko mediana kalkulatzeko jarraitu ditugun pausoak

    egingo ditugu baina hasieran N/2 kontsideratu beharrean3N

    4kontsideratuko dugu.

    Dezilak.

    Aldagaiaren K-garren dezila, Dk, honela definitzen da: Dk balio bat da non aldagaiaren ba-

    lioen hamarreko K bera baino txikiagoak edo berdinak diren, K = 1, 2, 3, ..., 9 izanik. Dk

    kalkulatzeko mediana kalkulatzeko jarraitu ditugun pausoak egingo ditugu baina hasieran

    N/2 kontsideratu beharrean KN

    10kontsideratuko dugu.

    Zentilak edo pertzentilak.

    Aldagaiaren K-garren zentila edo pertzentila, Pk, honela definitzen da: Pk balio bat da non

    aldagaiaren balioen ehuneko K bera baino txikiagoak edo berdinak diren, K = 1, 2, 3, ..., 99

    izanik. Pk kalkulatzeko mediana kalkulatzeko jarraitu ditugun pausoak egingo ditugu baina

    hasieran N/2 kontsideratu beharrean KN

    100kontsideratuko dugu.

    6. SAKABANATZE-NEURRIAK

    Datu-multzoaren ideia orokorra ematen ziguten zentru-joeraren neurriek. Ideia hau osatzeko,

    zentru-joeraren inguruan datu-multzoa guztiz bilduta edo oso sakabanatuta dagoen adieraz-

    ten diguten estatistiko batzuk ere behar ditugu.

    Adibidea. Talde baten soldataren batezbestekoa 2000 eurokoa dela esaten bada, honek gutxi

    17

  • balio dezake askok gutxi eta gutxik asko irabazten badute, beste gauza bat litzateke denek

    berdin irabaziko balute. Nola jakin denek berdintsu edo askok gutxi eta gutxik asko ira-

    bazten duten? Sakabanatze-neurriak erabiliz. Hau da, gure datuak uniformeak zenbateraino

    diren edo beraien artean oso hurbil dauden edo oso berezituak dauden ikusi nahi badugu,

    sakabanatze-neurriak erabiliko ditugu.

    Suposa dezagun X aldagai estatistikoak x1, x2, ..., xk balioak hartzen dituela eta n1, n2, ..., nk

    aurreko balioei dagozkien maiztasun absolutuak direla, hurrenez hurren.

    Bariantza.

    X aldagai estatistikoaren bariantza honela definitzen da.

    σ2 =

    k∑i=1

    (xi − x̄)2ni

    N.

    σ2 karraturen batura denez, beti positibooa edo nulua izango da. σ2 = 0 baldin bada, orduan

    batugai guztiak nuluak dira eta xi guztiak x̄ balioa hartzen dute; beraz, sakabanatze txikiena

    izango dugu (nulua), behaketa guztiak puntu batean konzentratuta baitaude.

    Desbideratze tipikoa edo estandarra.

    Desbideratze tipikoa edo estandarra bariantzaren karratu positiboa bezala definitzen dugu.

    σ = +√

    σ2 =

    √√√√√√k∑

    i=1

    (xi − x̄)2ni

    N.

    Batez besteko desbideratzea.

    p batez besteko batekiko batez besteko desbideratzea honela definitzen dugu,

    DMp =

    k∑i=1

    | xi − p | ni

    N.

    Honela, Batezbesteko aritmetikoarekiko batez besteko desbideratzea ondokoa izango da

    DMx̄ =

    k∑i=1

    | xi − x̄ | ni

    N.

    18

  • Eta, Medianarekiko batez besteko desbideratzea

    DMMe =

    k∑i=1

    | xi −Me | ni

    N.

    Neurri hauek indibiduoen homogeneotasuna adierazten digute, hau da, desbideratzeak txikiak

    badira, batez besteko desbideratzea txikia izango da eta, alderantziz, handiak badira batez

    besteko desbideratzea handia izango da. Sakabanatze-neurri hauek aldagaia neurtuta dagoen

    unitateetan agertzen dira, hortaz, bi aldagairen konparaketa egin nahi badugu ez dira balia-

    garriak aldagaiak unitate desberdinetan adierazita badaude. Beraz, zenbaki abstraktuetan

    adierazitako sakabanatze-neurriak behar ditugu.

    Pearson-en aldakuntza-koefizientea.

    C.V. =σ

    | x̄ |.

    x̄ = 0 denean, koefiziente honek ez du zentzurik. Batzuetan, koefiziente hau 100 zenbakiaz

    biderkatuta agertzen da eta horrela lana portzentaiekin egingo dugu.

    Batez besteko aldakuntza-koefizientea (C.V.M).

    p batez besteko batekiko batez besteko aldakuntza-koefizientea honela definitzen da

    C.V.M.p =DMp| p |

    .

    p = x̄ edo p = Me baldin bada, honela geratzen da

    C.V.M.x̄ =DMx̄| x̄ |

    eta C.V.M.Me =DMMe|Me |

    .

    Ibiltartea.

    X aldagai batek hartzen dituen balio maximo eta minimoaren arteko diferentziari ibiltartea

    deritzogu. Hots, R = max(x)−min(x).

    Kuartil arteko ibiltartea. RI = P3/4 − P1/4.

    19

  • Kuartil arteko ibiltarte-erdia.

    RSI =P3/4 − P1/4

    2=

    RI2

    .

    Momentuak.

    p parametroarekiko r ordenako momentua honela definitzen dugu

    Mr(p) =

    k∑i=1

    (xi − p)rni

    N.

    Bi motatako momentu aztertuko ditugu

    • Jatorriarekiko momentuak.

    p = 0 denean, jatorriarekiko momentuak lortzen dira

    ar =

    k∑i=1

    (xi − 0)rni

    N=

    k∑i=1

    xri ni

    N.

    • Batezbestekoarekiko momentuak.

    p = x̄ denean, batezbestekoarekiko momentuak edo momentu zentralak lortzen dira

    mr =

    k∑i=1

    (xi − x̄)rni

    N.

    Momentu partikular batzuk aipatuko ditugu

    a0 =

    k∑i=1

    x0i ni

    N= 1, m0 =

    k∑i=1

    (xi − x̄)0ni

    N= 1,

    a1 =

    k∑i=1

    xini

    N= x̄, m1 =

    k∑i=1

    (xi − x̄)ni

    N=

    0

    1= 0,

    a2 =

    k∑i=1

    x2i ni

    N, m2 =

    k∑i=1

    (xi − x̄)2ni

    N= σ2.

    Beti aurki ditzakegu momentu zentratuak eta jatorriarekiko momentuak erlazionatzen

    dituzten erlazioak. Nahikoa da Newton-en binomioa erabiltzea.

    20

  • 7. ASIMETRI ETA ZAPALTASUN-ZORROZTASUN NEURRIAK.

    Aztertzen ari garen aldagaiaren datu-multzoa zentrurako joeraren eta sakabanatze balioen

    bidez nahiko argi geratu bada ere, itxuraren balio tipikoak aztertzean gehiago osa daiteke;

    hauen artean asimetri koefizientea eta kurtosi koefizientea ikusiko ditugu.

    7.1. BANAKETA SIMETRIKOAK

    Maiztasun-banaketa bat simetrikoa dela esango dugu balio zentral batekiko distantzikide diren

    aldagaiaren balioek maiztasun berdinak dituztenean.

    Banaketa bat moda batekoa eta simetrikoa baldin bada, batezbesteko aritmetikoa, moda eta

    mediana balio berean daude x̄ = Moda = Me.

    -

    6

    Barra-diagrama

    -

    6

    Histograma

    7.2. BANAKETA ASIMETRIKOAK

    Maiztasun-banaketa bat simetrikoa ez denean asimetrikoa dela esango dugu.

    Eskuinerantz asimetrikoa edo asimetri positiboa.

    Maiztasunak eskuinetik polikiago jaisten dira. Kasu honetan honako hau betetzen da:

    x̄ ≥Me ≥Moda.

    .

    -

    6

    Barra-diagrama

    -

    6

    Histograma21

  • Ezkerrerantz asimetrikoa edo asimetri negatiboa.

    Maiztasunak ezkerretik polikiago jaisten dira. Kasu honetan honako hau betetzen da:

    x̄ ≤Me ≤Moda.

    .

    -

    6

    Barra-diagrama

    -

    6

    Histograma

    7.3. ASIMETRI KOEFIZIENTEAK

    Ondorengo asimetri koefizienteak erabiltzen baditugu, banaketaren simetria edo asimetria

    ezagutu dezakegu adierazpen grafikoa egin gabe.

    • Pearson-en asimetri koefizientea.

    Ap =x̄−Md

    σ

    Ap > 0 Eskuinerantz asimetrikoa

    Ap = 0 Simetrikoa

    Ap < 0 Ezkerrerantz asimetrikoa

    Koefiziente honek banaketa baten asimetriaren maila emango digu. Nabaria denez moda

    bakarra duten banaketetan erabiliko dugu.

    • Fisher-en asimetri koefizientea.

    Koefiziente hau honela definitzen da

    AF =m3σ3

    AF > 0 Eskuinerantz asimetrikoa

    AF = 0 Simetrikoa

    AF < 0 Ezkerrerantz asimetrikoa

    22

  • • Kurtosi koefizientea edo zapaltasun-zorroztasun koefizientea.

    X, Y eta Z banaketen grafikak aztertzen baditugu, hirurek mugatzen duten azalera bat

    da baina itxuraren aldetik oso desberdinak dira.

    -

    6Leptokurtikoa

    Mesokurtikoa

    Platikurtikoa

    g2 kurtosi koefizientea aztertzen ari garen banaketaren zapaltasunaren adierazle bezala

    erabiliko dugu, eta banaketaren zapaltasuna emango digu banaketa normalaren zapal-

    tasunarekin konparatuz.

    g2 =m4σ4

    .

    Eta horrela,

    g2 > 3 Banaketa normala baino zorrotzagoa: leptokurtikoa,

    g2 = 3 Banaketa normalaren zapaltasuna: mesokurtikoa,

    g2 < 3 Banaketa normala baino zapalagoa: platikurtikoa.

    23