Òscar Forner Gumbau - RUA:...

127
INTRODUCCIÓ A L’ESTADÍSTICA Òscar Forner Gumbau Materials de suport a la docència en valencià DEPARTAMENT D’ESTADÍSTICA I INVESTIGACIÓ OPERATIVA UNIVERSITAT D'ALACANT 150

Transcript of Òscar Forner Gumbau - RUA:...

Page 1: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

INTRODUCCIÓ A L’ESTADÍSTICA

Òscar Forner Gumbau

Materials de suport a la docència en valencià

DEPARTAMENT D’ESTADÍSTICA I INVESTIGACIÓ OPERATIVA

UNIVERSITAT D'ALACANT

150

Page 2: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Òscar Forner Gumbau Aquest material docent ha rebut una beca del Servei de Política Lingüística de la Universitat d'Alacant L’edició d’aquest material s’ha fet dins el marc del conveni per a la promoció de l’ús social del valencià signat per la Universitat d’Alacant amb la Conselleria d’Educació. ISBN: 978-84-9717-278-3Dipòsit legal: A 592-2013 Alacant, juliol de 2013 (1a edició) Edició: Universitat d'Alacant. Servei de Política Lingüística Apartat de Correus 99 - 03080 Alacant

A/e: [email protected] tel. 96 590 34 85

Impressió: Limencop Universitat d’Alacant. Edifici de Ciències Socials – Planta baixa

http://www.limencop.com tel. 96 590 34 00 Ext. 2784

Page 3: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Índex

Presentació............................................................................................................ VII

Introducció............................................................................................................. IX

1. Introducció al procés i al mètode estadístic ...................................................... 11

1.1 Història de l’estadística ............................................................................. 11

1.2 Definició d’estadística .............................................................................. 12

1.3 El procés estadístic .................................................................................... 13

2. Descripció, organització i representació de les dades ..................................... 15

2.1 Conceptes bàsics ....................................................................................... 15

2.2 Taules de freqüències ................................................................................ 16

2.2.1 Taula de freqüències per a variables qualitatives ............................ 16

2.2.2 Taula de freqüències per a variables quantitatives discretes ........... 18

2.2.3 Taula de freqüències per a variables quantitatives contínues ........... 20

2.3 Representació gràfica ................................................................................. 23

2.3.1 Gràfics per a variables qualitatives ................................................... 23

2.3.2 Gràfics per a variables quantitatives discretes ................................. 26

2.3.3 Gràfics per a variables quantitatives continues ............................... 27

2.4 Gràfic de tija i fulles ................................................................................... 31

2.5 Exercicis proposats..................................................................................... 37

3. Estadística descriptiva d’una variable .............................................................. 41

3.1 Mesures de posició central o de centralització ........................................... 41

3.1.1 Mitjana aritmètica ............................................................................. 41

3.1.2 Mediana ............................................................................................ 44

3.1.3 Moda ................................................................................................. 47

3.2 Mesures de posició no central .................................................................... 49

3.2.1 Quartils ............................................................................................. 49

3.2.2 Percentils i decils .............................................................................. 53

3.3 Mesures de dispersió .................................................................................. 53

Page 4: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

3.3.1 Mesures de dispersió absolutes ........................................................ 54

3.3.2 Mesures de dispersió relatives .......................................................... 59

3.4 Gràfic de caixa i bigots .............................................................................. 62

3.5 Mesures de concentració ............................................................................ 64

3.5.1 Índex de Gini .................................................................................... 64

3.5.2 Corba de Lorenz ............................................................................... 65

3.6 Exercicis proposats .................................................................................... 66

4. Introducció a la probabilitat. Càlcul de probabilitats ....................................... 73

4.1 Experiments aleatoris ................................................................................. 73

4.2 Successos ................................................................................................... 74

4.2.1 Tipus de successos............................................................................ 74

4.2.2 Operacions amb successos ............................................................... 76

4.3 Probabilitat ................................................................................................. 78

4.3.1 Concepte de probabilitat ................................................................... 78

4.3.2 Probabilitat condicionada ................................................................. 80

4.3.3 Dependència i independència de successos ...................................... 81

4.3.4 Probabilitat composta ....................................................................... 82

4.3.5 Probabilitat total ............................................................................... 83

4.3.6 Teorema de Bayes ............................................................................ 83

4.3.7 Càlcul de probabilitats utilitzant taules de dades i diagrames en

arbre ........................................................................................................... 84

4.4 Exercicis proposats .................................................................................... 87

5. Distribucions de probabilitat discretes i contínues ........................................... 95

5.1 Variable aleatòria ....................................................................................... 95

5.2 Distribucions de probabilitat d’una variable aleatòria discreta .................. 96

5.2.1 Funció de probabilitat ....................................................................... 96

5.2.2 Funció de distribució ........................................................................ 97

5.3 Esperança i variància d’una variable aleatòria discreta ............................. 98

5.4 Distribució binomial .................................................................................. 99

5.4.1 Funció de probabilitat, funció de distribució, esperança i variància

d’una distribució binomial....................................................................... 100

5.4.2 Taula de la distribució binomial ..................................................... 103

5.5 Distribucions de probabilitat d’una variable aleatòria contínua............... 107

5.6 Distribució normal ................................................................................... 108

5.6.1 Representació i característiques ..................................................... 108

5.6.2 Distribució normal estàndard ......................................................... 109

5.6.3 Tipificació de la variable ................................................................ 109

Page 5: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

5.6.4 Taula de la corba N(0, 1) ................................................................ 110

5.7 Aproximació de la distribució binomial mitjançant la distribució normal

........................................................................................................................ 117

5.8 Exercicis proposats................................................................................... 121

Bibliografia ......................................................................................................... 127

Page 6: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país
Page 7: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

VII

Presentació del rector

La Universitat d’Alacant vol ser una universitat multilingüe amb personal i estudiants plurilingües actius, i això només és possible amb una bona formació en llengües, un component clau per a una universitat competitiva. Tot i que l’entorn més eficaç per a l’aprenentatge de les llengües és la immersió social o l’aprenentatge natural al si de la família, en l’àmbit escolar i universitari, aquests entorns es poden generar amb el tractament integrat de llengües i continguts. Des de l’equip de govern de la Universitat d’Alacant valorem la docència en valencià (i en altres llengües) com un component molt positiu en la formació universitària dels futurs professionals que estudien en aquesta Universitat. És una obligació de la Universitat formar bons professionals que en un futur pròxim puguen exercir en valencià, en castellà i en anglès, o en qualsevol altra llengua. Aquest material docent que ara presentem és un resultat més d’aquest compromís de l’actual equip de direcció de la Universitat de preparar bons professionals. Per a fer possible que els alumnes actuals i futurs de la Universitat puguen exercir de manera competent la seua professió en valencià hem de preparar bons professors que puguen impartir la docència en valencià i proporcionar materials de suport amb la millor qualitat possible. Un altre objectiu de la Universitat és promoure el coneixement en obert i facilitar i compartir recursos entre les universitats i els seus usuaris. Per això, aquests materials estan disponibles en edició digital i en el Repositori de la Universitat d’Alacant (RUA). L’edició de materials docents en valencià, l’autoarxivament en el RUA i l’impuls del coneixement en obert, són accions que formen part del desplegament d’una de les línies estratègiques de política lingüística: “Millorar i augmentar l’oferta de la docència en valencià i garantir-ne una bona qualitat lingüística” del Pla de Política Lingüística de la Universitat d’Alacant (BOUA de 5 de juliol de 2011). Aquestes iniciatives de suport a l’ús del valencià com a llengua d’ensenyament i aprenentatge han comptat amb el suport de la Generalitat Valenciana a través del conveni per a la promoció de l’ús del valencià.

Manuel Palomar Sanz Rector

Page 8: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país
Page 9: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

IX

Introducció

Aquest material ha sigut preparat per a desenvolupar els continguts de l’assignatura Introducció a l’Estadística del primer curs del grau de Gestió i Administració Pública de la Universitat d’Alacant. L’objectiu d’aquest material és que els alumnes puguen treballar els continguts de l’assignatura amb més facilitat, ja que en els cinc capítols que formen el quadern estan tots els materials necessaris per a seguir l’assignatura, tant en la part teòrica com pràctica, amb exemples resolts i exercicis proposats. El llenguatge que s’utilitza en aquest quadern es senzill i clar, ja que l’alumnat d’aquesta assignatura no sol tenir una gran formació en matemàtiques, per la qual cosa amb aquest material s’intenta que l’assignatura no siga un obstacle insuperable i els alumnes acaben amb una formació bàsica en estadística (amb aquesta assignatura i amb l’assignatura Estadística Aplicada a l’Administració Pública cursada en segon) per a la seua futura incorporació al mercat laboral. Amb aquest material també he volgut potenciar l’ús del valencià en la docència, ja que crec que és una millora en la formació dels estudiants. Això no hauria sigut possible sense l’ajuda de Xavier Casero, responsable de l’Àrea d’Assessorament Lingüístic del Servei de Promoció del Valencià, al qual agraïsc la seua ajuda i les seues correccions. Per últim, vull dedicar aquest llibre: als meus pares, Manuel i Fina, que tant han treballat per a ajudar-me sempre, als meus germans, Manolo i José, que sempre m’han donat suport i m’han ajudat, a les seues parelles i fills, i sobretot, a la meua parella, Mónica, que m’anima en tot el que faig i que amb el seu sacrifici m’ha donat temps per a fer aquest material, i als meus fills, Aitana i Manel, que són la major alegria de la meua vida. Òscar Forner Gumbau Professor del Departament d’Estadística i Investigació Operativa Universitat d’Alacant, juny de 2013

Page 10: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país
Page 11: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

11

1 Introducció al procés i al mètode estadístic

1.1 Història de l’estadística

Des dels començaments de la civilització han existit formes senzilles

d’estadística, ja que s'utilitzaven representacions gràfiques i altres símbols en

pells, roques, pals de fusta i parets de coves per a explicar el nombre de

persones, animals o certes coses.

Cap a l’any 3.000 a. de C. els babilonis usaven ja xicotetes taules d'argila per a

recopilar dades sobre la producció agrícola i dels gèneres venuts o canviats

mitjançant barata.

Els egipcis analitzaven les dades de la població i la renda del país molt abans

de construir les piràmides en el segle XXXI a. de C. Els llibres bíblics de

Nombres i Cròniques inclouen, en algunes parts, treballs d'estadística. El

primer conté dos censos de la població d’Israel i el segon descriu el benestar

material de les diverses tribus jueves. A la Xina hi havia registres numèrics

similars amb anterioritat a l'any 2.000 a. de C.

Els grecs clàssics feien censos la informació dels quals s'utilitzava cap al 594

a. de C. per a cobrar impostos.

L’Imperi romà va ser el primer govern que va recopilar una gran quantitat de

dades sobre la població, superfície i renda de tots els territoris sota el seu

control.

Durant l’edat mitjana només es van fer alguns censos exhaustius a Europa. Cal

destacar els que van fer els reis carolingis Pipí el Breu i Carlemany, que van

ordenar fer estudis minuciosos de les propietats de l’Església en els anys 758 i

762 respectivament. A Anglaterra, Guillem el Conqueridor va recopilar al

Domesday Book o Llibre del Gran Cadastre a l’any 1086, un document de la

propietat, extensió i valor de les terres d’Anglaterra. Aquesta obra va ser la

primera recopilació de dades estadístiques d’Anglaterra.

El registre de naixements i defuncions va començar a Anglaterra a principis

del segle XVI, i el 1662 va aparèixer el primer estudi estadístic notable de

població, titulat Observations on the London Bills of Mortality (Comentaris

sobre les partides de defunció a Londres). Un estudi similar sobre la taxa de

mortalitat en la ciutat de Breslau, a Alemanya, fet el 1691, va ser utilitzat per

Page 12: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

12 Introducció a l’estadística

l’astrònom anglès Edmund Halley com a base per a la primera taula de

mortalitat.

Durant el segle XVIII es fan els primers censos oficials a Europa. Es pot dir

que fins a finals del segle XVIII i principis del XIX tots els treballs estadístics

eren purament descriptius.

El vertader origen de l’estadística moderna pot situar-se en l’última dècada del

segle XIX, com a resultat de la unió de dos disciplines que evolucionaren de

forma independent: el càlcul de probabilitats, que ve nàixer en el segle XVII

com a teoria matemàtica dels jocs d’atzar, i l’estadística, o ciència de l’estat,

que estudia la descripció de les dades i que té, com hem dit, unes arrels més

antigues.

En els nostres dies, l’estadística s’ha convertit en un mètode efectiu per a

descriure amb exactitud els valors de dades econòmiques, polítiques, socials,

psicològiques, biològiques i físiques, i serveix com a eina per a relacionar i

analitzar aquestes dades. El treball de l’expert estadístic no consisteix ja només

a reunir i tabular les dades, sinó sobretot en el procés d’interpretació d’aquesta

informació.

El desenvolupament de la teoria de la probabilitat ha augmentat l’abast de les

aplicacions de l’estadística. Molts conjunts de dades es poden aproximar, amb

gran exactitud, utilitzant determinades distribucions probabilístiques; els

resultats d'aquestes es poden utilitzar per a analitzar dades estadístiques. La

probabilitat és útil per a comprovar la fiabilitat de les inferències estadístiques

i per a predir el tipus i la quantitat de dades necessàries en un determinat estudi

estadístic.

1.2 Definició d’estadística

L’estadística és la disciplina que estudia els mètodes científics per a

arreplegar, organitzar, resumir i analitzar dades, així com per a traure

conclusions vàlides i prendre decisions raonables basades en aquesta anàlisi.

Arreplegar: mitjançant observació, mesures, enquestes, etc.

Organitzar: s’ordenen les dades per a ficar-les en taules i es construeixen

representacions gràfiques.

Resumir: resumim les dades en uns pocs valors que proporcionen la màxima

informació possible.

Analitzar: es fa utilitzant el càlcul de probabilitats i se centra a elaborar

estimacions, contrastos d’hipòtesis, prediccions i mesurar relacions o

dependències.

Hi ha dos grans branques clarament diferenciades dins de l’estadística:

l’estadística descriptiva (o aplicada), que arreplega els tres primers passos, i

l’inferència estadística, que arreplega l’últim pas.

Page 13: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Introducció al procés i al mètode estadístic 13

1.3 El procés estadístic

Tota investigació estadística comprèn una sèrie d’etapes o fases que podem

classificar així:

a) Fase de planificació:

Plantejament del problema i clarificació de l’objectiu que es

persegueix.

Determinació de la variable o variables que hi intervenen.

Identificació dels individus a investigar.

Selecció de la mostra (quan faça falta).

b) Fase d’execució: obtenció de les dades i la seua posterior descripció o

anàlisi.

c) Fase de conclusions i informació.

Per a comprendre millor aquestes fases, vegem-ne un exemple:

a) Suposem que l’objectiu de la investigació és conèixer el rendiment

acadèmic dels alumnes de 1r de GAP en la Universitat d’Alacant.

Una vegada fixat l’objectiu de l’estudi, el pas següent serà seleccionar

les variables i identificar els individus que ens ajuden a aconseguir

aquest objectiu; en el nostre cas està clar que les variables seran les

qualificacions en les diferents assignatures dels alumnes de primer

curs de GAP.

b) A continuació, passem a l’obtenció de les dades, és a dir, conèixer les

notes dels alumnes en les diferents assignatures.

Aquesta informació no serà útil si no l’ordenem en forma de taules per

assignatura. A més, podem obtenir ràpidament una idea

complementària sobre com ha sigut aquest rendiment fent la

representació gràfica d’aquesta informació.

Perquè aquesta quantitat de dades siga manejable, podem utilitzar

algunes mesures que sintetitzen la informació i que ens permeten

realitzar comparacions amb altres investigacions similars. Aquestes

mesures poden ser per exemple: la nota mitjana final per alumne, les

notes mitjanes del conjunt d’alumnes per assignatura, l’anàlisi

comparativa de les notes entre alumnes i assignatura, etcètera.

c) Per últim, traiem les conclusions sobre el rendiment acadèmic

d’aquest grup d’estudiants.

Page 14: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país
Page 15: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

15

2 Descripció, organització i representació de les dades

En aquest tema primer veurem els conceptes bàsics de població, mostra,

element i tipus de variable. Després ordenarem i organitzarem les dades

estadístiques mitjançant taules de freqüències, per a continuació representar-

les gràficament. Finalment veurem el gràfic de tija i fulles, el qual ens permet

organitzar i representar les dades simultàniament.

2.1 Conceptes bàsics

- Individu o element: persones o objectes que contenen certa informació que

es vol estudiar.

- Població: conjunt d'individus o elements que compleixen certes propietats

comunes.

- Mostra: subconjunt representatiu d’una població, l’estudi de la qual serveix

per a inferir característiques de tota la població.

- Grandària de la població: nombre d'individus que formen la població. En

relació amb la grandària de la població, aquesta pot ser finita o infinita.

Exemple

Volem estudiar el gènere cinematogràfic favorit dels alumnes de GAP de la

Universitat d’Alacant. Per a aquest cas particular:

Població: tots els alumnes de GAP de la Universitat d’Alacant.

Individus: cadascun dels alumnes.

Grandària de la població: nombre total d'alumnes. En aquest cas la població

seria finita.

Mostra: subconjunt d’alumnes de GAP als qui preguntem sobre el seu gènere

cinematogràfic preferit.

- Variable o caràcter: propietat, tret o qualitat dels elements de la població, i

que pretenem estudiar.

Page 16: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

16 Introducció a l’estadística

- Variable qualitativa: els valors que pren no són quantificables. Una variable

qualitativa pot ser a més nominal, si no és possible establir un ordre en les

seues modalitats; o ordinal, si pel contrari sí que s’hi pot establir un ordre.

Exemple

Són variables qualitatives nominals: els colors (roig, blau...), el sexe d’una

persona, la professió, l’estat civil...

Són variables qualitatives ordinals: l’ordre d'arribada a la meta en una

competició (1r, 2n, 3r ...), els rangs militars...

- Variable quantitativa: és aquella els valors de la qual són quantitats

numèriques amb les quals podem fer operacions aritmètiques. Dins d’aquest

tipus de variables podem distingir-ne dos grups:

Discretes: quan no admeten un valor intermedi entre dos qualssevol

dels seus valors i cada valor de la variable és un nombre natural.

Contínues: quan admeten un valor intermedi entre dos qualssevol dels

seus valors. En aquests casos, els valors de la variable són nombres

reals.

Exemple

Són variables quantitatives discretes: el nombre de fills per unitat familiar, el

total d'assignatures completes aprovades durant un curs, el nombre de vegades

que s'ha anat al cinema en els últims dos mesos...

Són variables quantitatives contínues: el pes d'un xiquet en nàixer, la

temperatura del cos, la longitud del braç...

Si la variable estadística és contínua, o si hi ha moltes dades, els valors

obtinguts s’agrupen en intervals o classes. Cada classe és un interval de la

forma [a , b[, és a dir, tancat per l’esquerra i obert per la dreta. Això vol dir

que a aquest interval pertanyen els valors majors o iguals que a i els menors

que b (a ≤ x < b).

2.2 Taules de freqüències

Les taules de freqüències serveixen per a ordenar i organitzar les dades

estadístiques. Anem a distingir tres tipus de taules, segons que la variable siga

qualitativa, quantitativa discreta o quantitativa contínua.

2.2.1 Taula de freqüències per a variables qualitatives

Considerem una població o mostra de n individus, descrita segons un caràcter

o variable X qualitatiu, els valors de la qual són . Per a cadascun

d'aquests valors, introduïm les següents magnituds:

- Freqüència absoluta: és el nombre de vegades que apareix cada valor de la

variable. La denotarem per .

Page 17: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Descripció, organització i representació de les dades 17

La suma de les freqüències absolutes, , és el nombre total d’observacions de

la variable. La denotarem per .

- Freqüència relativa: és el quocient entre la freqüència absoluta d’un valor

de la variable i el nombre total d’observacions de la variable. La denotarem

per .

La suma de les freqüències relatives, , és la unitat.

La freqüència relativa és el tant per u d’observacions que pertanyen a cada

valor de la variable. Si multipliquem la freqüència relativa per 100%,

representarà el percentatge de la mostra o població que té aquest valor:

Una taula estadística de freqüències serveix per a presentar de forma ordenada

les dades de la variable. La taula de freqüències per a variables qualitatives

serà d’aquesta manera:

Exemple

L’estat civil d’un grup de 20 persones és el següent:

X

Solter 4 4/20 20%

Casat 6 6/20 30%

Vidu 7 7/20 35%

Divorciat 3 3/20 15%

Total 20 1 100%

X Freq. abs. ( ) Freq. rel. ( ) Percentatge ( )

... ... ... ...

... ... ... ...

Total 1 100%

Page 18: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

18 Introducció a l’estadística

2.2.2 Taula de freqüències per a variables quantitatives discretes

Considerem una població o mostra de n individus, descrita segons un caràcter

o variable X quantitativa discreta, els valors de la qual són . Per a

cadascun d’aquests valors, introduïm les següents magnituds:

- Freqüència absoluta: és el nombre de vegades que apareix cada valor de la

variable. La denotarem per . La suma de les freqüències absolutes, , és el nombre total d’observacions de

la variable. La denotarem per .

- Freqüència relativa: és el quocient entre la freqüència absoluta d’un valor

de la variable i el nombre total d’observacions de la variable. La denotarem

per .

La suma de les freqüències relatives, , és la unitat.

La freqüència relativa és el tant per u d’observacions que pertanyen a cada

valor de la variable. Si multipliquem la freqüència relativa per 100%,

representarà el percentatge de la mostra o població que té aquest valor:

- Freqüència absoluta acumulada: és la suma de les freqüències absolutes

fins un valor determinat de la variable. La denotarem per .

L’últim valor de la freqüència absoluta acumulada coincideix amb el nombre

d’observacions de la variable.

- Freqüència relativa acumulada: és la suma de les freqüències relatives fins

un valor determinat de la variable. La denotarem per .

També podríem definir la freqüència relativa acumulada com el quocient entre

cada una de les freqüències absolutes acumulades i el nombre total

d’observacions de la variable.

Page 19: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Descripció, organització i representació de les dades 19

L’últim valor de la freqüència relativa acumulada és la unitat.

La freqüència relativa acumulada és el tant per u d’observacions fins un valor

determinat de la variable. Si multipliquem la freqüència relativa acumulada

per 100%, representarà el percentatge acumulat de la mostra o població fins

un valor determinat de la variable:

La taula de freqüències per a variables quantitatives discretes serà d’aquesta

manera:

Exemple

Per a conèixer l’acollida que un jardí d’infància pot tenir en un barri, ens

interessa saber el nombre de matrimonis amb els dos components menors de

40 anys que hi ha en cada bloc d’edificis i hem obtingut els següents resultats:

5 7 7 5 4 6 2 6 5 5 4 3

X

... ... ... ... ... ...

... ... ... ... ... ...

X

2 1 1 1/12 1/12 8,33% 8,33%

3 1 2 1/12 2/12 8,33% 16,67%

4 2 4 2/12 4/12 16,67% 33,33%

5 4 8 4/12 8/12 33,33% 66,67%

6 2 10 2/12 10/12 16,67% 83,33%

7 2 12 2/12 12/12 =1 16,67% 100%

Total 12 1 100%

Page 20: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

20 Introducció a l’estadística

2.2.3 Taula de freqüències per a variables quantitatives continues

Considerem una població o mostra de n individus, descrita segons un caràcter

o variable X quantitatiu, els valors de la qual són .

El problema que es presenta en treballar amb aquest tipus de variables és

l’enorme quantitat de modalitats diferents que poden arribar a aparèixer. El

més convenient és agrupar les dades en classes o intervals, en cadascun dels

quals s’inclouen determinats valors de la variable. Aquest agrupament també

és convenient fer-ho amb variables quantitatives discretes amb un nombre

elevat de valors diferents.

- Cadascun dels intervals vindrà definit per una parella de valors, i que

s’anomenaran límits de l’interval, i en l’interval estaran tots els

valors de X menors que i majors o iguals que .

- La diferencia s’anomena amplitud de l’interval.

- El punt mitjà de cada interval s’anomena marca de classe.

Exemple

En l’interval estan tots els valors majors o iguals que i menors que .

L’amplitud de l’interval serà:

La marca de classe serà:

A l’hora de construir els intervals es pot fer de diverses maneres. Nosaltres

utilitzarem la fórmula de Sturges per al càlcul del nombre d’intervals.

Passos a seguir per a la construcció dels intervals:

1) Ordenem les dades de menor a major:

2) Apuntem la unitat de precisió de les dades (up)

3) Calculem el rang de les dades:

4) Calculem el rang ampliat:

5) Calculem el nombre d’intervals utilitzant la fórmula de Sturges

6) Calculem l’amplitud de l’interval:

Page 21: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Descripció, organització i representació de les dades 21

Si l’amplitud de l’interval no està amb la mateixa unitat de precisió

que les dades, aquest valor de l’amplitud l’hem d’arredonir per excés a

la unitat de precisió.

7) Si hem arredonit el valor de l’amplitud de l’interval, hem de calcular

el rang final:

8) Calculem el límit inferior del primer interval, :

Si no hem arredonit l’amplitud de l’interval, fem

Si hem arrodonit l’amplitud de l’interval, és a dir, hem calculat el rang

final, fem

9) Calculem el límit superior del primer interval sumant al límit inferior,

, l’amplitud de l’interval, és a dir,

10) El límit inferior del segon interval serà igual al límit superior del

primer interval i el límit superior del segon interval el calcularem

sumant l’amplitud al límit inferior de l’interval, igual que hem fet

abans en el primer interval. La resta d’intervals s’obtindran de la

mateixa manera, és a dir,

Una vegada calculats els intervals els posem en columna, calculem les seues

marques de classe i les freqüències.

Per a cadascun dels intervals podem definir els conceptes de freqüència

absoluta, freqüència absoluta acumulada, freqüència relativa, freqüència

relativa acumulada, percentatge i percentatge acumulat, tal com hem fet per a

les variables quantitatives discretes.

Exemple

Disposem de les següents dades sobre les alçades en centímetres dels

components d’un equip de bàsquet:

172 168 167 175 179 180 198 164

174 177 182 185 191 173 160 166

Fem una taula de freqüències agrupant les dades amb intervals solapats d’igual

amplitud utilitzant la fórmula de Sturges.

Page 22: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

22 Introducció a l’estadística

Passos a seguir:

1) Ordenem les dades:

Nombre de dades:

2) Unitat de precisió:

3)

4)

5) Formula de Sturges

6)

7) Calculem el rang final perquè hem hagut d’arredonir l’amplitud

8) Calculem :

9) Calculem :

aleshores el primer interval és:

10) La resta d’intervals són:

Fem la taula de freqüències:

Intervals Marca

classe

Page 23: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Descripció, organització i representació de les dades 23

Taula de freqüències amb intervals de diferent amplitud

Si l’amplitud dels intervals no és constant, apareix el concepte de densitat de

freqüències en cada interval:

on és l’amplitud de l’interval corresponent.

Exemple

2.3 Representació gràfica

En una taula estadística de freqüències hi ha tota la informació disponible. No

obstant això amb les representacions gràfiques es pretén, amb un colp de vista,

presentar i resumir de manera efectiva el comportament de la mostra o

població respecte la variable estudiada.

Segons la naturalesa de la variable estudiada, les representacions gràfiques

més usuals són les següents:

2.3.1 Gràfics per a variables qualitatives

Diagrama de barres

Cada valor diferent de la variable està representat per un rectangle. Com a base

de cada rectangle es prenen segments d’igual amplitud sobre l’eix d’abscisses i

l’altura de cadascun d’ells és proporcional a la freqüència absoluta del valor

que representa.

Exemple

L’estat civil d’un grup de 20 persones és el següent:

X Solter 4

Casat 6

Vidu 7

Divorciat 3

20

Intervals

Page 24: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

24 Introducció a l’estadística

Diagrama de sectors

Per a fer el diagrama de sectors es divideix l’àrea total del cercle en tantes

porcions com valors diferents de la variable hi haja. Cada valor ve representat

per un sector circular, l’àrea del qual ha de ser proporcional a la seua

freqüència absoluta. Una manera ràpida de calcular l’angle corresponent a

cada sector és multiplicar la freqüència relativa de cada valor diferent per 360º.

Exemple

L’estat civil d’un grup de 20 persones és el següent:

0

1

2

3

4

5

6

7

8

Solter Casat Vidu Divorciat

Diagrama de barres

X Solter 4 4/20

Casat 6 6/20

Vidu 7 7/20

Divorciat 3 3/20

20 1

Page 25: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Descripció, organització i representació de les dades 25

Pictogrames

Expressen amb dibuixos al·lusius al tema d’estudi les freqüències absolutes

dels valors de la variable. Aquests gràfics es fan generalment representant a

diferents escales un mateix dibuix o repetint el mateix dibuix

proporcionalment al valor de les freqüències. L’escalament dels dibuixos ha de

ser tal que l’àrea de cadascun d'ells siga proporcional a la freqüència del valor

que representa. Aquests tipus de gràfics s’utilitzen habitualment als mitjans de

comunicació, perquè siguen compresos pel públic no especialitzat, sense que

siga necessària una explicació complexa.

Exemple

En la taula següent apareixen els dies de pluja a les ciutats d’Alacant i Castelló

l’any 2011.

Ciutat Dies de pluja ( ) Alacant 66

Castelló 84

Diagrama de sectors

Solter

Casat

Vidu

Divorciat

0

10

20

30

40

50

60

70

80

90

Alacant Castelló

Pictograma

Page 26: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

26 Introducció a l’estadística

2.3.2 Gràfics per a variables quantitatives discretes

Diagrama de barres

S’utilitza quan la variable té pocs valors diferents. El diagrama es construeix

situant en l’eix d'abscisses els valors diferents de la variable, i sobre ells, i

paral·lels a l'eix d’ordenades, barres de longitud igual a les freqüències

absolutes (o relatives).

Exemple

En la taula següent apareixen classificades 12 famílies pel nombre de fills:

Polígon de freqüències

S’obté unint, mitjançant segments de recta, els extrems superiors de les barres

d’un diagrama de barres.

Exemple

En la taula següent apareixen classificades 12 famílies pel nombre de fills:

0

1

2

3

4

5

6

1 2 3 4

Diagrama de barres

Nombre

de fills

1 1

2 3

3 5

4 3

12

Nombre

de fills

1 1

2 3

3 5

4 3

12

Page 27: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Descripció, organització i representació de les dades 27

2.3.3 Gràfics per a variables quantitatives continues

Histograma

Les representacions gràfiques més adequades per a variables quantitatives

contínues, o discretes amb un gran nombre de valors possibles, són els

histogrames.

Es construeix a partir de la taula de freqüències. Sobre l’eix d’abscisses

s’escriuen els intervals, alçant sobre cadascun d’aquests un rectangle que té

aquest segment com a base. El criteri per a calcular l’altura de cada rectangle

és el de mantenir la proporcionalitat entre les freqüències absolutes (o

relatives) de cada interval i l’àrea dels mateixos.

0

1

2

3

4

5

6

1 2 3 4

Diagrama de barres i polígon de freqüències

0

1

2

3

4

5

6

1 2 3 4

Polígon de freqüències

Page 28: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

28 Introducció a l’estadística

Les condicions bàsiques per a un traçat correcte de l’histograma són:

Els rectangles han d’aparèixer juxtaposats, per a respectar la

continuïtat de la variable.

La mesura de la base de cada rectangle ha de ser l’amplitud de la

classe corresponent.

Si l’amplitud és constant, l’alçada de cada rectangle es pren com la

freqüència absoluta, , de l’interval sobre el qual està situat.

En el cas que els intervals no siguen tots de la mateixa amplitud,

l’alçada de cada rectangle serà la densitat de freqüència de l’interval

corresponent, és a dir, el quocient entre la freqüència absoluta de

l’interval i la seua amplitud.

També podem representar un histograma de freqüències acumulades. Els

passos a seguir són els mateixos que abans però tenint en compte les

freqüències absolutes acumulades en lloc de les freqüències absolutes.

Exemple

Disposem de les següents dades sobre les alçades en centímetres dels

components d’un equip de bàsquet:

0

1

2

3

4

5

6

[159,167[ [167,175[ [175,183[ [183,191[ [191,199[

Histograma amb intervals d'igual amplitud

Intervals

Page 29: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Descripció, organització i representació de les dades 29

Exemple

Disposem de les següents dades sobre les mesures (en metres quadrats) de les

habitacions d’una casa.

0

2

4

6

8

10

12

14

16

18

[159,167[ [167,175[ [175,183[ [183,191[ [191,199[

Histograma de freqüències acumulades

0

0,5

1

1,5

2

2,5

[2,4[ [4,7[ [7,12[

Histograma amb intervals de diferent amplitud

Intervals

Page 30: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

30 Introducció a l’estadística

Polígon de freqüències

S’obté unint, mitjançant segments de recta, els punts mitjans de les bases

superiors dels rectangles de l’histograma. Es prolonga la línia poligonal fins a

tallar l’eix d’abscisses en els punts mitjans dels intervals anterior al primer i

següent a l’últim, assignant-los d’aquesta manera freqüència nul·la.

És important assenyalar que l’àrea que hi ha per davall del polígon de

freqüències és igual a la suma de les àrees dels rectangles de l’histograma.

També podem representar un polígon de freqüències acumulades. Per a

realitzar aquest polígon el que tenim que fer és unir els vèrtexs superiors drets

dels rectangles de l’histograma de freqüències acumulades mitjançant una línia

poligonal.

Exemple:

Tornant a l’exemple anterior, el polígon de freqüències seria de la forma:

0

1

2

3

4

5

6

[159,167[ [167,175[ [175,183[ [183,191[ [191,199[

Histograma i polígon de freqüències

0

1

2

3

4

5

6

[159,167[ [167,175[ [175,183[ [183,191[ [191,199[

Polígon de freqüències

Page 31: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Descripció, organització i representació de les dades 31

2.4 Gràfic de tija i fulles

El gràfic de tija i fulles es construeix a partir de les dades originals de les

variables quantitatives, tant discretes com contínues.

Les indicacions per a la seua construcció són les següents:

- Per al nombre de dades que nosaltres manegem, els gràfics han de

tenir sempre de 4 a 12 files.

- Les dades han de tenir el mateix nombre de dígits tant enters com

decimals. Si no és així, afegirem zeros a dreta o esquerra (segons ens

convinga).

0

2

4

6

8

10

12

14

16

18

[159,167[ [167,175[ [175,183[ [183,191[ [191,199[

Histograma i polígon de freqüències acumulades

0

2

4

6

8

10

12

14

16

18

[159,167[ [167,175[ [175,183[ [183,191[ [191,199[

Polígon de freqüències acumulades

Page 32: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

32 Introducció a l’estadística

- Una vegada aconseguit el mateix nombre de dígits, les dades es

divideixen en dues parts: la de l'esquerra serà la tija i la de la dreta les

fulles.

- Es dibuixa una línia vertical i a la seua esquerra s’anoten en columna

les tiges ordenades de menor a major. Les tiges han de ser

consecutives i abastar tot el recorregut de la variable.

- A la dreta de la línia vertical s’anoten les fulles corresponents a cada

tija. Les fulles s’ordenen de menor a major i han d’ocupar el mateix

espai. Han d’haver-hi tantes fulles com nombre d’observacions.

- Hem d’indicar les xifres decimals que presenten les nostres dades. Si

les nostres dades presenten xifres decimals, farem el gràfic com si no

les tingueren i al final, indicarem per quina quantitat han de

multiplicar-se les dades del gràfic per a obtenir les nostres dades

originals. Així, si tenim dos xifres decimals, al final del gràfic

escriurem × 0,01.

- Si volem aconseguir més files en el nostre gràfic podrem dividir cada

tija en dos files, reservant el símbol * per a la primera meitat de les

fulles possibles i el símbol º per a la resta, o en 5 files, on els símbols

utilitzats són:

* per al 20% inicial de fulles

t per al 20% següent

f per al 20% següent

s per al 20% següent

º per a l'últim 20%

El gràfic de tija i fulles és molt útil per les raons següents:

- Ens presenta les dades ordenades, cosa que serà útil per al càlcul

d'algunes mesures que veurem posteriorment.

- És una tècnica d’organització de les dades que permet obtindre

simultàniament la distribució de freqüències i la seua representació

gràfica, ja que, si ho girem, ens presenta la forma que té l’histograma

(la forma de l'histograma és la mateixa que la del gràfic de tija i fulla

si aquest últim el girem 90º cap a l'esquerra).

A continuació veurem com arribar a aquesta construcció, pas a pas, amb un

exemple. Les dades de les quals partim són:

4 12 23 32 18 7 12 15

51 45 42 45 56 21 23 35

En primer lloc, les dades han de tenir el mateix nombre de dígits tant enters

com decimals. Si no és així, afegirem zeros a dreta o esquerra (segons ens

convinga). Així, les dades ens quedaran:

04 12 23 32 18 07 12 15

51 45 42 45 56 21 23 35

Page 33: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Descripció, organització i representació de les dades 33

Una vegada aconseguit el mateix nombre de dígits, les dades es divideixen en

dos parts: la de l'esquerra serà la tija i la de la dreta, les fulles. Per tant,

tindrem:

0

1

2

3

4

5

A continuació anem escrivint les fulles seguint les dades: la primera dada és

04, que té tija 0 i fulla 4, per la qual cosa situem un 4 al costat de la tija 0; la

segona dada és 12, per la qual cosa situem un 6 al costat de la tija 1 i així

successivament, obtenint el gràfic que apareix a continuació:

0 4 7

1 2 8 2 5

2 3 1 3

3 2 5

4 5 2 5

5 1 6

Després ordenem les fulles en cadascuna de les tiges i obtenim el gràfic que

volíem de tija i fulles:

0 4 7

1 2 2 5 8

2 1 3 3

3 2 5

4 2 5 5

5 1 6

A continuació, veurem una sèrie d’exemples on ens apareixeran tots els tipus

de casos diferents que podem tenir.

Exemple:

Fer el gràfic de tija i fulles per a les dades:

4 12 23 18 7 12 15

51 45 42 45 56 21 23

0 4 7

1 2 2 5 8

2 1 3 3

3

4 2 5 5

5 1 6

Les tiges intermèdies que queden buides no poden ser eliminades, però si

queden al principi o al final les eliminem.

Page 34: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

34 Introducció a l’estadística

Exemple:

Fer el gràfic de tija i fulles per a les dades:

14 12 23 22 27 17 12 15

11 25 12 15 10 21 23 25

Si agafem com a tija el primer dígit de les xifres sols tindrem dos tiges (el

mínim hem dit que és quatre), per la qual cosa dividirem cada tija en dos o

cinc parts. Per tant, tenim dos possibilitats:

1* 0 1 2 2 2 4

º 5 5 7

2* 1 2 3 3

º 5 5 7

o bé

1* 0 1

t 2 2 2

f 4 5 5

s 7

º

2* 1

t 2 3 3

f 5 5

s 7

Exemple:

Fer el gràfic de tija i fulles per a les dades:

0,4 1,2 2,3 3,2 1,8 0,7 1,2 1,5

5,1 4,5 4,2 4,5 5,6 2,1 2,3 3,5

0 4 7

1 2 2 5 8

2 1 3 3

3 2 5

4 2 5 5

5 1 6

×0,1

Exemple:

Fer el gràfic de tija i fulles per a les dades:

114 112 123 132 118 167

112 165 151 145 142 145

156 121 163 135

Ara les nostres dades tenen 3 dígits, per la qual cosa hem de decidir què és la

tija i què és la fulla. En principi, tenim dues possibilitats: que les dues primeres

constituïsquen la tija i l'última la fulla, o bé triar la primera xifra la tija i les

dues últimes la fulla. Amb la primera opció el gràfic ens quedarà:

Page 35: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Descripció, organització i representació de les dades 35

11 2 2 4 8

12 1 3

13 2 5

14 2 5 5

15 1 6

16 3 5 7

Amb la segona opció el gràfic quedarà així:

1* 12 12 14 18

t 21 23 32 35

f 42 45 45 51 56

s 63 65 67

Exemple:

Fer el gràfic de tija i fulles per a les dades:

1,14 1,12 1,23 1,32 1,18 1,67

1,12 1,65 1,51 1,45 1,42 1,45

1,56 1,21 1,63 1,35

Tenim dos possibilitats:

11 2 2 4 8

12 1 3

13 2 5

14 2 5 5

15 1 6

16 3 5 7

×0,01

o bé:

1* 12 12 14 18

t 21 23 32 35

f 42 45 45 51 56

s 63 65 67

×0,01

Exemple:

Fer el gràfic de tija i fulles per a les dades:

1,14 2,12 1,23 1,32 1 1,67

1,02 2 1,51 3,45 1,42 1,45

2,56 3,12 3,63 1,35

En primer lloc, les dades han de tenir el mateix nombre de dígits tant enters

com decimals, així que afegirem zeros a l’esquerra. Aleshores les dades ens

quedaran:

Page 36: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

36 Introducció a l’estadística

1,14 2,12 1,23 1,32 1,00 1,67

1,02 2,00 1,51 3,45 2,52 1,45

2,56 3,12 3,63 2,35

Agafem com a tija la primera xifra i les dividim en dos files. No té sentit fer

més divisions, ja que aleshores ens eixirien massa files.

×0,01

Pas d’un gràfic de tija i fulles a una taula de freqüències

El pas d'un diagrama de tija i fulles a una taula de freqüències és senzill,

cadascuna de les tiges representarà una classe i el nombre de fulles la seua

freqüència absoluta. Com hem de treballar amb intervals solapats, restarem i

sumarem la meitat del nivell de precisió a l'extrem inferior i superior de cada

classe.

Exemple:

Fer el gràfic de tija i fulles per a les dades següents i construeix a partir del

gràfic la taula de freqüències:

4 12 23 32 18 7 12 15

51 45 42 45 56 21 23 35

0 4 7

1 2 2 5 8

2 1 3 3

3 2 5

4 2 5 5

5 1 6

A partir d’aquest gràfic obtenim les següents classes:

Intervals

Com la unitat de precisió d’aquestes dades és 1, sumarem i restarem a

cadascun dels intervals 0,5 i la taula de freqüències quedarà així:

1* 00 02 14 23 32 45

º 51 67

2* 00 12 35

º 52 56

3* 12 45

º 63

Page 37: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Descripció, organització i representació de les dades 37

Intervals

2.5 Exercicis proposats

1. Considerem les següents dades relatives a una variable aleatòria:

5 25 32 7 102 20 382 50 19 5 40 7

232 70 65 9 26 8 29 83 28 16 12 45

16 41 15 159 76 80 236 6 30 18 42 300

10 14 5 40 42 13 19 87 23 132 63 330

a. Construeix la taula de freqüències apropiada amb intervals solapats i

d'igual amplitud aplicant la fórmula de Sturges.

b. A partir de la taula anterior, quin percentatge de dades es troben per

sobre de 75?

2. Es va fer una anàlisi de sang a 40 estudiants d’una universitat espanyola, i es

van obtindre les següents quantitats de colesterol en mg/dl:

135 169 126 149 197 221 220 147 165 178

212 184 173 195 218 139 212 230 159 148

201 159 192 214 178 188 205 196 174 201

142 199 178 245 200 191 187 138 201 216

a. Agrupar les dades en 10 intervals solapats d’igual amplitud .

b. Fes amb les dades de la taula anterior un histograma i un polígon de

freqüències absolutes.

c. Fes amb les dades de la taula anterior un histograma i un polígon de

freqüències acumulades.

d. A partir de la taula anterior, digues el percentatge d’homes amb una

xifra de colesterol compresa entre 198 i 233 mg/dl.

e. Construeix ara un gràfic de tiges i fulles apropiat i construeix a partir

d’ell la taula de freqüències.

Page 38: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

38 Introducció a l’estadística

3. En la següent taula veiem les faltes d’assistència d’un grup d’alumnes d’un

institut en l’assignatura de Matemàtiques al llarg d’un curs escolar.

a. Agrupeu les dades en una taula de distribució de freqüències amb 7

intervals superposats d'igual amplitud.

b. Fes amb les dades de la taula anterior un histograma i un polígon de

freqüències absolutes.

c. Fes amb les dades de la taula anterior un histograma i un polígon de

freqüències acumulades.

d. Quin percentatge d’alumnes es troben entre 7 i 14 faltes d’assistència?

Calcula-ho a partir de les dades reals i a partir de la taula de l'apartat a.

e. Fes un gràfic de tiges i fulles apropiat.

f. Construeix la taula de freqüències apropiada amb intervals superposats

i d'igual amplitud aplicant la fórmula de Sturges.

g. A partir de la taula feta en l’apartat f calcula:

- el percentatge d’alumnes que es troben entre 7 i 14 faltes

d’assistència.

- el percentatge d’alumnes que tenen menys de 5 faltes d’assistència.

- el percentatge d’alumnes que tenen més de 18 faltes d’assistència.

4. Per a esbrinar la intenció de vot d’un poble sobre tres candidats A, B i C a

les pròximes eleccions, s’ha entrevistat a una mostra de 400 persones triades a

l’atzar d’aquest poble, amb els següents resultats: el 35,2% prefereixen A, el

28,8% prefereixen B, el 31,7 % prefereixen C i la resta no mostra preferència

per cap candidat o no vol fer l'entrevista.

a. Construeix la corresponent taula de freqüències.

b. Fes amb les dades de la taula anterior un diagrama de barres i un

diagrama de sectors.

5. En cert país la població activa està constituïda per 5 milions de persones, de

les quals un milió treballa en el sector primari, 1,75 milions en el sector

secundari, 1,5 milions en el sector serveis i la resta són parats.

a. Construeix la corresponent taula de freqüències.

b. Fes amb les dades de la taula anterior un diagrama de barres i un

diagrama de sectors.

4 10 13 2 19 6 21 8 11 1

12 5 18 10 3 15 9 2 16 4

14 8 16 11 7 18 10 3 12 17

Page 39: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Descripció, organització i representació de les dades 39

6. En un test realitzat a un grup d’alumnes universitaris s’han recollit les

següents puntuacions:

62,3 57,5 49 59,8 37,4 60,5 37,8 65,2 40,1 52,8

39,6 41,5 60,8 71,3 68,9 39 49,5 61,5 47,5 56,4

39 41,7 63,5 43,8 58,5 58,9 37 56,8 48,7 56

a. Construeix un gràfic de tiges i fulles apropiat i construeix a partir d’ell

la taula de freqüències.

b. Construeix la taula de freqüències apropiada amb intervals superposats

i d'igual amplitud aplicant la fórmula de Sturges.

7. En la següent taula es mostra la distribució de freqüències absolutes del

nombre d'empleats en 70 bars i restaurants d’una ciutat:

Nombre d’empleats [2,5) 12

[5,9) 36

[9,11) 12

[11,16) 10

a. Completa la taula de distribució de freqüències.

b. Dibuixa l’histograma de freqüències.

Page 40: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país
Page 41: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

41

3 Estadística descriptiva d’una variable

En aquest tema veurem les mesures i els paràmetres que ens serveixen per a

descriure les principals característiques d’una variable estadística

unidimensional.

Primer estudiarem les mesures de posició central (mitjana, mediana i moda) i

les de posició no central (quartils, decils i percentils). Després estudiarem la

representativitat de les mesures de tendència central mitjançant les mesures de

dispersió (rang, recorregut interquartílic, variància, desviació típica i coeficient

de variació de Pearson).

També estudiarem l’anàlisi de la concentració o no del total dels valors de la

variable mitjançant un mètode numèric (índex de Gini) i gràficament (corba de

Lorenz).

Per últim, veurem el gràfic de caixa i bigots, el qual recull algunes de les

característiques principals d’una variable.

3.1 Mesures de posició central o de centralització

Les mesures de centralització són aquells paràmetres o estadístics que

tendeixen a situar-se en el centre del conjunt de dades ordenades respecte a la

seua magnitud.

3.1.1 Mitjana aritmètica

La mitjana aritmètica és defineix com la suma de totes les dades dividit pel

nombre de dades. La denotarem per .

La mitjana aritmètica ve donada amb la mateixa unitat de mesura que les dades

de la variable.

Page 42: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

42 Introducció a l’estadística

Exemple

Calcula la mitjana aritmètica dels anys que tenen un grup de xiquets amb

aquestes edats:

5 7 8 2 5 3

* Si tenim moltes dades o venen agrupades mitjançant una taula de

freqüències, la fórmula de la mitjana quedaria de la següent forma:

on són els diferents valors d’una variable, són les freqüències absolutes

de cada valor de la variable i és la suma de les freqüències absolutes

(nombre total de dades).

Exemple

Calcula la mitjana aritmètica dels anys que tenen un grup de xiquets amb

aquestes edats:

5 7 7 5 4 6 2 6 6 5 4 3

* Si les dades vénen agrupades amb intervals, com no coneixem el valor real

de totes les dades, no serà possible calcular de forma exacta la mitjana, per la

qual cosa, aproximarem el càlcul de la mitjana canviant cada dada per la marca

de classe dels intervals i aplicant la fórmula anterior.

Exemple

Disposem de les següents dades sobre les alçades en centímetres dels

components d’un equip de bàsquet. Calcula l’alçada mitjana dels jugadors.

2 1 2

3 1 3

4 2 8

5 3 15

6 3 18

7 2 14

12 60

Intervals

Page 43: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Estadística descriptiva d’una variable 43

Propietats de la mitjana aritmètica

1) La suma de les desviacions respecte de la mitjana és zero.

La desviació d’una dada (o marca de classe), pel que fa a la mitjana, és

la distància que separa cada dada (o marca de classe) de la mitjana

aritmètica. Aquesta desviació pot ser positiva (a la dreta de la mitjana)

o negativa (a l’esquerra de la mitjana).

Exemple

Siga una variable que pren aquests valors:

La desviació d’aquestes dades respecte la mitjana és:

2) Si a tots els valors d’una distribució se li suma (resta) una constant la

mitjana aritmètica de la nova distribució és igual a la mitjana

aritmètica de la distribució inicial més (menys) la constant.

Exemple

Siga una variable que pren aquests valors:

3) Si tots els valors d’una distribució són multiplicats (dividits) per una

constant , la mitjana aritmètica de la nova distribució és igual a la

mitjana aritmètica de la distribució inicial multiplicada (dividida) per

.

Exemple

Siga una variable que pren aquests valors:

Page 44: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

44 Introducció a l’estadística

Avantatges i inconvenients de la mitjana aritmètica

Els avantatges d’utilitzar la mitjana aritmètica són:

- És una mesura de centralització fàcil de calcular.

- La mitjana aritmètica és única.

- S’utilitzen tots els valors de la variable per a calcular-la.

Els inconvenients d’utilitzar la mitjana aritmètica són:

- Es veu molt influenciada quan la variable té valors extrems (grans o

xicotets), ja que per a calcular-la utilitzem tots els valors i per tant la

mitjana ens pot donar un valor poc representatiu del conjunt de dades.

- No es pot calcular quan la variable és qualitativa.

Exemple

Calcula la mitjana aritmètica d’aquestes dades:

2 3 3 3 3 4 24

La mitjana aritmètica és: , valor que no representa adequadament el

conjunt de dades.

3.1.2 Mediana

Si ordenem les dades de menor a major, la mediana és el valor que hi ha al mig

de les dades, és a dir, té tantes dades per sota com per a dalt d’ella. Si el

nombre de dades és parell, assignarem a la mediana la mitjana aritmètica dels

dos termes centrals. La denotarem per .

Exemple

Calcula la mediana de les següents dades:

1 2 4 5 6

1 2 4 5 6 7

* Si les dades vénen agrupades mitjançant una taula de freqüències, farem els

següents passos per a calcular-la:

- Calcularem la freqüència absoluta acumulada de les dades.

- Dividirem el nombre total de dades, , entre 2:

si el nombre de dades és imparell arredonirem el resultat de la

divisió a l’enter següent i buscarem a la taula la dada que

ocupa aquesta posició

si el nombre de dades és parell agafarem les dades que estan

en la posició del resultat de la divisió i la següent, fent a

continuació la seua mitjana aritmètica

Page 45: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Estadística descriptiva d’una variable 45

Exemple

Calcula la mediana dels anys que tenen un grup de xiquets amb aquestes edats:

Posició arredonim a l'enter

següent, .

Mirant la veiem que la posició està en la fila

on (en aquesta estan les posicions , i ).

Aleshores,

Posició , aleshores agafarem

les dades i , fent a continuació la seua mitjana.

Ajudant-nos de la veiem que la dada 6 i estan

en la fila on (en aquesta estan les posicions

, i ). Aleshores:

* Si les dades vénen agrupades amb intervals, com no coneixem el valor real

de totes les dades, no serà possible calcular de forma exacta la mediana, per la

qual cosa, aproximarem el càlcul de la mediana de la següent manera:

- Calcularem la freqüència absoluta acumulada dels intervals.

- Dividirem el nombre total de dades, , entre 2:

si qualsevol dels intervals té la freqüència absoluta acumulada

igual a , aleshores la mediana és el límit superior d’aquest

interval

si no passa el cas anterior, buscarem l’interval que conté

aquesta dada, anomenat classe mediana. Una aproximació de

la mediana seria la marca de classe d’aquest interval.

No obstant això, és possible donar un valor més aproximat

utilitzant la següent fórmula, la qual es pot obtindre fent us

d’una propietat de la semblança de triangles.

on,

és el límit inferior de la classe mediana

és el nombre de dades

és la freqüència absoluta acumulada de la classe anterior

a la mediana

és la freqüència absoluta de la classe mediana

és l’amplitud de la classe mediana

2 1 1

3 1 2

4 2 4

5 3 7

6 2 9

7 2 11

11

2 1 1

3 1 2

4 2 4

5 3 7

6 3 10

7 2 12

12

Page 46: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

46 Introducció a l’estadística

Exemple

Disposem de les següents dades sobre les alçades en centímetres dels

components d’un equip de bàsquet. Calcula la mediana.

Posició , aleshores la mediana és

Exemple

Disposem de les següents dades sobre les alçades en centímetres dels

components d’un equip de bàsquet. Calcula la mediana.

Posició aleshores la classe mediana és

Avantatges i inconvenients de la mediana

Els avantatges d’utilitzar la mediana són:

- És una mesura de centralització fàcil de calcular.

- La mediana és única.

- Sols s’utilitzen els valors centrals de la variable per a calcular-la, per

la qual cosa no l’afecten els valors extrems d’una variable. Aleshores,

si les dades tenen valors extrems és preferible utilitzar la mediana com

a mesura de centralització en lloc de la mitjana aritmètica.

Els inconvenients d’utilitzar la mediana són:

- No s’utilitzen tots els valors de la variable per a calcular-la.

- No es pot calcular quan la variable és qualitativa.

Intervals Marca

classe

Intervals Marca

classe

Page 47: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Estadística descriptiva d’una variable 47

3.1.3 Moda

La moda és el valor o valors de la variable que més vegades es repeteixen, és a

dir, és el valor o valors de la variable que tenen major freqüència absoluta. La

denotarem per .

La moda pot tindre un sol element (unimodal), dos (bimodal), tres (trimodal),

.... fins i tot, tots els valors de la variable poden ser la moda.

Exemple

Calcula la moda dels anys que tenen dos grups de xiquets amb aquestes edats:

5 7 8 2 5 3

5 7 2 2 5 3

Exemple

Observem l’estat civil de 15 persones i obtenim els valors següents:

C S C C C D C S C C C C D S S

sent: C casat; S solter; D divorciat. Calcula la seua moda.

C (casat)

Exemple

Calcula la moda dels anys que tenen un grup de xiquets amb aquestes edats:

* Si les dades vénen agrupades amb intervals, com no coneixem el valor real

de totes les dades, no serà possible calcular de forma exacta la moda, per la

qual cosa, aproximarem el càlcul de la moda de la següent manera:

- Determinarem l’interval amb major freqüència absoluta (si tots els

intervals són d’igual amplitud) o major densitat (si tots els intervals no

tenen la mateixa amplitud). Aquest interval s’anomena classe modal.

- Una aproximació de la moda seria prendre la marca de classe de

l’interval modal.

No obstant això, és possible donar un valor més aproximat utilitzant la

següent fórmula, si tots els intervals tenen la mateixa amplitud:

2 3

3 3

4 3

5 3

6 3

7 3

Page 48: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

48 Introducció a l’estadística

on,

és el límit inferior de la classe modal

és la freqüència absoluta de la classe anterior a la modal

és la freqüència absoluta de la classe posterior a la modal

és l’amplitud de la classe modal

Utilitzarem aquesta fórmula si els intervals no tenen tots la mateixa

amplitud:

on,

és el límit inferior de la classe modal

és la densitat de la classe anterior a la modal

és la densitat de la classe posterior a la modal

és l’amplitud de la classe modal

Exemple

Disposem de les següents dades sobre les alçades en centímetres dels

components d’un equip de bàsquet. Calcula la moda.

La classe modal és

Exemple

Disposem de les següents dades sobre les edats que tenen els convidats a una

boda. Calcula la moda.

La classe modal és

Intervals Marca

classe

Intervals Marca

classe

60

Page 49: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Estadística descriptiva d’una variable 49

Avantatges i inconvenients de la moda

Els avantatges d’utilitzar la moda són:

- És una mesura de centralització fàcil de calcular.

- És la única mesura de centralització que es pot calcular quan la

variable és qualitativa.

Els inconvenients d’utilitzar la moda són:

- No s’utilitzen tots els valors de la variable per a calcular-la.

- La moda pot no ser única.

3.2 Mesures de posició no central

3.2.1 Quartils

Ja hem vist que la mitjana, en les dades ordenades de menor a major, deixa a la

seua esquerra el 50% de les dades. Podem considerar també valors que

divideixen el conjunt de les dades en quatre parts iguals, és a dir, deixen a la

seua esquerra el 25%, el 50% i el 75% de les observacions. Aquests valors es

denominen quartils i es denoten com a , i respectivament. És clar que

= per definició.

Vegem com es calcula el .

Per a trobar el primer quartil, s’ordenen els valors de menor a major i a

continuació se cerca en aquesta sèrie ordenada el primer valor que supera el

lloc .

Exemple

Calcula el

1 3 7 8 9 15 17

Posició , aleshores busquem en la sèrie el valor que ocupa

el lloc 2, és a dir, .

Pot ocórrer que l’ordre de l’observació coincidisca exactament amb

(succeeix quan és múltiple de 4). En tal cas, el primer quartil s'obté prenent

aquesta observació i la següent, i calculant la seua mitjana aritmètica.

Exemple

Calcula el

1 3 7 8 9 9 10 12 13 13 14 15

Posició , aleshores busquem en la sèrie el valor que ocupa el

lloc 3 i 4 i fem la mitjana aritmètica dels dos, és a dir,

.

Page 50: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

50 Introducció a l’estadística

Per a trobar , el procediment és anàleg però considerant en compte

de .

* Si les dades vénen agrupades mitjançant una taula de freqüències, farem els

següents passos per a calcular el :

- Calcularem la freqüència absoluta acumulada de les dades.

- Dividirem el nombre total de dades, , entre 4:

si el nombre de dades no és múltiple de 4 arredonirem el

resultat de la divisió a l’enter següent i buscarem a la taula la

dada que ocupa aquesta posició

si el nombre de dades és múltiple de 4 agafarem les dades que

estan en la posició del resultat de la divisió i la següent, fent a

continuació la seua mitjana aritmètica

Per a trobar , el procediment és anàleg però considerant en compte

de .

Exemple

Calcula el i dels anys que tenen un grup de xiquets amb aquestes edats:

Posició arredonim a l'enter

següent, .

Mirant la veiem que la posició està en la fila

on (en aquesta estan les posicions i ).

Aleshores,

Posició arredonim a l'enter següent, .

Mirant la veiem que la posició està en la fila on (en aquesta estan

les posicions i ).

Aleshores,

Exemple

Calcula el i dels anys que tenen un grup de xiquets amb aquestes edats:

Posició aleshores agafarem

les dades i i fem a continuació la mitjana.

Mirant la veiem que la posició i estan en la

Fila on (en aquesta estan les posicions i

). Aleshores,

2 1 1

3 1 2

4 2 4

5 3 7

6 2 9

7 2 11

11

2 1 1

3 1 2

4 2 4

5 3 7

6 3 10

7 2 12

12

Page 51: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Estadística descriptiva d’una variable 51

Posició aleshores agafarem les dades i , i fem a

continuació la mitjana.

Mirant la veiem que la posició està en la fila on (en aquesta estan

les posicions , i ).

Aleshores,

* Si les dades vénen agrupades amb intervals, com no coneixem el valor real

de totes les dades, no serà possible calcular de forma exacta el , per la qual

cosa, aproximarem el càlcul del de la següent manera:

- Calcularem la freqüència absoluta acumulada dels intervals.

- Dividirem el nombre total de dades, , entre 4:

si qualsevol dels intervals té la freqüència absoluta acumulada

igual a , aleshores el és el límit superior d’aquest

interval

si no passa el cas anterior, buscarem l’interval que conté

aquesta dada i aplicarem la següent fórmula, la qual és

semblant a la del càlcul de la mediana

on,

és el límit inferior de la classe on està el

és el nombre de dades

és la freqüència absoluta acumulada de la classe anterior

on està el

és la freqüència absoluta de la classe on està el

és l’amplitud de la classe on està el

Per a trobar , el procediment és anàleg però considerant en compte

de .

Aleshores la fórmula serà:

Page 52: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

52 Introducció a l’estadística

Exemple

Disposem de les següents dades sobre les alçades en centímetres dels

components d’un equip de bàsquet. Calcula els quartils 1 i 3.

Posició , aleshores el és

Posició , aleshores el és

Exemple

Disposem de les següents dades sobre les alçades en centímetres dels

components d’un equip de bàsquet. Calcula els quartils 1 i 3.

Posició , aleshores la classe on està el és

Posició , aleshores la classe on està el és

Intervals Marca

classe

Intervals Marca

classe

Page 53: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Estadística descriptiva d’una variable 53

3.2.2 Percentils i decils

Fins ara ens hem interessat per obtenir aquells valors la posició dels quals

representava un percentatge molt concret de la mostra: 25, 50 i 75 per cent.

Però, generalitzant, podrem estar interessats a obtenir qualsevol posició dins

de les dades. Per a això establirem una fórmula general de càlcul per a obtenir

qualsevol posició relativa:

on,

és el percentatge a calcular

és el valor entre 1 i 100, equivalent al percentatge cercat

és el límit inferior de la classe on està el

és el nombre de dades

és la freqüència absoluta acumulada de la classe anterior on està el

és la freqüència absoluta de la classe on està el

és l’amplitud de la classe on està el

Mitjançant aquesta fórmula, ja utilitzada per a calcular la mediana i els

quartils, podrem obtenir qualsevol valor percentil o posició relativa dins de les

dades estudiades.

Depenent del percentatge que calculem, el valor obtingut rebrà la següent

denominació:

- Quartil: 25 (primer), 50 (segon) , 75 (tercer)

- Decil: 10 (primer) ,20 (segon),...90 (novè)

- Centil o percentil: 1, 2, 3, ...100

3.3 Mesures de dispersió

Les mesures de dispersió permeten calcular la representativitat d’una mesura

de tendència central. La seua finalitat és estudiar fins a quin punt, per a una

sèrie de valors, les mesures de centralització són representatives de tota la

informació de les dades. Mesurar la representativitat d’una mesura de posició

central equival a quantificar la separació de les dades respecte a aquesta

mesura.

S’anomena dispersió o variabilitat, a la major o menor separació dels valors

d’una distribució respecte d’un altre que pretén ser la seua síntesi. Aleshores,

per exemple, serà més representativa la mitjana aritmètica d’una variable quan

més agrupats estiguen els valors d’aquesta al voltant de la mitjana i al contrari,

serà menys representativa quan els valors estiguen més dispersos respecte la

mitjana.

A continuació veiem un exemple amb dos distribucions diferents que tenen la

mateixa mitjana aritmètica i on és pot veure clarament com la dispersió de les

dades respecte la mitjana és molt diferent.

Page 54: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

54 Introducció a l’estadística

Exemple

S’ha analitzat la distribució del nombre de fills de 50 famílies pertanyents a

dues regions d'un mateix país obtenint-se els següents resultats:

Regió A Regió B

En les dues distribucions s’observa que la mitjana aritmètica de fills per

família és d’ fills; no obstant això, en la primera de les distribucions

s’observa que hi ha més valors de la variable al voltant de la mitjana que en la

segona. Això fa que puguem afirmar que la mitjana calculada és més

representativa a la regió A que a la regió B.

Aleshores, resulta necessari per a completar la informació que puga deduir-se

de les mesures de tendència central, acompanyar a aquestes mesures d’un o

diversos coeficients que mesuren el grau de dispersió de la distribució de la

variable.

Podem distingir dos tipus de mesures de dispersió, les absolutes i les relatives.

3.3.1 Mesures de dispersió absolutes

Com el nom indica, mesuren la dispersió en termes absoluts, presentant el

desavantatge que tenen unitats de mesura, cosa que en ocasions dificulta la

seua interpretació i la possibilitat de realitzar comparacions sobre la dispersió

de diferents distribucions.

Vegem a continuació quatre mesures de dispersió absolutes.

1) Rang o recorregut

És la diferència entre el màxim i el mínim valor que presenta una distribució.

Aleshores, un valor elevat del recorregut indicaria que la diferència entre el

major i el menor valor de la variable és alta, fet que podria portar a pensar que

també ho és la dispersió.

El principal inconvenient d'aquesta mesura és que com que no intervenen en

tots els valors de la distribució en el seu càlcul, pot conduir a conclusions

equivocades.

Page 55: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Estadística descriptiva d’una variable 55

Exemple:

Utilitzant l’exemple de les regions:

S’observa com el recorregut de les dues distribucions és el mateix; no obstant

això, com ja s'ha comentat, la distribució de la regió B és més dispersa que la

regió A.

2) Recorregut interquartílic

És la diferència entre el tercer quartil i el primer quartil d’una distribució.

Aquesta mesura ens ofereix l'amplitud de l’interval en el qual es troba el 50%

dels valors centrals de la distribució. Aleshores, un valor elevat indicaria que

el 50% dels valors centrals es troben en un interval ample, la qual cosa podria

portar a pensar en una elevada dispersió.

Aquesta mesura és menys sensible a valors extrems de la distribució.

Exemple:

Utilitzant l’exemple de les regions:

Regió A Regió B

Regió A

Calculem els quartils:

Aleshores el recorregut interquartílic és:

Regió B

Calculem els quartils:

Aleshores el recorregut interquartílic és:

S’observa com el recorregut interquartílic de la regió B és major que el de la

regió A, la qual cosa ens indica que les dades de la regió B estan més disperses

que les de la regió A.

Page 56: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

56 Introducció a l’estadística

3) Variància

És la mitjana de la suma de les desviacions de les dades respecte a la mitjana

aritmètica al quadrat.

Com més concentrats estiguen els valors al voltant de la mitjana aritmètica,

més pròximes a zero estaran les desviacions i aleshores menor serà la

variància. Si, pel contrari, els valors estan molt dispersos respecte a la mitjana

aritmètica, els quadrats de les desviacions seran grans i aleshores la variància

també.

Nota: Hi ha una altra mesura de dispersió, similar a la variància, coneguda

com a quasi variància, la qual es calcula de la següent manera:

Exemple:

Calcula la variància i la quasi variància d’aquestes dades:

1 3 3 6 8 9

Primer calculem la mitjana aritmètica que es:

* Si les dades estan agrupades, podem desenvolupar l’anterior fórmula per a

poder fer els càlculs d’una manera més còmoda.

Page 57: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Estadística descriptiva d’una variable 57

Exemple:

Utilitzant l’exemple de les regions:

Regió A Regió B

S’observa com la variància de la regió B és major que la de la regió A, la qual

cosa ens indica que les dades de la regió B estan més disperses que les de la

regió A.

* Si les dades estan agrupades en intervals, utilitzarem la fórmula anterior

agafant com a variable la marca de classe de cada interval.

Exemple

Disposem de les següents dades sobre les alçades en centímetres dels

components d’un equip de bàsquet. Calcula la variància de l’alçada dels

jugadors.

La variància utilitza les unitats dels valors de la variable al quadrat, la qual

cosa fa que tinguem resultats incoherents com en els exemples que hem vist

(fills2 i cm

2). Per a evitar aquest problema desprès veurem una altra mesura

que ho soluciona, que és la desviació típica.

Intervals

Page 58: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

58 Introducció a l’estadística

Propietats de la variància

1) La variància sempre es major o igual que zero, ja que no pot ser

negativa per ser una suma de quadrats.

2) Si a tots els valors d’una distribució se li suma (resta) una constant la

variància de la nova distribució no varia.

Exemple

Siga una variable que pren aquests valors:

3) Si tots els valors d’una distribució són multiplicats (dividits) per una

constant , la variància de la nova distribució és igual a la variància de

la distribució inicial multiplicada (dividida) per aquesta constant

elevada al quadrat.

Exemple

Siga una variable que pren aquests valors:

4) Desviació típica

És l’arrel quadrada positiva de la variància. La seua interpretació és similar a

la de la variància, amb la diferència que la desviació típica ve mesurada amb la

mateixa unitat que la variable.

Exemple:

Utilitzant l’exemple de les regions:

Page 59: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Estadística descriptiva d’una variable 59

Propietats de la desviació típica

1) La desviació típica sempre és major o igual que zero.

2) Si a tots els valors d’una distribució se li suma (resta) una constant la

desviació típica de la nova distribució no varia.

Exemple

Siga una variable que pren aquests valors:

3) Si tots els valors d’una distribució són multiplicats (dividits) per una

constant , la desviació típica de la nova distribució és igual a la

desviació típica de la distribució inicial multiplicada (dividida) per

aquesta constant .

Exemple

Siga una variable que pren aquests valors:

3.3.2 Mesures de dispersió relatives

Es caracteritzen perquè no vénen expressades en unitats, presentant l'avantatge

respecte a les mesures de dispersió absolutes que permeten establir

comparacions entre distribucions heterogènies.

Vegem a continuació tres mesures de dispersió relatives.

1) Coeficient d’obertura

És el quocient entre els valors extrems de la variable.

Representa el nombre de vegades que el valor màxim és major que el valor

mínim. Com més gran siga aquest valor més dispersió relativa tenen les dades.

Page 60: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

60 Introducció a l’estadística

El principal inconvenient d'aquesta mesura és que, com que no intervenen tots

els valors de la distribució en el seu càlcul, pot conduir a conclusions

equivocades.

Exemple

Calcula el coeficient d’obertura dels anys que tenen dos grups de xiquets amb

aquestes edats:

5 7 8 2 5 3

És a dir, el xiquet major té 4 vegades els anys que té el menut.

5 7 2 2 5 3

És a dir, el xiquet major té 3,5 vegades els anys que té el menut.

2) Rang o recorregut relatiu

És el quocient entre el rang i la mitjana aritmètica.

Representa el nombre de vegades que el recorregut conté a la mitjana

aritmètica. Com més gran siga aquest valor, més dispersió relativa tenen les

dades.

El principal inconvenient d'aquesta mesura és que, com que no intervenen tots

els valors de la distribució en el seu càlcul (en el càlcul del rang), pot conduir a

conclusions equivocades.

Exemple

Calcula el recorregut relatiu dels anys que tenen dos grups de xiquets amb

aquestes edats:

5 7 8 2 5 3

És a dir, el recorregut conté 1,2 vegades la mitjana aritmètica dels anys.

5 7 2 2 5 3

És a dir, el recorregut conté 1,2 vegades la mitjana aritmètica dels anys.

Page 61: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Estadística descriptiva d’una variable 61

3) Coeficient de variació de Pearson

És el quocient entre la desviació típica i la mitjana aritmètica.

Quan comparem dues distribucions, les seues dispersions es poden comparar

mitjançant la desviació típica si les seues mitjanes aritmètiques són iguals. Si

no és així, utilitzarem el coeficient de variació de Pearson.

El coeficient de variació de Pearson representa el nombre de vegades que la

desviació típica conté la mitjana aritmètica; aleshores com més gran siga el

coeficient de variació de Pearson més vegades la desviació típica contindrà la

mitjana aritmètica, és a dir, menor representativitat tindrà la mitjana aritmètica

i major dispersió relativa tindran les dades.

Aquest coeficient també es pot expressar en percentatges:

Com per al càlcul de la mitjana aritmètica i de la desviació típica utilitzem tots

els valors de la distribució, el coeficient de variació de Pearson és més fiable

que els altres dos coeficients definits anteriorment.

Quan la mitjana aritmètica d’una distribució siga 0, no podrem utilitzar el

coeficient de variació de Pearson, ja que aquest tendirà a infinit.

Exemple

Calcula el coeficient de variació de Pearson dels anys que tenen dos grups de

xiquets amb aquestes edats:

5 7 8 2 5 3

És a dir, el coeficient de variació de Pearson conté 0,4163 vegades la mitjana

aritmètica dels anys.

5 7 2 2 5 3

És a dir, el coeficient de variació de Pearson conté 0,4563 vegades la mitjana

aritmètica dels anys.

Segons aquests valors té menor dispersió relativa el primer grup i la seua

mitjana aritmètica és més representativa.

A continuació, veurem un exemple on compararem dos distribucions on les

seues dades vénen donades en unitats diferents.

Page 62: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

62 Introducció a l’estadística

Exemple

Una empresa vol esbrinar si té major variabilitat el rendiment mitjà dels

treballadors o els seus ingressos. Sabem que el rendiment dels treballadors (en

una escala arbitraria) és de 80 punts de mitjana i de 20 punts de desviació

típica. També sabem que els ingressos són de 12.000 euros a l’any de mitjana i

de 2.400 euros de desviació típica.

Calculem el coeficient de variació de Pearson:

Això significa que té major variabilitat el rendiment que els ingressos.

3.4 Gràfic de caixa i bigots

Un gràfic o diagrama de caixa i bigots és una representació gràfica, basada en

els quartils, que ajuda a avaluar la forma de les distribucions. Aquest gràfic és

molt sensible per a detectar casos extrems, per tant, aquest gràfic indicarà quan

la distribució té valors extremadament grans o xicotets.

Una aproximació a la forma d’aquests gràfics és la següent:

○ ● ● x x ● ● ○

La caixa està formada entre el i el . Dins de la caixa es troben el 50% de

les dades de forma centralitzada.

Per a la construcció d’aquest gràfic necessitarem calcular una sèrie de valors

que descrivim a continuació:

Mediana (es troba sempre a l’interior de la caixa)

Primer quartil (marca la paret inferior de la caixa)

Tercer quartil (marca la paret superior de la caixa)

Recorregut interquartílic:

Factor d’escala:

Frontera interior inferior:

Frontera interior superior:

Page 63: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Estadística descriptiva d’una variable 63

Frontera exterior inferior:

Frontera exterior superior:

x Valors adjacents:

- Valor adjacent inferior: valor de les dades més pròxim a (frontera

interior inferior), sent major o igual que aquest.

- Valor adjacent superior: valor de les dades més pròxim a (frontera

interior superior), sent menor o igual que aquest.

○ ● Valors atípics: són aquells valors que cauen fora dels rangs de la

distribució.

- Valors atípics menors (●): són els valors de les dades que estan entre

(frontera interior inferior) i (frontera exterior inferior) o entre

(frontera interior superior) i (frontera exterior superior).

- Valors atípics majors (○): són els valors de les dades que estan per

davall de (frontera exterior inferior) o per damunt de (frontera

exterior superior).

Exemple:

Les següents dades recullen el nombre de dies que han faltat al treball en un

any 20 treballadors d’una empresa. Construeix el gràfic de caixa i bigots

d’aquestes dades.

0 0 12 22 23 24 24 25 25 25

25 26 26 27 28 38 38 40 49 68

Calculem primer els valors que ens fan falta:

Valor adjacent inferior: 12

Valor adjacent superior: 40

Valors atípics: 0, 0, 49 i 68

Page 64: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

64 Introducció a l’estadística

A continuació fem el gràfic:

(2)

● x x ● ○

0 10 20 30 40 50 60 70

3.5 Mesures de concentració

Les mesures de concentració d’una distribució de freqüències tracten de posar

en relleu el major o menor grau d’igualtat en el repartiment del total dels

valors de la variable. Són, per tant, indicadors del grau de equidistribució de la

variable.

Es denomina concentració la major o menor equitat en el repartiment de la

suma total de la variable considerada.

Per a mesurar el nivell de concentració en la distribució d’una variable

utilitzarem dues eines: una de gràfica (corba de Lorenz) i una altra d’analítica

(índex de Gini).

3.5.1 Índex de Gini

Per a calcular aquest índex, ens ajudarem d’una taula en la qual construirem

els valors que ens fan falta per a aplicar la fórmula de l'índex de Gini.

Columna amb els valors de la variable

Freqüència absoluta

Freqüència absoluta acumulada

Freqüència relativa acumulada

Producte que ens indicarà el total que correspon a cada interval

Columna que acumula els valors de la columna anterior

Columna anterior de forma percentual (o de tant per u)

Calcula la diferència entre les columnes i

Amb els resultats obtinguts en la taula, aplicarem la fórmula de l’índex de

Gini, que és la següent:

L’índex de Gini va de 0 a 1. Quan és 0 significa que hi ha igualtat de

repartiment i quan és 1 significa que està tot concentrat en un únic individu.

Page 65: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Estadística descriptiva d’una variable 65

Aleshores, això significa que quan ens done un valor pròxim a 0 direm que la

concentració és baixa i si ens dóna un valor pròxim a 1 direm que la

concentració és alta.

Exemple:

Suposem la següent estructura de salaris d’una empresa industrial. Estudiar el

nivell de concentració dels salaris.

( és el salari i és el nombre de treballadors que reben aquest salari)

Això vol dir que els salaris en aquesta empresa estan poc concentrats, o dit

d’una altra manera, ben repartits.

3.5.2 Corba de Lorenz

Per a dibuixar la corba de Lorenz gastarem la distribució utilitzada per a la

determinació de l'índex de Gini .

Els passos a seguir per a representar aquesta corba són:

- Representem els eixos cartesians

- Fem un quadrat els costats del qual estan dividits en una escala de l’1

al 100, de manera que en el vèrtex inferior esquerre està l’origen de

coordenades

- En l’eix d’abscisses representem i en el d'ordenades

- Tracem una diagonal dins del quadrat

- Representem els punts ( ), els quals unirem mitjançant una línia

poligonal anomenada corba de Lorenz

9.750 7 7 0.14 68.250 68.250 0.08 0.06

12.500 15 22 0,44 187.500 255.750 0,31 0,13

17.000 20 42 0.84 340.000 595.700 0.72 0.12

25.000 6 48 0.96 150.000 745.750 0.90 0.06

40.000 2 50 1 80.000 825.750 1 -

50 825.750

Page 66: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

66 Introducció a l’estadística

Exemple:

Amb les dades de l’exemple anterior i seguint els passos que hem dit farem el

següent gràfic:

La corba necessàriament haurà de situar-se per davall de la diagonal, ja que els

valors de la variable analitzada sempre han d’estar ordenats de menor a major.

Per la mateixa raó la corba haurà de ser sempre creixent.

La corba que indica l'existència de concentració mínima o equidistribució

( ) coincideix amb la diagonal, ja que en cadascun dels punts d'aquesta

diagonal es verifica que = .

Com més gran siga la concentració de la variable major serà la separació que

presenta la corba respecte de la diagonal.

3.6 Exercicis proposats

1. Una companyia de transport de viatgers disposa de 4 autocars de quaranta

places, 15 de cinquanta-quatre places i 5 de setanta-vuit places. El nombre

mitjà de serveis que fa al dia cada tipus d'autocar és 5, 12 i 8, respectivament.

Calcular el nombre mitjà de serveis que fa al dia aquesta companyia i el

nombre total de serveis.

2. El consum elèctric diari en una determinada ciutat té les següents dades:

suposa el 10% des de les dotze de la nit fins a les sis del matí; a les vuit aquest

valor augmenta fins al 20%; arriba al 60% a les dues de la vesprada i al 85% a

les vint hores.

a. A quina hora del dia el consum és màxim?

b. Quantes hores al dia faran falta per a obtenir un consum del 65%?

c. Seguint el criteri de consum diari, a quina hora s’establiria el migdia?

0

0,2

0,4

0,6

0,8

1

1,2

0 0,5 1 1,5

pi

Page 67: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Estadística descriptiva d’una variable 67

3. La distribució d’un xalet de 50 habitacions és:

Superfície

(m2)

Nombre

d’habitacions

[0-10) 4

[50-70) 2

[10-20) 5

[34-40) 6

[40-50) 7

[20-26) 12

[26-34) 14

Calcular:

a. La superfície aproximada del xalet.

b. La superfície mitjana.

c. La grandària més habitual de les habitacions.

d. Indicar a partir de quina mesura una habitació és més gran que la

meitat de les habitacions de menor superfície.

4. En el tiquet de la compra que ha fet un individu en un supermercat

apareixen els següents productes i preus:

Producte Unitats Preu per unitat

Sucre 5 1,56

Oli 10 1,15

Llet 15 0,64

Suc 6 0,75

Refresc 12 0,50

Vi 2 1,39

Quin és el preu superat per la meitat dels productes?

5. En una ciutat han de construir 80 pisos nous de diverses superfícies. En la

següent taula apareixen el nombre de pisos distribuïts segons la seua

superfície.

Superfície

(m2)

Nombre

de pisos

[50-60) 30

[60-80) 25

[80-90) 14

[90-110) 11

Calcular:

a. La superfície mitjana dels pisos.

b. La grandària més habitual dels pisos.

Page 68: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

68 Introducció a l’estadística

c. Quina superfície té el pis que divideix en dos parts iguals el nombre de

pisos amb major i menor superfície?

d. Quina és la proporció de pisos que està compresa entre 75 i 85 metres

quadrats?

6. Una papereria ha emès durant l’últim mes 800 factures amb diversos

imports (en euros). En la següent taula apareix l’import i el nombre de factures

de l’empresa:

Import de

la factura

Nombre

de factures

[20-100) 40

[100-150) 240

[150-200) 320

[200-250) 140

[250-400) 60

Calcular:

a. L’import mitjà de la facturació del trimestre.

b. Fins a quin import estan la meitat de les factures?

c. És representatiu l’import mitjà de la facturació.

7. Les vendes de calçat d’una sabateria durant l’última setmana han sigut les

següents:

Talla de

sabata

Nombre de

parells venuts

38 7

40 10

41 14

43 8

45 4

52 1

a. Digues quina talla de calçat és la que es ven més.

b. Calcula la talla mitjana de les sabates venudes.

c. Quina és la talla, a partir de la qual, el 50% de les sabates està per

davall d’aquesta.

d. Entre quins valors, de forma centralitzada, es troba el 50% de les

sabates?

e. Calcula el recorregut interquartílic.

Page 69: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Estadística descriptiva d’una variable 69

8. En la següent taula apareixen les dades, en milions d’euros, sobre la relació

comercial exterior d’un país. Digues si és més estable en el temps la

importació o la exportació.

Any Importació Exportació

2009 101 63,7

2010 112,3 52,3

2011 117,5 70

2012 120 76,5

2013 116 61

9. Completa la següent taula per a l'estudi de la concentració d’una distribució

de freqüències i calcula l'índex de Gini. Comenta el resultat.

10. En les següents taules tenim les dades del nombre de crèdits concedits, en

desenes de milers d’euros, per dues entitats bancàries en l’exercici 2012.

Compara la concentració i l’estabilitat de les dues distribucions.

Valor del crèdit

Entitat A

(Nombre de crèdits)

Entitat B

(Nombre de crèdits)

[0-0,5) 3 10

[0,5-1) 4 12

[1-2) 6 8

[2-4) 58 30

[4-7) 78 12

[7-12) 90 15

[12-14) 20 5

[14-18) 6 4

[18-20) 4 16

11. En la següent taula apareixen les ajudes concedides per la Unió Europea a

diferents projectes en l’any 2012:

Import de

l’ajuda

Nombre

de projectes

[0-100) 10

[100-250) 15

[250-500) 20

[500-1000) 15

a. Calcula l’ajuda mitjana i digues si aquest valor és representatiu.

10 90 900 900 0,18

20 50

40 30

60 20

70 10 700 5.000 1

Page 70: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

70 Introducció a l’estadística

b. Calcula l'ajuda màxima concedida al 60% dels projectes menys

afavorits en el repartiment.

c. Si s’augmenta posteriorment l’ajuda en 2.000 euros a cada projecte,

com afecta els apartats anteriors?

d. Si per a l’any següent les ajudes augmenten un 5% sobre el valor

inicial, mantenint-se el criteri de repartiment, quin serà ara l’ajuda

mitjana? Segueix sent representativa?

e. Per a les dades inicials, estudia la concentració.

12. Els salaris anuals, en desenes de milers d’euros, dels treballadors de dues

empreses del mateix sector productiu són els següents:

Salari anual

Empresa A

(Nombre de treballadors)

Empresa B

(Nombre de treballadors)

[1-2) 180 40

[2-3) 260 240

[3-4) 240 200

[4-6) 100 180

[6-10) 20 140

a. Compara la concentració dels salaris dels treballadors de les dues

empreses.

b. Si aquestes dues empreses es fusionaren, quina seria la concentració

dels salaris després de la fusió?

13. En una companyia d’assegurances, el valor de les pòlisses atribuïbles als

agents que figuren en plantilla es distribueix de la següent forma:

Valor de les pòlisses

(en milers d’euros)

Nombre

d’agents

[0-5) 10

[5-10) 12

[10-20) 60

[20-40) 90

[40-70) 18

[70-120) 10

a. Estudia la concentració de les dades.

b. Representa la corba de Lorenz.

Page 71: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Estadística descriptiva d’una variable 71

14. Els pesos dels xics i xiques de dos grups de batxillerat d’un institut

d’Alacant són els següents:

Xics

55 64 70 74 75 70 64 93 60 62 70 80

61 99 62 68 65 65 66 68 70 72 72 71

Xiques

60 45 46 50 47 55 49 52 50 46 50 52

52 48 52 63 53 54 54 54 53 55 57 44

56 56 56 53 60 65 67 61 68 55 64 60

a. Fes el gràfic de tija i fulles dels pesos dels xics, de les xiques i de tots

junts.

b. Fes el gràfic de caixa i bigots dels pesos dels xics, de les xiques i de

tots junts.

Page 72: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país
Page 73: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

73

4 Introducció a la probabilitat. Càlcul de probabilitats

En aquest tema farem una introducció a la probabilitat, veient els conceptes

bàsics, per a després calcular probabilitats aplicant diversos teoremes.

Primer estudiarem què és un experiment aleatori i els tipus de successos que

poden ocórrer. Després veurem el concepte de probabilitat i calcularem les

probabilitats de diferents tipus de successos.

4.1 Experiments aleatoris

Tots els fenòmens naturals es desenvolupen segons dos tipus fonamentals

d’esquemes:

- Esquema determinista, en el qual cada vegada que es presenten un

conjunt de circumstàncies similars sempre es produirà el mateix

esdeveniment. Per exemple, en l’experiment de llançar una pedra al

buit observarem que, repetint l’experiment en les mateixes condicions,

la pedra sempre cau al buit amb la mateixa acceleració de la gravetat.

- Esquema estocàstic o aleatori, en el qual presentant-se un conjunt de

circumstàncies similars es poden produir esdeveniments diferents, sent

impossible prediir-los. Per exemple, en el llançament d’un dau

observarem que, repetint l’experiment en les mateixes condicions, no

sabrem mai a priori quin resultat eixirà.

La teoria de la probabilitat es desenvolupa justament per a l’estudi dels

experiments relacionats amb els fenòmens estocàstics i reben el nom

d’experiments aleatoris.

Un experiment aleatori serà qualsevol experiment realitzat sobre un fenomen

estocàstic. Tots els experiments aleatoris tenen les següents característiques:

- Si els repetim de manera indefinida i en igualtat de condicions, poden

presentar resultats diferents en cada experiment en particular.

- No puc fer la predicció del resultat de l’experiment abans de fer-lo.

- Es coneixen sense ambigüitats els possibles resultats de l’experiment.

Page 74: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

74 Introducció a l’estadística

Anomenem espai mostral el conjunt de tots els possibles resultats d’un

experiment aleatori. El denotarem per .

Exemple:

En l’experiment de tirar un dau, l’espai mostral és:

En l’experiment de tirar una moneda, l’espai mostral és:

4.2 Successos

Anomenem succés qualsevol subconjunt de l’espai mostral, és a dir, qualsevol

esdeveniment que puga ocórrer en fer l’experiment.

Definim parts de l’espai mostral ( ) com el conjunt format pels

possibles subconjunts que es poden formar amb els elements de l’espai

mostral.

Exemple:

En l’experiment de tirar una moneda, l’espai mostral és:

Aleshores, per a aquest experiment hi ha possibles subconjunts.

4.2.1 Tipus de successos

- Succés elemental: és el format per un únic element de l’espai mostral.

- Succés compost: és el format per més d’un element de l’espai mostral.

- Succés impossible ( ): és el succés que no té cap element de l’espai mostral.

- Succés segur: és el format per tots els elements de l’espai mostral, és a dir, el

succés segur és .

- Direm que un succés ocorre quan el resultat de l’experiment és u dels

elements que formen , és a dir, conté el resultat.

- Dos successos i són diferents ( ) si es possible trobar un resultat

de l’experiment per al qual un dels successos ocorre i l’altre no.

- Dos successos i són iguals ( ) si sempre que ocorre un d’ells,

l’altre també ocorre.

- Succés contrari o complementari ( ): és el succés format per tots els

elements de l’espai mostral que no estan en .

Page 75: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Introducció a la probabilitat. Càlcul de probabilitats 75

Es compleixen les següents relacions:

El succés contrari del succés cert és el succés impossible

El succés contrari del succés impossible és el succés cert

El contrari del contrari d’un succés és

- Direm que dos successos i són incompatibles, mútuament excloents o

disjunts si no poden ocórrer els dos a la vegada, és a dir, no tenen cap element

en comú.

Si dos successos són complementaris són també incompatibles, però si dos

successos són incompatibles no tenen perquè ser complementaris.

- Direm que un succés està inclòs en un succés B ( ) si sempre que

ocorre també ocorre .

Donats els successos , i d’un espai mostral , es compleixen les

relacions següents:

, per a qualsevol succés

Si i , aleshores

Si aleshores

Si i aleshores

Exemple:

Considerem l’experiment aleatori que consisteix en el llançament de dos

monedes i considerem aquests successos:

= Traure almenys una cara

= Traure com a molt una creu

= Traure dos creus

= Traure menys de tres cares

= Traure exactament una cara

= Traure més de dos creus

Calcula l’espai mostral, digues quins elements de l’espai mostral formen els

successos anteriors i indica les relacions que verifiquen aquests successos.

Page 76: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

76 Introducció a l’estadística

L’espai mostral és:

(succés compost)

(succés compost)

(succés elemental)

(succés segur)

(succés compost)

(succés impossible)

Algunes relacions que es verifiquen entre aquests successos són:

i són incompatibles i complementaris

i E són incompatibles però no complementaris

4.2.2 Operacions amb successos

Donats dos successos i definim les operacions següents:

- Unió ( ): és el succés format pels elements d’ o de o dels dos.

- Intersecció ( ): és el succés format pels elements que pertanyen a i

a la vegada.

- Diferència ( ): és el succés format pels elements d’ que no estan en .

Propietats:

Donats tres successos , i d’un espai mostral es compleix que:

1)

2)

3)

4)

5) Si , Si ,

6) Commutativa:

Page 77: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Introducció a la probabilitat. Càlcul de probabilitats 77

7) Associativa:

8) Distributiva:

9) Lleis de De Morgan:

Exemple:

Considerem l’experiment de llançar un dau i vegem els successos:

Traure un nombre parell =

Traure un nombre imparell =

Traure més de tres punts =

Traure tres o menys de tres punts =

Aleshores fem aquestes operacions:

Traure un nombre parell o més de tres punts

Traure un nombre parell i més de tres punts

Traure un nombre parell menys els de més de tres punts

Traure més de tres punts menys els nombres parells

Sistema complet de successos

Diem que els successos formen un sistema complet de

successos per un determinat experiment aleatori, si es compleix que:

a)

b) són incompatibles dos a dos, és a dir,

Exemple:

Considerem l’experiment de llançar un dau i vegem els successos:

Els successos , i formen un sistema complet de successos, ja que:

a)

b) , i són incompatibles dos a dos

Page 78: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

78 Introducció a l’estadística

4.3 Probabilitat

4.3.1 Concepte de probabilitat

Al llarg de la història podem trobar dos definicions o interpretacions de la

probabilitat:

Definició freqüencialista Definim la probabilitat d’un succés com el valor a què tendeixen les

freqüències relatives d’aquest succés al repetir l’experiment infinites vegades

de manera idèntica.

Aquesta definició té l’inconvenient que per a calcular la probabilitat d’un

succés és necessari fer moltes proves amb l’objectiu d’obtenir

experimentalment el valor al qual s’aproximen les freqüències relatives del

succés que estem estudiant. D’altra banda, d’aquesta manera sempre tindrem

un valor aproximat, en lloc del valor exacte de la probabilitat.

Definició clàssica La primera definició que es coneix del concepte de probabilitat fou enunciada

per Pierre Simon Laplace. Aquesta definició diu el següent: la probabilitat

d’un succés és el quocient entre el nombre de casos favorables al succés i el

nombre de casos possibles, és a dir,

expressió coneguda com regla o llei de Laplace.

Els casos favorables són els elements que formen el succés i els casos

possibles són tots els resultats de l’experiment, és a dir, tots els elements de

l’espai mostral.

A l’hora d’aplicar aquesta definició hem de tindre en compte que els successos

elementals han de tenir tots la mateixa probabilitat (equiprobables).

Aquesta definició té dos inconvenients. El primer inconvenient és que sols es

pot aplicar quan el nombre total de casos és finit. El segon inconvenient és que

sols podem aplicar la regla de Laplace quan tots les successos elementals tenen

la mateixa probabilitat, cosa que no passa sempre.

Aquests inconvenients, en les dos definicions, portaren a buscar una nova

definició de probabilitat. Així, en 1933 el matemàtic rus Andrei Kolmogorov

va establir la següent definició axiomàtica de probabilitat:

S’anomena probabilitat una funció que associa a cada succés , de l’espai de

successos, un nombre real que anomenem probabilitat de i denotem per

, que compleix els axiomes següents:

1) La probabilitat d’un succés qualsevol de l’espai de successos és

positiva o nul·la, és a dir,

Page 79: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Introducció a la probabilitat. Càlcul de probabilitats 79

2) La probabilitat del succés segur és igual a la unitat, és a dir,

3) La probabilitat de la unió d’infinits successos incompatibles és igual a

la suma de les probabilitats de cadascú d’ells, és a dir,

Vegem algunes de les conseqüències més importants d’aquesta definició:

1. Si és una col·lecció finita de successos i ,

, aleshores:

Nota: en el cas de dos successos i incompatibles, serà:

2. Si i són dos successos compatibles es compleix que la unió de i

és igual a la suma de les probabilitats de cadascun d’ells, menys la

probabilitat de la intersecció de i , és a dir,

3. La probabilitat del succés contrari, , és igual a la unitat menys la

probabilitat del succés , és a dir,

Nota: com i són incompatibles:

4. La probabilitat d’un succés és menor o igual que la unitat, és a dir,

5. La probabilitat del succés impossible és igual a zero, és a dir,

6. Si és un succés que està contingut en un succés , aleshores la

probabilitat de serà menor o igual que la probabilitat de , és a dir,

7. Com

per tant:

Page 80: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

80 Introducció a l’estadística

Exemple:

Considerem i dos successos que compleixen que:

i

Calcula: , i

Exemple:

Considerem i dos successos tals que i compleixen que:

i . Calcula:

ja que i són disjunts

Exemple:

Considerem i dos successos que compleixen que:

i

Calcula: , i

4.3.2 Probabilitat condicionada

Si i són dos successos associats a un mateix experiment aleatori, es

defineix la probabilitat condicionada del succés al succés (ho denotarem

per ) a la probabilitat que ocórrega el succés sabent que ha ocorregut

el succés i ho calcularem de la manera següent:

Per a qualsevol succés tal que , és una probabilitat que

compleix els axiomes de Kolmogorov, aleshores podem aplicar a la

probabilitat condicionada totes les propietats derivades d’aquesta definició

axiomàtica.

Page 81: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Introducció a la probabilitat. Càlcul de probabilitats 81

A partir de la fórmula anterior deduïm que:

o també,

Exemple:

Una borsa té 6 boles blanques numerades de l’1 al 6 i 5 boles negres

numerades de l’1 al 5.

a. Traiem una bola i resulta ser imparella, quina és la probabilitat que

siga negra?

Direm que el succés és ser la bola negra i el succés és ser la bola

imparella.

b. Traiem una bola i resulta ser negra, quina és la probabilitat que siga

imparella?

Direm que el succés és ser la bola negra i el succés és ser la bola

imparella.

Exemple:

Traiem dos cartes d’una baralla espanyola sense devolució. Calcula la

probabilitat de traure dos bastos.

Direm que el succés és ser la primera carta bastos i el succés és ser la

segona carta bastos.

4.3.3 Dependència i independència de successos

Dos successos i són independents quan la ocurrència de qualsevol d’ells

no influeix en la ocurrència de l’altre, és a dir, dos successos són independents

quan es compleix qualsevol d’aquestes relacions:

A partir de la definició de probabilitat condicionada i de la definició de

successos independents podem dir que es compleix que:

Page 82: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

82 Introducció a l’estadística

Dos successos i són independents

Exemple:

Llancem a la vegada una moneda i un dau. Són independents els successos

traure cara i obtenir un 4?

Direm que el succés és obtenir cara i el succés és traure un quatre.

Aleshores, com direm que aquests successos són

independents.

Exemple:

Considerem i dos successos independents que compleixen que:

i . Calcula .

4.3.4 Probabilitat composta

Siguen n successos qualsevol d’un mateix experiment aleatori i

que compleixen que la probabilitat de la realització simultània dels n successos

no és nul·la ( ), aleshores es compleix que:

si són dependents.

Nota: Si són independents aleshores serà:

Exemple:

Traiem tres cartes d’una baralla espanyola sense devolució. Calcula la

probabilitat de traure tres bastos.

Direm que el succés és ser la primera carta bastos, el succés és ser la

segona carta bastos i el succés és ser la tercera carta bastos.

Page 83: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Introducció a la probabilitat. Càlcul de probabilitats 83

Exemple:

Calcula la probabilitat de traure tres cares en tres llançaments d’una moneda.

Direm que el succés és traure cara el primer llançament, el succés és

traure cara el segon llançament i el succés és traure cara el tercer

llançament.

Com els successos són independents tenim que:

4.3.5 Probabilitat total

Si els successos formen un sistema complet de successos per

un determinat experiment aleatori ( i ) i

, aleshores qualsevol que siga el succés tenim que:

Exemple:

Tenim dos urnes, una amb 2 boles blanques i 8 negres i l’altra amb 7 boles

blanques i 3 negres. Si triem una urna a l’atzar i traiem d’aquesta urna una

bola, quina és la probabilitat que siga blanca?

Direm que el succés és triar la primera urna, el succés és triar la segona

urna i el succés és traure una bola blanca.

4.3.6 Teorema de Bayes

Si els successos formen un sistema complet de successos per

un determinat experiment aleatori ( i ) i

, aleshores qualsevol que siga el succés tenim que:

Exemple:

Tenim dos urnes, una amb 2 boles blanques i 8 negres i l’altra amb 7 boles

blanques i 3 negres. Si traiem una bola i resulta ser blanca, quina és la

probabilitat que siga de la primera urna?

Direm que el succés és triar la bola de la primera urna, el succés és triar

la bola de segona urna i el succés és traure una bola blanca.

Page 84: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

84 Introducció a l’estadística

4.3.7 Càlcul de probabilitats utilitzant taules de dades i diagrames en arbre

Taula de dades

Exemple:

A partir de les dades d’una enquesta feta en la Comunitat Valenciana sobre les

condicions de vida de la població major de 30 anys, tenim la següent taula de

dades per estat de salut i estat civil:

Molt bo Bo Acceptable Roí Molt roí

Casat 6.910 17.329 7.380 3.618 904

Separat 2.928 10.326 4.928 2.296 505

Viudo 205 534 265 115 33

Solter 3.646 5.783 1.208 414 123

Primer calculem les marginals i el total per estat de salut i per estat civil.

Molt bo Bo Acceptable Roí Molt roí

Casat 6.910 17.329 7.380 3.618 904 36.141

Separat 2.928 10.326 4.928 2.296 505 21.019

Viudo 205 534 265 115 33 1.153

Solter 3.646 5.783 1.208 414 123 11.174

13.689 34.008 13.782 6.443 1.566 69.487

a. Calcula la probabilitat d’estar casat o haver-ho estat.

b. Calcula la probabilitat de tenir un estat de salut roí o molt roí.

c. Si una persona té una salut acceptable, quin estat civil té amb major

probabilitat?

Page 85: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Introducció a la probabilitat. Càlcul de probabilitats 85

Veient les respectives probabilitats direm que l’estat civil que té més

probabilitat és el de casat.

d. Que és més probable, estar casat i tenir bona salut o molt bona, o ser

solter i tenir una salut roïna o molt roïna?

Veien les respectives probabilitats direm que és més probable estar casat i

tenir bona o molt bon salut.

Diagrama en arbre Un diagrama d’arbre és una representació gràfica dels possibles resultats d’un

experiment aleatori, el qual consta d’una sèrie de passos, on cadascun dels

passos té un nombre finit de resultats possibles.

Per a la construcció d’un diagrama en arbre es partirà posant una branca per a

cadascuna de les possibilitats, acompanyada de la seua probabilitat. Cadascuna

d’aquestes branques es coneix com branca de primera generació. En el final de

cada branca de primera generació es constitueix, al seu torn, un nuc del qual

parteixen noves branques conegudes com a branques de segona generació,

segons les possibilitats del següent pas, excepte si el nuc representa un

possible final de l’experiment (nuc final). Cal tenir en compte que la suma de

probabilitats de les branques de cada nuc ha de donar 1.

Existeix un principi senzill dels diagrames d’arbre que fa que aquests siguen

molt més útils per als càlculs ràpids de probabilitat: multipliquem les

probabilitats si es tracta de branques adjacents (contigües) o bé les anem

sumant si es tracta de branques separades que emergeixen d’un mateix punt.

Page 86: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

86 Introducció a l’estadística

Exemple:

El 70% dels habitants d’una població són homes i el 30% són dones. El 20%

dels homes fuma i el 40% de les dones també.

a. Representa en un diagrama en arbre les dades de l’enunciat

b. Quin percentatge dels habitants són dones fumadores?

c. Quin percentatge d’habitants fuma?

d. Si triem una persona a l’atzar i és fumadora, quina probabilitat hi ha

que siga dona?

Exemple:

Tenim dos urnes, una amb 2 boles blanques i 8 negres i l’altra amb 7 boles

blanques i 3 negres. Si traiem una bola i resulta ser blanca, quina és la

probabilitat que siga de la primera urna?

Page 87: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Introducció a la probabilitat. Càlcul de probabilitats 87

4.4 Exercicis proposats

1. Considerem l’experiment aleatori consistent a girar una fitxa de les 28 del

dòmino, que es troben cap avall sobre la taula, i llegir el nombre de punts que

resulten. Denotem per el succés que consisteix en haver-hi aconseguit punts. Descriu els següents successos:

a. L’espai mostral.

b.

c.

d.

e. Traure almenys 10 punts

f. Traure un múltiple de 6

g.

h.

i.

j.

k.

2. Prenem un dau i pintem les cares de la següent manera: 1 de groc; 2 i 3 de

verd; 4, 5 i 6 de roig. En llançar el dau, ens fixarem exclusivament en el color.

a. Quin és l'espai mostral?

b. Escriu tots els possibles successos ( ).

c. Quin és el succés contrari de traure el color roig?

d. Indica tots els successos que es verifiquen quan en tirar el dau ix verd.

Page 88: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

88 Introducció a l’estadística

3. Es tiren dos monedes a l’aire. Descriu els següents successos:

a. L’espai mostral.

b. Traure almenys una cara

c. Traure dos cares

d. Traure més de dos cares

e. No traure cap cara

f. No traure cap creu

g. Descriu totes les relacions que trobes amb aquests successos.

4. Considerem el cas de llançar una moneda i un dau i anotar tots dos resultats.

Descriu els següents successos:

a. L’espai mostral.

b. Traure una cara i un nombre parell

c. Traure un nombre primer

d. Traure una creu i un nombre imparell

e. Ocorre el succés o .

f. Ocorre el succés i C.

g. Ocorre sols el succés .

h. No ocorre el succés .

i. Quins dels successos , i C són disjunts o mútuament excloents?

5. Un grup de 5 aspirants a dos ocupacions idèntiques està format per tres

homes i , i dos dones i . El cap de personal ha de seleccionar

dos dels cinc aspirants. Siga el conjunt de tots els resultats possibles de la

selecció del cap de personal. Descriu els següents successos:

a. L’espai mostral.

b. el succés que es verifica quan la selecció correspon a dos homes

c. el succés que es verifica quan en la selecció hi ha almenys una

dona

d. , , i

Page 89: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Introducció a la probabilitat. Càlcul de probabilitats 89

6. Considerem i dos successos que compleixen que i

i es verifica que . Raona la veracitat o falsedat d’aquesta

afirmació.

7. Considerem i dos successos que compleixen que ,

i

. Calculeu:

a.

b.

c.

d.

8. Considerem i dos successos que compleixen que ,

i

. Calculeu:

a.

b.

c.

d.

e.

9. Considerem i dos successos que compleixen que ,

i . Calculeu:

a.

b.

c.

d.

e.

f.

g.

h.

Page 90: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

90 Introducció a l’estadística

10. Considerem i dos successos que compleixen que ,

. Calculeu en les situacions següents:

a. Si i són incompatibles.

b. Si sempre que ocorre també ocorre .

c. Si i són independents.

d. Si i són dependents i

11. El 30% dels treballadors d’una empresa estan capacitats per a fer una faena

A, i el 6% d’aquests estan capacitats també per a fer una altra faena B.

a. Calcula la probabilitat que un treballador triat a l’atzar estiga capacitat

per a fer les dos faenes.

b. Calcula la probabilitat que un treballador triat a l’atzar no estiga

capacitat per a fer una de les dos faenes.

c. Calcula la probabilitat que un treballador triat a l’atzar estiga capacitat

per a fer la faena A i no la B.

d. Calcula la probabilitat que un treballador triat a l’atzar no estiga

capacitat per a fer la faena B sabent que si que està capacitat per a fer

la faena A.

12. En un grup d’alumnes de GAP el 30% aprova l’assignatura Introducció a

l’Estadística i el 40% l’assignatura Estadística Aplicada a l’Administració

Pública. La probabilitat d’aprovar Introducció a l’Estadística havent aprovat

Estadística Aplicada a l’Administració Pública és del 50%.

a. Calcula la probabilitat d’aprovar les dos assignatures.

b. Calcula la probabilitat de suspendre les dos assignatures.

c. Calcula el percentatge d’alumnes que, havent aprovat Introducció a

l’Estadística, aprova també Estadística Aplicada a l’Administració

Pública.

d. Calcula el percentatge d’alumnes que aprova almenys una de les

assignatures.

13. Una urna té 5 boles blanques, 4 roges i 3 negres. Una altra urna té 3 boles

blanques, 6 roges i 7 negres. Es tria a l’atzar una bola de cada urna.

a. Quina és la probabilitat que la bola de la segona urna siga roja sabent

que la de la primera ha sigut roja?

b. Quina és la probabilitat que les dos boles siguen del mateix color?

Page 91: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Introducció a la probabilitat. Càlcul de probabilitats 91

14. Una urna té 12 boles blanques i 8 boles roges. Traiem dos boles amb

devolució, és a dir, traiem una bola mirem el color i la tornem a posar a l’urna.

Calcula la probabilitat dels següents successos:

a. La primera bola que hem tret és blanca.

b. La segona bola que hem tret és blanca.

c. Les dos boles que hem tret són blanques.

Repeteix els anteriors apartats suposant que traiem les dos boles sense

devolució.

15. En el Rectorat de la Universitat d’Alacant s’han rebut 100 telefonades.

D’aquestes telefonades 20 les havien fet des de la Facultat de Ciències. Si ens

fixem en les tres primeres telefonades, calcula la probabilitat que:

a. Les tres telefonades vénen de la Facultat de Ciències.

b. La primera i la tercera vénen de la Facultat de Ciències però la segona

no.

c. Almenys una telefonada venia de la Facultat de Ciències.

16. Sabem que un alumne de GAP respon correctament a una pregunta d’un

examen amb una probabilitat de 0,9. Si agafem tres alumnes, calcula la

probabilitat que:

a. Els tres alumnes responen correctament.

b. El primer alumne respon correctament i els altres dos no.

c. Almenys un alumne respon correctament.

17. La taula següent mostra la relació entre la filiació política i els estudis d’un

grup de persones:

Sense

estudis

Estudis

primaris

Estudis

secundaris

Estudis

universitaris

Democratacristià 180 80 20 15

Socialdemòcrata 90 80 50 60

Independentista 30 40 30 40

Si seleccionem una persona a l’atzar, calcula:

a. La probabilitat que no tinga estudis secundaris i siga independent.

b. La probabilitat que si no té estudis, siga democratacristià.

c. La probabilitat de tindre estudis universitaris i no ser socialdemòcrata.

Page 92: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

92 Introducció a l’estadística

d. Són independents els successos ser socialdemòcrata i tindre estudis

secundaris?

e. Que és més probable ser independentista i tindre estudis universitaris o

ser independentista sabent que té estudis secundaris?

18. La taula següent mostra l’edat dels treballadors d’una empresa i la

província on està situada la fàbrica:

Menys de 30

anys

Entre 30 i 40

anys

Entre 40 i 50

anys

Més de 50

anys

Alacant 24 10 62 22

València 62 42 48 8

Barcelona 32 50 24 12

Castelló 8 26 12 6

Calcula la probabilitat que:

a. Un treballador de més de 40 anys treballe en la fàbrica de Barcelona.

b. Si un treballador treballa a Barcelona, tinga menys de 50 anys.

c. Si un treballador té més de 30 anys, no treballe a Alacant.

d. Un treballador tinga entre 30 i 40 anys i treballe a Castelló.

e. Si un treballador té més de 40 anys, treballe a la Comunitat

Valenciana.

19. En un grup de primer de GAP el 60% dels alumnes que acudeixen a classe

de manera habitual en l’assignatura de Introducció a l’Estadística són xiques i

el 40% són xics. El 50% d’aquestes xiques i el 40% d’aquests xics aproven

l’assignatura a juny.

a. Si triem una alumne a l’atzar, quina és la probabilitat que aprove

l’assignatura a juny i siga xica?

b. Si triem una alumne a l’atzar, quina és la probabilitat que aprove

l’assignatura a juny?

c. Si triem un alumne a l’atzar i resulta que ha aprovat, quina és la

probabilitat que siga xica?

d. Si triem un alumne a l’atzar i resulta que ha suspès, quina és la

probabilitat que siga xic?

e. Són independents els successos aprovar l’assignatura a juny i ser xica?

Page 93: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Introducció a la probabilitat. Càlcul de probabilitats 93

20. En la facultat de Dret d’una universitat el 50% dels alumnes estudien Dret,

el 30% GAP i la resta Relacions laborals. El 80% dels alumnes de Dret, El

90% dels alumnes de GAP i el 70% dels alumnes de Relacions laborals

acaben la carrera. Si triem un alumne a l’atzar, quina és la probabilitat que:

a. Acabe la carrera.

b. Sabent que ha acabat la carrera, haja estudiat GAP.

c. Estudie Dret i no acabe la carrera.

d. Que no estudie Dret i no acabe la carrera.

e. Sabent que no ha acabat la carrera, no haja estudiat GAP.

21. Una empresa vol fer inversions que pretén rendibilitzar però sap que els

beneficis de la seua inversió depenen de la política econòmica del govern

(expansiva o recessiva). L’experiència d’anys anteriors diu que, en condicions

similars a les actuals, en un 40% de les ocasions el govern va optar per una

política expansiva i en un 60% per una política recessiva. També sabem que la

probabilitat d’obtenir beneficis en una política expansiva és de 0,7 i la

d’obtenir pèrdues en polítiques recessives és de 0,6.

a. Feta una determinada inversió, quina és la probabilitat que s'hagen

obtingut beneficis?

b. Si es fa una inversió i s’obtenen pèrdues, quina és la probabilitat que

s’haja adoptat per part del govern una política recessiva?

22. Una empresa produeix motors per a màquines de calçat, dels quals el 25%

resulten ser defectuosos, per la qual cosa, abans de traure’ls al mercat, els

sotmeten a un procés de control de qualitat, que dóna resultats erronis en un

10% dels casos, tant per als motors bons com per als defectuosos.

a. Si es trauen al mercat només aquells motors que superen

satisfactòriament el procés de control de qualitat, calculeu el

percentatge de motors defectuosos que ixen al mercat.

b. I si fóra necessari passar dues vegades pel mateix procés de control de

qualitat?

23. En una fàbrica es disposa de tres màquines A, B i C que fabriquen peces

mecàniques d’un tipus determinat. La màquina A fa el 25% de la producció, la

màquina B el 35% i la C el 40%. El 5% de les peces fabricades amb l’ajuda de

la màquina A són defectuoses, igual que ocorre amb el 4% i el 2% de les

fabricades per B i C, respectivament. Si seleccionem una peça a l’atzar i és

defectuosa.

a. Quina és la probabilitat que s’haja fabricat en la màquina A?

b. Quina és la probabilitat que s’haja fabricat amb la màquina A o B?

Page 94: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

94 Introducció a l’estadística

c. Quina és la probabilitat que s’haja fabricat en alguna de les tres

màquines?

d. Quina és la probabilitat que s’haja fabricat amb la màquina A i B?

Page 95: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

95

5 Distribucions de probabilitat discretes i contínues

En aquest capítol estudiarem què és una variable aleatòria discreta i què és una

variable aleatòria contínua. A continuació veurem què és una distribució de

variable discreta (estudiant la distribució binomial) i una distribució de

variable contínua (estudiant la distribució normal). Per últim, veurem com

aproximar una distribució de variable discreta mitjançant una distribució de

variable contínua.

5.1 Variable aleatòria

Anomenem variable aleatòria tota funció que associa a cada element de

l'espai mostral, , un nombre real.

Anomenem rang de la variable aleatòria el conjunt de valors que pot prendre

la variable.

Utilitzarem lletres majúscules , ... per a designar variables aleatòries, i les

respectives minúscules ( , ...) per a designar-ne valors concrets.

Una variable aleatòria discreta és aquella que només pot prendre valors

enters.

Exemple

El nombre de fills d’una família, la puntuació obtinguda en llançar un dau, el

nombre de cotxes que té una família...

Exemple 1

Considerem l’experiment aleatori de llançar una moneda a l’aire 2 vegades, el

seu espai mostral és = {(C C), (C X), (X C), (X X)}. Definim la variable

aleatòria com el nombre de cares observades en 2 llançaments.

(C C) 2

(C X) 1

(X C) 1

(X X) 0

Una variable aleatòria contínua és aquella que pot prendre tots els valors

possibles dins d’un cert interval de la recta real.

Page 96: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

96 Introducció a l’estadística

Exemple

L'altura dels alumnes d'una classe, les hores de durada d'una pila...

5.2 Distribucions de probabilitat d’una variable aleatòria discreta

5.2.1 Funció de probabilitat

S’anomena funció de probabilitat d’una variable aleatòria discreta la

funció que associa a cada valor de la variable la seua probabilitat .

Propietats:

1.

2.

Exemple 1

En el llançament de dues monedes vist anteriorment, la variable aleatòria és

el nombre de cares observades en 2 llançaments. Calcula la funció de

probabilitat.

Exemple 2

Calcula la funció de probabilitat de les puntuacions obtingudes en llançar un

dau.

= {1, 2, 3, 4, 5, 6}

Page 97: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Distribucions de probabilitat discretes i continues 97

5.2.2 Funció de distribució

Anomenem funció de distribució de la variable aleatòria , que escriurem

, la funció que associa a cada valor de la variable aleatòria la probabilitat

acumulada fins a aquell valor:

Propietats:

1.

2.

3. és monòtona i no decreixent, és a dir, si

4.

Exemple 1

En el llançament de dues monedes vist anteriorment, la variable aleatòria és

el nombre de cares observades en 2 llançaments. Calcula la funció de

distribució.

Exemple 2

Calcula la funció de distribució de les puntuacions obtingudes en llançar un

dau.

Page 98: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

98 Introducció a l’estadística

5.3 Esperança i variància d’una variable aleatòria discreta

L’esperança matemàtica o mitjana d’una variable aleatòria discreta és el valor

mitjà teòric, on la probabilitat de cada valor del rang pot ser interpretada com

la freqüència relativa del valor. Aleshores, l’esperança es defineix com la suma

dels productes entre els valors de la variable i les seues respectives

probabilitats.

Denotem l’esperança matemàtica pels símbols i .

Propietats:

1. L’esperança de la suma és igual a la suma de les esperances.

2. L’esperança d’una constant és igual a aquesta mateixa constant.

3. L’esperança d’una constant per una variable és igual a aquesta

constant per l'esperança d’aquesta variable.

Donada una variable aleatòria , denotem per o la seua variància,

que es defineix com l’esperança del quadrat de la variable menys la seua

esperança, és a dir:

Desenvolupant aquest quadrat, tenim:

Igual que fèiem en l’estadística descriptiva, podem definir la desviació típica

d’una variable aleatòria com l’arrel quadrada positiva de la variància:

Propietats:

1. La variància d’una constant és igual a zero.

Page 99: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Distribucions de probabilitat discretes i continues 99

2. La variància d’una variable més una constant és igual a la variància

d’aquesta variable.

3. La variància d’una constant per una variable és igual a aquesta

constant al quadrat per la variància d’aquesta variable.

Exemple 1

En el llançament de dues monedes vist anteriorment, la variable aleatòria és

el nombre de cares observades en 2 llançaments. Calcula l’esperança i la

variància.

Exemple 2

Calcula l’esperança i la variància de les puntuacions obtingudes en llançar un

dau.

5.4 Distribució binomial

Suposem un experiment aleatori que té les característiques següents:

1. L’experiment consta de proves idèntiques.

2. Cada prova de l’experiment solament té dos possibles resultats: el

succés E (èxit) i el succés contrari F (fracàs).

3. La probabilitat de tenir èxit en una prova és igual a , que és constant

de prova en prova. La probabilitat de fracàs és igual a .

Page 100: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

100 Introducció a l’estadística

4. El resultat que obtenim en cada prova és independent dels resultats de

les proves fetes anteriorment.

Definim la variable aleatòria com el nombre d’èxits observats en les

proves. Aleshores, direm que segueix una distribució binomial de

paràmetres (nombre de proves que té l’experiment) i (probabilitat d’èxit).

Ho representarem de la manera següent:

La variable binomial és una variable aleatòria discreta, només pot prendre

valors enters (0, 1, 2, 3 ...).

5.4.1 Funció de probabilitat, funció de distribució, esperança i variància d’una distribució binomial

La funció de probabilitat de la distribució binomial és:

on és el nombre de proves, és el nombre d'èxits, és la probabilitat d'èxit,

és la probabilitat de fracàs, i el nombre combinatori es calcula així:

Nota: Càlcul del nombre combinatori.

on

Per exemple:

on

La funció de distribució de la distribució binomial és:

L’esperança, la variància i la desviació típica de la distribució binomial

són:

Page 101: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Distribucions de probabilitat discretes i continues 101

Exemple 1

En el llançament de dues monedes vist anteriorment, tenim que l’espai mostral

era = {(C C), (C X), (X C), (X X)}. Definíem la variable aleatòria com el

nombre de cares observades en 2 llançaments.

La seua funció de probabilitat era:

La seua funció de distribució era:

La seua esperança i variància eren:

Però si ens fixem en les característiques d’aquest experiment i de la variable

veurem que:

1. L'experiment consta de proves idèntiques.

2. Cadascuna de les proves té dos resultats possibles. Traure cara (èxit) o

traure creu (en aquest cas, fracàs).

3. La probabilitat de tenir èxit en una sola prova és igual a i es

manté constant de prova en prova. La probabilitat d’un fracàs és igual

a .

4. Les proves són independents.

està definida com el nombre d’èxits (nombres de cares, en aquest cas)

observats en les proves. Aleshores,

per la qual cosa podíem haver obtingut totes les funcions, l’esperança i la

variància utilitzant les fórmules corresponents. Vegem-ho:

Page 102: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

102 Introducció a l’estadística

Exemple

Sabem que en la ciutat d’Alacant el 80% dels aficionats al futbol són de

l’Hèrcules. Si en un bar hi ha un grup de 4 amics aficionats al futbol:

a. Quina és la probabilitat que en el grup d’amics hi haja 2 aficionats a

l’Hèrcules?

Anomenem al nombre d’amics del grup aficionats a l’Hèrcules.

Tenim que: , la probabilitat d’èxit (ser aficionat a l’Hèrcules)

i la probabilitat de fracàs (no ser aficionat a l’Hèrcules) .

Aleshores diem que:

b. Quina és la probabilitat que en el grup d’amics hi haja com a màxim 2

aficionats a l’Hèrcules?

c. Quina és la probabilitat que en el grup d’amics hi haja més de 2

aficionats a l’Hèrcules?

Però podem fer aquest exercici més ràpid si fem el següent:

d. Calcula el nombre esperat d’aficionats a l’Hèrcules en el grup d’amics,

la seua variància i la desviació típica.

Page 103: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Distribucions de probabilitat discretes i continues 103

5.4.2 Taula de la distribució binomial

Per a certs valors, la distribució binomial es troba tabulada, per la qual cosa,

podem calcular de forma ràpida les probabilitats d’aquests.

Per a poder utilitzar la taula tenim que saber quan val (nombre de vegades

que es fa l’experiment), (probabilitat d’èxit) i (nombre d’èxits).

En la taula següent apareixen el valors de les probabilitats de tipus .

0,10 0,1,5 0,20 0,25 0,30 0,35 0,40 0,45 0,50

1 0 ,9000 ,8500 ,8000 ,7500 ,7000 ,6500 ,6000 ,5500 ,5000

1 1 1 1 1 1 1 1 1 1

2 0 ,8100 ,7225 ,6400 ,5625 ,4900 ,4225 ,3600 ,3025 ,2500

1 ,9900 ,9775 ,9600 ,9375 ,9100 ,8775 ,8400 ,7975 ,7500

2 1 1 1 1 1 1 1 1 1

3 0 ,7290 ,6141 ,5120 ,4219 ,3430 ,2746 ,2160 ,1664 ,1250

1 ,9720 ,9393 ,8960 ,8438 ,7840 ,7183 ,6480 ,5747 ,5000

2 ,9990 ,9966 ,9920 ,9844 ,9730 .9571 ,9360 ,9089 ,8750

3 1 1 1 1 1 1 1 1 1

4 0 ,6561 ,5220 ,4096 ,3164 ,2401 ,1785 ,1296 ,0915 ,0625

1 ,9477 ,8905 ,8192 ,7383 ,6517 ,5630 ,4752 ,3910 ,3125

2 ,9963 ,9880 ,9728 ,9492 ,9163 ,8735 ,8208 ,7585 ,6875

3 ,9999 ,9995 ,9984 ,9961 ,9919 ,9850 ,9744 ,9590 ,9375

4 1 1 1 1 1 1 1 1 1

5 0 ,5905 ,4437 ,3277 ,2373 ,1681 ,1160 ,0778 ,0503 ,0313

1 ,9185 ,8352 ,7373 ,6328 ,5282 ,4284 ,3370 ,2562 ,1875

2 ,9914 ,9734 ,9421 ,8965 ,8369 ,7648 ,6826 ,5931 ,5000

3 ,9995 ,9978 ,9933 ,9844 ,9692 ,9460 ,9130 ,8688 ,8125

4 1 ,9999 ,9997 ,9990 ,9976 ,9947 ,9898 ,9815 ,9688

5 1 1 1 1 1 1 1 1 1

6 0 ,5314 ,3771 ,2621 ,1780 ,1176 ,0754 ,0467 ,0277 ,0156

1 ,8857 ,7765 ,6554 ,5339 ,4202 ,3191 ,2333 ,1636 ,1094

2 ,9842 ,9527 ,9011 ,8306 ,7443 ,6471 ,5443 ,4415 ,3428

3 ,9987 ,9941 ,9830 ,9624 ,9295 ,8826 .8208 ,7447 ,6562

4 ,9999 ,9996 ,9984 ,9954 ,9891 ,9777 ,9590 ,9308 ,8906

5 1 1 ,9999 ,9998 ,9993 ,9982 ,9959 ,9917 ,9844

6 1 1 1 1 1 1 1 1 1

7 0 ,4783 ,3206 ,2097 ,1335 ,0824 ,0490 ,0280 ,0152 ,0078

1 ,8503 ,7166 ,5767 ,4449 ,3294 ,2338 ,1586 ,1024 ,0625

2 ,9743 ,9262 ,8520 ,7564 ,6471 ,5323 ,4199 ,3164 ,2266

3 ,9973 ,9879 ,9667 ,9294 ,8740 ,8002 ,7102 ,6083 ,5000

4 ,9998 ,9988 ,9953 ,9871 ,9712 ,9444 ,9037 ,8471 ,7734

5 1 ,9999 ,9996 ,9987 ,9962 ,9910 ,9812 ,9643 ,9375

6 1 1 1 ,9999 ,9998 ,9994 ,9984 ,9963 ,9922

7 1 1 1 1 1 1 1 1 1

8 0 ,4305 ,2725 ,1678 ,1001 ,0577 ,0319 ,0168 ,0084 ,0039

1 ,8131 ,6572 ,5033 ,3671 ,2553 ,1691 ,1064 ,0632 ,0352

2 ,9619 ,8948 ,7969 ,6785 ,5518 ,4278 ,3154 ,2201 ,1445

3 ,9950 ,9786 ,9437 ,8862 ,8059 ,7064 ,5941 ,4770 ,3633

4 ,9996 ,9971 ,9896 ,9727 ,9420 ,8939 ,8263 ,7396 ,6367

5 1 ,9998 ,9988 ,9958 ,9887 ,9747 ,9502 ,9115 ,8555

6 1 1 ,9999 ,9996 ,9987 ,9964 ,9915 ,9819 ,9648

7 1 1 1 1 ,9999 ,9998 ,9993 ,9983 .9961

8 1 1 1 1 1 1 1 1 1

Page 104: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

104 Introducció a l’estadística

0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50

9 0 ,3874 ,2361 ,1342 ,0751 ,0404 ,0207 ,0101 ,0046 ,0020

1 ,7748 ,5995 ,4362 ,3003 ,1960 ,1211 ,0705 ,0385 ,0195

2 ,9470 ,8591 ,7382 ,6007 ,4628 ,3373 ,2318 ,1495 ,0898

3 ,9917 ,9661 ,9144 ,8343 ,7297 ,6089 ,4826 ,3614 ,2539

4 ,9991 ,9944 ,9804 ,9511 ,9012 ,8283 ,7334 ,6214 ,5000

5 ,9999 ,9994 ,9969 ,9900 ,9747 ,9464 ,9006 ,8342 ,7461

6 1 1 ,9997 ,9987 ,9957 ,9888 ,9750 ,9502 ,9102

8 1 1 1 ,9999 ,9996 ,9986 ,9962 ,9909 ,9805

9 1 1 1 1 1 1 1 1 1

10 0 ,3487 ,1969 ,1074 ,0563 ,0283 ,0135 ,0060 ,0025 ,0010

1 ,7361 ,5443 ,3758 ,2440 ,1493 ,0860 ,0464 ,0233 ,0107

2 ,9298 ,8202 ,6778 ,5256 ,3828 ,2616 ,1673 ,0996 ,0547

3 ,9872 ,9500 ,8791 ,7759 ,6496 ,5138 ,3823 ,2660 ,1719

4 ,9984 ,9901 ,9672 ,9219 ,8497 ,7515 ,6331 ,5040 ,3770

5 ,9999 ,9986 ,9936 ,9803 ,9527 ,9051 ,8338 ,7384 ,6230

6 1 ,9999 ,9991 ,9965 ,9894 ,9740 ,9452 ,8980 ,8281

7 1 1 ,9999 ,9996 ,9984 ,9952 ,9877 ,9726 ,9453

8 1 1 1 1 ,9999 ,9995 ,9983 ,9955 ,9893

9 1 1 1 1 1 1 ,9999 .9997 ,9990

10 1 1 1 1 1 1 1 1 1

15 0 ,2059 ,0874 .0352 ,0134 ,0047 ,0016 ,0005 ,0001 ,0000

1 ,5490 ,3186 ,1671 ,0802 ,0353 ,0142 ,0052 ,0017 ,0005

2 ,8159 ,6042 ,3980 ,2361 ,1268 ,0617 ,0271 ,0107 ,0037

3 ,9444 ,8227 ,6482 ,4613 ,2969 ,1727 ,0905 ,0424 ,0176

4 ,9873 ,9383 ,8358 ,6865 ,5155 ,3519 ,2173 ,1204 ,0592

5 ,9978 ,9832 ,9389 ,8516 ,7216 ,5643 ,4032 ,2608 ,1509

6 ,9997 ,9964 ,9819 ,9434 ,8689 ,7548 ,6098 ,4522 ,3036

7 1 ,9994 ,9958 ,9827 ,9500 ,8868 ,7869 ,6535 ,5000

8 1 ,9999 ,9992 ,9958 ,9848 ,9578 ,9050 ,8182 ,6964

9 1 1 ,9999 ,9992 ,9963 ,9876 ,9662 ,9231 ,8491

10 1 1 1 ,9999 ,9993 ,9972 ,9907 ,9745 ,9408

11 1 1 1 1 ,9999 ,9995 ,9981 ,9937 ,9824

12 1 1 1 1 1 ,9999 ,9997 ,9989 ,9963

13 1 1 1 1 1 1 1 ,9999 ,9995

14 1 1 1 1 1 1 1 1 1

15 1 1 1 1 1 1 1 1 1

La distribució binomial no està tabulada per a valors de > 0,5, ja que si passa

això tan sols hem de canviar la probabilitat de l’èxit per la de fracàs i definir la

binomial contraria. Per exemple, tenim que en l’exemple anterior és el

nombre d’amics del grup aficionats a l’Hèrcules i , però no

podem utilitzar la taula, però si definim com el nombre d’amics del grup que

no són aficionats a l’Hèrcules, i aquesta distribució sí que està

en la taula.

Per a veure com s’utilitza la taula veiem el següent exemple:

Exemple

La probabilitat d’aprovar l’assignatura d’Introducció a l’Estadística en la

primera convocatòria és de 0,45. Si tenim un grup de 10 alumnes que cursen

aquesta assignatura per primera vegada, calcula la probabilitat que:

Page 105: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Distribucions de probabilitat discretes i continues 105

a. Tres o menys d’aquests alumnes aproven l’assignatura en la primera

convocatòria.

Definim com el nombre d’alumnes d’aquest grup que aproven

l’assignatura en la primera convocatòria.

Per a calcular busquem en la primera columna igual a 10 i en

la segona igual a 3. Després busquem en la primera fila igual a 0,45 i

on es creuen aquesta fila i aquesta columna és el valor de la probabilitat

buscada.

0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50

10 0 ,3487 ,1969 ,1074 ,0563 ,0283 ,0135 ,0060 ,0025 ,0010

1 ,7361 ,5443 ,3758 ,2440 ,1493 ,0860 ,0464 ,0233 ,0107

2 ,9298 ,8202 ,6778 ,5256 ,3828 ,2616 ,1673 ,0996 ,0547

3 ,9872 ,9500 ,8791 ,7759 ,6496 ,5138 ,3823 ,2660 ,1719

4 ,9984 ,9901 ,9672 ,9219 ,8497 ,7515 ,6331 ,5040 ,3770

5 ,9999 ,9986 ,9936 ,9803 ,9527 ,9051 ,8338 ,7384 ,6230

6 1 ,9999 ,9991 ,9965 ,9894 ,9740 ,9452 ,8980 ,8281

7 1 1 ,9999 ,9996 ,9984 ,9952 ,9877 ,9726 ,9453

8 1 1 1 1 ,9999 ,9995 ,9983 ,9955 ,9893

9 1 1 1 1 1 1 ,9999 .9997 ,9990

10 1 1 1 1 1 1 1 1 1

Aleshores,

b. Menys de tres d’aquests alumnes aproven l’assignatura en la primera

convocatòria.

Hem de calcular , però aquest valor no està en la taula (recordem

que en la taula apareixen el valors de les probabilitats de tipus ). Com la distribució binomial és de variable discreta, menor que tres ( )

és el mateix que menor o igual que dos ( ). Aleshores:

c. Tres d’aquests alumnes aproven l’assignatura en la primera

convocatòria.

Hem de calcular , però aquest valor no està en la taula. Si que

tenim en la taula i , i si els restem tindrem .

d. Més de tres d’aquests alumnes aproven l’assignatura en la primera

convocatòria.

Hem de calcular , però aquest valor no està en la taula. Aleshores

farem el següent:

Page 106: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

106 Introducció a l’estadística

e. Tres o més d’aquests alumnes aproven l’assignatura en la primera

convocatòria.

Hem de calcular , però aquest valor no està en la taula. Aleshores

farem el següent:

f. Més de tres però menys de cinc d’aquests alumnes aproven

l’assignatura en la primera convocatòria.

Hem de calcular , però aquest valor no està en la taula.

Aleshores farem el següent:

De manera semblant podem calcular:

g. Més de set d’aquests alumnes suspenguen l’assignatura en la primera

convocatòria.

Ara ens demanen la probabilitat de suspendre i no la d’aprovar, per tant

definim una nova variable com el nombre d’alumnes d’aquest grup que

suspenen l’assignatura en la primera convocatòria.

Hem de calcular , però aquesta distribució no està en la taula,

aleshores, si no és que volem fer l’exercici aplicant la definició de la

funció de probabilitat de la distribució binomial, canviarem la pregunta

enunciant-la com a nombre d’alumnes que aproven, és a dir, és el mateix

dir que en suspenen més de set alumnes que dir que en aproven dos o

menys. Vegem-ho:

Page 107: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Distribucions de probabilitat discretes i continues 107

Exemple proposat

Sabem que en una determinada població la probabilitat de tindre un fill de sexe

masculí (xiquet) és 0,45. Si una família té 6 fills,

a. Quina és la probabilitat que la família tinga dos xiquets?

b. Quina és la probabilitat que la família tinga menys de quatre xiquets?

c. Quina és la probabilitat que la família tinga més de dos xiquets?

d. Quina és la probabilitat que la família tinga més de tres xiquetes?

e. Quina és la probabilitat que la família tinga tres xiquetes o menys?

f. Calcula l’esperança, la variància i la desviació típica del nombre de

xiquets.

Resol aquest exemple, primer sense utilitzar la taula de la distribució binomial

i després utilitzant-la.

5.5 Distribucions de probabilitat d’una variable aleatòria contínua

Quan la variable és contínua no té sentit fer una suma de les probabilitats de

cadascun dels termes com en la variable discreta, ja que el conjunt de valors

que pot prendre la variable no és numerable. En aquest cas el que generalitza

de manera natural el concepte de la suma és el d'integral.

D’altra banda per a variables aleatòries contínues no té interès parlar de

, perquè aquesta probabilitat val sempre zero, ja que, com hem dit

abans, la variable pot prendre un nombre infinit de valors i aleshores per a un

valor en concret la probabilitat és zero.

D’aquesta manera és necessari introduir un nou concepte que substituïsca en

variables aleatòries contínues el de funció de probabilitat d’una variable

discreta. Aquest concepte és el de funció de densitat d’una variable aleatòria

contínua, que es defineix com una funció integrable, que verifica

les dues propietats següents:

1.

2.

i que a més verifica que:

donat , tenim que

, és a dir, que la

probabilitat d’un interval és l’àrea que existeix entre la funció i l’eix

d’abscisses.

Page 108: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

108 Introducció a l’estadística

Podem calcular també, de forma anàloga, la funció de distribució, l’esperança i

la variància d’una variable aleatòria contínua, però aquests càlculs excedeixen

el contingut d’aquesta assignatura.

5.6 Distribució normal

Una variable aleatòria contínua segueix una distribució normal de mitjana

i desviació típica , és a dir, si la seua funció de densitat és:

5.6.1 Representació i característiques

La representació de la corba és:

Algunes característiques d’aquesta corba són:

- Camp d’existència: és tota la recta real, és a dir,

- Simetries: és simètrica respecte a la mitjana

- Punts de tall amb els eixos:

Amb l’eix OX no té punts de tall

Amb l’eix OY, per a

- Creixement i decreixement: creix fins la mitjana i decreix a partir

d’aquesta

- Màxims i mínims: té un màxim en i no té mínim

Page 109: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Distribucions de probabilitat discretes i continues 109

- Punts d’inflexió: té dos punts d’inflexió en i en

- Asímptotes: l’eix OX és una asímptota horitzontal de la corba

- L’àrea del recinte determinat per la funció i l’'eix d’abscisses és igual

a la unitat

- Com és simètrica respecte a l’eix que passa per , deixa un àrea

igual a 0,5 a l’esquerra i una altra igual a 0,5 a la dreta

- La probabilitat equival a l’àrea tancada sota la corba

5.6.2 Distribució normal estàndard

La distribució normal estàndard o tipificada és la que té per mitjana el valor

zero ( ) i per desviació típica la unitat ( ), és a dir, .

La seua funció de densitat és:

La funció de distribució per a la distribució està tabulada per a facilitar

el càlcul i ens proporciona per a cada valor de el valor de la integral des de

a , és a dir, l’àrea sota la corba des de a .

5.6.3 Tipificació de la variable

Per a poder utilitzar la taula de la distribució normal estàndard hem de

transformar la variable que segueix una distribució en una altra

variable que seguisca una distribució i açò ho farem amb el següent

canvi de variable

La variable s’anomena variable aleatòria tipificada de la variable . Aquesta

nova variable sempre té mitjana 0 i desviació típica 1. Vegem-ho:

Page 110: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

110 Introducció a l’estadística

5.6.4 Taula de la corba N(0, 1)

La taula ens dóna les probabilitats de , sent la variable tipificada.

La distribució es troba tabulada per a valors a partir de 0 i fins 3,99.

K 0 1 2 3 4 5 6 7 8 9

0,0 ,5000 ,5040 ,5080 ,5120 ,5160 ,5199 ,5239 ,5279 ,5319 ,5359

0,1 ,5398 ,5438 ,5478 ,5517 ,5557 ,5596 ,5636 ,5675 ,5714 ,5754

0,2 ,5793 ,5832 ,5871 ,5910 ,5948 ,5987 ,6026 ,6005 ,6103 ,6141

0,3 ,6179 ,6217 ,6255 ,6293 ,6331 ,6368 ,6406 ,6443 ,6480 ,6517

0,4 ,6554 ,6591 ,6628 ,6664 ,6700 ,6736 ,6772 ,6808 ,6844 ,6879

0,5 ,6915 ,6950 ,6985 ,7019 ,7054 ,7088 ,7123 ,7157 ,7190 ,7224

0,6 ,7258 ,7291 ,7324 ,7357 ,7389 ,7422 ,7454 ,7486 ,7518 ,7549

0,7 ,7580 ,7612 ,7642 ,7673 ,7704 ,7734 ,7764 ,7794 ,7823 ,7852

0,8 ,7881 ,7910 ,7939 ,7967 ,7996 ,8023 ,8051 ,8078 ,8106 ,8133

0,9 ,8159 ,8186 ,8212 ,8238 ,8264 ,8289 ,8315 ,8340 ,8365 ,8389

1,0 ,8413 ,8438 ,8461 ,8485 ,8508 ,8531 ,8554 ,8577 ,8599 ,8621

1,1 ,8643 ,8665 ,8686 ,8708 ,8729 ,8749 ,8770 ,8790 ,8810 ,8830

1,2 ,8849 ,8869 ,8888 ,8907 ,8925 ,8944 ,8962 ,8980 ,8097 ,9015

1,3 ,9032 ,9049 ,9066 ,9082 ,9099 ,9115 ,9131 ,9147 ,9162 ,9177

1,4 ,9192 ,9207 ,9222 ,9236 ,9251 ,9265 ,9279 ,9292 ,9306 ,9319

1,5 ,9332 ,9345 ,9357 ,9370 ,9382 ,9394 ,9406 ,9418 ,9429 9441

1,6 ,9452 ,9463 ,9474 ,9484 ,9495 ,9505 ,9515 ,9525 ,9535 ,9545

1,7 ,9554 ,9564 ,9573 ,9582 ,9591 ,9599 ,9608 ,9616 ,9625 ,9633

1,8 ,9641 ,9649 ,9656 ,9664 ,9671 ,9678 ,9686 ,9693 ,9699 ,9706

1,9 ,9713 ,9719 ,9726 ,9732 ,9738 ,9744 ,9750 ,9756 ,9761 9767

2,0 ,9772 ,9778 ,9783 ,9788 ,9793 ,9798 ,9803 ,9808 ,9812 ,9817

2,1 ,9821 ,9826 ,9830 ,9834 ,9838 ,9842 ,9846 ,9850 ,9854 ,9857

2,2 ,9861 ,9864 ,9868 ,9871 ,9875 ,9878 ,9881 ,9884 ,9887 ,9890

2,3 ,9893 ,9896 ,9898 ,9901 ,9904 ,9906 ,9909 ,9911 ,9913 ,9916

2,4 ,9918 ,9920 ,9922 ,9925 ,9927 ,9929 ,9931 ,9932 ,9934 ,9936

2,5 ,9938 ,9940 ,9941 ,9943 ,9945 ,9946 ,9948 ,9949 ,9951 ,9952

2,6 ,9953 ,9955 ,9956 ,9957 ,9959 ,9960 ,9961 ,9962 ,9963 ,9964

2,7 ,9965 ,9966 ,9967 ,9968 ,9969 ,9970 ,9971 ,9972 ,9973 ,9974

2,8 ,9974 ,9975 ,9976 ,9977 ,9977 ,9978 ,9979 ,9979 ,9980 ,9981

2,9 ,9981 ,9982 ,9982 ,9983 ,9984 ,9984 ,9985 ,9985 ,9986 ,9986

3,0 ,9987 ,9987 ,9987 ,9988 ,9988 ,9989 ,9989 ,9989 ,9990 ,9990

3,1 ,9990 ,9991 ,9991 ,9991 ,9992 ,9992 ,9992 ,9992 ,9993 ,9993

3,2 ,9993 ,9993 ,9994 ,9994 ,9994 ,9994 ,9994 ,9995 ,9995 ,9995

3,3 ,9995 ,9995 ,9995 ,9996 ,9996 ,9996 ,9996 ,9996 ,9996 ,9997

3,4 ,9997 ,9997 ,9997 ,9997 ,9997 ,9997 ,9997 ,9997 ,9997 ,9998

3,5 ,9998 ,9998 ,9998 ,9998 ,9998 ,9998 ,9998 ,9998 ,9998 ,9998

3,6 ,9998 ,9998 ,9999 ,9999 ,9999 ,9999 ,9999 ,9999 ,9999 ,9999

3,7 ,9999 ,9999 ,9999 ,9999 ,9999 ,9999 ,9999 ,9999 ,9999 ,9999

3,8 ,9999 ,9999 ,9999 ,9999 ,9999 ,9999 ,9999 ,9999 ,9999 ,9999

3,9 1 1 1 1 1 1 1 1 1 1

Page 111: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Distribucions de probabilitat discretes i continues 111

Si per exemple volem calcular , hem de fer els següents passos:

1. Buscar la part sencera i les dècimes en la primera columna (en aquest

cas ).

2. Buscar les centècimes en la primera fila (en aquest cas ).

3. En el punt comú a la fila i la columna que hem trobat, tenim la

probabilitat buscada, en aquest cas .

k 0 1 2 3 4 5 6 7 8 9

0,0 ,5000 ,5040 ,5080 ,5120 ,5160 ,5199 ,5239 ,5279 ,5319 ,5359

0,1 ,5398 ,5438 ,5478 ,5517 ,5557 ,5596 ,5636 ,5675 ,5714 ,5754

0,2 ,5793 ,5832 ,5871 ,5910 ,5948 ,5987 ,6026 ,6005 ,6103 ,6141

0,3 ,6179 ,6217 ,6255 ,6293 ,6331 ,6368 ,6406 ,6443 ,6480 ,6517

0,4 ,6554 ,6591 ,6628 ,6664 ,6700 ,6736 ,6772 ,6808 ,6844 ,6879

Aleshores

Si volem calcular una probabilitat d’un valor major que , hi ha prou fixar-

se en què les probabilitats corresponents a valors tals com i majors ja

valen (pràcticament ). Per això, per a aquests valors majors que

direm que la probabilitat és aproximadament 1.

Així: , encara que no aparega en la taula.

D’altra banda, fixem-nos en què en aquest tipus de distribucions no té sentit

plantejar-se probabilitats del tipus , ja que sempre valen , al no

tancar cap àrea. Per tant, si ens demanaren , diríem directament

que .

Així, en passar al complementari, si tenim , el seu complementari serà

, però com incloure no influeix en la probabilitat, per a calcular

probabilitats podem escriure:

Només es pot fer això en distribucions contínues, en el cas de la binomial no

es pot fer i cal ser acurats amb el pas al complementari.

Anem a veure alguns casos que ens podem trobar a l’hora de calcular una

probabilitat amb la taula:

1.

Page 112: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

112 Introducció a l’estadística

2. (recordem que )

3.

Per simetria podem veure la igualtat de les dues figures

4.

Per simetria podem veure la igualtat de les duss figures

Page 113: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Distribucions de probabilitat discretes i continues 113

5.

Calculem les dos àrees de les imatges següents i les restem per a obtindre

l’àrea demanada.

6.

Exemple

Siga una variable aleatòria que segueix una distribució . Calcula les

probabilitats següents:

a.

però per a poder utilitzar la taula hem de tipificar la variable

, transformant-la amb la variable que es distribueix .

Page 114: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

114 Introducció a l’estadística

b.

Tipifiquem la variable i busquem en la taula de la distribució .

c.

Tipifiquem la variable i busquem en la taula de la distribució .

Cas invers

● Fins ara ens han donat la distribució i ens demanaven , sent un cert nombre, i ens demanaven calcular aquesta probabilitat.

Ara bé, una altra pregunta pot ser: atès que en una normal sabem que

, qui és ?

La resolució és ben senzilla, n’hi ha prou a buscar dins de la taula de la

distribució normal, i ho trobem en l’encreuament de la fila amb la columna

6, i per tant ha de ser .

k 0 1 2 3 4 5 6 7 8 9

0,0 ,5000 ,5040 ,5080 ,5120 ,5160 ,5199 ,5239 ,5279 ,5319 ,5359

0,1 ,5398 ,5438 ,5478 ,5517 ,5557 ,5596 ,5636 ,5675 ,5714 ,5754

0,2 ,5793 ,5832 ,5871 ,5910 ,5948 ,5987 ,6026 ,6005 ,6103 ,6141

0,3 ,6179 ,6217 ,6255 ,6293 ,6331 ,6368 ,6406 ,6443 ,6480 ,6517

0,4 ,6554 ,6591 ,6628 ,6664 ,6700 ,6736 ,6772 ,6808 ,6844 ,6879

Exemple:

Calcula si:

a. , aleshores

b. , és a dir,

Aïllant en l’equació tenim que:

, aleshores

● En el cas que el valor a buscar no aparega directament dins de la taula de la

distribució normal, poden ocórrer dues possibilitats:

Page 115: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Distribucions de probabilitat discretes i continues 115

1. Si el valor es troba entre dos valors de la taula i a la mateixa distància

(aproximadament) de cadascun d’ells, per exemple:

, en aquest cas el valor buscat serà la mitjana

entre els valors extrems.

Si busquem en la taula aquest valor no apareix directament, sinó que

es troba entre els valors (que correspon a ) i (que

correspon a ).

K 0 1 2 3 4 5 6 7 8 9

0,0 ,5000 ,5040 ,5080 ,5120 ,5160 ,5199 ,5239 ,5279 ,5319 ,5359

0,1 ,5398 ,5438 ,5478 ,5517 ,5557 ,5596 ,5636 ,5675 ,5714 ,5754

0,2 ,5793 ,5832 ,5871 ,5910 ,5948 ,5987 ,6026 ,6005 ,6103 ,6141

0,3 ,6179 ,6217 ,6255 ,6293 ,6331 ,6368 ,6406 ,6443 ,6480 ,6517

0,4 ,6554 ,6591 ,6628 ,6664 ,6700 ,6736 ,6772 ,6808 ,6844 ,6879

0,5 ,6915 ,6950 ,6985 ,7019 ,7054 ,7088 ,7123 ,7157 ,7190 ,7224

0,6 ,7258 ,7291 ,7324 ,7357 ,7389 ,7422 ,7454 ,7486 ,7518 ,7549

0,7 ,7580 ,7612 ,7642 ,7673 ,7704 ,7734 ,7764 ,7794 ,7823 ,7852

0,8 ,7881 ,7910 ,7939 ,7967 ,7996 ,8023 ,8051 ,8078 ,8106 ,8133

0,9 ,8159 ,8186 ,8212 ,8238 ,8264 ,8289 ,8315 ,8340 ,8365 ,8389

Aleshores el valor de serà:

2. Si el valor està entre dos valors, però molt proper a un d’ells,

directament prenem aquest valor, per exemple:

El valor més proper és (que correspon a ).

K 0 1 2 3 4 5 6 7 8 9

0,0 ,5000 ,5040 ,5080 ,5120 ,5160 ,5199 ,5239 ,5279 ,5319 ,5359

0,1 ,5398 ,5438 ,5478 ,5517 ,5557 ,5596 ,5636 ,5675 ,5714 ,5754

0,2 ,5793 ,5832 ,5871 ,5910 ,5948 ,5987 ,6026 ,6005 ,6103 ,6141

0,3 ,6179 ,6217 ,6255 ,6293 ,6331 ,6368 ,6406 ,6443 ,6480 ,6517

0,4 ,6554 ,6591 ,6628 ,6664 ,6700 ,6736 ,6772 ,6808 ,6844 ,6879

0,5 ,6915 ,6950 ,6985 ,7019 ,7054 ,7088 ,7123 ,7157 ,7190 ,7224

0,6 ,7258 ,7291 ,7324 ,7357 ,7389 ,7422 ,7454 ,7486 ,7518 ,7549

0,7 ,7580 ,7612 ,7642 ,7673 ,7704 ,7734 ,7764 ,7794 ,7823 ,7852

0,8 ,7881 ,7910 ,7939 ,7967 ,7996 ,8023 ,8051 ,8078 ,8106 ,8133

0,9 ,8159 ,8186 ,8212 ,8238 ,8264 ,8289 ,8315 ,8340 ,8365 ,8389

Com el valor buscat està molt prop d’aquest, aleshores directament

.

● Si la distribució no és sinó que és , hem de tipificar

prèviament.

Per exemple, si i , calcula quant val .

Tipifiquem:

Page 116: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

116 Introducció a l’estadística

Si busquem dins la taula tenim que correspon a .

K 0 1 2 3 4 5 6 7 8 9

0,0 ,5000 ,5040 ,5080 ,5120 ,5160 ,5199 ,5239 ,5279 ,5319 ,5359

0,1 ,5398 ,5438 ,5478 ,5517 ,5557 ,5596 ,5636 ,5675 ,5714 ,5754

0,2 ,5793 ,5832 ,5871 ,5910 ,5948 ,5987 ,6026 ,6005 ,6103 ,6141

0,3 ,6179 ,6217 ,6255 ,6293 ,6331 ,6368 ,6406 ,6443 ,6480 ,6517

0,4 ,6554 ,6591 ,6628 ,6664 ,6700 ,6736 ,6772 ,6808 ,6844 ,6879

0,5 ,6915 ,6950 ,6985 ,7019 ,7054 ,7088 ,7123 ,7157 ,7190 ,7224

0,6 ,7258 ,7291 ,7324 ,7357 ,7389 ,7422 ,7454 ,7486 ,7518 ,7549

Aleshores:

Exemple

En la fase comarcal de l’olimpíada matemàtica la distribució dels punts

obtinguts pels participants segueix una distribució normal de mitjana 110

punts i una desviació típica de 15 punts.

a. Quina és la probabilitat que un participant hi obtinga més de 125

punts?

= nombre de punts obtinguts pels participants

b. Per a passar a la següent fase és necessari obtindre 100 punts o més.

Quin percentatge de participants passa a la següent fase?

c. Quants punts, com a mínim, té que traure un participant per a estar

entre el 25% dels millors?

Si volem calcular el 25% dels millors, el que farem serà calcular el valor

de la variable que deixa per baix al 75% de la població.

Page 117: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Distribucions de probabilitat discretes i continues 117

Si busquem en la taula aquest valor no apareix directament, sinó que es

troba entre els valors (que correspon a ) i (que

correspon a ). Aleshores el valor que busquem serà:

Per tant,

Per a estar entre el 25% dels millors un participant a de traure

punts o més.

5.7 Aproximació de la distribució binomial mitjançant la distribució normal

El matemàtic francès De Moivre va demostrar que en determinades condicions

la distribució binomial es pot aproximar mitjançant la distribució normal.

Aquestes condicions que s’han de complir són:

Aleshores tenim que si es compleixen les condicions anteriors:

(Recordem que: i en la distribució binomial)

Com més pròxim siga a 0,5 millor serà l’aproximació i gràcies a aquesta

aproximació és fàcil calcular probabilitats amb la distribució binomial per a

valors grans de .

Cal tenir en compte que per a realitzar correctament aquesta transformació

d’una variable discreta (binomial) en una variable contínua (normal) és

necessari fer una correcció de continuïtat. Vegem-ho:

1.

Page 118: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

118 Introducció a l’estadística

2.

3.

4.

Page 119: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Distribucions de probabilitat discretes i continues 119

5.

6.

7.

Page 120: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

120 Introducció a l’estadística

Exemple

Sabem que en la ciutat d’Alacant el 80% dels aficionats al futbol són de

l’Hèrcules. Si en un bar hi ha 50 aficionats al futbol,

a. quina és la probabilitat que en el bar hi haja més de 25 aficionats a

l’Hèrcules?

Anomenem al nombre d’aficionats a l’Hèrcules que hi ha al bar.

Tenim que: , la probabilitat d’èxit (ser aficionat a l’Hèrcules)

i la probabilitat de fracàs (no ser aficionat a l’Hèrcules) .

Aleshores diem que:

Tenim que calcular la , però si ho tenim que calcular utilitzant

la funció de probabilitat de la distribució binomial serà molt costos.

Aleshores anem a comprovar si es compleixen les condicions i podem

aproximar la binomial mitjançant la normal.

b. quina és la probabilitat que en el bar hi haja entre 35 i 45 aficionats a

l’Hèrcules?

Page 121: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Distribucions de probabilitat discretes i continues 121

5.8 Exercicis proposats

1. Una variable aleatòria discreta té la següent distribució de probabilitat:

3 4 5 6 7 8

1/9 1/18 1/3 5/18 m 1/6

a. Completa la distribució de probabilitat.

b. Calcula la mitjana i la desviació típica.

2. Una companyia d’assegurances ha agrupat en quatre grans tipus les

indemnitzacions (en milers d’euros) que espera haver d’afrontar el pròxim any.

La companyia coneix les probabilitats de cadascuna de les possibles

indemnitzacions tal com apareixen en la següent taula:

10 30 70 150

0,5 0,2 0,15 0,15

a. Calcula la funció de distribució.

b. Calcula l’esperança matemàtica i la variància.

3. Les regles d’un joc amb un dau són les següents:

- Guanyem 1 euro si traiem 1, 2 o 3.

- Guanyem 2 euros si traiem 4 o 5.

- Perdem 5 euros si traiem 6.

Calcula l’esperança matemàtica d’aquest joc i digues si el joc és equilibrat.

4. Si és una variable aleatòria que es distribueix , calcula les

següents probabilitats primer sense utilitzar la taula de la binomial i després

utilitzant la taula:

a.

b.

c.

d.

e.

f.

g.

Page 122: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

122 Introducció a l’estadística

5. Calcula la probabilitat que en seleccionar a l’atzar 10 persones d’una

empresa en la qual el 32% dels treballadors són dones obtinguem:

a. Set homes.

b. El mateix nombre d’homes que de dones.

c. Un mínim de 8 dones.

d. Entre un i tres homes (ambdós inclosos).

6. Una universitat sap que el 75% dels seus graduats obté un lloc de treball

durant el primer any. Es trien a l’atzar 8 graduats de la citada universitat.

a. Calcula la probabilitat que almenys 6 tinguen treball el primer any.

b. Calcula la probabilitat que com a màxim 6 tinguen treball el primer

any.

c. Calcula la probabilitat que 6 tinguen treball el primer any.

d. Calcula la probabilitat que més de 6 tinguen treball el primer any.

e. Calcula la probabilitat que menys de 6 tinguen treball el primer any.

f. Calcula el nombre mitjà d’alumnes que van tenir ocupació durant el

primer any si es van graduar un total de 300 alumnes.

7. Tots els anys, a l’estiu, una empresa de gelats fa una promoció que

consisteix en premiar el 20% dels seus gelats amb un gelat gratis.

a. Si comprem una caixa de 10 gelats, quina és la probabilitat que hi haja

algun gelat premiat?

b. Si comprem una caixa de 10 gelats, quina és la probabilitat que

estiguen tots premiats?

c. Quants gelats hauríem de comprar perquè la probabilitat de trobar-ne

algun premiat fóra major que 0,8?

8. En una facultat d’una universitat el 40% dels alumnes suspèn alguna

assignatura el primer any de carrera. Si prenem una mostra de 15 alumnes,

calcula:

a. La probabilitat que més de 8 alumnes suspenguen alguna assignatura.

b. La probabilitat que més de 6 però menys de 10 suspenguen alguna

assignatura.

Page 123: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Distribucions de probabilitat discretes i continues 123

c. Quants alumnes hauríem de prendre en la mostra perquè la probabilitat

que algun suspenguera alguna assignatura fóra major que 0.75?

d. La probabilitat que més de 5 alumnes aproven totes les assignatures.

9. La taxa de desocupació en una població és del 15% sobre la població activa.

Si seleccionem a l’atzar 6 individus en edat de treballar d’aquesta població.

a. Quina és la probabilitat que exactament dos dels individus seleccionats

estiguen aturats?

b. Quina és la probabilitat que no hi haja més de dos individus aturats?

c. Quina és la probabilitat que hi haja entre dos i cinc aturats?

d. Quina és la probabilitat que tots treballen?

10. Si és una variable aleatòria que es distribueix , calcula les

següents probabilitats:

a.

b.

c.

d.

e.

f.

g.

h.

11. En una empresa de fabricació d’envasos per a sucs hi ha una màquina que

fabrica envasos de 112 mil·lilitres, encara que per diverses raons la màquina fa

xicotetes variacions en la capacitat de l’envàs. Sabem que la capacitat dels

envasos que fa aquesta màquina segueix una distribució normal de mitjana 112

i desviació típica 1. Si la màquina ha fet 1.500 envasos,

a. quants tindran una capacitat entre 111 i 114 mil·lilitres?

b. quants tindran una capacitat menor a 110 mil·lilitres?

c. quants tindran una capacitat major a 113 mil·lilitres?

d. quants tindran una capacitat major a 112 mil·lilitres? Contesta aquesta

pregunta sense fer el càlcul de la probabilitat.

Page 124: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

124 Introducció a l’estadística

12. En un magatzem hi ha 500 paquets de material d’oficina amb un pes mitjà

per paquet de 70 kg i amb una desviació típica de 3 kg. Si els pesos dels

paquets segueixen una distribució normal, calcula quants paquets pesen:

a. entre 60 kg i 75 kg

b. més de 90kg

c. menys de 64 kg

d. exactament 64 kg

e. 64 kg o menys

13. Les notes d’una assignatura del grau de GAP en la Universitat d’Alacant

segueixen una distribució normal de mitjana 7 punts i amb una desviació típica

de 2 punts. Calcula la probabilitat que un alumne:

a. aprove

b. suspenga

c. traga un notable (7 o més, però menys de 9)

d. traga menys de 4

14. Si llancem una moneda 196 vegades, calcula la probabilitat que:

a. el nombre de cares estiga comprès entre 91 i 105 (ambdós inclosos)

b. el nombre de cares siga major a 112

c. el nombre de cares siga menor a 77

d. el nombre de creus siga major a 119

e. el nombre de creus siga major a 98

f. el nombre de cares siga igual a 105

15. Sabem que, en un poble de la província d’Alacant, de cada 100 aturats 60

han tingut treball abans. Calcula la probabilitat que al seleccionar 30 aturats a

l’atzar d’aquest poble,

a. hi haja com a mínim 20 aturats que han treballat abans

b. hi haja entre 15 i 20 aturats que han treballat abans

Page 125: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

Distribucions de probabilitat discretes i continues 125

16. En una cadena de muntatge la probabilitat que un accident passe per una

errada en les màquines és de 0,01. Calcula la probabilitat que almenys 4

accidents hagen passat per una errada en les màquines quan analitzem una

mostra aleatòria de:

a. 10 accidents

b. 600 accidents

17. En una empresa de joguines es fabriquen per a Nadal cotxes teledirigits. El

1,5% del cotxes que es fabriquen són defectuosos. En un lot de 10.000 cotxes,

a. quants hem d’esperar que siguen defectuosos?

b. quina és la probabilitat que el nombre de cotxes defectuosos estiga

entre 130 i 175 (ambdós inclosos)

18. En una escola universitària és necessari superar un examen d’ingrés per a

poder entrar. D’anys anteriors sabem que les puntuacions de l’examen d’ingrés

segueixen una distribució normal de mitjana 5,5 i variància 4.

a. Quina és la probabilitat que un sol·licitant traga menys d’un 4?

b. Per a ser admès es necessita una puntuació mínima de 6, quina és la

probabilitat que siga admès un sol·licitant?

c. Quina és la probabilitat que entre 50 sol·licitants s’admeten més de la

meitat?

Page 126: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país
Page 127: Òscar Forner Gumbau - RUA: Principalrua.ua.es/dspace/bitstream/10045/29175/6/2013_Forner_Introduccio... · Els egipcis analitzaven les dades de la població i la renda del país

127

Bibliografia

FERNÁNDEZ, Santiago – CORDERO, José M. – CÓRDOBA, Alejandro,

Estadística descriptiva, Editorial Esic, Madrid, 1996.

MULLOR, Rubén – FAJARDO, M. Dolores, Manual práctico de estadística

aplicada a las ciencias sociales, Editorial Ariel Practicum, Barcelona,

2000.

De GROOT, Morris, Probabilidad y estadística, Editorial Addison-Wesley

Iberoamericana, Pittsburgh, Pennsylvania, USA,1988.

CUADRAS, Carles M. – ECHEVERRÍA, Benito – MATEO, Juan – SÁNCHEZ,

Pedro, Fundamentos de estadística, Editorial P. P. U., Barcelona,

1984.

SERRET, Jaime, Manual de estadística universitaria, Editorial Esic, Madrid,

1995.

NORTES, Andrés, Estadística teórica y aplicada, Editorial P. P. U., Barcelona,

1993.

SÁNCHEZ, Joaquín – MANTECA, Isidoro, Cuestiones y problemas resueltos de

estadística, Editorial Gamma, Alacant, 1995.

FERNÁNDEZ, Carlos – FUENTES, Felipe, Curso de estadística descriptiva,

Editorial Ariel, Barcelona, 1995.

SARRIÓN, M. Dolores, Estadística descriptiva, Editorial Mc Graw Hill,

Madrid, 2012.

MARTÍN - PLIEGO, Francisco J., Introducción a la estadística económica y

empresarial, Editorial AC, Madrid, 2005.

BRETÓ, Josep – NOGUERA, Joan Josep – VIDAL, Miquel, Estadística.

Introducció a la teoria de la decisió, Conselleria de Cultura, Educació

i Ciència, València, 1986.

TOLEDO, Maria I., Estadística, Editorial Alhambra Longman, Madrid, 1992.