Post on 18-Oct-2020
INTRODUCCIÓ A L’ESTADÍSTICA
Òscar Forner Gumbau
Materials de suport a la docència en valencià
DEPARTAMENT D’ESTADÍSTICA I INVESTIGACIÓ OPERATIVA
UNIVERSITAT D'ALACANT
150
Òscar Forner Gumbau Aquest material docent ha rebut una beca del Servei de Política Lingüística de la Universitat d'Alacant L’edició d’aquest material s’ha fet dins el marc del conveni per a la promoció de l’ús social del valencià signat per la Universitat d’Alacant amb la Conselleria d’Educació. ISBN: 978-84-9717-278-3Dipòsit legal: A 592-2013 Alacant, juliol de 2013 (1a edició) Edició: Universitat d'Alacant. Servei de Política Lingüística Apartat de Correus 99 - 03080 Alacant
A/e: servei.pl@ua.es tel. 96 590 34 85
Impressió: Limencop Universitat d’Alacant. Edifici de Ciències Socials – Planta baixa
http://www.limencop.com tel. 96 590 34 00 Ext. 2784
Índex
Presentació............................................................................................................ VII
Introducció............................................................................................................. IX
1. Introducció al procés i al mètode estadístic ...................................................... 11
1.1 Història de l’estadística ............................................................................. 11
1.2 Definició d’estadística .............................................................................. 12
1.3 El procés estadístic .................................................................................... 13
2. Descripció, organització i representació de les dades ..................................... 15
2.1 Conceptes bàsics ....................................................................................... 15
2.2 Taules de freqüències ................................................................................ 16
2.2.1 Taula de freqüències per a variables qualitatives ............................ 16
2.2.2 Taula de freqüències per a variables quantitatives discretes ........... 18
2.2.3 Taula de freqüències per a variables quantitatives contínues ........... 20
2.3 Representació gràfica ................................................................................. 23
2.3.1 Gràfics per a variables qualitatives ................................................... 23
2.3.2 Gràfics per a variables quantitatives discretes ................................. 26
2.3.3 Gràfics per a variables quantitatives continues ............................... 27
2.4 Gràfic de tija i fulles ................................................................................... 31
2.5 Exercicis proposats..................................................................................... 37
3. Estadística descriptiva d’una variable .............................................................. 41
3.1 Mesures de posició central o de centralització ........................................... 41
3.1.1 Mitjana aritmètica ............................................................................. 41
3.1.2 Mediana ............................................................................................ 44
3.1.3 Moda ................................................................................................. 47
3.2 Mesures de posició no central .................................................................... 49
3.2.1 Quartils ............................................................................................. 49
3.2.2 Percentils i decils .............................................................................. 53
3.3 Mesures de dispersió .................................................................................. 53
3.3.1 Mesures de dispersió absolutes ........................................................ 54
3.3.2 Mesures de dispersió relatives .......................................................... 59
3.4 Gràfic de caixa i bigots .............................................................................. 62
3.5 Mesures de concentració ............................................................................ 64
3.5.1 Índex de Gini .................................................................................... 64
3.5.2 Corba de Lorenz ............................................................................... 65
3.6 Exercicis proposats .................................................................................... 66
4. Introducció a la probabilitat. Càlcul de probabilitats ....................................... 73
4.1 Experiments aleatoris ................................................................................. 73
4.2 Successos ................................................................................................... 74
4.2.1 Tipus de successos............................................................................ 74
4.2.2 Operacions amb successos ............................................................... 76
4.3 Probabilitat ................................................................................................. 78
4.3.1 Concepte de probabilitat ................................................................... 78
4.3.2 Probabilitat condicionada ................................................................. 80
4.3.3 Dependència i independència de successos ...................................... 81
4.3.4 Probabilitat composta ....................................................................... 82
4.3.5 Probabilitat total ............................................................................... 83
4.3.6 Teorema de Bayes ............................................................................ 83
4.3.7 Càlcul de probabilitats utilitzant taules de dades i diagrames en
arbre ........................................................................................................... 84
4.4 Exercicis proposats .................................................................................... 87
5. Distribucions de probabilitat discretes i contínues ........................................... 95
5.1 Variable aleatòria ....................................................................................... 95
5.2 Distribucions de probabilitat d’una variable aleatòria discreta .................. 96
5.2.1 Funció de probabilitat ....................................................................... 96
5.2.2 Funció de distribució ........................................................................ 97
5.3 Esperança i variància d’una variable aleatòria discreta ............................. 98
5.4 Distribució binomial .................................................................................. 99
5.4.1 Funció de probabilitat, funció de distribució, esperança i variància
d’una distribució binomial....................................................................... 100
5.4.2 Taula de la distribució binomial ..................................................... 103
5.5 Distribucions de probabilitat d’una variable aleatòria contínua............... 107
5.6 Distribució normal ................................................................................... 108
5.6.1 Representació i característiques ..................................................... 108
5.6.2 Distribució normal estàndard ......................................................... 109
5.6.3 Tipificació de la variable ................................................................ 109
5.6.4 Taula de la corba N(0, 1) ................................................................ 110
5.7 Aproximació de la distribució binomial mitjançant la distribució normal
........................................................................................................................ 117
5.8 Exercicis proposats................................................................................... 121
Bibliografia ......................................................................................................... 127
VII
Presentació del rector
La Universitat d’Alacant vol ser una universitat multilingüe amb personal i estudiants plurilingües actius, i això només és possible amb una bona formació en llengües, un component clau per a una universitat competitiva. Tot i que l’entorn més eficaç per a l’aprenentatge de les llengües és la immersió social o l’aprenentatge natural al si de la família, en l’àmbit escolar i universitari, aquests entorns es poden generar amb el tractament integrat de llengües i continguts. Des de l’equip de govern de la Universitat d’Alacant valorem la docència en valencià (i en altres llengües) com un component molt positiu en la formació universitària dels futurs professionals que estudien en aquesta Universitat. És una obligació de la Universitat formar bons professionals que en un futur pròxim puguen exercir en valencià, en castellà i en anglès, o en qualsevol altra llengua. Aquest material docent que ara presentem és un resultat més d’aquest compromís de l’actual equip de direcció de la Universitat de preparar bons professionals. Per a fer possible que els alumnes actuals i futurs de la Universitat puguen exercir de manera competent la seua professió en valencià hem de preparar bons professors que puguen impartir la docència en valencià i proporcionar materials de suport amb la millor qualitat possible. Un altre objectiu de la Universitat és promoure el coneixement en obert i facilitar i compartir recursos entre les universitats i els seus usuaris. Per això, aquests materials estan disponibles en edició digital i en el Repositori de la Universitat d’Alacant (RUA). L’edició de materials docents en valencià, l’autoarxivament en el RUA i l’impuls del coneixement en obert, són accions que formen part del desplegament d’una de les línies estratègiques de política lingüística: “Millorar i augmentar l’oferta de la docència en valencià i garantir-ne una bona qualitat lingüística” del Pla de Política Lingüística de la Universitat d’Alacant (BOUA de 5 de juliol de 2011). Aquestes iniciatives de suport a l’ús del valencià com a llengua d’ensenyament i aprenentatge han comptat amb el suport de la Generalitat Valenciana a través del conveni per a la promoció de l’ús del valencià.
Manuel Palomar Sanz Rector
IX
Introducció
Aquest material ha sigut preparat per a desenvolupar els continguts de l’assignatura Introducció a l’Estadística del primer curs del grau de Gestió i Administració Pública de la Universitat d’Alacant. L’objectiu d’aquest material és que els alumnes puguen treballar els continguts de l’assignatura amb més facilitat, ja que en els cinc capítols que formen el quadern estan tots els materials necessaris per a seguir l’assignatura, tant en la part teòrica com pràctica, amb exemples resolts i exercicis proposats. El llenguatge que s’utilitza en aquest quadern es senzill i clar, ja que l’alumnat d’aquesta assignatura no sol tenir una gran formació en matemàtiques, per la qual cosa amb aquest material s’intenta que l’assignatura no siga un obstacle insuperable i els alumnes acaben amb una formació bàsica en estadística (amb aquesta assignatura i amb l’assignatura Estadística Aplicada a l’Administració Pública cursada en segon) per a la seua futura incorporació al mercat laboral. Amb aquest material també he volgut potenciar l’ús del valencià en la docència, ja que crec que és una millora en la formació dels estudiants. Això no hauria sigut possible sense l’ajuda de Xavier Casero, responsable de l’Àrea d’Assessorament Lingüístic del Servei de Promoció del Valencià, al qual agraïsc la seua ajuda i les seues correccions. Per últim, vull dedicar aquest llibre: als meus pares, Manuel i Fina, que tant han treballat per a ajudar-me sempre, als meus germans, Manolo i José, que sempre m’han donat suport i m’han ajudat, a les seues parelles i fills, i sobretot, a la meua parella, Mónica, que m’anima en tot el que faig i que amb el seu sacrifici m’ha donat temps per a fer aquest material, i als meus fills, Aitana i Manel, que són la major alegria de la meua vida. Òscar Forner Gumbau Professor del Departament d’Estadística i Investigació Operativa Universitat d’Alacant, juny de 2013
11
1 Introducció al procés i al mètode estadístic
1.1 Història de l’estadística
Des dels començaments de la civilització han existit formes senzilles
d’estadística, ja que s'utilitzaven representacions gràfiques i altres símbols en
pells, roques, pals de fusta i parets de coves per a explicar el nombre de
persones, animals o certes coses.
Cap a l’any 3.000 a. de C. els babilonis usaven ja xicotetes taules d'argila per a
recopilar dades sobre la producció agrícola i dels gèneres venuts o canviats
mitjançant barata.
Els egipcis analitzaven les dades de la població i la renda del país molt abans
de construir les piràmides en el segle XXXI a. de C. Els llibres bíblics de
Nombres i Cròniques inclouen, en algunes parts, treballs d'estadística. El
primer conté dos censos de la població d’Israel i el segon descriu el benestar
material de les diverses tribus jueves. A la Xina hi havia registres numèrics
similars amb anterioritat a l'any 2.000 a. de C.
Els grecs clàssics feien censos la informació dels quals s'utilitzava cap al 594
a. de C. per a cobrar impostos.
L’Imperi romà va ser el primer govern que va recopilar una gran quantitat de
dades sobre la població, superfície i renda de tots els territoris sota el seu
control.
Durant l’edat mitjana només es van fer alguns censos exhaustius a Europa. Cal
destacar els que van fer els reis carolingis Pipí el Breu i Carlemany, que van
ordenar fer estudis minuciosos de les propietats de l’Església en els anys 758 i
762 respectivament. A Anglaterra, Guillem el Conqueridor va recopilar al
Domesday Book o Llibre del Gran Cadastre a l’any 1086, un document de la
propietat, extensió i valor de les terres d’Anglaterra. Aquesta obra va ser la
primera recopilació de dades estadístiques d’Anglaterra.
El registre de naixements i defuncions va començar a Anglaterra a principis
del segle XVI, i el 1662 va aparèixer el primer estudi estadístic notable de
població, titulat Observations on the London Bills of Mortality (Comentaris
sobre les partides de defunció a Londres). Un estudi similar sobre la taxa de
mortalitat en la ciutat de Breslau, a Alemanya, fet el 1691, va ser utilitzat per
12 Introducció a l’estadística
l’astrònom anglès Edmund Halley com a base per a la primera taula de
mortalitat.
Durant el segle XVIII es fan els primers censos oficials a Europa. Es pot dir
que fins a finals del segle XVIII i principis del XIX tots els treballs estadístics
eren purament descriptius.
El vertader origen de l’estadística moderna pot situar-se en l’última dècada del
segle XIX, com a resultat de la unió de dos disciplines que evolucionaren de
forma independent: el càlcul de probabilitats, que ve nàixer en el segle XVII
com a teoria matemàtica dels jocs d’atzar, i l’estadística, o ciència de l’estat,
que estudia la descripció de les dades i que té, com hem dit, unes arrels més
antigues.
En els nostres dies, l’estadística s’ha convertit en un mètode efectiu per a
descriure amb exactitud els valors de dades econòmiques, polítiques, socials,
psicològiques, biològiques i físiques, i serveix com a eina per a relacionar i
analitzar aquestes dades. El treball de l’expert estadístic no consisteix ja només
a reunir i tabular les dades, sinó sobretot en el procés d’interpretació d’aquesta
informació.
El desenvolupament de la teoria de la probabilitat ha augmentat l’abast de les
aplicacions de l’estadística. Molts conjunts de dades es poden aproximar, amb
gran exactitud, utilitzant determinades distribucions probabilístiques; els
resultats d'aquestes es poden utilitzar per a analitzar dades estadístiques. La
probabilitat és útil per a comprovar la fiabilitat de les inferències estadístiques
i per a predir el tipus i la quantitat de dades necessàries en un determinat estudi
estadístic.
1.2 Definició d’estadística
L’estadística és la disciplina que estudia els mètodes científics per a
arreplegar, organitzar, resumir i analitzar dades, així com per a traure
conclusions vàlides i prendre decisions raonables basades en aquesta anàlisi.
Arreplegar: mitjançant observació, mesures, enquestes, etc.
Organitzar: s’ordenen les dades per a ficar-les en taules i es construeixen
representacions gràfiques.
Resumir: resumim les dades en uns pocs valors que proporcionen la màxima
informació possible.
Analitzar: es fa utilitzant el càlcul de probabilitats i se centra a elaborar
estimacions, contrastos d’hipòtesis, prediccions i mesurar relacions o
dependències.
Hi ha dos grans branques clarament diferenciades dins de l’estadística:
l’estadística descriptiva (o aplicada), que arreplega els tres primers passos, i
l’inferència estadística, que arreplega l’últim pas.
Introducció al procés i al mètode estadístic 13
1.3 El procés estadístic
Tota investigació estadística comprèn una sèrie d’etapes o fases que podem
classificar així:
a) Fase de planificació:
Plantejament del problema i clarificació de l’objectiu que es
persegueix.
Determinació de la variable o variables que hi intervenen.
Identificació dels individus a investigar.
Selecció de la mostra (quan faça falta).
b) Fase d’execució: obtenció de les dades i la seua posterior descripció o
anàlisi.
c) Fase de conclusions i informació.
Per a comprendre millor aquestes fases, vegem-ne un exemple:
a) Suposem que l’objectiu de la investigació és conèixer el rendiment
acadèmic dels alumnes de 1r de GAP en la Universitat d’Alacant.
Una vegada fixat l’objectiu de l’estudi, el pas següent serà seleccionar
les variables i identificar els individus que ens ajuden a aconseguir
aquest objectiu; en el nostre cas està clar que les variables seran les
qualificacions en les diferents assignatures dels alumnes de primer
curs de GAP.
b) A continuació, passem a l’obtenció de les dades, és a dir, conèixer les
notes dels alumnes en les diferents assignatures.
Aquesta informació no serà útil si no l’ordenem en forma de taules per
assignatura. A més, podem obtenir ràpidament una idea
complementària sobre com ha sigut aquest rendiment fent la
representació gràfica d’aquesta informació.
Perquè aquesta quantitat de dades siga manejable, podem utilitzar
algunes mesures que sintetitzen la informació i que ens permeten
realitzar comparacions amb altres investigacions similars. Aquestes
mesures poden ser per exemple: la nota mitjana final per alumne, les
notes mitjanes del conjunt d’alumnes per assignatura, l’anàlisi
comparativa de les notes entre alumnes i assignatura, etcètera.
c) Per últim, traiem les conclusions sobre el rendiment acadèmic
d’aquest grup d’estudiants.
15
2 Descripció, organització i representació de les dades
En aquest tema primer veurem els conceptes bàsics de població, mostra,
element i tipus de variable. Després ordenarem i organitzarem les dades
estadístiques mitjançant taules de freqüències, per a continuació representar-
les gràficament. Finalment veurem el gràfic de tija i fulles, el qual ens permet
organitzar i representar les dades simultàniament.
2.1 Conceptes bàsics
- Individu o element: persones o objectes que contenen certa informació que
es vol estudiar.
- Població: conjunt d'individus o elements que compleixen certes propietats
comunes.
- Mostra: subconjunt representatiu d’una població, l’estudi de la qual serveix
per a inferir característiques de tota la població.
- Grandària de la població: nombre d'individus que formen la població. En
relació amb la grandària de la població, aquesta pot ser finita o infinita.
Exemple
Volem estudiar el gènere cinematogràfic favorit dels alumnes de GAP de la
Universitat d’Alacant. Per a aquest cas particular:
Població: tots els alumnes de GAP de la Universitat d’Alacant.
Individus: cadascun dels alumnes.
Grandària de la població: nombre total d'alumnes. En aquest cas la població
seria finita.
Mostra: subconjunt d’alumnes de GAP als qui preguntem sobre el seu gènere
cinematogràfic preferit.
- Variable o caràcter: propietat, tret o qualitat dels elements de la població, i
que pretenem estudiar.
16 Introducció a l’estadística
- Variable qualitativa: els valors que pren no són quantificables. Una variable
qualitativa pot ser a més nominal, si no és possible establir un ordre en les
seues modalitats; o ordinal, si pel contrari sí que s’hi pot establir un ordre.
Exemple
Són variables qualitatives nominals: els colors (roig, blau...), el sexe d’una
persona, la professió, l’estat civil...
Són variables qualitatives ordinals: l’ordre d'arribada a la meta en una
competició (1r, 2n, 3r ...), els rangs militars...
- Variable quantitativa: és aquella els valors de la qual són quantitats
numèriques amb les quals podem fer operacions aritmètiques. Dins d’aquest
tipus de variables podem distingir-ne dos grups:
Discretes: quan no admeten un valor intermedi entre dos qualssevol
dels seus valors i cada valor de la variable és un nombre natural.
Contínues: quan admeten un valor intermedi entre dos qualssevol dels
seus valors. En aquests casos, els valors de la variable són nombres
reals.
Exemple
Són variables quantitatives discretes: el nombre de fills per unitat familiar, el
total d'assignatures completes aprovades durant un curs, el nombre de vegades
que s'ha anat al cinema en els últims dos mesos...
Són variables quantitatives contínues: el pes d'un xiquet en nàixer, la
temperatura del cos, la longitud del braç...
Si la variable estadística és contínua, o si hi ha moltes dades, els valors
obtinguts s’agrupen en intervals o classes. Cada classe és un interval de la
forma [a , b[, és a dir, tancat per l’esquerra i obert per la dreta. Això vol dir
que a aquest interval pertanyen els valors majors o iguals que a i els menors
que b (a ≤ x < b).
2.2 Taules de freqüències
Les taules de freqüències serveixen per a ordenar i organitzar les dades
estadístiques. Anem a distingir tres tipus de taules, segons que la variable siga
qualitativa, quantitativa discreta o quantitativa contínua.
2.2.1 Taula de freqüències per a variables qualitatives
Considerem una població o mostra de n individus, descrita segons un caràcter
o variable X qualitatiu, els valors de la qual són . Per a cadascun
d'aquests valors, introduïm les següents magnituds:
- Freqüència absoluta: és el nombre de vegades que apareix cada valor de la
variable. La denotarem per .
Descripció, organització i representació de les dades 17
La suma de les freqüències absolutes, , és el nombre total d’observacions de
la variable. La denotarem per .
- Freqüència relativa: és el quocient entre la freqüència absoluta d’un valor
de la variable i el nombre total d’observacions de la variable. La denotarem
per .
La suma de les freqüències relatives, , és la unitat.
La freqüència relativa és el tant per u d’observacions que pertanyen a cada
valor de la variable. Si multipliquem la freqüència relativa per 100%,
representarà el percentatge de la mostra o població que té aquest valor:
Una taula estadística de freqüències serveix per a presentar de forma ordenada
les dades de la variable. La taula de freqüències per a variables qualitatives
serà d’aquesta manera:
Exemple
L’estat civil d’un grup de 20 persones és el següent:
X
Solter 4 4/20 20%
Casat 6 6/20 30%
Vidu 7 7/20 35%
Divorciat 3 3/20 15%
Total 20 1 100%
X Freq. abs. ( ) Freq. rel. ( ) Percentatge ( )
... ... ... ...
... ... ... ...
Total 1 100%
18 Introducció a l’estadística
2.2.2 Taula de freqüències per a variables quantitatives discretes
Considerem una població o mostra de n individus, descrita segons un caràcter
o variable X quantitativa discreta, els valors de la qual són . Per a
cadascun d’aquests valors, introduïm les següents magnituds:
- Freqüència absoluta: és el nombre de vegades que apareix cada valor de la
variable. La denotarem per . La suma de les freqüències absolutes, , és el nombre total d’observacions de
la variable. La denotarem per .
- Freqüència relativa: és el quocient entre la freqüència absoluta d’un valor
de la variable i el nombre total d’observacions de la variable. La denotarem
per .
La suma de les freqüències relatives, , és la unitat.
La freqüència relativa és el tant per u d’observacions que pertanyen a cada
valor de la variable. Si multipliquem la freqüència relativa per 100%,
representarà el percentatge de la mostra o població que té aquest valor:
- Freqüència absoluta acumulada: és la suma de les freqüències absolutes
fins un valor determinat de la variable. La denotarem per .
L’últim valor de la freqüència absoluta acumulada coincideix amb el nombre
d’observacions de la variable.
- Freqüència relativa acumulada: és la suma de les freqüències relatives fins
un valor determinat de la variable. La denotarem per .
També podríem definir la freqüència relativa acumulada com el quocient entre
cada una de les freqüències absolutes acumulades i el nombre total
d’observacions de la variable.
Descripció, organització i representació de les dades 19
L’últim valor de la freqüència relativa acumulada és la unitat.
La freqüència relativa acumulada és el tant per u d’observacions fins un valor
determinat de la variable. Si multipliquem la freqüència relativa acumulada
per 100%, representarà el percentatge acumulat de la mostra o població fins
un valor determinat de la variable:
La taula de freqüències per a variables quantitatives discretes serà d’aquesta
manera:
Exemple
Per a conèixer l’acollida que un jardí d’infància pot tenir en un barri, ens
interessa saber el nombre de matrimonis amb els dos components menors de
40 anys que hi ha en cada bloc d’edificis i hem obtingut els següents resultats:
5 7 7 5 4 6 2 6 5 5 4 3
X
... ... ... ... ... ...
... ... ... ... ... ...
X
2 1 1 1/12 1/12 8,33% 8,33%
3 1 2 1/12 2/12 8,33% 16,67%
4 2 4 2/12 4/12 16,67% 33,33%
5 4 8 4/12 8/12 33,33% 66,67%
6 2 10 2/12 10/12 16,67% 83,33%
7 2 12 2/12 12/12 =1 16,67% 100%
Total 12 1 100%
20 Introducció a l’estadística
2.2.3 Taula de freqüències per a variables quantitatives continues
Considerem una població o mostra de n individus, descrita segons un caràcter
o variable X quantitatiu, els valors de la qual són .
El problema que es presenta en treballar amb aquest tipus de variables és
l’enorme quantitat de modalitats diferents que poden arribar a aparèixer. El
més convenient és agrupar les dades en classes o intervals, en cadascun dels
quals s’inclouen determinats valors de la variable. Aquest agrupament també
és convenient fer-ho amb variables quantitatives discretes amb un nombre
elevat de valors diferents.
- Cadascun dels intervals vindrà definit per una parella de valors, i que
s’anomenaran límits de l’interval, i en l’interval estaran tots els
valors de X menors que i majors o iguals que .
- La diferencia s’anomena amplitud de l’interval.
- El punt mitjà de cada interval s’anomena marca de classe.
Exemple
En l’interval estan tots els valors majors o iguals que i menors que .
L’amplitud de l’interval serà:
La marca de classe serà:
A l’hora de construir els intervals es pot fer de diverses maneres. Nosaltres
utilitzarem la fórmula de Sturges per al càlcul del nombre d’intervals.
Passos a seguir per a la construcció dels intervals:
1) Ordenem les dades de menor a major:
2) Apuntem la unitat de precisió de les dades (up)
3) Calculem el rang de les dades:
4) Calculem el rang ampliat:
5) Calculem el nombre d’intervals utilitzant la fórmula de Sturges
6) Calculem l’amplitud de l’interval:
Descripció, organització i representació de les dades 21
Si l’amplitud de l’interval no està amb la mateixa unitat de precisió
que les dades, aquest valor de l’amplitud l’hem d’arredonir per excés a
la unitat de precisió.
7) Si hem arredonit el valor de l’amplitud de l’interval, hem de calcular
el rang final:
8) Calculem el límit inferior del primer interval, :
Si no hem arredonit l’amplitud de l’interval, fem
Si hem arrodonit l’amplitud de l’interval, és a dir, hem calculat el rang
final, fem
9) Calculem el límit superior del primer interval sumant al límit inferior,
, l’amplitud de l’interval, és a dir,
10) El límit inferior del segon interval serà igual al límit superior del
primer interval i el límit superior del segon interval el calcularem
sumant l’amplitud al límit inferior de l’interval, igual que hem fet
abans en el primer interval. La resta d’intervals s’obtindran de la
mateixa manera, és a dir,
Una vegada calculats els intervals els posem en columna, calculem les seues
marques de classe i les freqüències.
Per a cadascun dels intervals podem definir els conceptes de freqüència
absoluta, freqüència absoluta acumulada, freqüència relativa, freqüència
relativa acumulada, percentatge i percentatge acumulat, tal com hem fet per a
les variables quantitatives discretes.
Exemple
Disposem de les següents dades sobre les alçades en centímetres dels
components d’un equip de bàsquet:
172 168 167 175 179 180 198 164
174 177 182 185 191 173 160 166
Fem una taula de freqüències agrupant les dades amb intervals solapats d’igual
amplitud utilitzant la fórmula de Sturges.
22 Introducció a l’estadística
Passos a seguir:
1) Ordenem les dades:
Nombre de dades:
2) Unitat de precisió:
3)
4)
5) Formula de Sturges
6)
7) Calculem el rang final perquè hem hagut d’arredonir l’amplitud
8) Calculem :
9) Calculem :
aleshores el primer interval és:
10) La resta d’intervals són:
Fem la taula de freqüències:
Intervals Marca
classe
Descripció, organització i representació de les dades 23
Taula de freqüències amb intervals de diferent amplitud
Si l’amplitud dels intervals no és constant, apareix el concepte de densitat de
freqüències en cada interval:
on és l’amplitud de l’interval corresponent.
Exemple
2.3 Representació gràfica
En una taula estadística de freqüències hi ha tota la informació disponible. No
obstant això amb les representacions gràfiques es pretén, amb un colp de vista,
presentar i resumir de manera efectiva el comportament de la mostra o
població respecte la variable estudiada.
Segons la naturalesa de la variable estudiada, les representacions gràfiques
més usuals són les següents:
2.3.1 Gràfics per a variables qualitatives
Diagrama de barres
Cada valor diferent de la variable està representat per un rectangle. Com a base
de cada rectangle es prenen segments d’igual amplitud sobre l’eix d’abscisses i
l’altura de cadascun d’ells és proporcional a la freqüència absoluta del valor
que representa.
Exemple
L’estat civil d’un grup de 20 persones és el següent:
X Solter 4
Casat 6
Vidu 7
Divorciat 3
20
Intervals
24 Introducció a l’estadística
Diagrama de sectors
Per a fer el diagrama de sectors es divideix l’àrea total del cercle en tantes
porcions com valors diferents de la variable hi haja. Cada valor ve representat
per un sector circular, l’àrea del qual ha de ser proporcional a la seua
freqüència absoluta. Una manera ràpida de calcular l’angle corresponent a
cada sector és multiplicar la freqüència relativa de cada valor diferent per 360º.
Exemple
L’estat civil d’un grup de 20 persones és el següent:
0
1
2
3
4
5
6
7
8
Solter Casat Vidu Divorciat
Diagrama de barres
X Solter 4 4/20
Casat 6 6/20
Vidu 7 7/20
Divorciat 3 3/20
20 1
Descripció, organització i representació de les dades 25
Pictogrames
Expressen amb dibuixos al·lusius al tema d’estudi les freqüències absolutes
dels valors de la variable. Aquests gràfics es fan generalment representant a
diferents escales un mateix dibuix o repetint el mateix dibuix
proporcionalment al valor de les freqüències. L’escalament dels dibuixos ha de
ser tal que l’àrea de cadascun d'ells siga proporcional a la freqüència del valor
que representa. Aquests tipus de gràfics s’utilitzen habitualment als mitjans de
comunicació, perquè siguen compresos pel públic no especialitzat, sense que
siga necessària una explicació complexa.
Exemple
En la taula següent apareixen els dies de pluja a les ciutats d’Alacant i Castelló
l’any 2011.
Ciutat Dies de pluja ( ) Alacant 66
Castelló 84
Diagrama de sectors
Solter
Casat
Vidu
Divorciat
0
10
20
30
40
50
60
70
80
90
Alacant Castelló
Pictograma
26 Introducció a l’estadística
2.3.2 Gràfics per a variables quantitatives discretes
Diagrama de barres
S’utilitza quan la variable té pocs valors diferents. El diagrama es construeix
situant en l’eix d'abscisses els valors diferents de la variable, i sobre ells, i
paral·lels a l'eix d’ordenades, barres de longitud igual a les freqüències
absolutes (o relatives).
Exemple
En la taula següent apareixen classificades 12 famílies pel nombre de fills:
Polígon de freqüències
S’obté unint, mitjançant segments de recta, els extrems superiors de les barres
d’un diagrama de barres.
Exemple
En la taula següent apareixen classificades 12 famílies pel nombre de fills:
0
1
2
3
4
5
6
1 2 3 4
Diagrama de barres
Nombre
de fills
1 1
2 3
3 5
4 3
12
Nombre
de fills
1 1
2 3
3 5
4 3
12
Descripció, organització i representació de les dades 27
2.3.3 Gràfics per a variables quantitatives continues
Histograma
Les representacions gràfiques més adequades per a variables quantitatives
contínues, o discretes amb un gran nombre de valors possibles, són els
histogrames.
Es construeix a partir de la taula de freqüències. Sobre l’eix d’abscisses
s’escriuen els intervals, alçant sobre cadascun d’aquests un rectangle que té
aquest segment com a base. El criteri per a calcular l’altura de cada rectangle
és el de mantenir la proporcionalitat entre les freqüències absolutes (o
relatives) de cada interval i l’àrea dels mateixos.
0
1
2
3
4
5
6
1 2 3 4
Diagrama de barres i polígon de freqüències
0
1
2
3
4
5
6
1 2 3 4
Polígon de freqüències
28 Introducció a l’estadística
Les condicions bàsiques per a un traçat correcte de l’histograma són:
Els rectangles han d’aparèixer juxtaposats, per a respectar la
continuïtat de la variable.
La mesura de la base de cada rectangle ha de ser l’amplitud de la
classe corresponent.
Si l’amplitud és constant, l’alçada de cada rectangle es pren com la
freqüència absoluta, , de l’interval sobre el qual està situat.
En el cas que els intervals no siguen tots de la mateixa amplitud,
l’alçada de cada rectangle serà la densitat de freqüència de l’interval
corresponent, és a dir, el quocient entre la freqüència absoluta de
l’interval i la seua amplitud.
També podem representar un histograma de freqüències acumulades. Els
passos a seguir són els mateixos que abans però tenint en compte les
freqüències absolutes acumulades en lloc de les freqüències absolutes.
Exemple
Disposem de les següents dades sobre les alçades en centímetres dels
components d’un equip de bàsquet:
0
1
2
3
4
5
6
[159,167[ [167,175[ [175,183[ [183,191[ [191,199[
Histograma amb intervals d'igual amplitud
Intervals
Descripció, organització i representació de les dades 29
Exemple
Disposem de les següents dades sobre les mesures (en metres quadrats) de les
habitacions d’una casa.
0
2
4
6
8
10
12
14
16
18
[159,167[ [167,175[ [175,183[ [183,191[ [191,199[
Histograma de freqüències acumulades
0
0,5
1
1,5
2
2,5
[2,4[ [4,7[ [7,12[
Histograma amb intervals de diferent amplitud
Intervals
30 Introducció a l’estadística
Polígon de freqüències
S’obté unint, mitjançant segments de recta, els punts mitjans de les bases
superiors dels rectangles de l’histograma. Es prolonga la línia poligonal fins a
tallar l’eix d’abscisses en els punts mitjans dels intervals anterior al primer i
següent a l’últim, assignant-los d’aquesta manera freqüència nul·la.
És important assenyalar que l’àrea que hi ha per davall del polígon de
freqüències és igual a la suma de les àrees dels rectangles de l’histograma.
També podem representar un polígon de freqüències acumulades. Per a
realitzar aquest polígon el que tenim que fer és unir els vèrtexs superiors drets
dels rectangles de l’histograma de freqüències acumulades mitjançant una línia
poligonal.
Exemple:
Tornant a l’exemple anterior, el polígon de freqüències seria de la forma:
0
1
2
3
4
5
6
[159,167[ [167,175[ [175,183[ [183,191[ [191,199[
Histograma i polígon de freqüències
0
1
2
3
4
5
6
[159,167[ [167,175[ [175,183[ [183,191[ [191,199[
Polígon de freqüències
Descripció, organització i representació de les dades 31
2.4 Gràfic de tija i fulles
El gràfic de tija i fulles es construeix a partir de les dades originals de les
variables quantitatives, tant discretes com contínues.
Les indicacions per a la seua construcció són les següents:
- Per al nombre de dades que nosaltres manegem, els gràfics han de
tenir sempre de 4 a 12 files.
- Les dades han de tenir el mateix nombre de dígits tant enters com
decimals. Si no és així, afegirem zeros a dreta o esquerra (segons ens
convinga).
0
2
4
6
8
10
12
14
16
18
[159,167[ [167,175[ [175,183[ [183,191[ [191,199[
Histograma i polígon de freqüències acumulades
0
2
4
6
8
10
12
14
16
18
[159,167[ [167,175[ [175,183[ [183,191[ [191,199[
Polígon de freqüències acumulades
32 Introducció a l’estadística
- Una vegada aconseguit el mateix nombre de dígits, les dades es
divideixen en dues parts: la de l'esquerra serà la tija i la de la dreta les
fulles.
- Es dibuixa una línia vertical i a la seua esquerra s’anoten en columna
les tiges ordenades de menor a major. Les tiges han de ser
consecutives i abastar tot el recorregut de la variable.
- A la dreta de la línia vertical s’anoten les fulles corresponents a cada
tija. Les fulles s’ordenen de menor a major i han d’ocupar el mateix
espai. Han d’haver-hi tantes fulles com nombre d’observacions.
- Hem d’indicar les xifres decimals que presenten les nostres dades. Si
les nostres dades presenten xifres decimals, farem el gràfic com si no
les tingueren i al final, indicarem per quina quantitat han de
multiplicar-se les dades del gràfic per a obtenir les nostres dades
originals. Així, si tenim dos xifres decimals, al final del gràfic
escriurem × 0,01.
- Si volem aconseguir més files en el nostre gràfic podrem dividir cada
tija en dos files, reservant el símbol * per a la primera meitat de les
fulles possibles i el símbol º per a la resta, o en 5 files, on els símbols
utilitzats són:
* per al 20% inicial de fulles
t per al 20% següent
f per al 20% següent
s per al 20% següent
º per a l'últim 20%
El gràfic de tija i fulles és molt útil per les raons següents:
- Ens presenta les dades ordenades, cosa que serà útil per al càlcul
d'algunes mesures que veurem posteriorment.
- És una tècnica d’organització de les dades que permet obtindre
simultàniament la distribució de freqüències i la seua representació
gràfica, ja que, si ho girem, ens presenta la forma que té l’histograma
(la forma de l'histograma és la mateixa que la del gràfic de tija i fulla
si aquest últim el girem 90º cap a l'esquerra).
A continuació veurem com arribar a aquesta construcció, pas a pas, amb un
exemple. Les dades de les quals partim són:
4 12 23 32 18 7 12 15
51 45 42 45 56 21 23 35
En primer lloc, les dades han de tenir el mateix nombre de dígits tant enters
com decimals. Si no és així, afegirem zeros a dreta o esquerra (segons ens
convinga). Així, les dades ens quedaran:
04 12 23 32 18 07 12 15
51 45 42 45 56 21 23 35
Descripció, organització i representació de les dades 33
Una vegada aconseguit el mateix nombre de dígits, les dades es divideixen en
dos parts: la de l'esquerra serà la tija i la de la dreta, les fulles. Per tant,
tindrem:
0
1
2
3
4
5
A continuació anem escrivint les fulles seguint les dades: la primera dada és
04, que té tija 0 i fulla 4, per la qual cosa situem un 4 al costat de la tija 0; la
segona dada és 12, per la qual cosa situem un 6 al costat de la tija 1 i així
successivament, obtenint el gràfic que apareix a continuació:
0 4 7
1 2 8 2 5
2 3 1 3
3 2 5
4 5 2 5
5 1 6
Després ordenem les fulles en cadascuna de les tiges i obtenim el gràfic que
volíem de tija i fulles:
0 4 7
1 2 2 5 8
2 1 3 3
3 2 5
4 2 5 5
5 1 6
A continuació, veurem una sèrie d’exemples on ens apareixeran tots els tipus
de casos diferents que podem tenir.
Exemple:
Fer el gràfic de tija i fulles per a les dades:
4 12 23 18 7 12 15
51 45 42 45 56 21 23
0 4 7
1 2 2 5 8
2 1 3 3
3
4 2 5 5
5 1 6
Les tiges intermèdies que queden buides no poden ser eliminades, però si
queden al principi o al final les eliminem.
34 Introducció a l’estadística
Exemple:
Fer el gràfic de tija i fulles per a les dades:
14 12 23 22 27 17 12 15
11 25 12 15 10 21 23 25
Si agafem com a tija el primer dígit de les xifres sols tindrem dos tiges (el
mínim hem dit que és quatre), per la qual cosa dividirem cada tija en dos o
cinc parts. Per tant, tenim dos possibilitats:
1* 0 1 2 2 2 4
º 5 5 7
2* 1 2 3 3
º 5 5 7
o bé
1* 0 1
t 2 2 2
f 4 5 5
s 7
º
2* 1
t 2 3 3
f 5 5
s 7
Exemple:
Fer el gràfic de tija i fulles per a les dades:
0,4 1,2 2,3 3,2 1,8 0,7 1,2 1,5
5,1 4,5 4,2 4,5 5,6 2,1 2,3 3,5
0 4 7
1 2 2 5 8
2 1 3 3
3 2 5
4 2 5 5
5 1 6
×0,1
Exemple:
Fer el gràfic de tija i fulles per a les dades:
114 112 123 132 118 167
112 165 151 145 142 145
156 121 163 135
Ara les nostres dades tenen 3 dígits, per la qual cosa hem de decidir què és la
tija i què és la fulla. En principi, tenim dues possibilitats: que les dues primeres
constituïsquen la tija i l'última la fulla, o bé triar la primera xifra la tija i les
dues últimes la fulla. Amb la primera opció el gràfic ens quedarà:
Descripció, organització i representació de les dades 35
11 2 2 4 8
12 1 3
13 2 5
14 2 5 5
15 1 6
16 3 5 7
Amb la segona opció el gràfic quedarà així:
1* 12 12 14 18
t 21 23 32 35
f 42 45 45 51 56
s 63 65 67
Exemple:
Fer el gràfic de tija i fulles per a les dades:
1,14 1,12 1,23 1,32 1,18 1,67
1,12 1,65 1,51 1,45 1,42 1,45
1,56 1,21 1,63 1,35
Tenim dos possibilitats:
11 2 2 4 8
12 1 3
13 2 5
14 2 5 5
15 1 6
16 3 5 7
×0,01
o bé:
1* 12 12 14 18
t 21 23 32 35
f 42 45 45 51 56
s 63 65 67
×0,01
Exemple:
Fer el gràfic de tija i fulles per a les dades:
1,14 2,12 1,23 1,32 1 1,67
1,02 2 1,51 3,45 1,42 1,45
2,56 3,12 3,63 1,35
En primer lloc, les dades han de tenir el mateix nombre de dígits tant enters
com decimals, així que afegirem zeros a l’esquerra. Aleshores les dades ens
quedaran:
36 Introducció a l’estadística
1,14 2,12 1,23 1,32 1,00 1,67
1,02 2,00 1,51 3,45 2,52 1,45
2,56 3,12 3,63 2,35
Agafem com a tija la primera xifra i les dividim en dos files. No té sentit fer
més divisions, ja que aleshores ens eixirien massa files.
×0,01
Pas d’un gràfic de tija i fulles a una taula de freqüències
El pas d'un diagrama de tija i fulles a una taula de freqüències és senzill,
cadascuna de les tiges representarà una classe i el nombre de fulles la seua
freqüència absoluta. Com hem de treballar amb intervals solapats, restarem i
sumarem la meitat del nivell de precisió a l'extrem inferior i superior de cada
classe.
Exemple:
Fer el gràfic de tija i fulles per a les dades següents i construeix a partir del
gràfic la taula de freqüències:
4 12 23 32 18 7 12 15
51 45 42 45 56 21 23 35
0 4 7
1 2 2 5 8
2 1 3 3
3 2 5
4 2 5 5
5 1 6
A partir d’aquest gràfic obtenim les següents classes:
Intervals
Com la unitat de precisió d’aquestes dades és 1, sumarem i restarem a
cadascun dels intervals 0,5 i la taula de freqüències quedarà així:
1* 00 02 14 23 32 45
º 51 67
2* 00 12 35
º 52 56
3* 12 45
º 63
Descripció, organització i representació de les dades 37
Intervals
2.5 Exercicis proposats
1. Considerem les següents dades relatives a una variable aleatòria:
5 25 32 7 102 20 382 50 19 5 40 7
232 70 65 9 26 8 29 83 28 16 12 45
16 41 15 159 76 80 236 6 30 18 42 300
10 14 5 40 42 13 19 87 23 132 63 330
a. Construeix la taula de freqüències apropiada amb intervals solapats i
d'igual amplitud aplicant la fórmula de Sturges.
b. A partir de la taula anterior, quin percentatge de dades es troben per
sobre de 75?
2. Es va fer una anàlisi de sang a 40 estudiants d’una universitat espanyola, i es
van obtindre les següents quantitats de colesterol en mg/dl:
135 169 126 149 197 221 220 147 165 178
212 184 173 195 218 139 212 230 159 148
201 159 192 214 178 188 205 196 174 201
142 199 178 245 200 191 187 138 201 216
a. Agrupar les dades en 10 intervals solapats d’igual amplitud .
b. Fes amb les dades de la taula anterior un histograma i un polígon de
freqüències absolutes.
c. Fes amb les dades de la taula anterior un histograma i un polígon de
freqüències acumulades.
d. A partir de la taula anterior, digues el percentatge d’homes amb una
xifra de colesterol compresa entre 198 i 233 mg/dl.
e. Construeix ara un gràfic de tiges i fulles apropiat i construeix a partir
d’ell la taula de freqüències.
38 Introducció a l’estadística
3. En la següent taula veiem les faltes d’assistència d’un grup d’alumnes d’un
institut en l’assignatura de Matemàtiques al llarg d’un curs escolar.
a. Agrupeu les dades en una taula de distribució de freqüències amb 7
intervals superposats d'igual amplitud.
b. Fes amb les dades de la taula anterior un histograma i un polígon de
freqüències absolutes.
c. Fes amb les dades de la taula anterior un histograma i un polígon de
freqüències acumulades.
d. Quin percentatge d’alumnes es troben entre 7 i 14 faltes d’assistència?
Calcula-ho a partir de les dades reals i a partir de la taula de l'apartat a.
e. Fes un gràfic de tiges i fulles apropiat.
f. Construeix la taula de freqüències apropiada amb intervals superposats
i d'igual amplitud aplicant la fórmula de Sturges.
g. A partir de la taula feta en l’apartat f calcula:
- el percentatge d’alumnes que es troben entre 7 i 14 faltes
d’assistència.
- el percentatge d’alumnes que tenen menys de 5 faltes d’assistència.
- el percentatge d’alumnes que tenen més de 18 faltes d’assistència.
4. Per a esbrinar la intenció de vot d’un poble sobre tres candidats A, B i C a
les pròximes eleccions, s’ha entrevistat a una mostra de 400 persones triades a
l’atzar d’aquest poble, amb els següents resultats: el 35,2% prefereixen A, el
28,8% prefereixen B, el 31,7 % prefereixen C i la resta no mostra preferència
per cap candidat o no vol fer l'entrevista.
a. Construeix la corresponent taula de freqüències.
b. Fes amb les dades de la taula anterior un diagrama de barres i un
diagrama de sectors.
5. En cert país la població activa està constituïda per 5 milions de persones, de
les quals un milió treballa en el sector primari, 1,75 milions en el sector
secundari, 1,5 milions en el sector serveis i la resta són parats.
a. Construeix la corresponent taula de freqüències.
b. Fes amb les dades de la taula anterior un diagrama de barres i un
diagrama de sectors.
4 10 13 2 19 6 21 8 11 1
12 5 18 10 3 15 9 2 16 4
14 8 16 11 7 18 10 3 12 17
Descripció, organització i representació de les dades 39
6. En un test realitzat a un grup d’alumnes universitaris s’han recollit les
següents puntuacions:
62,3 57,5 49 59,8 37,4 60,5 37,8 65,2 40,1 52,8
39,6 41,5 60,8 71,3 68,9 39 49,5 61,5 47,5 56,4
39 41,7 63,5 43,8 58,5 58,9 37 56,8 48,7 56
a. Construeix un gràfic de tiges i fulles apropiat i construeix a partir d’ell
la taula de freqüències.
b. Construeix la taula de freqüències apropiada amb intervals superposats
i d'igual amplitud aplicant la fórmula de Sturges.
7. En la següent taula es mostra la distribució de freqüències absolutes del
nombre d'empleats en 70 bars i restaurants d’una ciutat:
Nombre d’empleats [2,5) 12
[5,9) 36
[9,11) 12
[11,16) 10
a. Completa la taula de distribució de freqüències.
b. Dibuixa l’histograma de freqüències.
41
3 Estadística descriptiva d’una variable
En aquest tema veurem les mesures i els paràmetres que ens serveixen per a
descriure les principals característiques d’una variable estadística
unidimensional.
Primer estudiarem les mesures de posició central (mitjana, mediana i moda) i
les de posició no central (quartils, decils i percentils). Després estudiarem la
representativitat de les mesures de tendència central mitjançant les mesures de
dispersió (rang, recorregut interquartílic, variància, desviació típica i coeficient
de variació de Pearson).
També estudiarem l’anàlisi de la concentració o no del total dels valors de la
variable mitjançant un mètode numèric (índex de Gini) i gràficament (corba de
Lorenz).
Per últim, veurem el gràfic de caixa i bigots, el qual recull algunes de les
característiques principals d’una variable.
3.1 Mesures de posició central o de centralització
Les mesures de centralització són aquells paràmetres o estadístics que
tendeixen a situar-se en el centre del conjunt de dades ordenades respecte a la
seua magnitud.
3.1.1 Mitjana aritmètica
La mitjana aritmètica és defineix com la suma de totes les dades dividit pel
nombre de dades. La denotarem per .
La mitjana aritmètica ve donada amb la mateixa unitat de mesura que les dades
de la variable.
42 Introducció a l’estadística
Exemple
Calcula la mitjana aritmètica dels anys que tenen un grup de xiquets amb
aquestes edats:
5 7 8 2 5 3
* Si tenim moltes dades o venen agrupades mitjançant una taula de
freqüències, la fórmula de la mitjana quedaria de la següent forma:
on són els diferents valors d’una variable, són les freqüències absolutes
de cada valor de la variable i és la suma de les freqüències absolutes
(nombre total de dades).
Exemple
Calcula la mitjana aritmètica dels anys que tenen un grup de xiquets amb
aquestes edats:
5 7 7 5 4 6 2 6 6 5 4 3
* Si les dades vénen agrupades amb intervals, com no coneixem el valor real
de totes les dades, no serà possible calcular de forma exacta la mitjana, per la
qual cosa, aproximarem el càlcul de la mitjana canviant cada dada per la marca
de classe dels intervals i aplicant la fórmula anterior.
Exemple
Disposem de les següents dades sobre les alçades en centímetres dels
components d’un equip de bàsquet. Calcula l’alçada mitjana dels jugadors.
2 1 2
3 1 3
4 2 8
5 3 15
6 3 18
7 2 14
12 60
Intervals
Estadística descriptiva d’una variable 43
Propietats de la mitjana aritmètica
1) La suma de les desviacions respecte de la mitjana és zero.
La desviació d’una dada (o marca de classe), pel que fa a la mitjana, és
la distància que separa cada dada (o marca de classe) de la mitjana
aritmètica. Aquesta desviació pot ser positiva (a la dreta de la mitjana)
o negativa (a l’esquerra de la mitjana).
Exemple
Siga una variable que pren aquests valors:
La desviació d’aquestes dades respecte la mitjana és:
2) Si a tots els valors d’una distribució se li suma (resta) una constant la
mitjana aritmètica de la nova distribució és igual a la mitjana
aritmètica de la distribució inicial més (menys) la constant.
Exemple
Siga una variable que pren aquests valors:
3) Si tots els valors d’una distribució són multiplicats (dividits) per una
constant , la mitjana aritmètica de la nova distribució és igual a la
mitjana aritmètica de la distribució inicial multiplicada (dividida) per
.
Exemple
Siga una variable que pren aquests valors:
44 Introducció a l’estadística
Avantatges i inconvenients de la mitjana aritmètica
Els avantatges d’utilitzar la mitjana aritmètica són:
- És una mesura de centralització fàcil de calcular.
- La mitjana aritmètica és única.
- S’utilitzen tots els valors de la variable per a calcular-la.
Els inconvenients d’utilitzar la mitjana aritmètica són:
- Es veu molt influenciada quan la variable té valors extrems (grans o
xicotets), ja que per a calcular-la utilitzem tots els valors i per tant la
mitjana ens pot donar un valor poc representatiu del conjunt de dades.
- No es pot calcular quan la variable és qualitativa.
Exemple
Calcula la mitjana aritmètica d’aquestes dades:
2 3 3 3 3 4 24
La mitjana aritmètica és: , valor que no representa adequadament el
conjunt de dades.
3.1.2 Mediana
Si ordenem les dades de menor a major, la mediana és el valor que hi ha al mig
de les dades, és a dir, té tantes dades per sota com per a dalt d’ella. Si el
nombre de dades és parell, assignarem a la mediana la mitjana aritmètica dels
dos termes centrals. La denotarem per .
Exemple
Calcula la mediana de les següents dades:
1 2 4 5 6
1 2 4 5 6 7
* Si les dades vénen agrupades mitjançant una taula de freqüències, farem els
següents passos per a calcular-la:
- Calcularem la freqüència absoluta acumulada de les dades.
- Dividirem el nombre total de dades, , entre 2:
si el nombre de dades és imparell arredonirem el resultat de la
divisió a l’enter següent i buscarem a la taula la dada que
ocupa aquesta posició
si el nombre de dades és parell agafarem les dades que estan
en la posició del resultat de la divisió i la següent, fent a
continuació la seua mitjana aritmètica
Estadística descriptiva d’una variable 45
Exemple
Calcula la mediana dels anys que tenen un grup de xiquets amb aquestes edats:
Posició arredonim a l'enter
següent, .
Mirant la veiem que la posició està en la fila
on (en aquesta estan les posicions , i ).
Aleshores,
Posició , aleshores agafarem
les dades i , fent a continuació la seua mitjana.
Ajudant-nos de la veiem que la dada 6 i estan
en la fila on (en aquesta estan les posicions
, i ). Aleshores:
* Si les dades vénen agrupades amb intervals, com no coneixem el valor real
de totes les dades, no serà possible calcular de forma exacta la mediana, per la
qual cosa, aproximarem el càlcul de la mediana de la següent manera:
- Calcularem la freqüència absoluta acumulada dels intervals.
- Dividirem el nombre total de dades, , entre 2:
si qualsevol dels intervals té la freqüència absoluta acumulada
igual a , aleshores la mediana és el límit superior d’aquest
interval
si no passa el cas anterior, buscarem l’interval que conté
aquesta dada, anomenat classe mediana. Una aproximació de
la mediana seria la marca de classe d’aquest interval.
No obstant això, és possible donar un valor més aproximat
utilitzant la següent fórmula, la qual es pot obtindre fent us
d’una propietat de la semblança de triangles.
on,
és el límit inferior de la classe mediana
és el nombre de dades
és la freqüència absoluta acumulada de la classe anterior
a la mediana
és la freqüència absoluta de la classe mediana
és l’amplitud de la classe mediana
2 1 1
3 1 2
4 2 4
5 3 7
6 2 9
7 2 11
11
2 1 1
3 1 2
4 2 4
5 3 7
6 3 10
7 2 12
12
46 Introducció a l’estadística
Exemple
Disposem de les següents dades sobre les alçades en centímetres dels
components d’un equip de bàsquet. Calcula la mediana.
Posició , aleshores la mediana és
Exemple
Disposem de les següents dades sobre les alçades en centímetres dels
components d’un equip de bàsquet. Calcula la mediana.
Posició aleshores la classe mediana és
Avantatges i inconvenients de la mediana
Els avantatges d’utilitzar la mediana són:
- És una mesura de centralització fàcil de calcular.
- La mediana és única.
- Sols s’utilitzen els valors centrals de la variable per a calcular-la, per
la qual cosa no l’afecten els valors extrems d’una variable. Aleshores,
si les dades tenen valors extrems és preferible utilitzar la mediana com
a mesura de centralització en lloc de la mitjana aritmètica.
Els inconvenients d’utilitzar la mediana són:
- No s’utilitzen tots els valors de la variable per a calcular-la.
- No es pot calcular quan la variable és qualitativa.
Intervals Marca
classe
Intervals Marca
classe
Estadística descriptiva d’una variable 47
3.1.3 Moda
La moda és el valor o valors de la variable que més vegades es repeteixen, és a
dir, és el valor o valors de la variable que tenen major freqüència absoluta. La
denotarem per .
La moda pot tindre un sol element (unimodal), dos (bimodal), tres (trimodal),
.... fins i tot, tots els valors de la variable poden ser la moda.
Exemple
Calcula la moda dels anys que tenen dos grups de xiquets amb aquestes edats:
5 7 8 2 5 3
5 7 2 2 5 3
Exemple
Observem l’estat civil de 15 persones i obtenim els valors següents:
C S C C C D C S C C C C D S S
sent: C casat; S solter; D divorciat. Calcula la seua moda.
C (casat)
Exemple
Calcula la moda dels anys que tenen un grup de xiquets amb aquestes edats:
* Si les dades vénen agrupades amb intervals, com no coneixem el valor real
de totes les dades, no serà possible calcular de forma exacta la moda, per la
qual cosa, aproximarem el càlcul de la moda de la següent manera:
- Determinarem l’interval amb major freqüència absoluta (si tots els
intervals són d’igual amplitud) o major densitat (si tots els intervals no
tenen la mateixa amplitud). Aquest interval s’anomena classe modal.
- Una aproximació de la moda seria prendre la marca de classe de
l’interval modal.
No obstant això, és possible donar un valor més aproximat utilitzant la
següent fórmula, si tots els intervals tenen la mateixa amplitud:
2 3
3 3
4 3
5 3
6 3
7 3
48 Introducció a l’estadística
on,
és el límit inferior de la classe modal
és la freqüència absoluta de la classe anterior a la modal
és la freqüència absoluta de la classe posterior a la modal
és l’amplitud de la classe modal
Utilitzarem aquesta fórmula si els intervals no tenen tots la mateixa
amplitud:
on,
és el límit inferior de la classe modal
és la densitat de la classe anterior a la modal
és la densitat de la classe posterior a la modal
és l’amplitud de la classe modal
Exemple
Disposem de les següents dades sobre les alçades en centímetres dels
components d’un equip de bàsquet. Calcula la moda.
La classe modal és
Exemple
Disposem de les següents dades sobre les edats que tenen els convidats a una
boda. Calcula la moda.
La classe modal és
Intervals Marca
classe
Intervals Marca
classe
60
Estadística descriptiva d’una variable 49
Avantatges i inconvenients de la moda
Els avantatges d’utilitzar la moda són:
- És una mesura de centralització fàcil de calcular.
- És la única mesura de centralització que es pot calcular quan la
variable és qualitativa.
Els inconvenients d’utilitzar la moda són:
- No s’utilitzen tots els valors de la variable per a calcular-la.
- La moda pot no ser única.
3.2 Mesures de posició no central
3.2.1 Quartils
Ja hem vist que la mitjana, en les dades ordenades de menor a major, deixa a la
seua esquerra el 50% de les dades. Podem considerar també valors que
divideixen el conjunt de les dades en quatre parts iguals, és a dir, deixen a la
seua esquerra el 25%, el 50% i el 75% de les observacions. Aquests valors es
denominen quartils i es denoten com a , i respectivament. És clar que
= per definició.
Vegem com es calcula el .
Per a trobar el primer quartil, s’ordenen els valors de menor a major i a
continuació se cerca en aquesta sèrie ordenada el primer valor que supera el
lloc .
Exemple
Calcula el
1 3 7 8 9 15 17
Posició , aleshores busquem en la sèrie el valor que ocupa
el lloc 2, és a dir, .
Pot ocórrer que l’ordre de l’observació coincidisca exactament amb
(succeeix quan és múltiple de 4). En tal cas, el primer quartil s'obté prenent
aquesta observació i la següent, i calculant la seua mitjana aritmètica.
Exemple
Calcula el
1 3 7 8 9 9 10 12 13 13 14 15
Posició , aleshores busquem en la sèrie el valor que ocupa el
lloc 3 i 4 i fem la mitjana aritmètica dels dos, és a dir,
.
50 Introducció a l’estadística
Per a trobar , el procediment és anàleg però considerant en compte
de .
* Si les dades vénen agrupades mitjançant una taula de freqüències, farem els
següents passos per a calcular el :
- Calcularem la freqüència absoluta acumulada de les dades.
- Dividirem el nombre total de dades, , entre 4:
si el nombre de dades no és múltiple de 4 arredonirem el
resultat de la divisió a l’enter següent i buscarem a la taula la
dada que ocupa aquesta posició
si el nombre de dades és múltiple de 4 agafarem les dades que
estan en la posició del resultat de la divisió i la següent, fent a
continuació la seua mitjana aritmètica
Per a trobar , el procediment és anàleg però considerant en compte
de .
Exemple
Calcula el i dels anys que tenen un grup de xiquets amb aquestes edats:
Posició arredonim a l'enter
següent, .
Mirant la veiem que la posició està en la fila
on (en aquesta estan les posicions i ).
Aleshores,
Posició arredonim a l'enter següent, .
Mirant la veiem que la posició està en la fila on (en aquesta estan
les posicions i ).
Aleshores,
Exemple
Calcula el i dels anys que tenen un grup de xiquets amb aquestes edats:
Posició aleshores agafarem
les dades i i fem a continuació la mitjana.
Mirant la veiem que la posició i estan en la
Fila on (en aquesta estan les posicions i
). Aleshores,
2 1 1
3 1 2
4 2 4
5 3 7
6 2 9
7 2 11
11
2 1 1
3 1 2
4 2 4
5 3 7
6 3 10
7 2 12
12
Estadística descriptiva d’una variable 51
Posició aleshores agafarem les dades i , i fem a
continuació la mitjana.
Mirant la veiem que la posició està en la fila on (en aquesta estan
les posicions , i ).
Aleshores,
* Si les dades vénen agrupades amb intervals, com no coneixem el valor real
de totes les dades, no serà possible calcular de forma exacta el , per la qual
cosa, aproximarem el càlcul del de la següent manera:
- Calcularem la freqüència absoluta acumulada dels intervals.
- Dividirem el nombre total de dades, , entre 4:
si qualsevol dels intervals té la freqüència absoluta acumulada
igual a , aleshores el és el límit superior d’aquest
interval
si no passa el cas anterior, buscarem l’interval que conté
aquesta dada i aplicarem la següent fórmula, la qual és
semblant a la del càlcul de la mediana
on,
és el límit inferior de la classe on està el
és el nombre de dades
és la freqüència absoluta acumulada de la classe anterior
on està el
és la freqüència absoluta de la classe on està el
és l’amplitud de la classe on està el
Per a trobar , el procediment és anàleg però considerant en compte
de .
Aleshores la fórmula serà:
52 Introducció a l’estadística
Exemple
Disposem de les següents dades sobre les alçades en centímetres dels
components d’un equip de bàsquet. Calcula els quartils 1 i 3.
Posició , aleshores el és
Posició , aleshores el és
Exemple
Disposem de les següents dades sobre les alçades en centímetres dels
components d’un equip de bàsquet. Calcula els quartils 1 i 3.
Posició , aleshores la classe on està el és
Posició , aleshores la classe on està el és
Intervals Marca
classe
Intervals Marca
classe
Estadística descriptiva d’una variable 53
3.2.2 Percentils i decils
Fins ara ens hem interessat per obtenir aquells valors la posició dels quals
representava un percentatge molt concret de la mostra: 25, 50 i 75 per cent.
Però, generalitzant, podrem estar interessats a obtenir qualsevol posició dins
de les dades. Per a això establirem una fórmula general de càlcul per a obtenir
qualsevol posició relativa:
on,
és el percentatge a calcular
és el valor entre 1 i 100, equivalent al percentatge cercat
és el límit inferior de la classe on està el
és el nombre de dades
és la freqüència absoluta acumulada de la classe anterior on està el
és la freqüència absoluta de la classe on està el
és l’amplitud de la classe on està el
Mitjançant aquesta fórmula, ja utilitzada per a calcular la mediana i els
quartils, podrem obtenir qualsevol valor percentil o posició relativa dins de les
dades estudiades.
Depenent del percentatge que calculem, el valor obtingut rebrà la següent
denominació:
- Quartil: 25 (primer), 50 (segon) , 75 (tercer)
- Decil: 10 (primer) ,20 (segon),...90 (novè)
- Centil o percentil: 1, 2, 3, ...100
3.3 Mesures de dispersió
Les mesures de dispersió permeten calcular la representativitat d’una mesura
de tendència central. La seua finalitat és estudiar fins a quin punt, per a una
sèrie de valors, les mesures de centralització són representatives de tota la
informació de les dades. Mesurar la representativitat d’una mesura de posició
central equival a quantificar la separació de les dades respecte a aquesta
mesura.
S’anomena dispersió o variabilitat, a la major o menor separació dels valors
d’una distribució respecte d’un altre que pretén ser la seua síntesi. Aleshores,
per exemple, serà més representativa la mitjana aritmètica d’una variable quan
més agrupats estiguen els valors d’aquesta al voltant de la mitjana i al contrari,
serà menys representativa quan els valors estiguen més dispersos respecte la
mitjana.
A continuació veiem un exemple amb dos distribucions diferents que tenen la
mateixa mitjana aritmètica i on és pot veure clarament com la dispersió de les
dades respecte la mitjana és molt diferent.
54 Introducció a l’estadística
Exemple
S’ha analitzat la distribució del nombre de fills de 50 famílies pertanyents a
dues regions d'un mateix país obtenint-se els següents resultats:
Regió A Regió B
En les dues distribucions s’observa que la mitjana aritmètica de fills per
família és d’ fills; no obstant això, en la primera de les distribucions
s’observa que hi ha més valors de la variable al voltant de la mitjana que en la
segona. Això fa que puguem afirmar que la mitjana calculada és més
representativa a la regió A que a la regió B.
Aleshores, resulta necessari per a completar la informació que puga deduir-se
de les mesures de tendència central, acompanyar a aquestes mesures d’un o
diversos coeficients que mesuren el grau de dispersió de la distribució de la
variable.
Podem distingir dos tipus de mesures de dispersió, les absolutes i les relatives.
3.3.1 Mesures de dispersió absolutes
Com el nom indica, mesuren la dispersió en termes absoluts, presentant el
desavantatge que tenen unitats de mesura, cosa que en ocasions dificulta la
seua interpretació i la possibilitat de realitzar comparacions sobre la dispersió
de diferents distribucions.
Vegem a continuació quatre mesures de dispersió absolutes.
1) Rang o recorregut
És la diferència entre el màxim i el mínim valor que presenta una distribució.
Aleshores, un valor elevat del recorregut indicaria que la diferència entre el
major i el menor valor de la variable és alta, fet que podria portar a pensar que
també ho és la dispersió.
El principal inconvenient d'aquesta mesura és que com que no intervenen en
tots els valors de la distribució en el seu càlcul, pot conduir a conclusions
equivocades.
Estadística descriptiva d’una variable 55
Exemple:
Utilitzant l’exemple de les regions:
S’observa com el recorregut de les dues distribucions és el mateix; no obstant
això, com ja s'ha comentat, la distribució de la regió B és més dispersa que la
regió A.
2) Recorregut interquartílic
És la diferència entre el tercer quartil i el primer quartil d’una distribució.
Aquesta mesura ens ofereix l'amplitud de l’interval en el qual es troba el 50%
dels valors centrals de la distribució. Aleshores, un valor elevat indicaria que
el 50% dels valors centrals es troben en un interval ample, la qual cosa podria
portar a pensar en una elevada dispersió.
Aquesta mesura és menys sensible a valors extrems de la distribució.
Exemple:
Utilitzant l’exemple de les regions:
Regió A Regió B
Regió A
Calculem els quartils:
Aleshores el recorregut interquartílic és:
Regió B
Calculem els quartils:
Aleshores el recorregut interquartílic és:
S’observa com el recorregut interquartílic de la regió B és major que el de la
regió A, la qual cosa ens indica que les dades de la regió B estan més disperses
que les de la regió A.
56 Introducció a l’estadística
3) Variància
És la mitjana de la suma de les desviacions de les dades respecte a la mitjana
aritmètica al quadrat.
Com més concentrats estiguen els valors al voltant de la mitjana aritmètica,
més pròximes a zero estaran les desviacions i aleshores menor serà la
variància. Si, pel contrari, els valors estan molt dispersos respecte a la mitjana
aritmètica, els quadrats de les desviacions seran grans i aleshores la variància
també.
Nota: Hi ha una altra mesura de dispersió, similar a la variància, coneguda
com a quasi variància, la qual es calcula de la següent manera:
Exemple:
Calcula la variància i la quasi variància d’aquestes dades:
1 3 3 6 8 9
Primer calculem la mitjana aritmètica que es:
* Si les dades estan agrupades, podem desenvolupar l’anterior fórmula per a
poder fer els càlculs d’una manera més còmoda.
Estadística descriptiva d’una variable 57
Exemple:
Utilitzant l’exemple de les regions:
Regió A Regió B
S’observa com la variància de la regió B és major que la de la regió A, la qual
cosa ens indica que les dades de la regió B estan més disperses que les de la
regió A.
* Si les dades estan agrupades en intervals, utilitzarem la fórmula anterior
agafant com a variable la marca de classe de cada interval.
Exemple
Disposem de les següents dades sobre les alçades en centímetres dels
components d’un equip de bàsquet. Calcula la variància de l’alçada dels
jugadors.
La variància utilitza les unitats dels valors de la variable al quadrat, la qual
cosa fa que tinguem resultats incoherents com en els exemples que hem vist
(fills2 i cm
2). Per a evitar aquest problema desprès veurem una altra mesura
que ho soluciona, que és la desviació típica.
Intervals
58 Introducció a l’estadística
Propietats de la variància
1) La variància sempre es major o igual que zero, ja que no pot ser
negativa per ser una suma de quadrats.
2) Si a tots els valors d’una distribució se li suma (resta) una constant la
variància de la nova distribució no varia.
Exemple
Siga una variable que pren aquests valors:
3) Si tots els valors d’una distribució són multiplicats (dividits) per una
constant , la variància de la nova distribució és igual a la variància de
la distribució inicial multiplicada (dividida) per aquesta constant
elevada al quadrat.
Exemple
Siga una variable que pren aquests valors:
4) Desviació típica
És l’arrel quadrada positiva de la variància. La seua interpretació és similar a
la de la variància, amb la diferència que la desviació típica ve mesurada amb la
mateixa unitat que la variable.
Exemple:
Utilitzant l’exemple de les regions:
Estadística descriptiva d’una variable 59
Propietats de la desviació típica
1) La desviació típica sempre és major o igual que zero.
2) Si a tots els valors d’una distribució se li suma (resta) una constant la
desviació típica de la nova distribució no varia.
Exemple
Siga una variable que pren aquests valors:
3) Si tots els valors d’una distribució són multiplicats (dividits) per una
constant , la desviació típica de la nova distribució és igual a la
desviació típica de la distribució inicial multiplicada (dividida) per
aquesta constant .
Exemple
Siga una variable que pren aquests valors:
3.3.2 Mesures de dispersió relatives
Es caracteritzen perquè no vénen expressades en unitats, presentant l'avantatge
respecte a les mesures de dispersió absolutes que permeten establir
comparacions entre distribucions heterogènies.
Vegem a continuació tres mesures de dispersió relatives.
1) Coeficient d’obertura
És el quocient entre els valors extrems de la variable.
Representa el nombre de vegades que el valor màxim és major que el valor
mínim. Com més gran siga aquest valor més dispersió relativa tenen les dades.
60 Introducció a l’estadística
El principal inconvenient d'aquesta mesura és que, com que no intervenen tots
els valors de la distribució en el seu càlcul, pot conduir a conclusions
equivocades.
Exemple
Calcula el coeficient d’obertura dels anys que tenen dos grups de xiquets amb
aquestes edats:
5 7 8 2 5 3
És a dir, el xiquet major té 4 vegades els anys que té el menut.
5 7 2 2 5 3
És a dir, el xiquet major té 3,5 vegades els anys que té el menut.
2) Rang o recorregut relatiu
És el quocient entre el rang i la mitjana aritmètica.
Representa el nombre de vegades que el recorregut conté a la mitjana
aritmètica. Com més gran siga aquest valor, més dispersió relativa tenen les
dades.
El principal inconvenient d'aquesta mesura és que, com que no intervenen tots
els valors de la distribució en el seu càlcul (en el càlcul del rang), pot conduir a
conclusions equivocades.
Exemple
Calcula el recorregut relatiu dels anys que tenen dos grups de xiquets amb
aquestes edats:
5 7 8 2 5 3
És a dir, el recorregut conté 1,2 vegades la mitjana aritmètica dels anys.
5 7 2 2 5 3
És a dir, el recorregut conté 1,2 vegades la mitjana aritmètica dels anys.
Estadística descriptiva d’una variable 61
3) Coeficient de variació de Pearson
És el quocient entre la desviació típica i la mitjana aritmètica.
Quan comparem dues distribucions, les seues dispersions es poden comparar
mitjançant la desviació típica si les seues mitjanes aritmètiques són iguals. Si
no és així, utilitzarem el coeficient de variació de Pearson.
El coeficient de variació de Pearson representa el nombre de vegades que la
desviació típica conté la mitjana aritmètica; aleshores com més gran siga el
coeficient de variació de Pearson més vegades la desviació típica contindrà la
mitjana aritmètica, és a dir, menor representativitat tindrà la mitjana aritmètica
i major dispersió relativa tindran les dades.
Aquest coeficient també es pot expressar en percentatges:
Com per al càlcul de la mitjana aritmètica i de la desviació típica utilitzem tots
els valors de la distribució, el coeficient de variació de Pearson és més fiable
que els altres dos coeficients definits anteriorment.
Quan la mitjana aritmètica d’una distribució siga 0, no podrem utilitzar el
coeficient de variació de Pearson, ja que aquest tendirà a infinit.
Exemple
Calcula el coeficient de variació de Pearson dels anys que tenen dos grups de
xiquets amb aquestes edats:
5 7 8 2 5 3
És a dir, el coeficient de variació de Pearson conté 0,4163 vegades la mitjana
aritmètica dels anys.
5 7 2 2 5 3
És a dir, el coeficient de variació de Pearson conté 0,4563 vegades la mitjana
aritmètica dels anys.
Segons aquests valors té menor dispersió relativa el primer grup i la seua
mitjana aritmètica és més representativa.
A continuació, veurem un exemple on compararem dos distribucions on les
seues dades vénen donades en unitats diferents.
62 Introducció a l’estadística
Exemple
Una empresa vol esbrinar si té major variabilitat el rendiment mitjà dels
treballadors o els seus ingressos. Sabem que el rendiment dels treballadors (en
una escala arbitraria) és de 80 punts de mitjana i de 20 punts de desviació
típica. També sabem que els ingressos són de 12.000 euros a l’any de mitjana i
de 2.400 euros de desviació típica.
Calculem el coeficient de variació de Pearson:
Això significa que té major variabilitat el rendiment que els ingressos.
3.4 Gràfic de caixa i bigots
Un gràfic o diagrama de caixa i bigots és una representació gràfica, basada en
els quartils, que ajuda a avaluar la forma de les distribucions. Aquest gràfic és
molt sensible per a detectar casos extrems, per tant, aquest gràfic indicarà quan
la distribució té valors extremadament grans o xicotets.
Una aproximació a la forma d’aquests gràfics és la següent:
○ ● ● x x ● ● ○
La caixa està formada entre el i el . Dins de la caixa es troben el 50% de
les dades de forma centralitzada.
Per a la construcció d’aquest gràfic necessitarem calcular una sèrie de valors
que descrivim a continuació:
Mediana (es troba sempre a l’interior de la caixa)
Primer quartil (marca la paret inferior de la caixa)
Tercer quartil (marca la paret superior de la caixa)
Recorregut interquartílic:
Factor d’escala:
Frontera interior inferior:
Frontera interior superior:
Estadística descriptiva d’una variable 63
Frontera exterior inferior:
Frontera exterior superior:
x Valors adjacents:
- Valor adjacent inferior: valor de les dades més pròxim a (frontera
interior inferior), sent major o igual que aquest.
- Valor adjacent superior: valor de les dades més pròxim a (frontera
interior superior), sent menor o igual que aquest.
○ ● Valors atípics: són aquells valors que cauen fora dels rangs de la
distribució.
- Valors atípics menors (●): són els valors de les dades que estan entre
(frontera interior inferior) i (frontera exterior inferior) o entre
(frontera interior superior) i (frontera exterior superior).
- Valors atípics majors (○): són els valors de les dades que estan per
davall de (frontera exterior inferior) o per damunt de (frontera
exterior superior).
Exemple:
Les següents dades recullen el nombre de dies que han faltat al treball en un
any 20 treballadors d’una empresa. Construeix el gràfic de caixa i bigots
d’aquestes dades.
0 0 12 22 23 24 24 25 25 25
25 26 26 27 28 38 38 40 49 68
Calculem primer els valors que ens fan falta:
Valor adjacent inferior: 12
Valor adjacent superior: 40
Valors atípics: 0, 0, 49 i 68
64 Introducció a l’estadística
A continuació fem el gràfic:
(2)
● x x ● ○
0 10 20 30 40 50 60 70
3.5 Mesures de concentració
Les mesures de concentració d’una distribució de freqüències tracten de posar
en relleu el major o menor grau d’igualtat en el repartiment del total dels
valors de la variable. Són, per tant, indicadors del grau de equidistribució de la
variable.
Es denomina concentració la major o menor equitat en el repartiment de la
suma total de la variable considerada.
Per a mesurar el nivell de concentració en la distribució d’una variable
utilitzarem dues eines: una de gràfica (corba de Lorenz) i una altra d’analítica
(índex de Gini).
3.5.1 Índex de Gini
Per a calcular aquest índex, ens ajudarem d’una taula en la qual construirem
els valors que ens fan falta per a aplicar la fórmula de l'índex de Gini.
Columna amb els valors de la variable
Freqüència absoluta
Freqüència absoluta acumulada
Freqüència relativa acumulada
Producte que ens indicarà el total que correspon a cada interval
Columna que acumula els valors de la columna anterior
Columna anterior de forma percentual (o de tant per u)
Calcula la diferència entre les columnes i
Amb els resultats obtinguts en la taula, aplicarem la fórmula de l’índex de
Gini, que és la següent:
L’índex de Gini va de 0 a 1. Quan és 0 significa que hi ha igualtat de
repartiment i quan és 1 significa que està tot concentrat en un únic individu.
Estadística descriptiva d’una variable 65
Aleshores, això significa que quan ens done un valor pròxim a 0 direm que la
concentració és baixa i si ens dóna un valor pròxim a 1 direm que la
concentració és alta.
Exemple:
Suposem la següent estructura de salaris d’una empresa industrial. Estudiar el
nivell de concentració dels salaris.
( és el salari i és el nombre de treballadors que reben aquest salari)
Això vol dir que els salaris en aquesta empresa estan poc concentrats, o dit
d’una altra manera, ben repartits.
3.5.2 Corba de Lorenz
Per a dibuixar la corba de Lorenz gastarem la distribució utilitzada per a la
determinació de l'índex de Gini .
Els passos a seguir per a representar aquesta corba són:
- Representem els eixos cartesians
- Fem un quadrat els costats del qual estan dividits en una escala de l’1
al 100, de manera que en el vèrtex inferior esquerre està l’origen de
coordenades
- En l’eix d’abscisses representem i en el d'ordenades
- Tracem una diagonal dins del quadrat
- Representem els punts ( ), els quals unirem mitjançant una línia
poligonal anomenada corba de Lorenz
9.750 7 7 0.14 68.250 68.250 0.08 0.06
12.500 15 22 0,44 187.500 255.750 0,31 0,13
17.000 20 42 0.84 340.000 595.700 0.72 0.12
25.000 6 48 0.96 150.000 745.750 0.90 0.06
40.000 2 50 1 80.000 825.750 1 -
50 825.750
66 Introducció a l’estadística
Exemple:
Amb les dades de l’exemple anterior i seguint els passos que hem dit farem el
següent gràfic:
La corba necessàriament haurà de situar-se per davall de la diagonal, ja que els
valors de la variable analitzada sempre han d’estar ordenats de menor a major.
Per la mateixa raó la corba haurà de ser sempre creixent.
La corba que indica l'existència de concentració mínima o equidistribució
( ) coincideix amb la diagonal, ja que en cadascun dels punts d'aquesta
diagonal es verifica que = .
Com més gran siga la concentració de la variable major serà la separació que
presenta la corba respecte de la diagonal.
3.6 Exercicis proposats
1. Una companyia de transport de viatgers disposa de 4 autocars de quaranta
places, 15 de cinquanta-quatre places i 5 de setanta-vuit places. El nombre
mitjà de serveis que fa al dia cada tipus d'autocar és 5, 12 i 8, respectivament.
Calcular el nombre mitjà de serveis que fa al dia aquesta companyia i el
nombre total de serveis.
2. El consum elèctric diari en una determinada ciutat té les següents dades:
suposa el 10% des de les dotze de la nit fins a les sis del matí; a les vuit aquest
valor augmenta fins al 20%; arriba al 60% a les dues de la vesprada i al 85% a
les vint hores.
a. A quina hora del dia el consum és màxim?
b. Quantes hores al dia faran falta per a obtenir un consum del 65%?
c. Seguint el criteri de consum diari, a quina hora s’establiria el migdia?
0
0,2
0,4
0,6
0,8
1
1,2
0 0,5 1 1,5
pi
Estadística descriptiva d’una variable 67
3. La distribució d’un xalet de 50 habitacions és:
Superfície
(m2)
Nombre
d’habitacions
[0-10) 4
[50-70) 2
[10-20) 5
[34-40) 6
[40-50) 7
[20-26) 12
[26-34) 14
Calcular:
a. La superfície aproximada del xalet.
b. La superfície mitjana.
c. La grandària més habitual de les habitacions.
d. Indicar a partir de quina mesura una habitació és més gran que la
meitat de les habitacions de menor superfície.
4. En el tiquet de la compra que ha fet un individu en un supermercat
apareixen els següents productes i preus:
Producte Unitats Preu per unitat
Sucre 5 1,56
Oli 10 1,15
Llet 15 0,64
Suc 6 0,75
Refresc 12 0,50
Vi 2 1,39
Quin és el preu superat per la meitat dels productes?
5. En una ciutat han de construir 80 pisos nous de diverses superfícies. En la
següent taula apareixen el nombre de pisos distribuïts segons la seua
superfície.
Superfície
(m2)
Nombre
de pisos
[50-60) 30
[60-80) 25
[80-90) 14
[90-110) 11
Calcular:
a. La superfície mitjana dels pisos.
b. La grandària més habitual dels pisos.
68 Introducció a l’estadística
c. Quina superfície té el pis que divideix en dos parts iguals el nombre de
pisos amb major i menor superfície?
d. Quina és la proporció de pisos que està compresa entre 75 i 85 metres
quadrats?
6. Una papereria ha emès durant l’últim mes 800 factures amb diversos
imports (en euros). En la següent taula apareix l’import i el nombre de factures
de l’empresa:
Import de
la factura
Nombre
de factures
[20-100) 40
[100-150) 240
[150-200) 320
[200-250) 140
[250-400) 60
Calcular:
a. L’import mitjà de la facturació del trimestre.
b. Fins a quin import estan la meitat de les factures?
c. És representatiu l’import mitjà de la facturació.
7. Les vendes de calçat d’una sabateria durant l’última setmana han sigut les
següents:
Talla de
sabata
Nombre de
parells venuts
38 7
40 10
41 14
43 8
45 4
52 1
a. Digues quina talla de calçat és la que es ven més.
b. Calcula la talla mitjana de les sabates venudes.
c. Quina és la talla, a partir de la qual, el 50% de les sabates està per
davall d’aquesta.
d. Entre quins valors, de forma centralitzada, es troba el 50% de les
sabates?
e. Calcula el recorregut interquartílic.
Estadística descriptiva d’una variable 69
8. En la següent taula apareixen les dades, en milions d’euros, sobre la relació
comercial exterior d’un país. Digues si és més estable en el temps la
importació o la exportació.
Any Importació Exportació
2009 101 63,7
2010 112,3 52,3
2011 117,5 70
2012 120 76,5
2013 116 61
9. Completa la següent taula per a l'estudi de la concentració d’una distribució
de freqüències i calcula l'índex de Gini. Comenta el resultat.
10. En les següents taules tenim les dades del nombre de crèdits concedits, en
desenes de milers d’euros, per dues entitats bancàries en l’exercici 2012.
Compara la concentració i l’estabilitat de les dues distribucions.
Valor del crèdit
Entitat A
(Nombre de crèdits)
Entitat B
(Nombre de crèdits)
[0-0,5) 3 10
[0,5-1) 4 12
[1-2) 6 8
[2-4) 58 30
[4-7) 78 12
[7-12) 90 15
[12-14) 20 5
[14-18) 6 4
[18-20) 4 16
11. En la següent taula apareixen les ajudes concedides per la Unió Europea a
diferents projectes en l’any 2012:
Import de
l’ajuda
Nombre
de projectes
[0-100) 10
[100-250) 15
[250-500) 20
[500-1000) 15
a. Calcula l’ajuda mitjana i digues si aquest valor és representatiu.
10 90 900 900 0,18
20 50
40 30
60 20
70 10 700 5.000 1
70 Introducció a l’estadística
b. Calcula l'ajuda màxima concedida al 60% dels projectes menys
afavorits en el repartiment.
c. Si s’augmenta posteriorment l’ajuda en 2.000 euros a cada projecte,
com afecta els apartats anteriors?
d. Si per a l’any següent les ajudes augmenten un 5% sobre el valor
inicial, mantenint-se el criteri de repartiment, quin serà ara l’ajuda
mitjana? Segueix sent representativa?
e. Per a les dades inicials, estudia la concentració.
12. Els salaris anuals, en desenes de milers d’euros, dels treballadors de dues
empreses del mateix sector productiu són els següents:
Salari anual
Empresa A
(Nombre de treballadors)
Empresa B
(Nombre de treballadors)
[1-2) 180 40
[2-3) 260 240
[3-4) 240 200
[4-6) 100 180
[6-10) 20 140
a. Compara la concentració dels salaris dels treballadors de les dues
empreses.
b. Si aquestes dues empreses es fusionaren, quina seria la concentració
dels salaris després de la fusió?
13. En una companyia d’assegurances, el valor de les pòlisses atribuïbles als
agents que figuren en plantilla es distribueix de la següent forma:
Valor de les pòlisses
(en milers d’euros)
Nombre
d’agents
[0-5) 10
[5-10) 12
[10-20) 60
[20-40) 90
[40-70) 18
[70-120) 10
a. Estudia la concentració de les dades.
b. Representa la corba de Lorenz.
Estadística descriptiva d’una variable 71
14. Els pesos dels xics i xiques de dos grups de batxillerat d’un institut
d’Alacant són els següents:
Xics
55 64 70 74 75 70 64 93 60 62 70 80
61 99 62 68 65 65 66 68 70 72 72 71
Xiques
60 45 46 50 47 55 49 52 50 46 50 52
52 48 52 63 53 54 54 54 53 55 57 44
56 56 56 53 60 65 67 61 68 55 64 60
a. Fes el gràfic de tija i fulles dels pesos dels xics, de les xiques i de tots
junts.
b. Fes el gràfic de caixa i bigots dels pesos dels xics, de les xiques i de
tots junts.
73
4 Introducció a la probabilitat. Càlcul de probabilitats
En aquest tema farem una introducció a la probabilitat, veient els conceptes
bàsics, per a després calcular probabilitats aplicant diversos teoremes.
Primer estudiarem què és un experiment aleatori i els tipus de successos que
poden ocórrer. Després veurem el concepte de probabilitat i calcularem les
probabilitats de diferents tipus de successos.
4.1 Experiments aleatoris
Tots els fenòmens naturals es desenvolupen segons dos tipus fonamentals
d’esquemes:
- Esquema determinista, en el qual cada vegada que es presenten un
conjunt de circumstàncies similars sempre es produirà el mateix
esdeveniment. Per exemple, en l’experiment de llançar una pedra al
buit observarem que, repetint l’experiment en les mateixes condicions,
la pedra sempre cau al buit amb la mateixa acceleració de la gravetat.
- Esquema estocàstic o aleatori, en el qual presentant-se un conjunt de
circumstàncies similars es poden produir esdeveniments diferents, sent
impossible prediir-los. Per exemple, en el llançament d’un dau
observarem que, repetint l’experiment en les mateixes condicions, no
sabrem mai a priori quin resultat eixirà.
La teoria de la probabilitat es desenvolupa justament per a l’estudi dels
experiments relacionats amb els fenòmens estocàstics i reben el nom
d’experiments aleatoris.
Un experiment aleatori serà qualsevol experiment realitzat sobre un fenomen
estocàstic. Tots els experiments aleatoris tenen les següents característiques:
- Si els repetim de manera indefinida i en igualtat de condicions, poden
presentar resultats diferents en cada experiment en particular.
- No puc fer la predicció del resultat de l’experiment abans de fer-lo.
- Es coneixen sense ambigüitats els possibles resultats de l’experiment.
74 Introducció a l’estadística
Anomenem espai mostral el conjunt de tots els possibles resultats d’un
experiment aleatori. El denotarem per .
Exemple:
En l’experiment de tirar un dau, l’espai mostral és:
En l’experiment de tirar una moneda, l’espai mostral és:
4.2 Successos
Anomenem succés qualsevol subconjunt de l’espai mostral, és a dir, qualsevol
esdeveniment que puga ocórrer en fer l’experiment.
Definim parts de l’espai mostral ( ) com el conjunt format pels
possibles subconjunts que es poden formar amb els elements de l’espai
mostral.
Exemple:
En l’experiment de tirar una moneda, l’espai mostral és:
Aleshores, per a aquest experiment hi ha possibles subconjunts.
4.2.1 Tipus de successos
- Succés elemental: és el format per un únic element de l’espai mostral.
- Succés compost: és el format per més d’un element de l’espai mostral.
- Succés impossible ( ): és el succés que no té cap element de l’espai mostral.
- Succés segur: és el format per tots els elements de l’espai mostral, és a dir, el
succés segur és .
- Direm que un succés ocorre quan el resultat de l’experiment és u dels
elements que formen , és a dir, conté el resultat.
- Dos successos i són diferents ( ) si es possible trobar un resultat
de l’experiment per al qual un dels successos ocorre i l’altre no.
- Dos successos i són iguals ( ) si sempre que ocorre un d’ells,
l’altre també ocorre.
- Succés contrari o complementari ( ): és el succés format per tots els
elements de l’espai mostral que no estan en .
Introducció a la probabilitat. Càlcul de probabilitats 75
Es compleixen les següents relacions:
El succés contrari del succés cert és el succés impossible
El succés contrari del succés impossible és el succés cert
El contrari del contrari d’un succés és
- Direm que dos successos i són incompatibles, mútuament excloents o
disjunts si no poden ocórrer els dos a la vegada, és a dir, no tenen cap element
en comú.
Si dos successos són complementaris són també incompatibles, però si dos
successos són incompatibles no tenen perquè ser complementaris.
- Direm que un succés està inclòs en un succés B ( ) si sempre que
ocorre també ocorre .
Donats els successos , i d’un espai mostral , es compleixen les
relacions següents:
, per a qualsevol succés
Si i , aleshores
Si aleshores
Si i aleshores
Exemple:
Considerem l’experiment aleatori que consisteix en el llançament de dos
monedes i considerem aquests successos:
= Traure almenys una cara
= Traure com a molt una creu
= Traure dos creus
= Traure menys de tres cares
= Traure exactament una cara
= Traure més de dos creus
Calcula l’espai mostral, digues quins elements de l’espai mostral formen els
successos anteriors i indica les relacions que verifiquen aquests successos.
76 Introducció a l’estadística
L’espai mostral és:
(succés compost)
(succés compost)
(succés elemental)
(succés segur)
(succés compost)
(succés impossible)
Algunes relacions que es verifiquen entre aquests successos són:
i són incompatibles i complementaris
i E són incompatibles però no complementaris
4.2.2 Operacions amb successos
Donats dos successos i definim les operacions següents:
- Unió ( ): és el succés format pels elements d’ o de o dels dos.
- Intersecció ( ): és el succés format pels elements que pertanyen a i
a la vegada.
- Diferència ( ): és el succés format pels elements d’ que no estan en .
Propietats:
Donats tres successos , i d’un espai mostral es compleix que:
1)
2)
3)
4)
5) Si , Si ,
6) Commutativa:
Introducció a la probabilitat. Càlcul de probabilitats 77
7) Associativa:
8) Distributiva:
9) Lleis de De Morgan:
Exemple:
Considerem l’experiment de llançar un dau i vegem els successos:
Traure un nombre parell =
Traure un nombre imparell =
Traure més de tres punts =
Traure tres o menys de tres punts =
Aleshores fem aquestes operacions:
Traure un nombre parell o més de tres punts
Traure un nombre parell i més de tres punts
Traure un nombre parell menys els de més de tres punts
Traure més de tres punts menys els nombres parells
Sistema complet de successos
Diem que els successos formen un sistema complet de
successos per un determinat experiment aleatori, si es compleix que:
a)
b) són incompatibles dos a dos, és a dir,
Exemple:
Considerem l’experiment de llançar un dau i vegem els successos:
Els successos , i formen un sistema complet de successos, ja que:
a)
b) , i són incompatibles dos a dos
78 Introducció a l’estadística
4.3 Probabilitat
4.3.1 Concepte de probabilitat
Al llarg de la història podem trobar dos definicions o interpretacions de la
probabilitat:
Definició freqüencialista Definim la probabilitat d’un succés com el valor a què tendeixen les
freqüències relatives d’aquest succés al repetir l’experiment infinites vegades
de manera idèntica.
Aquesta definició té l’inconvenient que per a calcular la probabilitat d’un
succés és necessari fer moltes proves amb l’objectiu d’obtenir
experimentalment el valor al qual s’aproximen les freqüències relatives del
succés que estem estudiant. D’altra banda, d’aquesta manera sempre tindrem
un valor aproximat, en lloc del valor exacte de la probabilitat.
Definició clàssica La primera definició que es coneix del concepte de probabilitat fou enunciada
per Pierre Simon Laplace. Aquesta definició diu el següent: la probabilitat
d’un succés és el quocient entre el nombre de casos favorables al succés i el
nombre de casos possibles, és a dir,
expressió coneguda com regla o llei de Laplace.
Els casos favorables són els elements que formen el succés i els casos
possibles són tots els resultats de l’experiment, és a dir, tots els elements de
l’espai mostral.
A l’hora d’aplicar aquesta definició hem de tindre en compte que els successos
elementals han de tenir tots la mateixa probabilitat (equiprobables).
Aquesta definició té dos inconvenients. El primer inconvenient és que sols es
pot aplicar quan el nombre total de casos és finit. El segon inconvenient és que
sols podem aplicar la regla de Laplace quan tots les successos elementals tenen
la mateixa probabilitat, cosa que no passa sempre.
Aquests inconvenients, en les dos definicions, portaren a buscar una nova
definició de probabilitat. Així, en 1933 el matemàtic rus Andrei Kolmogorov
va establir la següent definició axiomàtica de probabilitat:
S’anomena probabilitat una funció que associa a cada succés , de l’espai de
successos, un nombre real que anomenem probabilitat de i denotem per
, que compleix els axiomes següents:
1) La probabilitat d’un succés qualsevol de l’espai de successos és
positiva o nul·la, és a dir,
Introducció a la probabilitat. Càlcul de probabilitats 79
2) La probabilitat del succés segur és igual a la unitat, és a dir,
3) La probabilitat de la unió d’infinits successos incompatibles és igual a
la suma de les probabilitats de cadascú d’ells, és a dir,
Vegem algunes de les conseqüències més importants d’aquesta definició:
1. Si és una col·lecció finita de successos i ,
, aleshores:
Nota: en el cas de dos successos i incompatibles, serà:
2. Si i són dos successos compatibles es compleix que la unió de i
és igual a la suma de les probabilitats de cadascun d’ells, menys la
probabilitat de la intersecció de i , és a dir,
3. La probabilitat del succés contrari, , és igual a la unitat menys la
probabilitat del succés , és a dir,
Nota: com i són incompatibles:
4. La probabilitat d’un succés és menor o igual que la unitat, és a dir,
5. La probabilitat del succés impossible és igual a zero, és a dir,
6. Si és un succés que està contingut en un succés , aleshores la
probabilitat de serà menor o igual que la probabilitat de , és a dir,
7. Com
per tant:
80 Introducció a l’estadística
Exemple:
Considerem i dos successos que compleixen que:
i
Calcula: , i
Exemple:
Considerem i dos successos tals que i compleixen que:
i . Calcula:
ja que i són disjunts
Exemple:
Considerem i dos successos que compleixen que:
i
Calcula: , i
4.3.2 Probabilitat condicionada
Si i són dos successos associats a un mateix experiment aleatori, es
defineix la probabilitat condicionada del succés al succés (ho denotarem
per ) a la probabilitat que ocórrega el succés sabent que ha ocorregut
el succés i ho calcularem de la manera següent:
Per a qualsevol succés tal que , és una probabilitat que
compleix els axiomes de Kolmogorov, aleshores podem aplicar a la
probabilitat condicionada totes les propietats derivades d’aquesta definició
axiomàtica.
Introducció a la probabilitat. Càlcul de probabilitats 81
A partir de la fórmula anterior deduïm que:
o també,
Exemple:
Una borsa té 6 boles blanques numerades de l’1 al 6 i 5 boles negres
numerades de l’1 al 5.
a. Traiem una bola i resulta ser imparella, quina és la probabilitat que
siga negra?
Direm que el succés és ser la bola negra i el succés és ser la bola
imparella.
b. Traiem una bola i resulta ser negra, quina és la probabilitat que siga
imparella?
Direm que el succés és ser la bola negra i el succés és ser la bola
imparella.
Exemple:
Traiem dos cartes d’una baralla espanyola sense devolució. Calcula la
probabilitat de traure dos bastos.
Direm que el succés és ser la primera carta bastos i el succés és ser la
segona carta bastos.
4.3.3 Dependència i independència de successos
Dos successos i són independents quan la ocurrència de qualsevol d’ells
no influeix en la ocurrència de l’altre, és a dir, dos successos són independents
quan es compleix qualsevol d’aquestes relacions:
A partir de la definició de probabilitat condicionada i de la definició de
successos independents podem dir que es compleix que:
82 Introducció a l’estadística
Dos successos i són independents
Exemple:
Llancem a la vegada una moneda i un dau. Són independents els successos
traure cara i obtenir un 4?
Direm que el succés és obtenir cara i el succés és traure un quatre.
Aleshores, com direm que aquests successos són
independents.
Exemple:
Considerem i dos successos independents que compleixen que:
i . Calcula .
4.3.4 Probabilitat composta
Siguen n successos qualsevol d’un mateix experiment aleatori i
que compleixen que la probabilitat de la realització simultània dels n successos
no és nul·la ( ), aleshores es compleix que:
si són dependents.
Nota: Si són independents aleshores serà:
Exemple:
Traiem tres cartes d’una baralla espanyola sense devolució. Calcula la
probabilitat de traure tres bastos.
Direm que el succés és ser la primera carta bastos, el succés és ser la
segona carta bastos i el succés és ser la tercera carta bastos.
Introducció a la probabilitat. Càlcul de probabilitats 83
Exemple:
Calcula la probabilitat de traure tres cares en tres llançaments d’una moneda.
Direm que el succés és traure cara el primer llançament, el succés és
traure cara el segon llançament i el succés és traure cara el tercer
llançament.
Com els successos són independents tenim que:
4.3.5 Probabilitat total
Si els successos formen un sistema complet de successos per
un determinat experiment aleatori ( i ) i
, aleshores qualsevol que siga el succés tenim que:
Exemple:
Tenim dos urnes, una amb 2 boles blanques i 8 negres i l’altra amb 7 boles
blanques i 3 negres. Si triem una urna a l’atzar i traiem d’aquesta urna una
bola, quina és la probabilitat que siga blanca?
Direm que el succés és triar la primera urna, el succés és triar la segona
urna i el succés és traure una bola blanca.
4.3.6 Teorema de Bayes
Si els successos formen un sistema complet de successos per
un determinat experiment aleatori ( i ) i
, aleshores qualsevol que siga el succés tenim que:
Exemple:
Tenim dos urnes, una amb 2 boles blanques i 8 negres i l’altra amb 7 boles
blanques i 3 negres. Si traiem una bola i resulta ser blanca, quina és la
probabilitat que siga de la primera urna?
Direm que el succés és triar la bola de la primera urna, el succés és triar
la bola de segona urna i el succés és traure una bola blanca.
84 Introducció a l’estadística
4.3.7 Càlcul de probabilitats utilitzant taules de dades i diagrames en arbre
Taula de dades
Exemple:
A partir de les dades d’una enquesta feta en la Comunitat Valenciana sobre les
condicions de vida de la població major de 30 anys, tenim la següent taula de
dades per estat de salut i estat civil:
Molt bo Bo Acceptable Roí Molt roí
Casat 6.910 17.329 7.380 3.618 904
Separat 2.928 10.326 4.928 2.296 505
Viudo 205 534 265 115 33
Solter 3.646 5.783 1.208 414 123
Primer calculem les marginals i el total per estat de salut i per estat civil.
Molt bo Bo Acceptable Roí Molt roí
Casat 6.910 17.329 7.380 3.618 904 36.141
Separat 2.928 10.326 4.928 2.296 505 21.019
Viudo 205 534 265 115 33 1.153
Solter 3.646 5.783 1.208 414 123 11.174
13.689 34.008 13.782 6.443 1.566 69.487
a. Calcula la probabilitat d’estar casat o haver-ho estat.
b. Calcula la probabilitat de tenir un estat de salut roí o molt roí.
c. Si una persona té una salut acceptable, quin estat civil té amb major
probabilitat?
Introducció a la probabilitat. Càlcul de probabilitats 85
Veient les respectives probabilitats direm que l’estat civil que té més
probabilitat és el de casat.
d. Que és més probable, estar casat i tenir bona salut o molt bona, o ser
solter i tenir una salut roïna o molt roïna?
Veien les respectives probabilitats direm que és més probable estar casat i
tenir bona o molt bon salut.
Diagrama en arbre Un diagrama d’arbre és una representació gràfica dels possibles resultats d’un
experiment aleatori, el qual consta d’una sèrie de passos, on cadascun dels
passos té un nombre finit de resultats possibles.
Per a la construcció d’un diagrama en arbre es partirà posant una branca per a
cadascuna de les possibilitats, acompanyada de la seua probabilitat. Cadascuna
d’aquestes branques es coneix com branca de primera generació. En el final de
cada branca de primera generació es constitueix, al seu torn, un nuc del qual
parteixen noves branques conegudes com a branques de segona generació,
segons les possibilitats del següent pas, excepte si el nuc representa un
possible final de l’experiment (nuc final). Cal tenir en compte que la suma de
probabilitats de les branques de cada nuc ha de donar 1.
Existeix un principi senzill dels diagrames d’arbre que fa que aquests siguen
molt més útils per als càlculs ràpids de probabilitat: multipliquem les
probabilitats si es tracta de branques adjacents (contigües) o bé les anem
sumant si es tracta de branques separades que emergeixen d’un mateix punt.
86 Introducció a l’estadística
Exemple:
El 70% dels habitants d’una població són homes i el 30% són dones. El 20%
dels homes fuma i el 40% de les dones també.
a. Representa en un diagrama en arbre les dades de l’enunciat
b. Quin percentatge dels habitants són dones fumadores?
c. Quin percentatge d’habitants fuma?
d. Si triem una persona a l’atzar i és fumadora, quina probabilitat hi ha
que siga dona?
Exemple:
Tenim dos urnes, una amb 2 boles blanques i 8 negres i l’altra amb 7 boles
blanques i 3 negres. Si traiem una bola i resulta ser blanca, quina és la
probabilitat que siga de la primera urna?
Introducció a la probabilitat. Càlcul de probabilitats 87
4.4 Exercicis proposats
1. Considerem l’experiment aleatori consistent a girar una fitxa de les 28 del
dòmino, que es troben cap avall sobre la taula, i llegir el nombre de punts que
resulten. Denotem per el succés que consisteix en haver-hi aconseguit punts. Descriu els següents successos:
a. L’espai mostral.
b.
c.
d.
e. Traure almenys 10 punts
f. Traure un múltiple de 6
g.
h.
i.
j.
k.
2. Prenem un dau i pintem les cares de la següent manera: 1 de groc; 2 i 3 de
verd; 4, 5 i 6 de roig. En llançar el dau, ens fixarem exclusivament en el color.
a. Quin és l'espai mostral?
b. Escriu tots els possibles successos ( ).
c. Quin és el succés contrari de traure el color roig?
d. Indica tots els successos que es verifiquen quan en tirar el dau ix verd.
88 Introducció a l’estadística
3. Es tiren dos monedes a l’aire. Descriu els següents successos:
a. L’espai mostral.
b. Traure almenys una cara
c. Traure dos cares
d. Traure més de dos cares
e. No traure cap cara
f. No traure cap creu
g. Descriu totes les relacions que trobes amb aquests successos.
4. Considerem el cas de llançar una moneda i un dau i anotar tots dos resultats.
Descriu els següents successos:
a. L’espai mostral.
b. Traure una cara i un nombre parell
c. Traure un nombre primer
d. Traure una creu i un nombre imparell
e. Ocorre el succés o .
f. Ocorre el succés i C.
g. Ocorre sols el succés .
h. No ocorre el succés .
i. Quins dels successos , i C són disjunts o mútuament excloents?
5. Un grup de 5 aspirants a dos ocupacions idèntiques està format per tres
homes i , i dos dones i . El cap de personal ha de seleccionar
dos dels cinc aspirants. Siga el conjunt de tots els resultats possibles de la
selecció del cap de personal. Descriu els següents successos:
a. L’espai mostral.
b. el succés que es verifica quan la selecció correspon a dos homes
c. el succés que es verifica quan en la selecció hi ha almenys una
dona
d. , , i
Introducció a la probabilitat. Càlcul de probabilitats 89
6. Considerem i dos successos que compleixen que i
i es verifica que . Raona la veracitat o falsedat d’aquesta
afirmació.
7. Considerem i dos successos que compleixen que ,
i
. Calculeu:
a.
b.
c.
d.
8. Considerem i dos successos que compleixen que ,
i
. Calculeu:
a.
b.
c.
d.
e.
9. Considerem i dos successos que compleixen que ,
i . Calculeu:
a.
b.
c.
d.
e.
f.
g.
h.
90 Introducció a l’estadística
10. Considerem i dos successos que compleixen que ,
. Calculeu en les situacions següents:
a. Si i són incompatibles.
b. Si sempre que ocorre també ocorre .
c. Si i són independents.
d. Si i són dependents i
11. El 30% dels treballadors d’una empresa estan capacitats per a fer una faena
A, i el 6% d’aquests estan capacitats també per a fer una altra faena B.
a. Calcula la probabilitat que un treballador triat a l’atzar estiga capacitat
per a fer les dos faenes.
b. Calcula la probabilitat que un treballador triat a l’atzar no estiga
capacitat per a fer una de les dos faenes.
c. Calcula la probabilitat que un treballador triat a l’atzar estiga capacitat
per a fer la faena A i no la B.
d. Calcula la probabilitat que un treballador triat a l’atzar no estiga
capacitat per a fer la faena B sabent que si que està capacitat per a fer
la faena A.
12. En un grup d’alumnes de GAP el 30% aprova l’assignatura Introducció a
l’Estadística i el 40% l’assignatura Estadística Aplicada a l’Administració
Pública. La probabilitat d’aprovar Introducció a l’Estadística havent aprovat
Estadística Aplicada a l’Administració Pública és del 50%.
a. Calcula la probabilitat d’aprovar les dos assignatures.
b. Calcula la probabilitat de suspendre les dos assignatures.
c. Calcula el percentatge d’alumnes que, havent aprovat Introducció a
l’Estadística, aprova també Estadística Aplicada a l’Administració
Pública.
d. Calcula el percentatge d’alumnes que aprova almenys una de les
assignatures.
13. Una urna té 5 boles blanques, 4 roges i 3 negres. Una altra urna té 3 boles
blanques, 6 roges i 7 negres. Es tria a l’atzar una bola de cada urna.
a. Quina és la probabilitat que la bola de la segona urna siga roja sabent
que la de la primera ha sigut roja?
b. Quina és la probabilitat que les dos boles siguen del mateix color?
Introducció a la probabilitat. Càlcul de probabilitats 91
14. Una urna té 12 boles blanques i 8 boles roges. Traiem dos boles amb
devolució, és a dir, traiem una bola mirem el color i la tornem a posar a l’urna.
Calcula la probabilitat dels següents successos:
a. La primera bola que hem tret és blanca.
b. La segona bola que hem tret és blanca.
c. Les dos boles que hem tret són blanques.
Repeteix els anteriors apartats suposant que traiem les dos boles sense
devolució.
15. En el Rectorat de la Universitat d’Alacant s’han rebut 100 telefonades.
D’aquestes telefonades 20 les havien fet des de la Facultat de Ciències. Si ens
fixem en les tres primeres telefonades, calcula la probabilitat que:
a. Les tres telefonades vénen de la Facultat de Ciències.
b. La primera i la tercera vénen de la Facultat de Ciències però la segona
no.
c. Almenys una telefonada venia de la Facultat de Ciències.
16. Sabem que un alumne de GAP respon correctament a una pregunta d’un
examen amb una probabilitat de 0,9. Si agafem tres alumnes, calcula la
probabilitat que:
a. Els tres alumnes responen correctament.
b. El primer alumne respon correctament i els altres dos no.
c. Almenys un alumne respon correctament.
17. La taula següent mostra la relació entre la filiació política i els estudis d’un
grup de persones:
Sense
estudis
Estudis
primaris
Estudis
secundaris
Estudis
universitaris
Democratacristià 180 80 20 15
Socialdemòcrata 90 80 50 60
Independentista 30 40 30 40
Si seleccionem una persona a l’atzar, calcula:
a. La probabilitat que no tinga estudis secundaris i siga independent.
b. La probabilitat que si no té estudis, siga democratacristià.
c. La probabilitat de tindre estudis universitaris i no ser socialdemòcrata.
92 Introducció a l’estadística
d. Són independents els successos ser socialdemòcrata i tindre estudis
secundaris?
e. Que és més probable ser independentista i tindre estudis universitaris o
ser independentista sabent que té estudis secundaris?
18. La taula següent mostra l’edat dels treballadors d’una empresa i la
província on està situada la fàbrica:
Menys de 30
anys
Entre 30 i 40
anys
Entre 40 i 50
anys
Més de 50
anys
Alacant 24 10 62 22
València 62 42 48 8
Barcelona 32 50 24 12
Castelló 8 26 12 6
Calcula la probabilitat que:
a. Un treballador de més de 40 anys treballe en la fàbrica de Barcelona.
b. Si un treballador treballa a Barcelona, tinga menys de 50 anys.
c. Si un treballador té més de 30 anys, no treballe a Alacant.
d. Un treballador tinga entre 30 i 40 anys i treballe a Castelló.
e. Si un treballador té més de 40 anys, treballe a la Comunitat
Valenciana.
19. En un grup de primer de GAP el 60% dels alumnes que acudeixen a classe
de manera habitual en l’assignatura de Introducció a l’Estadística són xiques i
el 40% són xics. El 50% d’aquestes xiques i el 40% d’aquests xics aproven
l’assignatura a juny.
a. Si triem una alumne a l’atzar, quina és la probabilitat que aprove
l’assignatura a juny i siga xica?
b. Si triem una alumne a l’atzar, quina és la probabilitat que aprove
l’assignatura a juny?
c. Si triem un alumne a l’atzar i resulta que ha aprovat, quina és la
probabilitat que siga xica?
d. Si triem un alumne a l’atzar i resulta que ha suspès, quina és la
probabilitat que siga xic?
e. Són independents els successos aprovar l’assignatura a juny i ser xica?
Introducció a la probabilitat. Càlcul de probabilitats 93
20. En la facultat de Dret d’una universitat el 50% dels alumnes estudien Dret,
el 30% GAP i la resta Relacions laborals. El 80% dels alumnes de Dret, El
90% dels alumnes de GAP i el 70% dels alumnes de Relacions laborals
acaben la carrera. Si triem un alumne a l’atzar, quina és la probabilitat que:
a. Acabe la carrera.
b. Sabent que ha acabat la carrera, haja estudiat GAP.
c. Estudie Dret i no acabe la carrera.
d. Que no estudie Dret i no acabe la carrera.
e. Sabent que no ha acabat la carrera, no haja estudiat GAP.
21. Una empresa vol fer inversions que pretén rendibilitzar però sap que els
beneficis de la seua inversió depenen de la política econòmica del govern
(expansiva o recessiva). L’experiència d’anys anteriors diu que, en condicions
similars a les actuals, en un 40% de les ocasions el govern va optar per una
política expansiva i en un 60% per una política recessiva. També sabem que la
probabilitat d’obtenir beneficis en una política expansiva és de 0,7 i la
d’obtenir pèrdues en polítiques recessives és de 0,6.
a. Feta una determinada inversió, quina és la probabilitat que s'hagen
obtingut beneficis?
b. Si es fa una inversió i s’obtenen pèrdues, quina és la probabilitat que
s’haja adoptat per part del govern una política recessiva?
22. Una empresa produeix motors per a màquines de calçat, dels quals el 25%
resulten ser defectuosos, per la qual cosa, abans de traure’ls al mercat, els
sotmeten a un procés de control de qualitat, que dóna resultats erronis en un
10% dels casos, tant per als motors bons com per als defectuosos.
a. Si es trauen al mercat només aquells motors que superen
satisfactòriament el procés de control de qualitat, calculeu el
percentatge de motors defectuosos que ixen al mercat.
b. I si fóra necessari passar dues vegades pel mateix procés de control de
qualitat?
23. En una fàbrica es disposa de tres màquines A, B i C que fabriquen peces
mecàniques d’un tipus determinat. La màquina A fa el 25% de la producció, la
màquina B el 35% i la C el 40%. El 5% de les peces fabricades amb l’ajuda de
la màquina A són defectuoses, igual que ocorre amb el 4% i el 2% de les
fabricades per B i C, respectivament. Si seleccionem una peça a l’atzar i és
defectuosa.
a. Quina és la probabilitat que s’haja fabricat en la màquina A?
b. Quina és la probabilitat que s’haja fabricat amb la màquina A o B?
94 Introducció a l’estadística
c. Quina és la probabilitat que s’haja fabricat en alguna de les tres
màquines?
d. Quina és la probabilitat que s’haja fabricat amb la màquina A i B?
95
5 Distribucions de probabilitat discretes i contínues
En aquest capítol estudiarem què és una variable aleatòria discreta i què és una
variable aleatòria contínua. A continuació veurem què és una distribució de
variable discreta (estudiant la distribució binomial) i una distribució de
variable contínua (estudiant la distribució normal). Per últim, veurem com
aproximar una distribució de variable discreta mitjançant una distribució de
variable contínua.
5.1 Variable aleatòria
Anomenem variable aleatòria tota funció que associa a cada element de
l'espai mostral, , un nombre real.
Anomenem rang de la variable aleatòria el conjunt de valors que pot prendre
la variable.
Utilitzarem lletres majúscules , ... per a designar variables aleatòries, i les
respectives minúscules ( , ...) per a designar-ne valors concrets.
Una variable aleatòria discreta és aquella que només pot prendre valors
enters.
Exemple
El nombre de fills d’una família, la puntuació obtinguda en llançar un dau, el
nombre de cotxes que té una família...
Exemple 1
Considerem l’experiment aleatori de llançar una moneda a l’aire 2 vegades, el
seu espai mostral és = {(C C), (C X), (X C), (X X)}. Definim la variable
aleatòria com el nombre de cares observades en 2 llançaments.
(C C) 2
(C X) 1
(X C) 1
(X X) 0
Una variable aleatòria contínua és aquella que pot prendre tots els valors
possibles dins d’un cert interval de la recta real.
96 Introducció a l’estadística
Exemple
L'altura dels alumnes d'una classe, les hores de durada d'una pila...
5.2 Distribucions de probabilitat d’una variable aleatòria discreta
5.2.1 Funció de probabilitat
S’anomena funció de probabilitat d’una variable aleatòria discreta la
funció que associa a cada valor de la variable la seua probabilitat .
Propietats:
1.
2.
Exemple 1
En el llançament de dues monedes vist anteriorment, la variable aleatòria és
el nombre de cares observades en 2 llançaments. Calcula la funció de
probabilitat.
Exemple 2
Calcula la funció de probabilitat de les puntuacions obtingudes en llançar un
dau.
= {1, 2, 3, 4, 5, 6}
Distribucions de probabilitat discretes i continues 97
5.2.2 Funció de distribució
Anomenem funció de distribució de la variable aleatòria , que escriurem
, la funció que associa a cada valor de la variable aleatòria la probabilitat
acumulada fins a aquell valor:
Propietats:
1.
2.
3. és monòtona i no decreixent, és a dir, si
4.
Exemple 1
En el llançament de dues monedes vist anteriorment, la variable aleatòria és
el nombre de cares observades en 2 llançaments. Calcula la funció de
distribució.
Exemple 2
Calcula la funció de distribució de les puntuacions obtingudes en llançar un
dau.
98 Introducció a l’estadística
5.3 Esperança i variància d’una variable aleatòria discreta
L’esperança matemàtica o mitjana d’una variable aleatòria discreta és el valor
mitjà teòric, on la probabilitat de cada valor del rang pot ser interpretada com
la freqüència relativa del valor. Aleshores, l’esperança es defineix com la suma
dels productes entre els valors de la variable i les seues respectives
probabilitats.
Denotem l’esperança matemàtica pels símbols i .
Propietats:
1. L’esperança de la suma és igual a la suma de les esperances.
2. L’esperança d’una constant és igual a aquesta mateixa constant.
3. L’esperança d’una constant per una variable és igual a aquesta
constant per l'esperança d’aquesta variable.
Donada una variable aleatòria , denotem per o la seua variància,
que es defineix com l’esperança del quadrat de la variable menys la seua
esperança, és a dir:
Desenvolupant aquest quadrat, tenim:
Igual que fèiem en l’estadística descriptiva, podem definir la desviació típica
d’una variable aleatòria com l’arrel quadrada positiva de la variància:
Propietats:
1. La variància d’una constant és igual a zero.
Distribucions de probabilitat discretes i continues 99
2. La variància d’una variable més una constant és igual a la variància
d’aquesta variable.
3. La variància d’una constant per una variable és igual a aquesta
constant al quadrat per la variància d’aquesta variable.
Exemple 1
En el llançament de dues monedes vist anteriorment, la variable aleatòria és
el nombre de cares observades en 2 llançaments. Calcula l’esperança i la
variància.
Exemple 2
Calcula l’esperança i la variància de les puntuacions obtingudes en llançar un
dau.
5.4 Distribució binomial
Suposem un experiment aleatori que té les característiques següents:
1. L’experiment consta de proves idèntiques.
2. Cada prova de l’experiment solament té dos possibles resultats: el
succés E (èxit) i el succés contrari F (fracàs).
3. La probabilitat de tenir èxit en una prova és igual a , que és constant
de prova en prova. La probabilitat de fracàs és igual a .
100 Introducció a l’estadística
4. El resultat que obtenim en cada prova és independent dels resultats de
les proves fetes anteriorment.
Definim la variable aleatòria com el nombre d’èxits observats en les
proves. Aleshores, direm que segueix una distribució binomial de
paràmetres (nombre de proves que té l’experiment) i (probabilitat d’èxit).
Ho representarem de la manera següent:
La variable binomial és una variable aleatòria discreta, només pot prendre
valors enters (0, 1, 2, 3 ...).
5.4.1 Funció de probabilitat, funció de distribució, esperança i variància d’una distribució binomial
La funció de probabilitat de la distribució binomial és:
on és el nombre de proves, és el nombre d'èxits, és la probabilitat d'èxit,
és la probabilitat de fracàs, i el nombre combinatori es calcula així:
Nota: Càlcul del nombre combinatori.
on
Per exemple:
on
La funció de distribució de la distribució binomial és:
L’esperança, la variància i la desviació típica de la distribució binomial
són:
Distribucions de probabilitat discretes i continues 101
Exemple 1
En el llançament de dues monedes vist anteriorment, tenim que l’espai mostral
era = {(C C), (C X), (X C), (X X)}. Definíem la variable aleatòria com el
nombre de cares observades en 2 llançaments.
La seua funció de probabilitat era:
La seua funció de distribució era:
La seua esperança i variància eren:
Però si ens fixem en les característiques d’aquest experiment i de la variable
veurem que:
1. L'experiment consta de proves idèntiques.
2. Cadascuna de les proves té dos resultats possibles. Traure cara (èxit) o
traure creu (en aquest cas, fracàs).
3. La probabilitat de tenir èxit en una sola prova és igual a i es
manté constant de prova en prova. La probabilitat d’un fracàs és igual
a .
4. Les proves són independents.
està definida com el nombre d’èxits (nombres de cares, en aquest cas)
observats en les proves. Aleshores,
per la qual cosa podíem haver obtingut totes les funcions, l’esperança i la
variància utilitzant les fórmules corresponents. Vegem-ho:
102 Introducció a l’estadística
Exemple
Sabem que en la ciutat d’Alacant el 80% dels aficionats al futbol són de
l’Hèrcules. Si en un bar hi ha un grup de 4 amics aficionats al futbol:
a. Quina és la probabilitat que en el grup d’amics hi haja 2 aficionats a
l’Hèrcules?
Anomenem al nombre d’amics del grup aficionats a l’Hèrcules.
Tenim que: , la probabilitat d’èxit (ser aficionat a l’Hèrcules)
i la probabilitat de fracàs (no ser aficionat a l’Hèrcules) .
Aleshores diem que:
b. Quina és la probabilitat que en el grup d’amics hi haja com a màxim 2
aficionats a l’Hèrcules?
c. Quina és la probabilitat que en el grup d’amics hi haja més de 2
aficionats a l’Hèrcules?
Però podem fer aquest exercici més ràpid si fem el següent:
d. Calcula el nombre esperat d’aficionats a l’Hèrcules en el grup d’amics,
la seua variància i la desviació típica.
Distribucions de probabilitat discretes i continues 103
5.4.2 Taula de la distribució binomial
Per a certs valors, la distribució binomial es troba tabulada, per la qual cosa,
podem calcular de forma ràpida les probabilitats d’aquests.
Per a poder utilitzar la taula tenim que saber quan val (nombre de vegades
que es fa l’experiment), (probabilitat d’èxit) i (nombre d’èxits).
En la taula següent apareixen el valors de les probabilitats de tipus .
0,10 0,1,5 0,20 0,25 0,30 0,35 0,40 0,45 0,50
1 0 ,9000 ,8500 ,8000 ,7500 ,7000 ,6500 ,6000 ,5500 ,5000
1 1 1 1 1 1 1 1 1 1
2 0 ,8100 ,7225 ,6400 ,5625 ,4900 ,4225 ,3600 ,3025 ,2500
1 ,9900 ,9775 ,9600 ,9375 ,9100 ,8775 ,8400 ,7975 ,7500
2 1 1 1 1 1 1 1 1 1
3 0 ,7290 ,6141 ,5120 ,4219 ,3430 ,2746 ,2160 ,1664 ,1250
1 ,9720 ,9393 ,8960 ,8438 ,7840 ,7183 ,6480 ,5747 ,5000
2 ,9990 ,9966 ,9920 ,9844 ,9730 .9571 ,9360 ,9089 ,8750
3 1 1 1 1 1 1 1 1 1
4 0 ,6561 ,5220 ,4096 ,3164 ,2401 ,1785 ,1296 ,0915 ,0625
1 ,9477 ,8905 ,8192 ,7383 ,6517 ,5630 ,4752 ,3910 ,3125
2 ,9963 ,9880 ,9728 ,9492 ,9163 ,8735 ,8208 ,7585 ,6875
3 ,9999 ,9995 ,9984 ,9961 ,9919 ,9850 ,9744 ,9590 ,9375
4 1 1 1 1 1 1 1 1 1
5 0 ,5905 ,4437 ,3277 ,2373 ,1681 ,1160 ,0778 ,0503 ,0313
1 ,9185 ,8352 ,7373 ,6328 ,5282 ,4284 ,3370 ,2562 ,1875
2 ,9914 ,9734 ,9421 ,8965 ,8369 ,7648 ,6826 ,5931 ,5000
3 ,9995 ,9978 ,9933 ,9844 ,9692 ,9460 ,9130 ,8688 ,8125
4 1 ,9999 ,9997 ,9990 ,9976 ,9947 ,9898 ,9815 ,9688
5 1 1 1 1 1 1 1 1 1
6 0 ,5314 ,3771 ,2621 ,1780 ,1176 ,0754 ,0467 ,0277 ,0156
1 ,8857 ,7765 ,6554 ,5339 ,4202 ,3191 ,2333 ,1636 ,1094
2 ,9842 ,9527 ,9011 ,8306 ,7443 ,6471 ,5443 ,4415 ,3428
3 ,9987 ,9941 ,9830 ,9624 ,9295 ,8826 .8208 ,7447 ,6562
4 ,9999 ,9996 ,9984 ,9954 ,9891 ,9777 ,9590 ,9308 ,8906
5 1 1 ,9999 ,9998 ,9993 ,9982 ,9959 ,9917 ,9844
6 1 1 1 1 1 1 1 1 1
7 0 ,4783 ,3206 ,2097 ,1335 ,0824 ,0490 ,0280 ,0152 ,0078
1 ,8503 ,7166 ,5767 ,4449 ,3294 ,2338 ,1586 ,1024 ,0625
2 ,9743 ,9262 ,8520 ,7564 ,6471 ,5323 ,4199 ,3164 ,2266
3 ,9973 ,9879 ,9667 ,9294 ,8740 ,8002 ,7102 ,6083 ,5000
4 ,9998 ,9988 ,9953 ,9871 ,9712 ,9444 ,9037 ,8471 ,7734
5 1 ,9999 ,9996 ,9987 ,9962 ,9910 ,9812 ,9643 ,9375
6 1 1 1 ,9999 ,9998 ,9994 ,9984 ,9963 ,9922
7 1 1 1 1 1 1 1 1 1
8 0 ,4305 ,2725 ,1678 ,1001 ,0577 ,0319 ,0168 ,0084 ,0039
1 ,8131 ,6572 ,5033 ,3671 ,2553 ,1691 ,1064 ,0632 ,0352
2 ,9619 ,8948 ,7969 ,6785 ,5518 ,4278 ,3154 ,2201 ,1445
3 ,9950 ,9786 ,9437 ,8862 ,8059 ,7064 ,5941 ,4770 ,3633
4 ,9996 ,9971 ,9896 ,9727 ,9420 ,8939 ,8263 ,7396 ,6367
5 1 ,9998 ,9988 ,9958 ,9887 ,9747 ,9502 ,9115 ,8555
6 1 1 ,9999 ,9996 ,9987 ,9964 ,9915 ,9819 ,9648
7 1 1 1 1 ,9999 ,9998 ,9993 ,9983 .9961
8 1 1 1 1 1 1 1 1 1
104 Introducció a l’estadística
0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50
9 0 ,3874 ,2361 ,1342 ,0751 ,0404 ,0207 ,0101 ,0046 ,0020
1 ,7748 ,5995 ,4362 ,3003 ,1960 ,1211 ,0705 ,0385 ,0195
2 ,9470 ,8591 ,7382 ,6007 ,4628 ,3373 ,2318 ,1495 ,0898
3 ,9917 ,9661 ,9144 ,8343 ,7297 ,6089 ,4826 ,3614 ,2539
4 ,9991 ,9944 ,9804 ,9511 ,9012 ,8283 ,7334 ,6214 ,5000
5 ,9999 ,9994 ,9969 ,9900 ,9747 ,9464 ,9006 ,8342 ,7461
6 1 1 ,9997 ,9987 ,9957 ,9888 ,9750 ,9502 ,9102
8 1 1 1 ,9999 ,9996 ,9986 ,9962 ,9909 ,9805
9 1 1 1 1 1 1 1 1 1
10 0 ,3487 ,1969 ,1074 ,0563 ,0283 ,0135 ,0060 ,0025 ,0010
1 ,7361 ,5443 ,3758 ,2440 ,1493 ,0860 ,0464 ,0233 ,0107
2 ,9298 ,8202 ,6778 ,5256 ,3828 ,2616 ,1673 ,0996 ,0547
3 ,9872 ,9500 ,8791 ,7759 ,6496 ,5138 ,3823 ,2660 ,1719
4 ,9984 ,9901 ,9672 ,9219 ,8497 ,7515 ,6331 ,5040 ,3770
5 ,9999 ,9986 ,9936 ,9803 ,9527 ,9051 ,8338 ,7384 ,6230
6 1 ,9999 ,9991 ,9965 ,9894 ,9740 ,9452 ,8980 ,8281
7 1 1 ,9999 ,9996 ,9984 ,9952 ,9877 ,9726 ,9453
8 1 1 1 1 ,9999 ,9995 ,9983 ,9955 ,9893
9 1 1 1 1 1 1 ,9999 .9997 ,9990
10 1 1 1 1 1 1 1 1 1
15 0 ,2059 ,0874 .0352 ,0134 ,0047 ,0016 ,0005 ,0001 ,0000
1 ,5490 ,3186 ,1671 ,0802 ,0353 ,0142 ,0052 ,0017 ,0005
2 ,8159 ,6042 ,3980 ,2361 ,1268 ,0617 ,0271 ,0107 ,0037
3 ,9444 ,8227 ,6482 ,4613 ,2969 ,1727 ,0905 ,0424 ,0176
4 ,9873 ,9383 ,8358 ,6865 ,5155 ,3519 ,2173 ,1204 ,0592
5 ,9978 ,9832 ,9389 ,8516 ,7216 ,5643 ,4032 ,2608 ,1509
6 ,9997 ,9964 ,9819 ,9434 ,8689 ,7548 ,6098 ,4522 ,3036
7 1 ,9994 ,9958 ,9827 ,9500 ,8868 ,7869 ,6535 ,5000
8 1 ,9999 ,9992 ,9958 ,9848 ,9578 ,9050 ,8182 ,6964
9 1 1 ,9999 ,9992 ,9963 ,9876 ,9662 ,9231 ,8491
10 1 1 1 ,9999 ,9993 ,9972 ,9907 ,9745 ,9408
11 1 1 1 1 ,9999 ,9995 ,9981 ,9937 ,9824
12 1 1 1 1 1 ,9999 ,9997 ,9989 ,9963
13 1 1 1 1 1 1 1 ,9999 ,9995
14 1 1 1 1 1 1 1 1 1
15 1 1 1 1 1 1 1 1 1
La distribució binomial no està tabulada per a valors de > 0,5, ja que si passa
això tan sols hem de canviar la probabilitat de l’èxit per la de fracàs i definir la
binomial contraria. Per exemple, tenim que en l’exemple anterior és el
nombre d’amics del grup aficionats a l’Hèrcules i , però no
podem utilitzar la taula, però si definim com el nombre d’amics del grup que
no són aficionats a l’Hèrcules, i aquesta distribució sí que està
en la taula.
Per a veure com s’utilitza la taula veiem el següent exemple:
Exemple
La probabilitat d’aprovar l’assignatura d’Introducció a l’Estadística en la
primera convocatòria és de 0,45. Si tenim un grup de 10 alumnes que cursen
aquesta assignatura per primera vegada, calcula la probabilitat que:
Distribucions de probabilitat discretes i continues 105
a. Tres o menys d’aquests alumnes aproven l’assignatura en la primera
convocatòria.
Definim com el nombre d’alumnes d’aquest grup que aproven
l’assignatura en la primera convocatòria.
Per a calcular busquem en la primera columna igual a 10 i en
la segona igual a 3. Després busquem en la primera fila igual a 0,45 i
on es creuen aquesta fila i aquesta columna és el valor de la probabilitat
buscada.
0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50
10 0 ,3487 ,1969 ,1074 ,0563 ,0283 ,0135 ,0060 ,0025 ,0010
1 ,7361 ,5443 ,3758 ,2440 ,1493 ,0860 ,0464 ,0233 ,0107
2 ,9298 ,8202 ,6778 ,5256 ,3828 ,2616 ,1673 ,0996 ,0547
3 ,9872 ,9500 ,8791 ,7759 ,6496 ,5138 ,3823 ,2660 ,1719
4 ,9984 ,9901 ,9672 ,9219 ,8497 ,7515 ,6331 ,5040 ,3770
5 ,9999 ,9986 ,9936 ,9803 ,9527 ,9051 ,8338 ,7384 ,6230
6 1 ,9999 ,9991 ,9965 ,9894 ,9740 ,9452 ,8980 ,8281
7 1 1 ,9999 ,9996 ,9984 ,9952 ,9877 ,9726 ,9453
8 1 1 1 1 ,9999 ,9995 ,9983 ,9955 ,9893
9 1 1 1 1 1 1 ,9999 .9997 ,9990
10 1 1 1 1 1 1 1 1 1
Aleshores,
b. Menys de tres d’aquests alumnes aproven l’assignatura en la primera
convocatòria.
Hem de calcular , però aquest valor no està en la taula (recordem
que en la taula apareixen el valors de les probabilitats de tipus ). Com la distribució binomial és de variable discreta, menor que tres ( )
és el mateix que menor o igual que dos ( ). Aleshores:
c. Tres d’aquests alumnes aproven l’assignatura en la primera
convocatòria.
Hem de calcular , però aquest valor no està en la taula. Si que
tenim en la taula i , i si els restem tindrem .
d. Més de tres d’aquests alumnes aproven l’assignatura en la primera
convocatòria.
Hem de calcular , però aquest valor no està en la taula. Aleshores
farem el següent:
106 Introducció a l’estadística
e. Tres o més d’aquests alumnes aproven l’assignatura en la primera
convocatòria.
Hem de calcular , però aquest valor no està en la taula. Aleshores
farem el següent:
f. Més de tres però menys de cinc d’aquests alumnes aproven
l’assignatura en la primera convocatòria.
Hem de calcular , però aquest valor no està en la taula.
Aleshores farem el següent:
De manera semblant podem calcular:
g. Més de set d’aquests alumnes suspenguen l’assignatura en la primera
convocatòria.
Ara ens demanen la probabilitat de suspendre i no la d’aprovar, per tant
definim una nova variable com el nombre d’alumnes d’aquest grup que
suspenen l’assignatura en la primera convocatòria.
Hem de calcular , però aquesta distribució no està en la taula,
aleshores, si no és que volem fer l’exercici aplicant la definició de la
funció de probabilitat de la distribució binomial, canviarem la pregunta
enunciant-la com a nombre d’alumnes que aproven, és a dir, és el mateix
dir que en suspenen més de set alumnes que dir que en aproven dos o
menys. Vegem-ho:
Distribucions de probabilitat discretes i continues 107
Exemple proposat
Sabem que en una determinada població la probabilitat de tindre un fill de sexe
masculí (xiquet) és 0,45. Si una família té 6 fills,
a. Quina és la probabilitat que la família tinga dos xiquets?
b. Quina és la probabilitat que la família tinga menys de quatre xiquets?
c. Quina és la probabilitat que la família tinga més de dos xiquets?
d. Quina és la probabilitat que la família tinga més de tres xiquetes?
e. Quina és la probabilitat que la família tinga tres xiquetes o menys?
f. Calcula l’esperança, la variància i la desviació típica del nombre de
xiquets.
Resol aquest exemple, primer sense utilitzar la taula de la distribució binomial
i després utilitzant-la.
5.5 Distribucions de probabilitat d’una variable aleatòria contínua
Quan la variable és contínua no té sentit fer una suma de les probabilitats de
cadascun dels termes com en la variable discreta, ja que el conjunt de valors
que pot prendre la variable no és numerable. En aquest cas el que generalitza
de manera natural el concepte de la suma és el d'integral.
D’altra banda per a variables aleatòries contínues no té interès parlar de
, perquè aquesta probabilitat val sempre zero, ja que, com hem dit
abans, la variable pot prendre un nombre infinit de valors i aleshores per a un
valor en concret la probabilitat és zero.
D’aquesta manera és necessari introduir un nou concepte que substituïsca en
variables aleatòries contínues el de funció de probabilitat d’una variable
discreta. Aquest concepte és el de funció de densitat d’una variable aleatòria
contínua, que es defineix com una funció integrable, que verifica
les dues propietats següents:
1.
2.
i que a més verifica que:
donat , tenim que
, és a dir, que la
probabilitat d’un interval és l’àrea que existeix entre la funció i l’eix
d’abscisses.
108 Introducció a l’estadística
Podem calcular també, de forma anàloga, la funció de distribució, l’esperança i
la variància d’una variable aleatòria contínua, però aquests càlculs excedeixen
el contingut d’aquesta assignatura.
5.6 Distribució normal
Una variable aleatòria contínua segueix una distribució normal de mitjana
i desviació típica , és a dir, si la seua funció de densitat és:
5.6.1 Representació i característiques
La representació de la corba és:
Algunes característiques d’aquesta corba són:
- Camp d’existència: és tota la recta real, és a dir,
- Simetries: és simètrica respecte a la mitjana
- Punts de tall amb els eixos:
Amb l’eix OX no té punts de tall
Amb l’eix OY, per a
- Creixement i decreixement: creix fins la mitjana i decreix a partir
d’aquesta
- Màxims i mínims: té un màxim en i no té mínim
Distribucions de probabilitat discretes i continues 109
- Punts d’inflexió: té dos punts d’inflexió en i en
- Asímptotes: l’eix OX és una asímptota horitzontal de la corba
- L’àrea del recinte determinat per la funció i l’'eix d’abscisses és igual
a la unitat
- Com és simètrica respecte a l’eix que passa per , deixa un àrea
igual a 0,5 a l’esquerra i una altra igual a 0,5 a la dreta
- La probabilitat equival a l’àrea tancada sota la corba
5.6.2 Distribució normal estàndard
La distribució normal estàndard o tipificada és la que té per mitjana el valor
zero ( ) i per desviació típica la unitat ( ), és a dir, .
La seua funció de densitat és:
La funció de distribució per a la distribució està tabulada per a facilitar
el càlcul i ens proporciona per a cada valor de el valor de la integral des de
a , és a dir, l’àrea sota la corba des de a .
5.6.3 Tipificació de la variable
Per a poder utilitzar la taula de la distribució normal estàndard hem de
transformar la variable que segueix una distribució en una altra
variable que seguisca una distribució i açò ho farem amb el següent
canvi de variable
La variable s’anomena variable aleatòria tipificada de la variable . Aquesta
nova variable sempre té mitjana 0 i desviació típica 1. Vegem-ho:
110 Introducció a l’estadística
5.6.4 Taula de la corba N(0, 1)
La taula ens dóna les probabilitats de , sent la variable tipificada.
La distribució es troba tabulada per a valors a partir de 0 i fins 3,99.
K 0 1 2 3 4 5 6 7 8 9
0,0 ,5000 ,5040 ,5080 ,5120 ,5160 ,5199 ,5239 ,5279 ,5319 ,5359
0,1 ,5398 ,5438 ,5478 ,5517 ,5557 ,5596 ,5636 ,5675 ,5714 ,5754
0,2 ,5793 ,5832 ,5871 ,5910 ,5948 ,5987 ,6026 ,6005 ,6103 ,6141
0,3 ,6179 ,6217 ,6255 ,6293 ,6331 ,6368 ,6406 ,6443 ,6480 ,6517
0,4 ,6554 ,6591 ,6628 ,6664 ,6700 ,6736 ,6772 ,6808 ,6844 ,6879
0,5 ,6915 ,6950 ,6985 ,7019 ,7054 ,7088 ,7123 ,7157 ,7190 ,7224
0,6 ,7258 ,7291 ,7324 ,7357 ,7389 ,7422 ,7454 ,7486 ,7518 ,7549
0,7 ,7580 ,7612 ,7642 ,7673 ,7704 ,7734 ,7764 ,7794 ,7823 ,7852
0,8 ,7881 ,7910 ,7939 ,7967 ,7996 ,8023 ,8051 ,8078 ,8106 ,8133
0,9 ,8159 ,8186 ,8212 ,8238 ,8264 ,8289 ,8315 ,8340 ,8365 ,8389
1,0 ,8413 ,8438 ,8461 ,8485 ,8508 ,8531 ,8554 ,8577 ,8599 ,8621
1,1 ,8643 ,8665 ,8686 ,8708 ,8729 ,8749 ,8770 ,8790 ,8810 ,8830
1,2 ,8849 ,8869 ,8888 ,8907 ,8925 ,8944 ,8962 ,8980 ,8097 ,9015
1,3 ,9032 ,9049 ,9066 ,9082 ,9099 ,9115 ,9131 ,9147 ,9162 ,9177
1,4 ,9192 ,9207 ,9222 ,9236 ,9251 ,9265 ,9279 ,9292 ,9306 ,9319
1,5 ,9332 ,9345 ,9357 ,9370 ,9382 ,9394 ,9406 ,9418 ,9429 9441
1,6 ,9452 ,9463 ,9474 ,9484 ,9495 ,9505 ,9515 ,9525 ,9535 ,9545
1,7 ,9554 ,9564 ,9573 ,9582 ,9591 ,9599 ,9608 ,9616 ,9625 ,9633
1,8 ,9641 ,9649 ,9656 ,9664 ,9671 ,9678 ,9686 ,9693 ,9699 ,9706
1,9 ,9713 ,9719 ,9726 ,9732 ,9738 ,9744 ,9750 ,9756 ,9761 9767
2,0 ,9772 ,9778 ,9783 ,9788 ,9793 ,9798 ,9803 ,9808 ,9812 ,9817
2,1 ,9821 ,9826 ,9830 ,9834 ,9838 ,9842 ,9846 ,9850 ,9854 ,9857
2,2 ,9861 ,9864 ,9868 ,9871 ,9875 ,9878 ,9881 ,9884 ,9887 ,9890
2,3 ,9893 ,9896 ,9898 ,9901 ,9904 ,9906 ,9909 ,9911 ,9913 ,9916
2,4 ,9918 ,9920 ,9922 ,9925 ,9927 ,9929 ,9931 ,9932 ,9934 ,9936
2,5 ,9938 ,9940 ,9941 ,9943 ,9945 ,9946 ,9948 ,9949 ,9951 ,9952
2,6 ,9953 ,9955 ,9956 ,9957 ,9959 ,9960 ,9961 ,9962 ,9963 ,9964
2,7 ,9965 ,9966 ,9967 ,9968 ,9969 ,9970 ,9971 ,9972 ,9973 ,9974
2,8 ,9974 ,9975 ,9976 ,9977 ,9977 ,9978 ,9979 ,9979 ,9980 ,9981
2,9 ,9981 ,9982 ,9982 ,9983 ,9984 ,9984 ,9985 ,9985 ,9986 ,9986
3,0 ,9987 ,9987 ,9987 ,9988 ,9988 ,9989 ,9989 ,9989 ,9990 ,9990
3,1 ,9990 ,9991 ,9991 ,9991 ,9992 ,9992 ,9992 ,9992 ,9993 ,9993
3,2 ,9993 ,9993 ,9994 ,9994 ,9994 ,9994 ,9994 ,9995 ,9995 ,9995
3,3 ,9995 ,9995 ,9995 ,9996 ,9996 ,9996 ,9996 ,9996 ,9996 ,9997
3,4 ,9997 ,9997 ,9997 ,9997 ,9997 ,9997 ,9997 ,9997 ,9997 ,9998
3,5 ,9998 ,9998 ,9998 ,9998 ,9998 ,9998 ,9998 ,9998 ,9998 ,9998
3,6 ,9998 ,9998 ,9999 ,9999 ,9999 ,9999 ,9999 ,9999 ,9999 ,9999
3,7 ,9999 ,9999 ,9999 ,9999 ,9999 ,9999 ,9999 ,9999 ,9999 ,9999
3,8 ,9999 ,9999 ,9999 ,9999 ,9999 ,9999 ,9999 ,9999 ,9999 ,9999
3,9 1 1 1 1 1 1 1 1 1 1
Distribucions de probabilitat discretes i continues 111
Si per exemple volem calcular , hem de fer els següents passos:
1. Buscar la part sencera i les dècimes en la primera columna (en aquest
cas ).
2. Buscar les centècimes en la primera fila (en aquest cas ).
3. En el punt comú a la fila i la columna que hem trobat, tenim la
probabilitat buscada, en aquest cas .
k 0 1 2 3 4 5 6 7 8 9
0,0 ,5000 ,5040 ,5080 ,5120 ,5160 ,5199 ,5239 ,5279 ,5319 ,5359
0,1 ,5398 ,5438 ,5478 ,5517 ,5557 ,5596 ,5636 ,5675 ,5714 ,5754
0,2 ,5793 ,5832 ,5871 ,5910 ,5948 ,5987 ,6026 ,6005 ,6103 ,6141
0,3 ,6179 ,6217 ,6255 ,6293 ,6331 ,6368 ,6406 ,6443 ,6480 ,6517
0,4 ,6554 ,6591 ,6628 ,6664 ,6700 ,6736 ,6772 ,6808 ,6844 ,6879
Aleshores
Si volem calcular una probabilitat d’un valor major que , hi ha prou fixar-
se en què les probabilitats corresponents a valors tals com i majors ja
valen (pràcticament ). Per això, per a aquests valors majors que
direm que la probabilitat és aproximadament 1.
Així: , encara que no aparega en la taula.
D’altra banda, fixem-nos en què en aquest tipus de distribucions no té sentit
plantejar-se probabilitats del tipus , ja que sempre valen , al no
tancar cap àrea. Per tant, si ens demanaren , diríem directament
que .
Així, en passar al complementari, si tenim , el seu complementari serà
, però com incloure no influeix en la probabilitat, per a calcular
probabilitats podem escriure:
Només es pot fer això en distribucions contínues, en el cas de la binomial no
es pot fer i cal ser acurats amb el pas al complementari.
Anem a veure alguns casos que ens podem trobar a l’hora de calcular una
probabilitat amb la taula:
1.
112 Introducció a l’estadística
2. (recordem que )
3.
Per simetria podem veure la igualtat de les dues figures
4.
Per simetria podem veure la igualtat de les duss figures
Distribucions de probabilitat discretes i continues 113
5.
Calculem les dos àrees de les imatges següents i les restem per a obtindre
l’àrea demanada.
6.
Exemple
Siga una variable aleatòria que segueix una distribució . Calcula les
probabilitats següents:
a.
però per a poder utilitzar la taula hem de tipificar la variable
, transformant-la amb la variable que es distribueix .
114 Introducció a l’estadística
b.
Tipifiquem la variable i busquem en la taula de la distribució .
c.
Tipifiquem la variable i busquem en la taula de la distribució .
Cas invers
● Fins ara ens han donat la distribució i ens demanaven , sent un cert nombre, i ens demanaven calcular aquesta probabilitat.
Ara bé, una altra pregunta pot ser: atès que en una normal sabem que
, qui és ?
La resolució és ben senzilla, n’hi ha prou a buscar dins de la taula de la
distribució normal, i ho trobem en l’encreuament de la fila amb la columna
6, i per tant ha de ser .
k 0 1 2 3 4 5 6 7 8 9
0,0 ,5000 ,5040 ,5080 ,5120 ,5160 ,5199 ,5239 ,5279 ,5319 ,5359
0,1 ,5398 ,5438 ,5478 ,5517 ,5557 ,5596 ,5636 ,5675 ,5714 ,5754
0,2 ,5793 ,5832 ,5871 ,5910 ,5948 ,5987 ,6026 ,6005 ,6103 ,6141
0,3 ,6179 ,6217 ,6255 ,6293 ,6331 ,6368 ,6406 ,6443 ,6480 ,6517
0,4 ,6554 ,6591 ,6628 ,6664 ,6700 ,6736 ,6772 ,6808 ,6844 ,6879
Exemple:
Calcula si:
a. , aleshores
b. , és a dir,
Aïllant en l’equació tenim que:
, aleshores
● En el cas que el valor a buscar no aparega directament dins de la taula de la
distribució normal, poden ocórrer dues possibilitats:
Distribucions de probabilitat discretes i continues 115
1. Si el valor es troba entre dos valors de la taula i a la mateixa distància
(aproximadament) de cadascun d’ells, per exemple:
, en aquest cas el valor buscat serà la mitjana
entre els valors extrems.
Si busquem en la taula aquest valor no apareix directament, sinó que
es troba entre els valors (que correspon a ) i (que
correspon a ).
K 0 1 2 3 4 5 6 7 8 9
0,0 ,5000 ,5040 ,5080 ,5120 ,5160 ,5199 ,5239 ,5279 ,5319 ,5359
0,1 ,5398 ,5438 ,5478 ,5517 ,5557 ,5596 ,5636 ,5675 ,5714 ,5754
0,2 ,5793 ,5832 ,5871 ,5910 ,5948 ,5987 ,6026 ,6005 ,6103 ,6141
0,3 ,6179 ,6217 ,6255 ,6293 ,6331 ,6368 ,6406 ,6443 ,6480 ,6517
0,4 ,6554 ,6591 ,6628 ,6664 ,6700 ,6736 ,6772 ,6808 ,6844 ,6879
0,5 ,6915 ,6950 ,6985 ,7019 ,7054 ,7088 ,7123 ,7157 ,7190 ,7224
0,6 ,7258 ,7291 ,7324 ,7357 ,7389 ,7422 ,7454 ,7486 ,7518 ,7549
0,7 ,7580 ,7612 ,7642 ,7673 ,7704 ,7734 ,7764 ,7794 ,7823 ,7852
0,8 ,7881 ,7910 ,7939 ,7967 ,7996 ,8023 ,8051 ,8078 ,8106 ,8133
0,9 ,8159 ,8186 ,8212 ,8238 ,8264 ,8289 ,8315 ,8340 ,8365 ,8389
Aleshores el valor de serà:
2. Si el valor està entre dos valors, però molt proper a un d’ells,
directament prenem aquest valor, per exemple:
El valor més proper és (que correspon a ).
K 0 1 2 3 4 5 6 7 8 9
0,0 ,5000 ,5040 ,5080 ,5120 ,5160 ,5199 ,5239 ,5279 ,5319 ,5359
0,1 ,5398 ,5438 ,5478 ,5517 ,5557 ,5596 ,5636 ,5675 ,5714 ,5754
0,2 ,5793 ,5832 ,5871 ,5910 ,5948 ,5987 ,6026 ,6005 ,6103 ,6141
0,3 ,6179 ,6217 ,6255 ,6293 ,6331 ,6368 ,6406 ,6443 ,6480 ,6517
0,4 ,6554 ,6591 ,6628 ,6664 ,6700 ,6736 ,6772 ,6808 ,6844 ,6879
0,5 ,6915 ,6950 ,6985 ,7019 ,7054 ,7088 ,7123 ,7157 ,7190 ,7224
0,6 ,7258 ,7291 ,7324 ,7357 ,7389 ,7422 ,7454 ,7486 ,7518 ,7549
0,7 ,7580 ,7612 ,7642 ,7673 ,7704 ,7734 ,7764 ,7794 ,7823 ,7852
0,8 ,7881 ,7910 ,7939 ,7967 ,7996 ,8023 ,8051 ,8078 ,8106 ,8133
0,9 ,8159 ,8186 ,8212 ,8238 ,8264 ,8289 ,8315 ,8340 ,8365 ,8389
Com el valor buscat està molt prop d’aquest, aleshores directament
.
● Si la distribució no és sinó que és , hem de tipificar
prèviament.
Per exemple, si i , calcula quant val .
Tipifiquem:
116 Introducció a l’estadística
Si busquem dins la taula tenim que correspon a .
K 0 1 2 3 4 5 6 7 8 9
0,0 ,5000 ,5040 ,5080 ,5120 ,5160 ,5199 ,5239 ,5279 ,5319 ,5359
0,1 ,5398 ,5438 ,5478 ,5517 ,5557 ,5596 ,5636 ,5675 ,5714 ,5754
0,2 ,5793 ,5832 ,5871 ,5910 ,5948 ,5987 ,6026 ,6005 ,6103 ,6141
0,3 ,6179 ,6217 ,6255 ,6293 ,6331 ,6368 ,6406 ,6443 ,6480 ,6517
0,4 ,6554 ,6591 ,6628 ,6664 ,6700 ,6736 ,6772 ,6808 ,6844 ,6879
0,5 ,6915 ,6950 ,6985 ,7019 ,7054 ,7088 ,7123 ,7157 ,7190 ,7224
0,6 ,7258 ,7291 ,7324 ,7357 ,7389 ,7422 ,7454 ,7486 ,7518 ,7549
Aleshores:
Exemple
En la fase comarcal de l’olimpíada matemàtica la distribució dels punts
obtinguts pels participants segueix una distribució normal de mitjana 110
punts i una desviació típica de 15 punts.
a. Quina és la probabilitat que un participant hi obtinga més de 125
punts?
= nombre de punts obtinguts pels participants
b. Per a passar a la següent fase és necessari obtindre 100 punts o més.
Quin percentatge de participants passa a la següent fase?
c. Quants punts, com a mínim, té que traure un participant per a estar
entre el 25% dels millors?
Si volem calcular el 25% dels millors, el que farem serà calcular el valor
de la variable que deixa per baix al 75% de la població.
Distribucions de probabilitat discretes i continues 117
Si busquem en la taula aquest valor no apareix directament, sinó que es
troba entre els valors (que correspon a ) i (que
correspon a ). Aleshores el valor que busquem serà:
Per tant,
Per a estar entre el 25% dels millors un participant a de traure
punts o més.
5.7 Aproximació de la distribució binomial mitjançant la distribució normal
El matemàtic francès De Moivre va demostrar que en determinades condicions
la distribució binomial es pot aproximar mitjançant la distribució normal.
Aquestes condicions que s’han de complir són:
Aleshores tenim que si es compleixen les condicions anteriors:
(Recordem que: i en la distribució binomial)
Com més pròxim siga a 0,5 millor serà l’aproximació i gràcies a aquesta
aproximació és fàcil calcular probabilitats amb la distribució binomial per a
valors grans de .
Cal tenir en compte que per a realitzar correctament aquesta transformació
d’una variable discreta (binomial) en una variable contínua (normal) és
necessari fer una correcció de continuïtat. Vegem-ho:
1.
118 Introducció a l’estadística
2.
3.
4.
Distribucions de probabilitat discretes i continues 119
5.
6.
7.
120 Introducció a l’estadística
Exemple
Sabem que en la ciutat d’Alacant el 80% dels aficionats al futbol són de
l’Hèrcules. Si en un bar hi ha 50 aficionats al futbol,
a. quina és la probabilitat que en el bar hi haja més de 25 aficionats a
l’Hèrcules?
Anomenem al nombre d’aficionats a l’Hèrcules que hi ha al bar.
Tenim que: , la probabilitat d’èxit (ser aficionat a l’Hèrcules)
i la probabilitat de fracàs (no ser aficionat a l’Hèrcules) .
Aleshores diem que:
Tenim que calcular la , però si ho tenim que calcular utilitzant
la funció de probabilitat de la distribució binomial serà molt costos.
Aleshores anem a comprovar si es compleixen les condicions i podem
aproximar la binomial mitjançant la normal.
b. quina és la probabilitat que en el bar hi haja entre 35 i 45 aficionats a
l’Hèrcules?
Distribucions de probabilitat discretes i continues 121
5.8 Exercicis proposats
1. Una variable aleatòria discreta té la següent distribució de probabilitat:
3 4 5 6 7 8
1/9 1/18 1/3 5/18 m 1/6
a. Completa la distribució de probabilitat.
b. Calcula la mitjana i la desviació típica.
2. Una companyia d’assegurances ha agrupat en quatre grans tipus les
indemnitzacions (en milers d’euros) que espera haver d’afrontar el pròxim any.
La companyia coneix les probabilitats de cadascuna de les possibles
indemnitzacions tal com apareixen en la següent taula:
10 30 70 150
0,5 0,2 0,15 0,15
a. Calcula la funció de distribució.
b. Calcula l’esperança matemàtica i la variància.
3. Les regles d’un joc amb un dau són les següents:
- Guanyem 1 euro si traiem 1, 2 o 3.
- Guanyem 2 euros si traiem 4 o 5.
- Perdem 5 euros si traiem 6.
Calcula l’esperança matemàtica d’aquest joc i digues si el joc és equilibrat.
4. Si és una variable aleatòria que es distribueix , calcula les
següents probabilitats primer sense utilitzar la taula de la binomial i després
utilitzant la taula:
a.
b.
c.
d.
e.
f.
g.
122 Introducció a l’estadística
5. Calcula la probabilitat que en seleccionar a l’atzar 10 persones d’una
empresa en la qual el 32% dels treballadors són dones obtinguem:
a. Set homes.
b. El mateix nombre d’homes que de dones.
c. Un mínim de 8 dones.
d. Entre un i tres homes (ambdós inclosos).
6. Una universitat sap que el 75% dels seus graduats obté un lloc de treball
durant el primer any. Es trien a l’atzar 8 graduats de la citada universitat.
a. Calcula la probabilitat que almenys 6 tinguen treball el primer any.
b. Calcula la probabilitat que com a màxim 6 tinguen treball el primer
any.
c. Calcula la probabilitat que 6 tinguen treball el primer any.
d. Calcula la probabilitat que més de 6 tinguen treball el primer any.
e. Calcula la probabilitat que menys de 6 tinguen treball el primer any.
f. Calcula el nombre mitjà d’alumnes que van tenir ocupació durant el
primer any si es van graduar un total de 300 alumnes.
7. Tots els anys, a l’estiu, una empresa de gelats fa una promoció que
consisteix en premiar el 20% dels seus gelats amb un gelat gratis.
a. Si comprem una caixa de 10 gelats, quina és la probabilitat que hi haja
algun gelat premiat?
b. Si comprem una caixa de 10 gelats, quina és la probabilitat que
estiguen tots premiats?
c. Quants gelats hauríem de comprar perquè la probabilitat de trobar-ne
algun premiat fóra major que 0,8?
8. En una facultat d’una universitat el 40% dels alumnes suspèn alguna
assignatura el primer any de carrera. Si prenem una mostra de 15 alumnes,
calcula:
a. La probabilitat que més de 8 alumnes suspenguen alguna assignatura.
b. La probabilitat que més de 6 però menys de 10 suspenguen alguna
assignatura.
Distribucions de probabilitat discretes i continues 123
c. Quants alumnes hauríem de prendre en la mostra perquè la probabilitat
que algun suspenguera alguna assignatura fóra major que 0.75?
d. La probabilitat que més de 5 alumnes aproven totes les assignatures.
9. La taxa de desocupació en una població és del 15% sobre la població activa.
Si seleccionem a l’atzar 6 individus en edat de treballar d’aquesta població.
a. Quina és la probabilitat que exactament dos dels individus seleccionats
estiguen aturats?
b. Quina és la probabilitat que no hi haja més de dos individus aturats?
c. Quina és la probabilitat que hi haja entre dos i cinc aturats?
d. Quina és la probabilitat que tots treballen?
10. Si és una variable aleatòria que es distribueix , calcula les
següents probabilitats:
a.
b.
c.
d.
e.
f.
g.
h.
11. En una empresa de fabricació d’envasos per a sucs hi ha una màquina que
fabrica envasos de 112 mil·lilitres, encara que per diverses raons la màquina fa
xicotetes variacions en la capacitat de l’envàs. Sabem que la capacitat dels
envasos que fa aquesta màquina segueix una distribució normal de mitjana 112
i desviació típica 1. Si la màquina ha fet 1.500 envasos,
a. quants tindran una capacitat entre 111 i 114 mil·lilitres?
b. quants tindran una capacitat menor a 110 mil·lilitres?
c. quants tindran una capacitat major a 113 mil·lilitres?
d. quants tindran una capacitat major a 112 mil·lilitres? Contesta aquesta
pregunta sense fer el càlcul de la probabilitat.
124 Introducció a l’estadística
12. En un magatzem hi ha 500 paquets de material d’oficina amb un pes mitjà
per paquet de 70 kg i amb una desviació típica de 3 kg. Si els pesos dels
paquets segueixen una distribució normal, calcula quants paquets pesen:
a. entre 60 kg i 75 kg
b. més de 90kg
c. menys de 64 kg
d. exactament 64 kg
e. 64 kg o menys
13. Les notes d’una assignatura del grau de GAP en la Universitat d’Alacant
segueixen una distribució normal de mitjana 7 punts i amb una desviació típica
de 2 punts. Calcula la probabilitat que un alumne:
a. aprove
b. suspenga
c. traga un notable (7 o més, però menys de 9)
d. traga menys de 4
14. Si llancem una moneda 196 vegades, calcula la probabilitat que:
a. el nombre de cares estiga comprès entre 91 i 105 (ambdós inclosos)
b. el nombre de cares siga major a 112
c. el nombre de cares siga menor a 77
d. el nombre de creus siga major a 119
e. el nombre de creus siga major a 98
f. el nombre de cares siga igual a 105
15. Sabem que, en un poble de la província d’Alacant, de cada 100 aturats 60
han tingut treball abans. Calcula la probabilitat que al seleccionar 30 aturats a
l’atzar d’aquest poble,
a. hi haja com a mínim 20 aturats que han treballat abans
b. hi haja entre 15 i 20 aturats que han treballat abans
Distribucions de probabilitat discretes i continues 125
16. En una cadena de muntatge la probabilitat que un accident passe per una
errada en les màquines és de 0,01. Calcula la probabilitat que almenys 4
accidents hagen passat per una errada en les màquines quan analitzem una
mostra aleatòria de:
a. 10 accidents
b. 600 accidents
17. En una empresa de joguines es fabriquen per a Nadal cotxes teledirigits. El
1,5% del cotxes que es fabriquen són defectuosos. En un lot de 10.000 cotxes,
a. quants hem d’esperar que siguen defectuosos?
b. quina és la probabilitat que el nombre de cotxes defectuosos estiga
entre 130 i 175 (ambdós inclosos)
18. En una escola universitària és necessari superar un examen d’ingrés per a
poder entrar. D’anys anteriors sabem que les puntuacions de l’examen d’ingrés
segueixen una distribució normal de mitjana 5,5 i variància 4.
a. Quina és la probabilitat que un sol·licitant traga menys d’un 4?
b. Per a ser admès es necessita una puntuació mínima de 6, quina és la
probabilitat que siga admès un sol·licitant?
c. Quina és la probabilitat que entre 50 sol·licitants s’admeten més de la
meitat?
127
Bibliografia
FERNÁNDEZ, Santiago – CORDERO, José M. – CÓRDOBA, Alejandro,
Estadística descriptiva, Editorial Esic, Madrid, 1996.
MULLOR, Rubén – FAJARDO, M. Dolores, Manual práctico de estadística
aplicada a las ciencias sociales, Editorial Ariel Practicum, Barcelona,
2000.
De GROOT, Morris, Probabilidad y estadística, Editorial Addison-Wesley
Iberoamericana, Pittsburgh, Pennsylvania, USA,1988.
CUADRAS, Carles M. – ECHEVERRÍA, Benito – MATEO, Juan – SÁNCHEZ,
Pedro, Fundamentos de estadística, Editorial P. P. U., Barcelona,
1984.
SERRET, Jaime, Manual de estadística universitaria, Editorial Esic, Madrid,
1995.
NORTES, Andrés, Estadística teórica y aplicada, Editorial P. P. U., Barcelona,
1993.
SÁNCHEZ, Joaquín – MANTECA, Isidoro, Cuestiones y problemas resueltos de
estadística, Editorial Gamma, Alacant, 1995.
FERNÁNDEZ, Carlos – FUENTES, Felipe, Curso de estadística descriptiva,
Editorial Ariel, Barcelona, 1995.
SARRIÓN, M. Dolores, Estadística descriptiva, Editorial Mc Graw Hill,
Madrid, 2012.
MARTÍN - PLIEGO, Francisco J., Introducción a la estadística económica y
empresarial, Editorial AC, Madrid, 2005.
BRETÓ, Josep – NOGUERA, Joan Josep – VIDAL, Miquel, Estadística.
Introducció a la teoria de la decisió, Conselleria de Cultura, Educació
i Ciència, València, 1986.
TOLEDO, Maria I., Estadística, Editorial Alhambra Longman, Madrid, 1992.