MODELS DE CAPTACIÓ, ANÀLISI Y INTERPRETACIÓ DE DADES · Exemple: Un nen que està aprenent a...

59
MODELS DE CAPTACIÓ, ANÀLISI Y INTERPRETACIÓ DE DADES MASTER DE LOGÍSTICA, TRANSPORT Y MOBILITAT MASTER D’ESTADÍSTICA i INVESTIGACIÓ OPERATIVA APUNTS DE CLASSE PROF. LÍDIA MONTERO: TEMA 2: REPÀS DE CÀLCUL DE PROBABILITATS I VARIABLE ALEATÒRIA AUTORA: Lídia Montero Mercadé Departament d’Estadística y Investigació Operativa Versió 1.2 Setembre del 2.011

Transcript of MODELS DE CAPTACIÓ, ANÀLISI Y INTERPRETACIÓ DE DADES · Exemple: Un nen que està aprenent a...

MODELS DE CAPTACIÓ, ANÀLISI Y INTERPRETACIÓ DE DADES

MASTER DE LOGÍSTICA, TRANSPORT Y MOBILITAT

MASTER D’ESTADÍSTICA i INVESTIGACIÓ OPERATIVA

APUNTS DE CLASSE PROF. LÍDIA MONTERO:

TEMA 2: REPÀS DE CÀLCUL DE PROBABILITATS I VARIABLE ALEATÒRIA

AUTORA:

Lídia Montero Mercadé

Departament d’Estadística y Investigació Operativa

Versió 1.2

Setembre del 2.011

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-2 Curs 2.011-2.012

TABLA DE CONTENIDOS 2.3-1. COMBINATÒRIA ______________________________________________________________________________________________________________ 3 2.3-2. NOCIONS BÀSIQUES DE PROBABILITAT _______________________________________________________________________________________ 8 2.3-2.1 DEFINICIÓ DE CONJUNT DE LES PARTS D’UN CONJUNT FONAMENTAL ___________________________________________________________________ 8 2.3-2.2 DEFINICIÓ ACTUAL DE PROBABILITAT ____________________________________________________________________________________________ 10 2.3-2.3 PROPIETATS DE LA PROBABILITAT _______________________________________________________________________________________________ 12 2.3-2.4 PROBABILITAT CONDICIONADA __________________________________________________________________________________________________ 13 2.3-2.5 TEOREMA DE LES PROBABILITATS TOTALS ________________________________________________________________________________________ 15 2.3-2.6 FÓRMULA DE BAYES ___________________________________________________________________________________________________________ 16 2.3-3. VARIABLE ALEATÒRIA DISCRETA ___________________________________________________________________________________________ 18 2.3-3.1 INTRODUCCIÓ A LA VARIABLE ALEATÒRIA DISCRETA _______________________________________________________________________________ 18 2.3-3.2 DEFINICIÓ DE VARIABLE ALEATÒRIA DISCRETA ____________________________________________________________________________________ 18 2.3-3.3 FUNCIÓ DE PROBABILITAT D’UNA VAD ___________________________________________________________________________________________ 18

2.3-3.4 PROPIETATS DE xpX ______________________________________________________________________________________________________ 19 2.3-3.5 FUNCIÓ DE DISTRIBUCIÓ DE PROBABILITAT DE X VAD ______________________________________________________________________________ 19 2.3-3.6 PROPIETATS D’UNA FUNCIÓ DE DISTRIBUCIÓ, FX (X) DE X VAD ________________________________________________________________________ 20 2.3-3.7 MOMENTS DE X VAD __________________________________________________________________________________________________________ 21 2.3-3.8 VECTORS ALEATORIS DISCRETS _________________________________________________________________________________________________ 29 2.3-3.9 DEFINICIÓ INDEPENDÈNCIA DE 2 VADS ___________________________________________________________________________________________ 31 2.3-3.10 ESPERANÇA DE FUNCIONS SOBRE VECTORS ALEATORIS DISCRETS ____________________________________________________________________ 32 2.3-3.11 EXEMPLES DE VARIABLES ALEATÒRIES DISCRETES ________________________________________________________________________________ 35 2.3-4. VARIABLE ALEATÒRIA CONTÍNUA ___________________________________________________________________________________________ 46 2.3-4.1 ALGUNES VARIABLES ALEATÒRIES CONTÍNUES _____________________________________________________________________________________ 48 2.3-4.2 APROXIMACIONS: _____________________________________________________________________________________________________________ 58 2.3-4.3 DESIGUALTAT DE TXEBITXEV ___________________________________________________________________________________________________ 59 2.3-4.4 TEOREMA CENTRAL DEL LÍMIT _________________________________________________________________________________________________ 59

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-3 Curs 2.011-2.012

2.3-1. COMBINATÒRIA

El principi de Multiplicació

El número total de maneres diferents de realitzar varies eleccions successives és el producte del número de formes diferents en què poden realitzar-se cadascuna de les eleccions individuals.

Exemple: Una persona ha de viatjar de Madrid a València i de València a Eivissa. El viatge de Madrid a València es pot fer en automòbil, ferrocarril o avió, i de València a Eivissa es pot anar en vaixell o en avió. El número total de maneres diferents de viatjar de Madrid a Eivissa es pot veure a la figura.

MADRID VALÈNCIA EIVISSA Automòbil _____ Avió Automòbil _____ Vaixell Ferrocarril _____ Avió Ferrocarril _____ Vaixell Avió _____ Avió Avió _____ Vaixell

En total, aquesta persona pot viatjar de 623 maneres diferents.

El mètode aplicat a l’exemple és l’eina bàsica per trobar la solució de problemes on cal desenvolupar successivament tasques que es puguin dur a terme de vàries maneres diferents: si cal realitzar successivament vàries tasques i la primera es pot desenvolupar d’m formes diferents, la segona d’n maneres diferents, etc. Llavors el nombre total N de formes diferents de dur a terme les tasques és el producte

nmN

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-4 Curs 2.011-2.012

Variacions Sigui un conjunt A amb nA # (el nombre d’element de A). Es defineix el conjunt de les “variacions d’elements” presos de k en k com totes les eleccions ordenades de k elements diferents entre els n existents, és a dir:

jiaakiAaaaakAV jiik ,;,...,1,:),...,,(),( 21

A la seva cardinalitat se l’anomena knV , i val:

)!(!

)(...)())((...)()),((# ,

knn

knnnknnnVkAV kn

1111

Exemple: Un nen que està aprenent a parlar té un vocabulari limitat a deu paraules. Es capaç de dir tres d’elles seguides sense repetir cap. Quantes frases es capaç d’articular?

El nen ha d’escollir 3 paraules diferents entre les 10 que coneix, llavors podrà dir:

72089107

10310

!!

,V frases.

Permutacions Sigui A amb nA # un conjunt. El conjunt de les “permutacions dels elements d’ A”, és donat per les maneres diferents d’ordenar els elements diferents d’ A , és a dir:

).,(

,;,...,1,:),...,()( 1

nAVar

jiaaniAaaaAPerm jiin

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-5 Curs 2.011-2.012

La seva cardinalitat és: !, nVP nnn

Exemple: Cal ordenar 12 llibres en un prestatge. Quantes maneres hi ha de fer-ho?

De 4790016001212 !P maneres.

Variacions amb repetició Sigui A amb ,# nA un conjunt. Es defineix el conjunt de “variacions amb repetició” d’n elements presos de k en k a totes les eleccions ordenades de k elements entre els n , això és:

},...,,:),...,{),( 1 kiAaaakAVR ik k

kn nkAVRVR )),((#,

Exemple: Travesses possibles:

969.782.4314

14,3

VR

Permutacions amb repeticions Sigui A amb nA # un conjunt en el qual no tots els seus n elements són indistingibles: hi ha 1n de la classe 1, 2n de la classe 2, … i rn de la classe r , amb

nnrjnnr

jjj

111 ,,...,, .

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-6 Curs 2.011-2.012

El conjunt de “permutacions dels n elements d’A on l’element j es repeteix jn cops, rj ,...,1 ” s’anomena conjunt d’ordenacions possibles dels elements d’ A , tenint en compte que dues ordenacions són la mateixa si una pot ser transformada en l’altre només canviant l’ordre dels elements de la mateixa classe.

La seva cardinalitat és:rnn

n PR ,...,1

I es calcula un,

!!...!

!!...)()(#

,...,

,...,

r

nn

n

rnn

n

nnnPR

nnPRBPerm

r

r

1

1

1

1

Exemple: En una llibreria hi ha deu exemplars de Tirant lo Blanc (de la mateixa edició) i quatre de Terra Baixa (també de la mateixa edició). Volem col·locar-los en un prestatge de l’aparador. De quantes maneres pot fer-se? I si no es vol separar els llibres que són iguals?

Responent a la primera pregunta, entre els 14 llibres n’hi ha 10 que són idèntics (hi ha una mena de llibre que es repeteix 10 cops) i d’altres 4 que també són indistingibles (es repeteixen 4 cops), en total podem comptar, doncs:

100111137234

11121314410

1441014

!!

!,PR

maneres de col·locar els llibres al prestatge.

Si no es vol separar els llibres que són iguals, llavors hi ha tantes formes de col·locar-los com permutacions de 2, doncs hi ha 2 menes de llibres. Així doncs, podem col·locar-los de dues maneres: els exemplars de Terra Baixa a l’esquerra i els de Tirant lo Blanc a la dreta, o a l’inrevés.

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-7 Curs 2.011-2.012

Combinacions: Sigui A amb nA # un conjunt. El “conjunt dels elements de k en k ” és el conjunt dels subconjunts d’ A amb k elements:

},:},...,{}:#{),(

1 jiaaAaaakBABkAC

jiik

on },...,{ kaa1 és una col·lecció no ordenada de k elements diferents.

Proposició: )!(!

!),(# , knkn

kn

CkAC kn

Exemple: De quantes maneres diferents pot emplenar-se un bitllet de loteria (es marquen sis números entre l’1 i el 49)? I si només s’utilitzen números senars?

S’han de seleccionar 6 números diferents entre els 49 (no importa l’ordre i no hi ha repeticions), així doncs n’hi ha

13983816436

496

49649

!!!

,C

maneres d’omplir el bitllet.

Si només s’utilitzen els números senars, llavors hi ha 25 números possibles per marcar i per tant hi haurà

177000196

25625

625

!!!

,C

maneres d’emplenar el bitllet.

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-8 Curs 2.011-2.012

2.3-2. NOCIONS BÀSIQUES DE PROBABILITAT

2.3-2.1 Definició de Conjunt de les Parts d’un Conjunt Fonamental Definició d’Experiència Aleatòria

Els fenòmens aleatoris o experiències aleatòries són aquelles en què el resultat, sota les mateixes condicions de repetició de l’experiència, no sempre és el mateix.

Però presenta una regularitat estocàstica al llarg d’un nombre elevat de repeticions de l’experiència.

El conjunt fonamental o conjunt de resultats d’una experiència aleatòria és el conjunt de tots els possibles resultats de l’experiència aleatòria. Es sol notar per .

Un succés és un conjunt de resultats elementals.

Cada un d’aquests possibles resultats es pot considerar com un succés elemental. El resultat es sol notar per i el succés elemental implicat {}.

Hi ha dos successos especials:

El succés cert (donada una experiència aleatòria sempre es realitza: ) . El succés fals (mai es realitza, no conté cap succés elemental, simbolitzat per ).

Dins el conjunt dels successos, hi ha un seguit d’operacions derivades de la Teoria de Conjunts:

1. Succés contrari o complementari: Sigui un succés A tal que A .

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-9 Curs 2.011-2.012

Definim el succés contrari A com el succés que es realitza quan no es realitza A.

És a dir, A = / A.

2. Succés intersecció: Siguin dos successos del conjunt fonamental, A1 i A2 , A1 i A2 .

Parteix de dos successos del conjunt fonamental, i es realitza quan ho fan A1 i A2 alhora. Matemàticament, A1 A2 = / A1 A2.

3. Succés unió: Siguin dos successos A1 i A2, A1 i A2 ,

El succés unió d’aquests dos es realitza quan es realitzen A1 ó A2 . És a dir, A1 A2 = / A1 A2.

Implicació: Si el succés A1 implica la realització del succés A2, notat A1 A2 , l’única cosa que vol dir és : A1

A2 .

Dos successos són incompatibles si A1 i A2 i A1 A2 = . La intersecció dels successos és el succés fals (no conté cap succés elemental).

Un succés A es realitza en una instància de l’experiència aleatòria si el resultat, w, és tal que A .

L’Àlgebra de Successos, basada en la Teoria de Conjunts, gaudeix d’unes certes propietats: Commutabilitat: AB = BA i igualment AB = BA. Associabilitat: A(BC) = (AB)C. Igualment amb la intersecció. Distributivitat: A(BC)=(AB)(AC) i A(BC)=(AB)(AC). Identitat: A=A i A=A.

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-10 Curs 2.011-2.012

Complementarietat: A A = i A A =.

Lleis de De Morgan: A B A B i A B A B .

Complementarietat del complementari: A A .

El conjunt de les parts o conjunt de successos d’una experiència aleatòria (notat ) és el conjunt format per tots els possibles subconjunts de .

Cada subconjunt de és un succés. Aquest conjunt compleix certes propietats:

E E . El conjunt de les parts és tancat per complementarietat .

n > 0 En Enn 0

. És tancat per la unió.

.

.

2.3-2.2 Definició Actual de Probabilitat Basada en l’axiomàtica de Kolmogorov, pren forma de definició estrictament matemàtica,

Sigui (,) un espai probabilitzable. La probabilitat és tota aplicació P : 1,0 tal que compleix els tres axiomes següents: 1. Axioma de probabilitats totals:

BPAPBAPBABA t.q.,

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-11 Curs 2.011-2.012

2. Axioma complert de les probabilitats totals:

00

.. 0n

nn

njin APAPjiAAqtAn

3. Axioma de normalització: 1P

Definició d’Espai Probabilitzat:

La tripleta (,, P) constituïda per un espai fonamental de resultats d’una experiència aleatòria i el conjunt de les seves parts sobre els qui s’ha definit una aplicació de probabilitat s’anomena espai probabilitzat.

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-12 Curs 2.011-2.012

2.3-2.3 Propietats de la Probabilitat

1. APAP 1

2. 0

3. Siguin A i B no incompatibles, és a dir, BA , llavors es compleix:

BAPBPAPBAP

011111

PPPpropietatPer

APAPAPAPPdoncsAixí

PaxPerAPAPAAPPaxPer

AAiAAAA

11

131

,

.

.

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-13 Curs 2.011-2.012

2.3-2.4 Probabilitat condicionada Tenim a priori una informació per calcular la probabilitat d’un determinat succés A lligat a una experiència aleatòria. Aquesta disponibilitat d’informació és una situació en la qual coneixem la probabilitat de realització d’un altre succés B tal que P(B) > 0 i volem veure com influeix P(B) en P(A).

Una cosa és la probabilitat d’un succés A (P(A)) i una altra és la probabilitat de A condicionada a B (P(A/B)). La probabilitat condicionada és el càlcul de la probabilitat d’A suposada la realització de B. Si P(B)>0 llavors:

Si P(B)=0 la probabilitat condicionada no està definida.

Conseqüències:

BP

BAPBAP /

0// 0 /0 /

ABPBAPaleshoresBASiAPsiAPABPBPsiBPBAP

BAP

1/

/

BPBP

BPBAPBAPaleshoresBASi

APBPAP

BPBAPBAPaleshoresBASi

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-14 Curs 2.011-2.012

Independència La independència és un concepte matemàtic, no intuïtiu.

Si tenim P(B)>0, aleshores pot passar:

ciaindependèn tenim :A de órealitzaci la afecta no B/

A de órealitzaci la perjudica B/A de órealitzaci laafavoreix B /

/APBAPAPBAPAPBAP

BAP

Dos successos A i B són independents si i només si P(A/B)= P(A); o sigui, quan la realització de B no afecta la realització de A.

Una altra manera de verificar la independència entre dos successos és que dos successos són independents si i només si P(AB)=P(A)·P(B), ja que:

La independència de successos té les següents propietats: Dos successos incompatibles de probabilitat no nul.la i diferent de la unitat mai són independents:

Siguin A , B tals que (AB) = P(AB)= 0 P(A)>0 i ·P(B)>0 per tant P(A)·P(B)>0 i mai són independents

El succés fals és independent de tots els successos:

P()·P(A) = 0 A

BPAPBPBAPBAP /

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-15 Curs 2.011-2.012

És commutativa: A independent de B B independent de A

És NO transitiva: A independent de BB independent de C

A independent de C

Contraexemple:

104 i

101 com definidaat probabilit

una amb ,,,,, successos els i ,,, Sigui

4321

4332214321

PPPP

CBA

Independència mútua Ara cal veure com s’estableix la independència entre més de dos successos.

Un conjunt de successos A1 ,...,An són mútuament independents si per tots els subconjunts de cardinal

2 k n de es compleix que la probabilitat de la intersecció és igual al producte de probabilitats:

Per exemple, per verificar la independència entre A1 , A2 , A3 caldrà verificar la independència entre

(A1 ,A2), (A1 ,A3), (A2 ,A3), (A1 ,A2 ,A3).

2.3-2.5 Teorema de les probabilitats totals En Teoria de Conjunts es defineix una partició com un conjunt de conjunts de la següent manera:

krmtqrmAPAPr

mjj

r

mjj

1 ,

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-16 Curs 2.011-2.012

jisiBABA

BAA

ji

n

ii

queja 1

qualsevol A , A es pot Sigui un succés expressar com a unió dels successos disjunts relacionats amb la partició B1,...,Bn:

Aleshores la probabilitat del succés A pot

expressar-se com:

El Teorema de les Probabilitats Totals expressa l’anterior igualtat:

2.3-2.6 Fórmula de Bayes

Sigui un succés A . Sigui n1 B,,B una partició del conjunt fonamental .

Les probabilitats a priori es defineixen com:

n

1i

n1

i ,1 , ;,

conjunt del particióuna formen ,..., successos Els

iji BnjijijiBB

BB

n

ii

n

ii BAPBAPAP

11

n

i

n

ii

ii BPB

APBAPAP1 1

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-17 Curs 2.011-2.012

niBA

i,,1

.

Les probabilitats a posteriori es defineixen com

niABi ,,1

i s’interpreten com “Donada la realització del succés A, la probabilitat que el succés iB s’hagi realitzat s’anomena

probabilitat a posteriori de iB ”.

Les probabilitats a posteriori poden calcular-se a partir de les probabilitats a priori mitjançant la definició de probabilitat condicional i el Teorema de les Probabilitats Totals i duu el nom de Fórmula de Bayes:

de partició la de Belement qualsevolPer i

1i

n

ii

iiiiii

BPBAP

BPBAPAP

BPBAPAP

ABPABP

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-18 Curs 2.011-2.012

2.3-3. VARIABLE ALEATÒRIA DISCRETA

2.3-3.1 Introducció a la Variable Aleatòria Discreta

La formulació dels resultats d’una experiència aleatòria com a variable aleatòria té com a avantatges que permet reflectir els resultats en valors numèrics, proporcionant un major grau d’abstracció, a canvi, es perd informació sobre el conjunt fonamental de l’experiència aleatòria tractada, de manera que la construcció de la variable aleatòria ha d’anar més lligada a l’objectiu de l’estudi.

2.3-3.2 Definició de variable aleatòria discreta

Una variable aleatòria discreta (VAD) és una aplicació tal que a cada li associa un valor real X(): X:

ω X()

2.3-3.3 Funció de probabilitat d’una VAD

Sigui X una VAD i I1iix el conjunt de tots els diferents valors que pot prendre aquesta

VAD.

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-19 Curs 2.011-2.012

Sigui també la partició de en successos induïda per la variable aleatòria.

iii xXxX tq A

Definim la funció de probabilitat de la VAD X, pX(x), com una aplicació dels reals i concretament del conjunt de valors de la vad, en l’interval [0,1],

0,1 : )(pX x

ixX

iiiX PAPxXPxpquetal

si ix és imatge de l’aplicació X

i altramentxpX 0

És a dir, és una funció definida des del conjunt de valors d’una VAD cap a [0,1, i val la suma de les probabilitats dels diferents successos elementals que tenen com a imatge el valor. Per ser precisos, cal extendre el domini a tots els reals, simplement indicant una probabilitat nul.la per tots els reals que no formen part del conjunt de valors de la VAD.

2.3-3.4 Propietats de xpX

1xp0 x per qualsevol valor real x.

11

I

iiX xp

2.3-3.5 Funció de Distribució de Probabilitat de X VAD

Noció de probabilitat acumulada

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-20 Curs 2.011-2.012

El succés xX denota el conjunt dels successos elementals del conjunt fonamental de l’experiència aleatòria tals que tenen per imatge en l’aplicació X VAD un valor real inferior o igual a x. Matemàticament,

xXxX |

xX

PxXP

|

La funció de distribució de probabilitat d’una variable aleatòria discreta X es nota Fx(x) i està definida com:

xx

iXxx

iXii

xpxXPxXPxF

2.3-3.6 Propietats d’una funció de distribució, Fx (x) de X VAD

1xF0 x per tot valor real x.

xFX és una funció monòtona no decreixent, és a dir,

2121 xFxFxx XX

1

xFlim Xx .

0

xFlim Xx .

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-21 Curs 2.011-2.012

Fx(x) de X VAD està definida a tot l’eix real.

Fx(x) s’incrementa a salts, ubicats als punts de l’eix d’abcisses valors de la VAD X, Ixx ,,1 , i suposen un increment en el valor de la funció (eix d’ordenades) de magnitud iX xp al ixx ,

1...1

,...,per

1

1111

IixxxperxFxFxxxpxFxF

iiixx

Iixixix

2.3-3.7 Moments de X VAD

Magnituds resum dels trets més característics de X VAD. Similaritat amb els estadístics definits al Tema d’Estadística Descriptiva.

2.3-3.7.1 Esperança matemàtica de X VAD

I

iiXi xpxX

1

on x1,...,xI són els valors de X VAD

Sumatori dels productes valor de la variable per la seva probabilitat: magnitud de tendència central dels valors de X VAD.

2.3-3.7.2 Esperança de funcions reals de X VAD

Si definim una nova variable Y VAD, a partir d’una funció real g(X) sobre la variable X VAD ,

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-22 Curs 2.011-2.012

ji

i

yx

xgYX

L’esperança de Y=g(X) VAD pot calcular-se a partir de la funció de probabilitat de X VAD,

I

iiXi xpxgXgEYE

1

No confondre: en general,

XgXg

Algunes propietats de l’esperança matemàtica de X VAD

XhEXgEXhXgE

bXaEbaXE

Hi ha dues funcions que es defineixen a partir de l’esperança matemàtica i que són força importants:

El moment d’ordre k de la variable X VAD és,

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-23 Curs 2.011-2.012

I

1iiX

kk )(xpxXEi

És un cas particular de Y on Y= g(X)= Xk.

El moment centrat d’ordre k de X VAD, notat com k , és,

1...Ii

iXk

ik

k )(xpXExE(X)XE

És un cas particular de Y on Y= g(X)= (X-E[X])k.

Variança de X VAD: és el moment centrat d’ordre 2 VAR(X)2 ,

I

iiXi xpx

1

222 E(X)E(X)XE=XVAR .

És un valor sempre positiu i si 02 , aleshores X és constant. La desviació típica o estàndard es defineix com la magnitud (arrel quadrada de la variança).

La propietat 21

222 XEXEXVAR

I

iiXi xpx

permet calcular més fàcilment la variança. Demostració:

22222

2222

XXXXX2XX

XX2XXXX2XXXXVAR

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-24 Curs 2.011-2.012

Estadístic relacionat en estadística descriptiva com a mesura de la dispersió dels valors d’una

característica quantitativa respecte la tendència central dels valors :

1nxx2

X

2is .

Moda: és el valor que més es repeteix.

Mediana: és el valor que deixa el 50% d’observacions per sota i el 50% per sobre. S’expressa Me i es defineix com,

Me t.q. P(X Me) = 0.5 i P(X Me) = 0.5.

Per exemple, aquest histograma representa els valors que pren una variable aleatòria que dóna la profunditat d’un llac dins d’una mostra prefixada. Si considerem que tots els valors són equiprobables, llavors la mediana representa dins el gràfics a la profunditat que deixa el mateix nombre de llacs a dreta i esquerra. En aquest cas la situaríem sobre 8-9.

3020100

30

20

10

0

Profund.

Freq

uenc

y

2010

5443

12

1919

31

2023

6

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-25 Curs 2.011-2.012

Exemple:

Llançament de dos daus. Quins valors pot prendre la suma?

= 6·6=36 , X: “VAD Suma dels valors del llençament de 2 daus”. Cada succés de té probabilitat 1/36.

Xi PX (xi ) Xi PX (xi )

2 {1,1} 1/36 10 {4,6}{5,5}{6,4} 3/36

3 {1,2}{2,1} 2/36 11 {5,6}{6,5} 2/36

4 {1,3}{2,2}{3,1} 3/36 12 {6,6} 1/36

5 {1,4}{2,3}{3,2}{4,1} 4/36

6 {1,5}{2,4}{3,3}{4,2}{5,1} 5/36

7 {1,6}{2,5}{3,4}{4,3}{5,2}{6,1} 6/36

8 {2,6}{3,5}{4,4}{5,3}{6,2} 5/36

9 {3,6}{4,5}{5,4}{6,3} 4/36

2 3 4 5 6 7 8 9 10 11 12

0,02

0,07

0,12

0,17

X

Sum

of N

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-26 Curs 2.011-2.012

Calculem els moments principals, esperança i variança,

736112

36211

36310

3649

3658

3667

3656

3645

3634

3623

3612)(xPxXE

11

1iiXi

21

222 XEXEXVAR

I

iiXi xpx

Sabem que EX=7 i, en conseqüència, EX2 = 49, però no sabem quant val EX2.

361974

36112

36211

36310

3649

3658

3667

3656

3645

3634

3623

3612)(xpxXE

222

2222222211

1iiX

2i

2

6

354936

1974XEXEXVAR 22

Per al càlcul de la mediana sols cal observar en la taula de successos i probabilitat la simetria existent i podem afirmar d’immediat que la mediana és 7. Veiem també que coincideix amb l’esperança, fenomen degut altre cop a la simetria de la distribució.

Exemple pel lector:

Llençament de dos daus. Quins valors pot prendre la diferència dels resultats en valor absolut?

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-27 Curs 2.011-2.012

Y: “VAD Diferència absoluta dels valors del llençament de 2 daus”. Cada succés de té probabilitat 1/36.

Y pY (yi )

0 {1,1} {2,2} {3,3} {4,4} {5,5} {6,6} 6/36

1 {1,2}{2,1}{2,3}{3,2}{3,4}{4,3}{4,5}{5,4}{5,6}{6,5}

10/36

2 {1,3} {3,1}{2,4} {4,2}{3,5} {5,3}{4,6} {6,4} 8/36

3 {1,4} {4,1}{2,5} {5,2}{3,6} {6,3} 6/36

4 {1,5} {5,1}{2,6} {6,2} 4/36

5 {1,6} {6,1} 2/36

Calculeu els moments principals, esperança i variança,

94.1)(ypyYE6

1iiYi

3666

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-28 Curs 2.011-2.012

07.294.1YEYEYVAR 26

1

222

iiYi ypy

543210

0,25

0,15

0,05

Y

Sum

of N

_Y

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-29 Curs 2.011-2.012

2.3-3.8 Vectors Aleatoris Discrets

Un vector aleatori discretX de dimensió K, )X,...,X,(XX K21

, està composat per K Xi ‘s VAD

definides TOTES sobre el mateix conjunt fonamental (finit) d’una experiència aleatòria,

X és una funció vectorial de

K que assigna a cada resultat un vector de K valors reals:

KK xxX

11XX

El conjunt de valors del vector aleatori discret )X,...,X,(XX K21

és un subconjunt discret de (finit o infinit numerable). Treballarem el cas particular del parell aleatori discret. Y)(X,X

Definim la funció de probabilitat del vector aleatori discret )X,...,X,(XX K21

, xpX

com

una aplicació del conjunt de vectors imatge de l’aplicació vectorial )X,...,X,(XX K21

en l’interval 1,0 ,

1,0:xp KKx

tal que

nxX

nnxPxXPxp

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-30 Curs 2.011-2.012

És a dir, és una funció definida des del conjunt de vectors imatge de l’aplicació vectorial )X,...,X,(XX K21

VECTOR A.D. cap a [0,1, i val la suma de les probabilitats dels diferents resultats que tenen una imatge comuna nx .

En el cas particular d’un parell aleatori discret Y)(X,X

, 1,0:y,xp 22XY

Exemple: Quina és la funció de probabilitat conjunta pel parell definit a partir de l’experiència del llançament simultani de 2 daus: X-“Suma dels valors” i Y-“Diferència absoluta dels valors”.

X/Y 0 1 2 3 4 5 xpX

2 1/36 0 0 0 0 0 1/36 3 0 2/36 0 0 0 0 2/36 4 1/36 2/36 0 0 0 3/36 5 0 2/36 0 2/36 0 0 4/36 6 1/36 0 2/36 0 2/36 0 5/36 7 0 2/36 0 2/36 0 2/36 6/36 8 1/36 0 2/36 0 2/36 0 5/36 9 0 2/36 0 2/36 0 0 4/36

10 1/36 0 2/36 0 0 0 3/36 11 0 2/36 0 0 0 0 2/36 12 1/36 0 0 0 0 0 1/36

ypY 6/36 10/36 8/36 6/36 4/36 2/36 /36

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-31 Curs 2.011-2.012

j jjXYj

jjX

yxpyYxX

yYxXxXxp

,

2.3-3.8.1 Funció de probabilitat marginal

Sigui el cas particular d’un parell aleatori discret Y)(X,X

,

y=Y,x=X P=y)(x,pXY

A partir de la funció de probabilitat conjunta del parell aleatori discret Y)(X,X

es pot determinar la funció de probabilitat de cadascuna de les variables aleatòries discretes que

constitueixen Y)(X,X

, denominades funcions de probabilitat marginal de X i de Y,

xpX i ypY

2.3-3.9 Definició Independència de 2 VADs

X i Y variables aleatòries discretes són independents si i només si

p x yXY ( , ) = p xX ( ) . p y x yY ( ) ,

Interpretació

i iiXYi

iiY

yxpyYxX

yYxXyYyp

,

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-32 Curs 2.011-2.012

X i Y són independents si el coneixement d’una de les variables no aporta informació sobre l’altra variable.

Definició d’Independència Mútua en un Vector Aleatori Discret

Sigui

X X X K 1 , , un vector aleatori discret de dimensió K. Les variables són mutuament independents si i només si ,

p x x p x p xX X i i X i X iK K K K1 1 1 1 ( , , ) ( ) ( )

2.3-3.10 Esperança de funcions sobre vectors aleatoris discrets

Sigui un vector a.d. )X,...,X,(XX K21

de dimensió K, on Xi són VADs.

Sigui una funció definida K :h on a cada vector Kx

li fa correspondre un valor

real: xh .

L’esperança matemàtica de la funció n : h aplicada sobre els vectors imatge de l’aplicació vector aleatori discret )X,...,X,(XX K21

és,

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-33 Curs 2.011-2.012

1 2

K1x x

K1X,..,XK1

XK1

)x,..,(xp)x,..,(x...

)x(p)x(X,...,XEXE

Kx

x

h

hhh

Per k=2, es té

i j

jiXYii ).y,(xp)y,(xYX,EXE hhh

En general :

En general :

K

1kk

K

1kk XEXE si X1,...,XK mútuament independents.

En general :

K

1kk

2k

K

1kkk XVaXaV ARAR si X1,...,XK mútuament independents.

YXCOVYVARXVARYXVARYXYXh

,2E)YX,(EZE 2

conegudesconstantsaon k , ,XEaXaEK

1kkk

K

1kkk

K

1kk

K

1kk XEXE

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-34 Curs 2.011-2.012

En l’estudi de les propietats de la variança de funcions del parell de variables X i Y, l’expressió de la variança de la suma requereix d’un nou moment: la covariança entre dues variables.

La covariança és una mesura de la relació lineal entre dues variables i té per expressió: Cov(X,Y) = E((X-E(X)(Y-E(Y)) =

( ( )) ( ( )) ( , )x E X y E Y p x yi j XY i jyx ji

Definició de Variables No Correlacionades

X i Y són no correlacionades si i només si Cov(X,Y) = 0.

Les propietats principals de la covariança són les següents:

1. Cov(X,Y) = E(X.Y) - E(X).E(Y)

2. Si X i Y són independents llavors Cov(X,Y) = 0.

3. Si 2211 YWiXZ llavors Cov Z W Cov X Y( , ) ( , ) 1 2 .

La segona propietat ilustra el fet que dues variables independents són no correlacionades; no obstant, cal notar que la implicació no és vàlida en el sentit invers:

Si X i Y són no correlacionades X i Y independents

L’última de les propietats ilustrada indica que la magnitut de la covariança depèn de les unitats en què es defineixen les variables i d’aquí sorgeix la necessitat de definir una mesura de la relació

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-35 Curs 2.011-2.012

lineal de caràcter adimensional, amb el que arribem a la definició del coeficient de correlació lineal:

YVaryXVarambYXCovYX YXYX

,,

Propietats principals del coeficient de correlació lineal X Y, :

X Y, pren valors en l’interval 1 1, .

X Y, > 0 si existeix una relació lineal positiva entre X i Y, és a dir, a valors creixents de X s’observen valors creixents de Y.

X Y, < 0 si existeix una relació lineal negativa entre X i Y, és a dir, a valors creixents de X s’observen valor decreixents de Y.

X Y, = 0 si les variables són no correlacionades.

Si Y = aX + b llavors X Y, 1 .

2.3-3.11 Exemples de Variables Aleatòries Discretes

Procés de Bernoulli:

S’anomena un procés de Bernouli a una seqüència de repeticions d’un experiment aleatori simple que cumpleix:

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-36 Curs 2.011-2.012

1. Cada experiència aleatòria té dos possibles resultats (cert/fals, èxit/fracàs,..., genèricament

A/B): BA ,

2. Al llarg de les repeticions, les probabilitats són constants: P(A) = p i P(B)=1-p = q.

3. Hi ha independència estadística dels resultats al llarg de les repeticions. 2.3-3.11.1 Llei de Bernoulli

Sigui la variable aleatòria discreta X definida com,

X: Nb d’aparicions de classe A en 1 repetició d’una prova de Bernoulli simple

El conjunt fonamental és BA , .

L’aplicació variable aleatòria X sobre el conjunt fonamental és,

1,0 i 0 1 BA XX

A partir d’aquí es poden deduir fàcilment les funcions de probabilitat i de distribució.

pp

ppqppxpx

qpXp

Xp

iii

A

B

1XVAR

10)1(1)0(0)(XE

1(1)F(0)F

P1P(1)qp)(1P0P(0)

XX

2

1X

X

X

X

X

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-37 Curs 2.011-2.012

2.3-3.11.2 Llei Binomial de paràmetres n i p

Un procés binomial de paràmetres n i p és la repetició de n experiències d’un procés de Bernoulli de paràmetre p.

Sigui Yn: Nombre d’aparicions de classe A en la seqüència de n.

Notada com p)B(n,Y n .

El conjunt fonamental de l’experiència aleatòria repetició del procés de Bernoulli bàsic i comptar les classes A és,

nitqYYYYY in 0 ,,,,,,, 210321

On iY denota el succés format per tots els successos elementals que gaudeixen de l’aparició de i classes A en les n repeticions del procés de Bernoulli bàsic.

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-38 Curs 2.011-2.012

L’aplicació variable aleatòria Yn sobre el conjunt fonamental és,

nkYY kn ,...,2,1,0 i

Ara bé la cardinalitat de kY és el nombre de combinacions de n elements de dos possibles valors

agafats en grups de k valors i n-k valors: !!!

knkn

kn

i totes elles són equiprobables, cadascuna

de probabilitat knk pp 1 , per tant,

knk

knk

kn pp

knknBBAA

kn

YkY

1

!!!

En la terminologia habitual, per pnBX ,

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-39 Curs 2.011-2.012

ppn

pn

pp

kn

kXp

ini

1XVARXE

nx1

nx01in

0x0

(x)F

p)(1pP(k)

x

0iX

k-nkX

:x Enter més gran inferior o igual a x. Ex: 77.3 .

La funció binomial cumpleix les propietats:

X B(n,p) i X B(n,1 p), P(X k) P(X n k)1 2 1 2

X B(n ,p) i X B(n ,p), X X B(n n ,p)1 1 2 2 1 2 1 2

A l’hora de mirar distribucions binomials, usarem les taules. De quina manera estan expressades les taules?

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-40 Curs 2.011-2.012

)p'n,1,-k-B(n-1=k) P(X )p'n,1,-k-B(n-)p'n,k,-B(n=k)-n=P(X'=k)= P(X

p-1=p' )p'B(n,X' 0'5>p Sip)n,B(k,=k)X P(

p)n,1,-B(k-p)n,B(k,=k)= P(X 20...n Si0'5.a 0'05 de pper i 20,<nper expressat Nomes p)n,B(k,(k) F

p)n,b(k,(k) P p)B(n,X

X

X

O equivalentment, 1'1' knXPknXPkXP Per gràfics de VAD Binomial visiteu el Web Site: http://www.kuleuven.ac.be/ucs/java/index.htm

2.3-3.11.3 Llei geomètrica

Sigui un procés de Bernoulli de paràmetre p, aleshores la variable X,

X= nº de repeticions de l’experiència fins assolir un resultat de classe A.

És una variable aleatòria discreta denominada geomètrica de paràmetre p.

Notat com X G(p)

El conjunt fonamental de l’experiència aleatòria repetició del procés de Bernoulli bàsic fins assolir una classe A és,

0|,,,,,,, 321 iABBBABBABAA i

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-41 Curs 2.011-2.012

L’aplicació variable aleatòria X sobre el conjunt fonamental és,

,...2,1 i 1 kABXX Kk

A partir d’aquí es poden deduir fàcilment les funcions de probabilitat i de distribució:

2p

p1

p1

kk

1i

1iX

1kX

XVAR

XE

q1pp)(1(k)F

pp)(1PP(k)

kkXp

2.3-3.11.4 Llei Binomial Negativa de paràmetres p i r

Sigui un procés de Bernoulli de paràmetre p, aleshores la variable X,

X= nº de repeticions de l’experiència fins assolir r resultats de classe A.

És una variable aleatòria discreta denominada binomial negativa de paràmetres r i p.

Notat com p)(r,BX n

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-42 Curs 2.011-2.012

2

k

riXX

r-kr11-k1-r

1X

2p

p1XVAR

prXE

(i)(k)F

p)(1p11

pp)(1p11

PP(k)

prqr

p

rk

rk

AYkXp

r

k

2.3-3.11.5 Llei de Poisson de paràmetre

Hi ha vegades en què apareixen successos puntuals sobre un suport continu:

1. Arribada de clients a banc (arribada de client: succés puntual, continu: temps), 2. Aparició de taques de corrosió a una tuberia (aparició de taques: succés puntual, continu:

espai).

Un procés poissonià es caracteritza per : L’aparició de successos puntuals en un suport continu; de manera que en promig, el número de

successos per interval (del continu) és un rati constant, , nombre de successos per interval.

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-43 Curs 2.011-2.012

És un procés sense memòria: en conèixer el nombre de successos observats en un interval no ajuda a predir el que apareixeran en l’interval següent

Hi ha independència en l’aparició dels successos puntuals.

Una variable discreta X de Poisson de paràmetre (X ))( modelitza en la situació anterior,

X: Nombre de successos en un interval .

El rang de valors de la VAD X és ,...,2,1,0 i és el nombre mig de successos per interval.

La llei de Poisson constitueix un cas límit de la llei Binomial quan n i 0p .

Funció de probabilitat: enter 0 x-ex!x

(x)xp

Funció de distribució: enterk 0; x(k)Xp(x)xFxk0

XE i XVAR

Les taules donen Fx(k). Si volem saber )1(kF(k)F(k)p XXX . Per gràfics de VAD Poisson visiteu el Web Site: http://www.kuleuven.ac.be/ucs/java/index.htm

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-44 Curs 2.011-2.012

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-45 Curs 2.011-2.012

2.3-3.11.6 Propietats de la llei de Poisson

Propietat aditiva: Suposem X i Y referides a la mateixa longitud d’interval d’un cert continu, )'(YX indep. YX, )'( Y)(X

Relació Binomial-Poisson: útil pel càlcul de probabilitats relacionades amb variables binomials quan n s’escapa de les taules i 0p ( < 0.1 ).

)(per Y se-aproximarot X 0 i gran ,X npppn pnB

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-46 Curs 2.011-2.012

2.3-4. VARIABLE ALEATÒRIA CONTÍNUA

Una variable aleatòria contínua (VAC) sobre un espai probabilitzat (, (), P) amb no numerable, és una funció : tal que assigna a tot succés un valor ( ), de manera que per tot nombre real x el succés x)( .

Observacions:

Mai es pot saber el valor exacte d’una variable aleatòria contínua.

Les variables aleatòries contínues, com les VAD’s, es caracteritzen per la seva funció de

distribució (F (x))X , però no tenen una funció de probabilitat xpx (ja que mai es pot saber el valor exacte). En comptes d’aquesta tenim una funció de densitat de probabilitat (x)Xf , que és la derivada de la funció de distribució.

En v.a.d. teníem que la funció de distribució representava la noció de probabilitat acumulada, en contínua és el mateix concepte i per definició,

xxXP(x)FX X VAC

La funció densitat de probabilitat de X VAC (fdp) és la derivada respecte la variable de la funció de distribució de probabilitat, és a dir,

dxdFf (x)(x) X

X x

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-47 Curs 2.011-2.012

De manera que la funció de distribució avaluada al punt real x pot determinar-se com la integral definida entre i x de la funció densitat de probabilitat (fdp):

x

-XX dt (t)(x)F f

x

Per un punt donat FX(x) és precisament l’àrea que tanca fX(x) des de - fins a aquest punt. Anàlogament a variable aleatòria discreta, a contínua també tenim moments: esperança, variança, covariança...

Propietats dels moments en VAD segueixen essent vàlides:

YEXEYXE

bXaEbaXE …

22 XEXEXVAR

YXCOVYVARXVARYXVAR ,2

XVARabaXVAR 2 …

dttftXE X

dttftgXgE X:g

dttfXEtXVAR X2

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-48 Curs 2.011-2.012

YEXEYXEYXCOV ,

2.3-4.1 Algunes variables aleatòries contínues 2.3-4.1.1 Llei uniforme U[a,b]:

Entre els diferents models (distribucions típiques) de variables aleatòries contínues n´hi ha un de molt senzill, l’uniforme a l’interval tancat ba, S’expressa com X baU , la funció de densitat de probabilitat és:

altrament0

ba,x si (x) ab

1

Xf

La funció de distribució és 0 fins a a, recta amb pendent 1

b a en l’interval a, b i 1 a partir de b. Gràficament, les dues funcions són:

a b

1b a

1

fX ( x )

m 1b a

FX (x) 1

a b

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-49 Curs 2.011-2.012

Per gràfics de VAC Uniforme visiteu el Web Site: http://www.kuleuven.ac.be/ucs/java/index.htm La funció de distribució i els moments bàsics són:

12a)(b22

a)3(bab2

2ab

a)2(ba)a)(b(b

a)2(ba

a)2(bbb

aa)2(bt

b

aa-b

dtt X

abaxx

aabt

x

aab

dtx

-XX

2

33

222

XEXEVAR(X)

XE

=dt (t)tXE

=dt (t)(x)F

f

bxaf

2.3-4.1.2 Llei exponencial de paràmetre )Exp(:

La distribució exponencial de paràmetre és una funció definida pels reals positius. S’expressa com

X Exp( ) i gràficament es representa:

altramentxe

xfx

X 00

funció de densitat de

xe

xe 11

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-50 Curs 2.011-2.012

La funció de distribució de probabilitat de la variable X, XF , és:

altrament

xedttfxXPxF

xx

XX 001

xexXP 0 .

L’esperança matemàtica de la variable aleatòria X és,

0

1

dtetdttftXE tX

La variança de la variable aleatòria X és,

ó

dtetXEXEXVar

dttfXEtXVar

t

X

0 22222

2

11

2.3-4.1.2.1 Propietats de les lleis exponencials

La funció densitat de probabilitat d’una variable aleatòria X, exponencial de paràmetre , xf X és una funció estrictament decreixent en x.

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-51 Curs 2.011-2.012

La distribució de probabilitat exponencial gaudeix de la propietat d’absència de memòria que pot formular-se en termes matemàtics com,

xXPxX

xxXP

per 0, xx ,

La propietat d'absència de memòria és una característica exclusiva de la distribució exponencial: cap altre distribució de probabilitats per una variable aleatòria contínua gaudeix d'aquesta característica.

Precisament per la seva singularitat, en intentar interpretar-la a la realitat s'arriba a conclusions que, pel sentit comú de les persones, semblen paradoxes.

Si la funció densitat de probabilitat de la variable aleatòria T, temps entre incidents (arribades o sortides d’un sistema) és exponencial de paràmetre , aleshores la variable aleatòria X definida com el nombre d’incidents en un interval fix t,0 segueix una distribució de Poisson de paràmetre

t .

És a dir, tX on tnn

X ente

nnf

!! i tXVarXE .

La interpretació del paràmetre és la taxa mitjana d’incidents per unitat de temps .

Sigui el succés A definit com que no arribi cap incident en el interval t,0 , calculem la seva probabilitat a partir de la definició de la variable X,

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-52 Curs 2.011-2.012

tttX eeetfXPAP

11

!000

0

Ara bé en termes de la variable T, tetTPtTPAP 1 .

Òbviament, el càlcul de probabilitat del succés A pren el mateix valor.

La variable aleatòria U definida com el mínim d’un conjunt de n variables aleatòries independents i exponencials nTT ,,1 , de paràmetres respectius n ,,1 , segueix una llei exponencial de

paràmetre

n

ii

1 .

És a dir, nTTMinU ,,1 i per tant la funció de distribució de U pot expressar-se com,

tttt

nnU

eeee

tTPtTPtTtTPtUPtUPtFn

i in

111

1,,1111

11

2.3-4.1.3 La distribució k-Erlang

Exemple: Una estació de servei té un únic servidor on una operació de servei consistent en una sèrie de k etapes consecutives i fins que no ha finalitzat amb la última etapa de les k etapes pel client amb el que està ocupat no passa a ocupar-se del següent client de la cua.

A més a més que el temps Ti de cada etapa de servei i és una variable aleatòria que és

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-53 Curs 2.011-2.012

independent dels altres temps de servei de la resta d'etapes i es distribueix exponencialment amb paràmetre o taxa de servei . k comú per totes les etapes de servei.

El temps total de servei T serà doncs una variable aleatòria i pot expressar-se com la suma dels temps de servei de les k etapes:

k

iiTT

1

En aquestes condicions la variable aleatòria T es distribueix segons la llei de probabilitats k-Erlang (o Erlang de paràmetres k, ) que presenta la següent funció de distribució:

0, 0per !

11

0

ktitketTPtF

k

i

itk

T

i la funció densitat de probabilitat:

0per

!11

tt

kketF

dtdtf k

ktk

TT

.

L’esperança matemàtica i la variança de la variable aleatòria T d’Erlang de paràmetres i k són:

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-54 Curs 2.011-2.012

2

22

1

111

k

VarVarTVarkkTT k

111

1

kkTETETE k ;

Així doncs la relació entre la desviació tipus i l'esperança matemàtica és sempre inferior a la unitat per k > 1 :

1 si 11

2/1

2/1

kkTE

TVar

Una representació gràfica de la funció de densitat de probabilitat per la distribució k-Erlang per diferents valors dels paràmetres k, però mantenint-se = 1, ve donada en la següent figura:

2.3-4.1.4 Llei Normal de paràmetres i 2

Notat 2,NX , X VAC que pot pendre qualsevol valor real amb una funció densitat de

probabilitat,

xexf

x

X2

2

21

21

Per gràfics de VAC Uniforme visiteu el Web Site: http://www.kuleuven.ac.be/ucs/java/index.htm

k=1

k=2

k=10

k=20

1 t

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-55 Curs 2.011-2.012

Passar de la normal estàndard 1,0 2 NX a la Normal 22 2,0 NX : canvi d’escala.

Passar de la normal estàndard 1,0 2 NX a 1,1 2 NX : canvi de posició, escala idèntica.

La funció de distribució de 2,NX no té una expressió analítica:

x

-XX dt (t)(x)F f

x

Per tant està tabulada pel cas particular 0 i 12 , coneguda com la llei normal 1,0 2 NZ estàndard.

Les taules faciliten la informació per poder calcular si 2,NX :

xFxXP X i 1221 xFxFxXxP XX

Propietats de 2,NX :

XE

2XVAR . és el punt d’inflexió de la fdp.

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-56 Curs 2.011-2.012

Funció densitat de probabilitat simètrica: XE = Mediana, el que implica

01 XX FF

XF

XF1

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-57 Curs 2.011-2.012

Percentils:

68.0 XP

95.022 XP

997.033 XP

Distribució estàndard 1,0 2 NZ

Tabulada la seva funció de distribució de probabilitat per valors z >0:

zdtezF

z t

Z

2

21

21

Per la propietat de simetria es poden calcular probabilitats acumulades de valors negatius, si 0 :

011 ZPFFZP ZZ

Si 2,NX llavors la variable

XZ està distribuïda com una normal estàndard,

1,0 2 NZ .

xFxZPxXPxXP Z

La tipificació permet d’emprar les taules de la normal estàndard pel càlcul de probabilitats de

qualsevol variable normal 2,NX .

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-58 Curs 2.011-2.012

2.3-4.1.5 Transformacions lineals de v.a. normals

Siguin nXXX ,,, 21 v.a. normals mútuament independents i amb distribucions respectives 2, iii NX i=1,…n, llavors la variable S definida com,

n

iii XbaS

1

està distribuïda 2,NS amb

n

iiiba

1

i 2

1

22i

n

iib

.

Si nXXX ,,, 21 no són mútuament independents llavors 2,NS , però

n

iiiba

1

i

n

i

n

jjiji XXCOVbb

1 1

2 ,

2.3-4.2 Aproximacions: B(n,p) ( = n·p)

si (p<0’1 i n>100 ) o np(1-p) < 5

B(n,p) N ( n·p, 2 n·p·(1-p))

si n·p·(1-p)>5

El que fem és = n·p i 2 = n·p·(1-p)

() N(, )

si >5 El que fem és = i 2 = .

Models de Captació, Anàlisi i Interpretació de Dades – MASTER LTM - UPC

Prof. Lídia Montero © Pàg. 2.3-59 Curs 2.011-2.012

2.3-4.3 Desigualtat de Txebitxev

Sigui X una VAC d’esperança matemàtica i variança 2 llavors, 0

2

2

1 XPXP

2.3-4.4 Teorema Central del Límit

Siguin nXXX ,,, 21 v.a. mútuament independents i amb distribucions d’esperança comuna i variança

comuna 2 llavors la variable nZ , suma de les anteriors centrada i reduïda, convergeix per n gran a una

distribució 1,0 2 N ,

1,01 Nn

nXZ n

n

ii

n

Alternativament, la variable nS , suma de les anteriors, convergeix per n gran a una distribució 2, nnN .

En general, si nXXX ,,, 21 són v.a. mútuament independents de llei qualsevol d’esperança respectiva i

i variança respectiva 2i , la variable nS , suma de les anteriors, convergeix per n gran a una distribució

2,N amb

n

ii

1

i 2

1

2i

n

i

.