Modelado estadistico (1)
-
Upload
charlys123 -
Category
Documents
-
view
221 -
download
0
Transcript of Modelado estadistico (1)
-
7/22/2019 Modelado estadistico (1)
1/68
MODELADO ESTADSTICO
06/03/2014 1
Por modelado estadstico se entiendeestablecer qu tipo de distribucin deprobabilidad sigue una variable aleatoriaque se quiere caracterizar:Distribucin de tiempo entre llegadas de lasllamadas o del servicio.
-
7/22/2019 Modelado estadistico (1)
2/68
Teora de Trfico. Henry Lamos Diaz.UIS-UNAB
2
-
7/22/2019 Modelado estadistico (1)
3/68
Distribucin probabilstica binomial
La distribucin binomialtiene lassiguientes caractersticas: un resultado de un experimento se clasifica en una de
dos categoras mutuamente excluyentes -xito ofracaso.
los datos recolectados son resultados de contar.
la probabilidad de xito es la misma para cada ensayo.
los ensayos son independientes.
6-18
06/03/2014 3
-
7/22/2019 Modelado estadistico (1)
4/68
-
7/22/2019 Modelado estadistico (1)
5/68
Distribucin probabilstica binomial
La frmula para la distribucin deprobabilidad binomial es:
P xn
x n xx n x( )
!
!( )!( )
1
6-20
06/03/2014 5
-
7/22/2019 Modelado estadistico (1)
6/68
EJEMPLO 3
La UIS reporta que 20% de los egresados estndesempleados. De una muestra de 14egresados, calcule la probabilidad de
encontrar tres desempleados :
tres estn desempleados: P(x=3)=.250
6-21
06/03/2014 6
-
7/22/2019 Modelado estadistico (1)
7/68
EJEMPLO 3 continuacin
Nota:stos tambin son ejemplos dedistribuciones probabilsticas acumulativas:
tres o ms estn desempleados:
P(x3)=.250 +.172 +.086 +.032+.009 +.002=.551
al menos un egresado est desempleado: P(x1) = 1 - P(x=0) =1 - .044 = .956
a lo ms dos egresados estn desem-pleados:P(x 2)=.044 +.154 +.250
=.448
6-22
06/03/2014 7
-
7/22/2019 Modelado estadistico (1)
8/68
Media y varianza de la distribucinbinomial
La mediaest dada por:
La varianzaest dada por:
n
2 1 n ( )
6-23
06/03/2014 8
-
7/22/2019 Modelado estadistico (1)
9/68
Distribucin binomial para nigual a 3 y 20,donde =.50
7-20
n=3
0
0,1
0,2
0,3
0,4
0 1 2 3
nmero de eventos
P(x)
n=20
0
0,05
0,1
0,15
0,2
2 4 6 8 10 12 14 16 18 20
n m e r o d e e v e n t o s
P
(x)
06/03/2014 9
-
7/22/2019 Modelado estadistico (1)
10/68
Distribucin binomial negativa
En relacin con ensayos de Bernoullirepetidos, nos interesa el nmero deensayos en el cual ocurre el k-simo exito: La probabilidad de que el dcimo nio expuesto a una
enfermedad ser el tercero en contagiarse.
la probabilidad de que la quinta persona en escuchar unrumor ser la primera en creerlo.
La probabilidad de sorprender un ladrn por segundavez en su octavo robo.
6-18
06/03/2014 10
-
7/22/2019 Modelado estadistico (1)
11/68
Distribucin binomial negativa
Si el ksimo xito va a ocurrir en el ensayoxsimo, debe haber k-1 xitos en los primerox-1 ensayos, y la probabilidad para esto es
Para elaborar una distribucin binomial, sea
kx1k
)1(1k
1x
);1x;1k(b
6-19
06/03/2014 11
-
7/22/2019 Modelado estadistico (1)
12/68
Distribucin binomial negativa
La probabilidad de un xito en el xsimoensayo es , y la probabilidad de que elksimo xito ocurra en el ensayo xsimo es,
por consiguiente:
6-20
06/03/2014 12
kxk
)1(1k
1x
);1x;1k(b.
-
7/22/2019 Modelado estadistico (1)
13/68
6 20
-
7/22/2019 Modelado estadistico (1)
14/68
Ejemplo
Si la probabilidad es 0.40 de que un nioexpuesto a una enfermedad contagiosa lacontraiga, cul es la probabilidad de que el
dcimo nio expuesto a la enfermedad ser eltercero en contrarela?
6-20
06/03/2014 14
0645.0)4.01(4.02
9
)4.0,3,10(b
73*
6 20
-
7/22/2019 Modelado estadistico (1)
15/68
Distribucin binomial negativa
La media y la varianza de
6-20
06/03/2014 15
)11(k,k 2
6 20
-
7/22/2019 Modelado estadistico (1)
16/68
Una binomial negativa constituye unasuma de variables aleatorias geomtricas
Suponga que una secuencia de ocho ensayosde Bernoulli independientes, cada uno conprobabilidad de xito , aparece de la
siguiente manera FFSFSFFS. Si X es el nmero de ensayos incluyendo al
tercer xito, entonces
6-20
06/03/2014 16
),8,3(*bX
-
7/22/2019 Modelado estadistico (1)
17/68
06/03/2014 17
Modelo Poisson
Los eventos de llegadasse modelan como
independientes, dichoseventos son producidos
por un gran # de clientes
Hay nico parmetro de ( velocidad media )
Correlaciones son fugaces y los bursts son limitados
La agregacin de trfico tiende a suavizarserpidamente
Esto implica (Si asumimosun modelo de Poisson):
-
7/22/2019 Modelado estadistico (1)
18/68
PROCESO DE POISSONSe diceque el
procesode conteoX(t) es
unproceso
dePoisson
si
1. El nmerode
ocurrencias
duranteintervalos detiempos
disjuntos sonvariablesaleatorias
independientes.
2. Procesotiene
incrementosindependient
es.
3. Si h es unintervalo de
tiempo
suficientementepequeo,entonces la
probabilidad deque ocurra unallegada en este
intervalo esproporcional a h.
( h + o(h))
4. Laprobabilidadde obtenerdos o ms
ocurrencia enel intervalode tiempo h
esdespreciable.
-
7/22/2019 Modelado estadistico (1)
19/68
19
06/03/2014
Tipos de procesos
Incrementos independientes: los cambios en elvalor del proceso en intervalos de tiempo disjuntos,
son independientes.
),()(
),()(
),()(
discretosestadosdeespaciode),(
1
12
1
nn
o
tXtX
tXtX
tXtX
TttX
SON VARIABLES
INDEPENDIENTES
-
7/22/2019 Modelado estadistico (1)
20/68
20
Funcin densidad de probabilidad, PDF (Probability density
function )
Poisson esta categorizado, por un parmetro . La agregacin de trfico de Poisson es tambin Poisson
Poisson
Pn(t) = et
(t)n
n!
Poisson
PoissonPoisson
Poisson
=> Poisson
06/03/2014
-
7/22/2019 Modelado estadistico (1)
21/68
21
t)[0,peridoeldurantellegadasdeNmero
t
2tt
2t
t
X
XEXEXVar
t)X(E
m]XE[)XVar(Burstiness
t
t
06/03/2014
-
7/22/2019 Modelado estadistico (1)
22/68
APLICACIONES
La distribucin de Poisson es un buenmodelo para representar el nmero deveces que un evento sucede, por unidad detiempo o espacio.
Nmero de clientes que llegan a unaestacin de servicio, durante un minuto.
Nmero de reclamaciones contra unacompaa de seguros, durante una semanadeterminada.
06/03/2014 22
-
7/22/2019 Modelado estadistico (1)
23/68
06/03/2014 2323
Proceso de tiempo entre
llegadas, caso discreto.
Proceso de Bernoulli Para un proceso de Bernoulli de modelacin
de llegadas durante un slot (tiempo) se tiene
0llegada)1(Prob
1llegadas)0(Prob
llegada)1(Prob
,...,....,X
0
1
21
pp
pp
XX n
-
7/22/2019 Modelado estadistico (1)
24/68
06/03/2014 2424
)()|(
,yracualesquiepositivosenterosdosParaTeorema.
,)(,1
)(
,..2,1,)(
Adeocurrenciaprimeralaincluirhasta
necesariasesrepeticiondenmero
2
1
tTPsTtsTP
ts
p
qTVar
pTE
kpqkTP
T
k
La Distribucin Geomtrica. Suponga que se efecta un
experimento y se esta interesado slo en la ocurrencia o
no ocurrencia de algn evento A.
-
7/22/2019 Modelado estadistico (1)
25/68
06/03/2014 2525
Interpretacin.
No hay memoria, esto si el evento A no haocurrido durante las primeras repeticionesdel experimento, entonces la probabilidad de
no ocurra durante las prximas t repeticioneses la misma que la probabilidad de no ocurradurante las primeras t repeticiones. En otraspalabras, la informacin de ningn xito esolvidada en lo que se refiere a clculossubsecuentes.
6-26
-
7/22/2019 Modelado estadistico (1)
26/68
Distribucin hipergeomtrica
Frmula:
donde Nes el tamao de la poblacin, Ses el nmero de xitos en la poblacin,x
es el nmero de xitos de inters, nes eltamao de la muestra, y Ces unacombinacin.
P xC C
C
S x N S n x
N n
( )( )( )
6 26
6-27
-
7/22/2019 Modelado estadistico (1)
27/68
Distribucin hipergeomtrica
Use la distribucin hipergeomtricaparaencontrar la probabilidad de un nmeroespecfico de xitos o fracasos si:
la muestra se selecciona de una poblacinfinita sin reemplazo (recuerde que un criteriopara la distribucin binomial es que laprobabilidad de xito es la misma de un ensayoa otro).
el tamao de la muestra nes mayor que5% del tamao de la poblacin N.
6 27
6-28
-
7/22/2019 Modelado estadistico (1)
28/68
EJEMPLO 5
Aerocivil tiene una lista de 10 violaciones a laseguridad reportadas por ValueJet. Suponga
que slo 4 de ellas son en realidad violacionesy que el Safety Board slo podr investigarcinco de las violaciones. Cul es la
probabilidad de que tres de las cincoviolaciones seleccionadas al azar parainvestigarlas sean en realidad violaciones?
6-29
-
7/22/2019 Modelado estadistico (1)
29/68
EJEMPLO 5 continuacin
PC C
C
( )* *
.34 15
252
2384 3 6 2
10 5
N=10
S=4x=3n=5
-
7/22/2019 Modelado estadistico (1)
30/68
Distribucin multinomial
06/03/2014 30
1nxin,..,1,0x
x..x,..x,x
n
),..,,;x,..x,x(f
k
1i
i
k
1i
ii
x
k
x
2
x
1
k21
k21k21 k21
ydonde,cadaparacadapara
Las variables aleatorias X1, X2,..Xk tienen una distribucinmultinomial y se conocen como variables aleatorias multinomiales
si y slo si du distribucin de probabilidad conjunta esta dada por
-
7/22/2019 Modelado estadistico (1)
31/68
MODELADO MEDIANTE VARIABLESALEATORIAS CONTINUAS
06/03/2014 31
-
7/22/2019 Modelado estadistico (1)
32/68
06/03/2014 32
proceso?este
tieneadprobabiliddendistribuciQugadas.
lleentretiempoelejemplo,porsucesivos,eventosentretiempoelcomoaleatoriavariableuna
definimospoisson;deprocesounaAsociado
-
7/22/2019 Modelado estadistico (1)
33/68
DISTRIBUCION EXPONENCIAL
Si un proceso de llegada a un sistema sepuede modelar mediante un proceso de
Poisson, entonces el tiempo entre llegadas
se modela mediante una variable aleatoriallamada exponencial. En otras palabras, si
es el nmero promedio de eventos
independientes de Poisson que ocurren por
unidad de tiempo, entonces 1/ es el tiempo
promedio entre dos eventos sucesivos.
3306/03/2014
-
7/22/2019 Modelado estadistico (1)
34/68
34
0,0
0,)(
Taleatoriavariable
ladeprobilidaddedensidaddefuncinLa
t
tetf
t
El valor esperado y varianza son
2
1)var(,
1)( XXE Burstiness?
06/03/2014
-
7/22/2019 Modelado estadistico (1)
35/68
3535
t
t
to
etfetTtF
etptT
ttNtT
)(1)Pr()(
)()Pr(
tiempoelenllegadashayno0)(
1
1
1
2deprobabdendistribucilaDeducirEjercicio. X11 tT
12112 || tttTT
t
06/03/2014
-
7/22/2019 Modelado estadistico (1)
36/68
DISTRIBUCION EXPONENCIAL
La distribucin exponencial es til para
modelar el tiempo que transcurre entredos ocurrencias consecutivas de un
evento.
Tiempo entre dos fallas sucesivas deun componente electrnico.
Tiempo entre dos llegadas sucesivasde clientes a una estacin de servicio.
06/03/2014 36
-
7/22/2019 Modelado estadistico (1)
37/68
06/03/2014 373737
PROCESO SIN MEMORIA
T es una variable aleatoria con distribucin exponencial,con parmetro, entonces
Es decir, T pierde la memoria.
En trminos del proceso de llegadas Poisson la propiedad sin
memoria significa que la distribucin del tiempo hasta lasiguiente llegada es la misma no importa cual es el punto enque nosotros nos encontramos
),()|( 11 tTPtTttTP oo
-
7/22/2019 Modelado estadistico (1)
38/68
A la propiedad de ladistribucin exponencial se
le llama prd id a de memoria,es decir, lo que ocurra deaqu en adelante, no esafectado por lo que haocurrido hasta ahora.
La distribucin exponencial
es la nica distribucincontinua que posee estapropiedad.
06/03/2014 38
-
7/22/2019 Modelado estadistico (1)
39/68
RELACIN ENTRE POISSONY EXPONENCIAL
Si el nmero de ocurrencias de un eventoobedece una distribucin de Poisson con
parmetro , entonces el tiempo entre dosllegadas sucesivas del evento obedece unadistribucin exponencial con parmetro y
viceversa.
06/03/2014 39
-
7/22/2019 Modelado estadistico (1)
40/68
06/03/2014
jR
,3
4)(
o
j
m
j
p
jj
RRRRE
,18
))(()(
)(
2 m
j
o
j
p
j
m
j
p
j
o
j
j
RRRRRR
RVar
VARIABLE ALEATORIA TRIANGULAR
40
-
7/22/2019 Modelado estadistico (1)
41/68
06/03/2014
x
xxn -para,
2
1exp
2
1),;(
2
VARIABLE ALEATORIA NORMAL
Una variable aleatoria tiene una distribucin normal
y se conoce como una variable aleatoria normal
si y slo si su densidad de probabilidad esta dada por:
41
7-3
-
7/22/2019 Modelado estadistico (1)
42/68
Caractersticas de una v.a normal
La curva normal tieneforma de campanacon un solopico justo en el centro de la distribucin.
La media, mediana y moda de la distribucinaritmtica son iguales y se localizan en el pico.
La mitad del rea bajo la curva est a la derecha delpico, y la otra mitad est a la izquierda.
06/03/2014 42
7-4
-
7/22/2019 Modelado estadistico (1)
43/68
Cont.
La distribucin normal es simtrica respecto a sumedia.
La distribucin normal es asinttica- la curva seacerca cada vez ms al ejexpero en realidad nunca
llega a tocarlo.
06/03/2014 43
r
a l
i
t
r b u i
o n :
= 0
2 = 1
-
7/22/2019 Modelado estadistico (1)
44/68
- 5
0 . 4
0 . 3
0 . 2
0 . 1
. 0
x
f
(
x
r a l i t r b u i o n : = 0 , = 1
Caractersticas de una distribucin normal
La media, mediana y
moda son iguales
La curva
normal es
simtrica
En teora,
la curva se
extiende hasta
infinito
a
06/03/2014 44
7-6
-
7/22/2019 Modelado estadistico (1)
45/68
V.a normal estndar
Una distribucin normal que tiene media igual a 0 ydesvicin estndar igual a 1 se denominadistribucin normal estndar.
Valor z:la distancia entre un valor seleccionado,designado comoX, y la poblacin media , divididaentre la desviacin estndar de la poblacin ,
X
z
06/03/2014 45
7-7
-
7/22/2019 Modelado estadistico (1)
46/68
EJEMPLO 1
El ingreso mensual que una corporacin grande ofrecea los recin graduados en Ing Financiera tiene unadistribucin normal con media de $2000 y desviacinestndar de $200. Cul es el valor zpara un ingreso
de $2200? y cul para uno de $1700? ParaX = $2200, z= (2200 - 2000) /200
= 1.
06/03/2014 46
7-8
-
7/22/2019 Modelado estadistico (1)
47/68
EJEMPLO 1 continuacin
ParaX = $1700, z= (1700 - 2000) /200= - 1.5
Un valorzigual a 1 indica que el valor de $2200 esmayor que la desviacin estndar de la media de
$2000, as como elvalor zigual a -1.5 indica que elvalor de $1700 es menor que la desviciacin estndarde la media de $2000.
06/03/2014 47
7-9
-
7/22/2019 Modelado estadistico (1)
48/68
reas bajo la curva normal
Cerca de 68% del rea bajo la curva normal est amenos de una desviacin estndar respecto a lamedia.
Alrededor de 95% est a menos de dos desviacionesestndar de la media.
99.74% est a menos de tres desviaciones estndar dela media.
1
2
3
06/03/2014 48
r
a l
i
t
r
b u i
o n :
= 0 ,
2 = 1
-
7/22/2019 Modelado estadistico (1)
49/68
- 5
0 . 4
0 . 3
0 . 2
0 . 1
. 0
x
f
(
x
reas bajo la curva normal
1
2
3 1
2
3
Entre:
1.68.26%2.95.44%
3.99.74%
06/03/2014 49
7-11
-
7/22/2019 Modelado estadistico (1)
50/68
EJEMPLO 2
El consumo de agua diario por persona en
Bucaramanga tiene una distribucin normal conmedia de 20 galones y desviacin estndar de 5galones.
Cerca de 68% del consumo de agua diario porpersona en Bucaramanga est entre cules dosvalores.
Esto es, cerca de 68% del consumo diario de agua
est entre 15 y 25 galones.
).5(1201
06/03/2014 50
7-12
-
7/22/2019 Modelado estadistico (1)
51/68
Cul es la probabilidad de que una persona deBucaramanga seleccionada al azar use menos de 20galones por da?
El valor zasociado es z = (20 - 20) /5 = 0. As, P(X
-
7/22/2019 Modelado estadistico (1)
52/68
Ejemplo Usted tiene la oportunidad de comprar un proyecto que
produce al final de los aos 1 a 5 los siguientes flujosde efectivo (aleatorios): El flujo de efectivo al final del
ao 1 es normal con media 1 000 y desviacin estndar
200. Calcular la probabilidad de que el flujo del primer
ao sea mayor a 1200. Calcular la probabilidad que elflujo este entre 850 y 1450.
Calcular la probabilidad que el flujo sea mayor a 1980.
Cul es el valor zpara un flujo 1000? y cul para unode $1700?
06/03/2014 52
-
7/22/2019 Modelado estadistico (1)
53/68
06/03/2014 53
7-9
-
7/22/2019 Modelado estadistico (1)
54/68
reas bajo la curva normal
Cerca de 68% del rea bajo la curva normal est amenos de una desviacin estndar respecto a lamedia.
Alrededor de 95% est a menos de dos desviacionesestndar de la media.
99.74% est a menos de tres desviaciones estndar dela media.
1
2
3
06/03/2014 54
-
7/22/2019 Modelado estadistico (1)
55/68
Aproximacin normal a la binomial
06/03/2014 55
)p1(np
npXZ
Sea X una variable aleatoria binomial; l a forma limitante dela distribucin de
Conforme n tiende a infinito es la distribucin normal
estndar.
-
7/22/2019 Modelado estadistico (1)
56/68
Distribucin gamma
06/03/2014 56
)!1n()n(
nx
0x,dueu)x( u1x0
entoncespositivoenterounSi
La funcin gamma se define
-
7/22/2019 Modelado estadistico (1)
57/68
Distribucin gamma
06/03/2014 57
0,
0x,ex)(
1)x(f /x1
Cuando
La variable aleatoria continua X tiene una distribucingamma, con parmetros y , si su funcin de densidad est
dada por
-
7/22/2019 Modelado estadistico (1)
58/68
Forma - Alpha=3, Escala -beta=1
06/03/2014 58
-
7/22/2019 Modelado estadistico (1)
59/68
Media y varianza de X gamma
06/03/2014 59
22
La variable aleatoria continua X tiene una distribucingamma, con parmetros y , si su funcin de densidad est
dada por
-
7/22/2019 Modelado estadistico (1)
60/68
Distribucin ji cuadrada
06/03/2014 60
La variable aleatoria continua X tiene una distribucin jicuadrada, con parmetros y , si su funcin de densidad
est dada por
libertaddegradosllamado
positivo,enterounesCuando
0x,ex)2/(2
1)x(f
2,2/
2/x12/
2/
-
7/22/2019 Modelado estadistico (1)
61/68
Distribucin lognormal
06/03/2014 61
2
2
2
2
varianzaymedia
connormalesentonces,,yparmetros
connormalndistribuciunatienesiqueObservey
parmetrosconlognormalndistribucitiene
aleatoriavariablelaentonces,varianzaymediaconnormalaleatoriavariableunaXSea
YlnX
Y
.
eY
,
X
-
7/22/2019 Modelado estadistico (1)
62/68
Parmetros
06/03/2014 62
)1e(e)Yvar(
e)Y(E22
2
2
2/
Observe el pico al principio y
la larga cola. Por lo tanto, unhistograma con esta
apariencia de un conjunto de
datos empricos se podra
modelar as.
-
7/22/2019 Modelado estadistico (1)
63/68
Ejemplo
06/03/2014 63
Los precios de las acciones u otros instrumentosfinancieros con frecuencia se modelan como unadistribucin lognormal. Un inversionista estconsiderando comprar acciones en una de dos
compaas, A o B. Hoy el precio de una accin enambas compaas es de un dlar. Para la A, el valor dela accin en un ao a partir de ahora se modela comouna lognormal con parmetros miu=0.05 y sigma=0.1.Para la B, el valor de la accin en un ao a partir deahora se modela como una lognormal con parmetrosmiu=0.02 y sigma=0.2.
-
7/22/2019 Modelado estadistico (1)
64/68
Ejemplo
06/03/2014 64
a. Determine la media del precio de una accin de la compaaA en un ao a partir de ahora.
b. Determine la probabilidad de que el precio de una accin de
la compaa A en un ao a partir de ahora sea mayor a $1,20
c. Determine la media del precio de una accin de la compaaB en un ao a partir de ahora.
d. Determine la probabilidad de que el precio de una accin de
la compaa B en un ao a partir de ahora sea mayor a $1,20
-
7/22/2019 Modelado estadistico (1)
65/68
Media geomtrica
06/03/2014 65
variable.ladevaloreslosdelogaritmoslosdearitmtica
medialaaigualesgeomtricamedialadelogaritmoEl
entonces
nmeroslos
todosdeproductodelsima-nrazlaes(n)nmerosdearbitrariacantidadunadegeomtricamediaLa
3xxxx9x,3x,1x
,x..xxx
3321321
n
n21
Datos Ln(x)
1 0
3 1,09861229
9 2,19722458
1,09861229
Relacin con media y desviacin
-
7/22/2019 Modelado estadistico (1)
66/68
Relacin con media y desviacinestndar geomtrica
06/03/2014 66
La distribucin log-normal, la media geomtrica y la
desviacin estndar estn relacionadas. En este caso, la media
geomtrica es igual a
exp(esgeomtricaestndardesviacinlayexp(
))
Estimacin de los parmetros de una
-
7/22/2019 Modelado estadistico (1)
67/68
Estimacin de los parmetros de unadistribucin lognormal
06/03/2014 67
nn22
11
n2
YlnX,..YlnX
,YlnX
Y,..Y,Y
.Yln,
YlnX
Y
alogartmicescala
laaaetransformsprimerolognormal,poblacinuna
dealeatoriamuestraunaessitanto,Por
devarianzaymedia
connormalesentonces,,yparmetros
connormalndistribuciunatieneSi
1
2
2
DESIGUALDAD DE CHEBYSHEV
-
7/22/2019 Modelado estadistico (1)
68/68
06/03/2014
DESIGUALDAD DE CHEBYSHEV.
Sea X una v.a con xXE )( y sea c un nmero real cualquiera. Entonces,si 2)( cXE es finita y es cualquier nmero positivo, tenemos
2
2)(
1]|[( | cXEcXP
o bien :
2
2)(
11]|[( | cXEcXP
al elegir c obtenemos
)(1]|[( | 2 XVarXP
al elegir ,c y k 2]|[(| kkXP