1 La ley de los grandes números "El indicio de que las cosas estaban saliéndose de su cauce normal...

31
1 La ley de los grandes números "El indicio de que las cosas estaban saliéndose de su cauce normal vino una tarde de finales de la década de 1940. Simplemente lo que pasó fue que entre las siete y las nueve de aquella tarde el puente de Triborough tuvo la concentración de tráfico saliente más elevada de su historia". Comienzo del relato corto "La Ley" de Robert M.

Transcript of 1 La ley de los grandes números "El indicio de que las cosas estaban saliéndose de su cauce normal...

Page 1: 1 La ley de los grandes números "El indicio de que las cosas estaban saliéndose de su cauce normal vino una tarde de finales de la década de 1940. Simplemente.

1

La ley de los grandes números

"El indicio de que las cosas estaban saliéndose de su cauce normal vino una tarde de finales de la década de 1940. Simplemente lo que pasó fue que entre las siete y las nueve de aquella tarde el puente de Triborough tuvo la concentración de tráfico saliente más elevada de su historia".

Comienzo del relato corto "La Ley" de Robert M. Coates

Page 2: 1 La ley de los grandes números "El indicio de que las cosas estaban saliéndose de su cauce normal vino una tarde de finales de la década de 1940. Simplemente.

2

Suma de variables aleatorias discretas

Supongamos que X e Y son dos variables aleatorias discretas e independientes con funciones de distribución p1(x) y p2(y) respectivamente. Sea Z = X + Y, ¿cómo será la función de distribución de Z, p3(z)?

Puesto que el evento Z = z es la unión del par de eventos disjuntos: (X = k) e (Y = z - k), tendremos:

k

kzYPkXPzZP )()()( 213

Decimos que p3(x) es la convolución de p1(x) y p2(x):

p3(x) = p1(x) * p2(x)

Page 3: 1 La ley de los grandes números "El indicio de que las cosas estaban saliéndose de su cauce normal vino una tarde de finales de la década de 1940. Simplemente.

3

k

kjpkpjp )()()( 213

Convolución

La convolución es una operación conmutativa y asociativa.

Visto lo visto, es "fácil" demostrar por inducción cómo será la suma de n variables aleatorias independientes:

nn XXXS ...21

nnn XSS 1

teniendo en cuenta que:

Page 4: 1 La ley de los grandes números "El indicio de que las cosas estaban saliéndose de su cauce normal vino una tarde de finales de la década de 1940. Simplemente.

4

Veamos un ejemplo: Supongamos que lanzamos un dado dos veces. Sea el resultado del primer lanzamiento la variable aleatoria X1 y del segundo, la variable aleatoria X2 , ambas con la misma distribución de probabilidad que llamaremos m(x). Calculemos la función de distribución de probabilidad para S2 = X1 + X2.

k

ksXmkXmsSP )()()( 212

(....)

Page 5: 1 La ley de los grandes números "El indicio de que las cosas estaban saliéndose de su cauce normal vino una tarde de finales de la década de 1940. Simplemente.

5

Si quisiéramos calcular S3 = X1 + X2 + X3 , tendríamos:

(...)

Este es el resultado gráfico para la suma S10 de 10 dados.

Page 6: 1 La ley de los grandes números "El indicio de que las cosas estaban saliéndose de su cauce normal vino una tarde de finales de la década de 1940. Simplemente.

6

Y estos son los resultados gráficos para las sumas S20 y S30 de 20 y 30 dados, respectivamente.

Observemos que, a medida que aumenta el número de dados, tenemos una curva que se aproxima más y más a una campana de Gauss, a una normal.

Veremos por qué más adelante, cuando hablemos del teorema central del límite.

Page 7: 1 La ley de los grandes números "El indicio de que las cosas estaban saliéndose de su cauce normal vino una tarde de finales de la década de 1940. Simplemente.

7

Suma de variables aleatorias continuas

Si X e Y son dos variables aleatorias continuas e independientes con funciones densidad de probabilidad f(x) y g(x) respectivamente, la variable aleatoria Z = X + Y, tendrá como densidad de probabilidad la convolución de f y g:

dxxfxzg

dyygyzfzgf

)()(

)()())((

Page 8: 1 La ley de los grandes números "El indicio de que las cosas estaban saliéndose de su cauce normal vino una tarde de finales de la década de 1940. Simplemente.

8

Suma de dos variables aleatorias uniformesindependientes

Dos distribuciones uniformes U(0,1).

Obtenemos la densidad de probabilidad de la suma de las dos variables por convolución de sus densidades.

Page 9: 1 La ley de los grandes números "El indicio de que las cosas estaban saliéndose de su cauce normal vino una tarde de finales de la década de 1940. Simplemente.

9

1

0)()( dyyzfzf XZ

Observa que, como X e Y varían entre 0 y 1, su suma Z variará entre 0 y 2.

Page 10: 1 La ley de los grandes números "El indicio de que las cosas estaban saliéndose de su cauce normal vino una tarde de finales de la década de 1940. Simplemente.

10

Convolución de dos densidades de probabilidad uniformes U(0,1).

Page 11: 1 La ley de los grandes números "El indicio de que las cosas estaban saliéndose de su cauce normal vino una tarde de finales de la década de 1940. Simplemente.

11

Suma de dos variables aleatorias exponenciales independientes

Dos densidades de probabilidadexponenciales Exp(λ).

Obtenemos la densidad de probabilidad de la suma de las dos variables por convolución de sus densidades.

Page 12: 1 La ley de los grandes números "El indicio de que las cosas estaban saliéndose de su cauce normal vino una tarde de finales de la década de 1940. Simplemente.

12

Convolución de dos densidades de probabilidad exponenciales Exp(λ).

Page 13: 1 La ley de los grandes números "El indicio de que las cosas estaban saliéndose de su cauce normal vino una tarde de finales de la década de 1940. Simplemente.

13

Suma de dos variables aleatorias normales independientes

Dos densidades de probabilidad normalestipificadas N(0,1).

Page 14: 1 La ley de los grandes números "El indicio de que las cosas estaban saliéndose de su cauce normal vino una tarde de finales de la década de 1940. Simplemente.

14

Obtenemos la densidad de probabilidad de la suma de las dos variables por convolución de sus densidades.

Normalización de N(0, √2)

El resultado es una normal de media 0 y varianza 2, N(0,2)

Page 15: 1 La ley de los grandes números "El indicio de que las cosas estaban saliéndose de su cauce normal vino una tarde de finales de la década de 1940. Simplemente.

15

Suma de n variables aleatorias independientes

nn XXXS ...21

nnn XSS 1

Teniendo en cuenta que:

)()(212xffxf XXS

Y que:

Tendremos para n variables aleatorias independientes:

)(...)(21

xfffxfnn XXXS

Recuerda que la convolución es una operación conmutativa y asociativa.

Page 16: 1 La ley de los grandes números "El indicio de que las cosas estaban saliéndose de su cauce normal vino una tarde de finales de la década de 1940. Simplemente.

16

Suma de n uniformes

Page 17: 1 La ley de los grandes números "El indicio de que las cosas estaban saliéndose de su cauce normal vino una tarde de finales de la década de 1940. Simplemente.

17

Suma de n normales

Page 18: 1 La ley de los grandes números "El indicio de que las cosas estaban saliéndose de su cauce normal vino una tarde de finales de la década de 1940. Simplemente.

18

Suma de n exponenciales

Page 19: 1 La ley de los grandes números "El indicio de que las cosas estaban saliéndose de su cauce normal vino una tarde de finales de la década de 1940. Simplemente.

19

Teorema central del límiteEn condiciones muy generales la suma de n

variables aleatorias , independientes e idénticamente distribuidas con media μ y varianza distinta de cero σ2, tiende a la distribución normal

a medida que n tiende a infinito.

nn XXXS ...21

Otra manera de enunciarlo: bajo las mismas condiciones, si n es suficientemente grande

se distribuye como una normal N(μ, σ2/n)

Page 20: 1 La ley de los grandes números "El indicio de que las cosas estaban saliéndose de su cauce normal vino una tarde de finales de la década de 1940. Simplemente.

20

22)( xP

Desigualdad de Chebyshev (1821-1894)

Una varianza pequeña indica que las desviaciones grandes alrededor de la media son improbables. La desigualdad de Chebyshev hace precisa esta impresión:

21)( kkxP

O bien, haciendo: kPafnuti Lvovic Cebicev (1821-1894)

Page 21: 1 La ley de los grandes números "El indicio de que las cosas estaban saliéndose de su cauce normal vino una tarde de finales de la década de 1940. Simplemente.

21

Demostración:

dxxfxdxxfx

x

)()( 222

xx

dxxfdxxf )()( 22

xP

xP22

Para el caso discreto la demostración es semejante.

Page 22: 1 La ley de los grandes números "El indicio de que las cosas estaban saliéndose de su cauce normal vino una tarde de finales de la década de 1940. Simplemente.
Page 23: 1 La ley de los grandes números "El indicio de que las cosas estaban saliéndose de su cauce normal vino una tarde de finales de la década de 1940. Simplemente.

23

1lim

:eequivalent formadeo

0lim

n

SP

n

SP

n

n

n

n

Ley de los grandes números (en forma débil)

Sean X1, X2, ..., Xn variables aleatorias independientes, con la misma distribución (misma media μ y varianza σ2). Entonces, para Sn = X1 + X2 + ... + Xn y cualquier real > 0:

«La frase "ley de los grandes números" es también usada ocasionalmente para referirse al principio de que la probabilidad de que cualquier evento posible (incluso uno improbable) ocurra al menos una vez en una serie, incrementa con el número de eventos en la serie. Por ejemplo, la probabilidad de que un individuo gane la lotería es bastante baja; sin embargo, la probabilidad de que alguien gane la lotería es bastante alta, suponiendo que suficientes personas comprasen boletos de lotería». Wikipedia

Page 24: 1 La ley de los grandes números "El indicio de que las cosas estaban saliéndose de su cauce normal vino una tarde de finales de la década de 1940. Simplemente.

24

Demostración:

1lim

:eequivalent forma de o

0lim

;

2

2

2

2

2

n

SP

n

SP

nn

SP

n

n

n

SE

nn

n

n

SVar

n

n

n

n

n

nn

Usando la desigualdad de Chebyshev y fijado un épsilón:

Page 25: 1 La ley de los grandes números "El indicio de que las cosas estaban saliéndose de su cauce normal vino una tarde de finales de la década de 1940. Simplemente.

25

Observa que Sn/n es un promedio y por eso a la ley de los grandes números suele conocerse también como ley de los promedios.

Hemos visto su "forma débil". En su "forma fuerte" nos dice que si repetimos el lanzamiento de una moneda, la proporción de caras se aproxima más y más a 1/2 a medida que aumentamos el número de lanzamientos.

Si Sn es el número de caras en n lanzamientos, la ley fuerte de los grandes números dice que cuando n tiende a infinito:

12

1

n

SP n

Page 26: 1 La ley de los grandes números "El indicio de que las cosas estaban saliéndose de su cauce normal vino una tarde de finales de la década de 1940. Simplemente.

26

En las gráficas se ha marcado con puntos las probabilidades comprendidas entre 0.45 y 0.55.

Vemos como a medida que n crece la distribución se concentra más y más alrededor de 0.5 y el porcentaje de área correspondiente al intervalo (0.45, 0.55) se hace más y más grande.

Distribuciones para el número de caras en n lanzamientos de una moneda.La ley de los grandes números predice que el porcentaje de caras para n grande estará próximo a 1/2.

Page 27: 1 La ley de los grandes números "El indicio de que las cosas estaban saliéndose de su cauce normal vino una tarde de finales de la década de 1940. Simplemente.

27

Supongamos que tomamos al azar n números del intervalo [0,1] con una distribución uniforme. Si la variable aleatoria Xi describe la elección i-ésima, tenemos:

nnn

SVar

n

SE

XVarXE

nn

ii

12

1;

2

1

12

1;

2

1

2

2

De modo que, para cualquier > 0, tendremos:

22

2

12

1

nn

SP n

Es decir, si escogemos al azar n números del intervalo [0,1], las probabilidades son mejores que 1 - 1/(12n2) de que la diferencia |Sn/n - 1/2| sea menor que .

Page 28: 1 La ley de los grandes números "El indicio de que las cosas estaban saliéndose de su cauce normal vino una tarde de finales de la década de 1940. Simplemente.

28

Gráficos semejantes al caso del lanzamiento de n monedas anterior, pero ahora con la suma de n valores independientes tomados de una U(0,1). Rigen los mismos comentarios.

Page 29: 1 La ley de los grandes números "El indicio de que las cosas estaban saliéndose de su cauce normal vino una tarde de finales de la década de 1940. Simplemente.

29

Una aplicación al Método de Monte Carlo

Sea g(x) una función continua definida en el intervalo [0,1] y con imagen en [0,1].Vimos cómo estimar el área bajo la función, su integral, generando pares de números (x,y) al azar.

Existe una forma más eficiente de calcular la integral basándose en la ley de los grandes números.

Page 30: 1 La ley de los grandes números "El indicio de que las cosas estaban saliéndose de su cauce normal vino una tarde de finales de la década de 1940. Simplemente.

30

Escojamos una gran cantidad de números Xn al azar del intervalo [0,1] con densidad uniforme. Definamos Yn = g (Xn). El valor esperado de Yn es una estimación del área.

1)()(

)()()()(

1

0

222

1

0

1

0

dxxgYE

dxxgdxxfxgYE

n

n

Como el dominio y la imagen de g(x) son el intervalo [0,1], la media μ estará en [0,1] también y |g(x)- μ| ≤ 1.

22

221 1...

nnn

YYYP n

Que podemos leer como: la diferencia entre el área estimada y la real, el error que cometemos, es mayor que épsilon con probabilidad 1/n2.

Page 31: 1 La ley de los grandes números "El indicio de que las cosas estaban saliéndose de su cauce normal vino una tarde de finales de la década de 1940. Simplemente.

31