Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad...

Post on 23-Jan-2016

236 views 4 download

Transcript of Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad...

Inferencia Estadística:5. Probabilidad: Axiomas y Modelos

Ricardo Ñanculef AlegríaUniversidad Técnica Federico Santa María

Estadística e Incertidumbre

• Métodos para recoletar y analizar datos acerca de un fenómeno acerca del cuál se tiene incertidumbre

• Objetivo: obtener conclusiones

• Entender un fenómeno• Tomar decisiones• Controlar un fenómeno

Estadística e Incertidumbre

• Ejemplos: Tiempo de espera en el banco, en una caja de supermercado, en la fila del almuerzo.

Estadística e Incertidumbre

• Ejemplos: Valor de un activo financiero.

Estadística e Incertidumbre

• Ejemplos: Medidas de un sensor.

Método Estadístico

1. Recolectar datos.2. Analizar los datos.3. Modelar el fenómeno.4. Sacar conclusiones

Las conclusiones son acerca de los datos, pero queremos proyectarlas hacia el fenómeno!

• Es esto correcto? • Qué confianza atribuir a las proyecciones? • Necesitamos modelar la incertidumbre.

Probabilidades

• Modelo Matemático para la Incertidumbre .

• Noción Frecuentista: generalización de la idea de “frecuencia” de un suceso o resultado.

Noción Frecuentista

• Ejemplo: ¿Cuál es la “probabilidad” de que tardemos más de 30 minutos en la cola del almuerzo? si sabemos que son las 13:15 de la tarde.

[0,15] [15,30] [30,45]

11-12 30 0 0 30

12-13 20 20 5 45

13-14 5 35 20 60

55 55 25

Hor

a de

l día

Tiempos de Espera

Noción Frecuentista

• Ejemplo: En un hospital se tienen los siguientes datos acerca de la recuperación de pacientes en términos de su edad (viejo, joven) y peso (normal, obeso)

Sí / Rápida Sí / Lenta No

Joven / normal 1000 150 50

Joven / anormal 500 300 100

Mayor / normal 400 400 200

Mayor / anormal 200 600 300

Paci

ente

Recuperación

Noción Frecuentista

•¿Cuál es la “probabilidad” de que un anciano tenga una operación exitosa?

Sí / Rápida Sí / Lenta No

Joven / normal 1000 150 50

Joven / anormal 500 300 100

Mayor / normal 400 400 200

Mayor / anormal 200 600 300

Paci

ente

Recuperación

Noción Frecuentista

•¿Cuál es la “probabilidad” de que un anciano se recupere rápido si no murió?

Sí / Rápida Sí / Lenta No

Joven / normal 1000 150 50

Joven / anormal 500 300 100

Mayor / normal 400 400 200

Mayor / anormal 200 600 300

Paci

ente

Recuperación

Noción Frecuentista

•¿Cuál es la “probabilidad” de que un paciente que se recuperó rápido haya sido obeso?

Sí / Rápida Sí / Lenta No

Joven / normal 1000 150 50

Joven / anormal 500 300 100

Mayor / normal 400 400 200

Mayor / anormal 200 600 300

Paci

ente

Recuperación

Probabilidades

• Necesitamos un modelo matemático de “probabilidad” que nos diga cómo operar con dichas cantidades (una “lógica de la incertidumbre”)

Espacio Muestral (Ω)

• Conjunto de resultados elementales posibles

• Ejemplo: Si tiramos un dado dos veces, ¿Cuáles son los resultados posibles?

• Primera Tirada: 1,2,3,4,5,6• Segunda Tirada: 1,2,3,4,5,6

Ω = (1,1) (1,2) (1,3) … (2,1) (2,2) … (6,4) (6,5) (6,6)

Espacio Muestral (Ω)

• Resultados elementales deben:• Ser excluyentes entre sí. • Representar todas las posibilidades (de interés).

• Otro ejemplo: Si medimos el tiempo de espera en una cola de supermercado.

Ω = 0 100

[0,100]

Espacio Muestral (Ω)

• Otro ejemplo: Si estudiamos la ocurrencia de accidentes en el centro de la ciudad

Ω =

02000

[0,1200] x [0,2000]

1200

Eventos

• Cualquier subconjunto del espacio muestral se denomina un evento.

• Nos interesa hablar de la “probabilidad” de eventos, por ejemplo: “la probabilidad de que el tiempo de espera sea mayor a 30 minutos y menor a 1 hora”

Ω = 0

Ω= [0, 100]10030 60

E = [30, 60]

Eventos

• Otro evento: “la probabilidad de que el accidente acurra el sector poniente”

Ω =

02000

[0,1200] x [0,2000]

1200

Eventos

• Otro evento: “la probabilidad de que el accidente acurra en los ponientes”

Ω =

02000

[0,1200] x [0,2000]

1200

[0,1200] x [0,1400]

Axiomas • Una medida de probabilidad será entonces una medida de la certeza de un evento (subconjunto del espacio muestral).

• La probabilidad de un evento debiera reflejar la certeza con que obtendremos uno de los resultados del evento

Axiomas

• ¿Qué propiedades mínimas debiera satisfacer?

Axioma 1. P(Ω) = 1 Axioma 2. P(A) ≥ 0Axioma 3. Si A y B son eventos disjuntos

P(A U B) = P(A) + P(B)

Axiomas • Queremos construir una medida de certeza. • Un evento es cierto ó incierto sólo en relación a algo sabemos totalmente cierto (pensamos en probabilidad como una generalización de frecuencia)

• Si Ω contiene todos los resultados posibles, entonces la “certidumbre” de que ocurre (el evento) Ω es total

Axioma 1. P(Ω) = 1

Axiomas • Supongamos que tenemos dos “sacos” de posibles resultados A, B de manera que con certeza P(A) obtenemos un resultado de los que contiene A y con certeza P(B) obtenemos un resultado de B

• Si A y B no repiten resultados, la certeza de tener un resultado en A ó en B es entonces

Axioma 3. P(A U B) = P(A) + P(B)

Axiomas • El axioma 1 y el axioma 3 implican que

1 = P(Ω) = P(Ф U Ω) = P(Ф) + P(Ω) P(Ф) = 0

• Esto significa que la certeza de que no ocurra ningún resultado es cero. Como cualquier evento contiene a este evento, éste debe ser el menos cierto de todos

Axioma 2. P(A) ≥ 0

Axiomas

• En resumen, una medida de probabilidad sobre una colección de eventos debiera satisfacer:

Axioma 1. P(Ω) = 1 Axioma 2. P(A) ≥ 0Axioma 3. Si A y B son eventos disjuntos

P(A U B) = P(A) + P(B)

Implicancias de los Axiomas

1. P(AC) = 1 - P(A)2. Si A B P(A) P(B)3. P(B-A) = P(B) - P(AB)4. P(AB) = P(A) + P(B) - P(AB) P(Ai) P(Ai)

¿Qué eventos serán medibles?• Dado un espacio muestral, ¿qué eventos nos interesa medir?. Por supuesto Ω y Ф: pero ¿cuáles más?

• Todos los posibles subconjuntos de Ω?

• Lamentablemente no siempre es posible construir una medida de probabilidad que satisfaga los axiomas y permita medir todos los subconjuntos de Ω.

• Para un ejemplo de esta paradoja, ver los conjuntos de Vitali, donde el espacio muestral es R (los reales)

Sigma Algebra• A la colección de eventos que sí podemos medir le llamaremos sigma-algebra.

• Un sigma-algebra deberá satisfacer propiedades mínimas de cerradura para que sea útil.

Sigma Algebra• Como los eventos son subconjuntos, tiene que tener sentido hablar de conjuntos que se obtienen operando esos subconjuntos:

• Complementos, intersecciones, uniones, diferencias• Por ejemplo: En el ejemplo de los dados,¿cuál es la probabilidad de que el primero sea par y (inter) sumen 5?

Sigma Algebra• Dado un espacio muestral Ω, una sigma-algebra es una colección C de subconjuntos de Ω tal que

1. C ≠ Ф2. Si A є C entonces (Ω - A) є C3. Si A1, A2, … , An є C son disjuntos

A1 U A2 U … U An є C

Sigma Algebra• Dado un espacio muestral Ω, una sigma-algebra es una colección C de subconjuntos de Ω tal que

1. C ≠ Ф2. Si A є C entonces (Ω - A) є C3. Si A1, A2, … , An є C son disjuntos

A1 U A2 U … U An є C

Sigma Algebra• Observaciones:

• Cualquier sigma-algebra contiene a Ω?• Cualquier sigma-algebra contiene a Ф? • Cuál es la mínima sigma-algebra?• Si Ω es finito, el conjunto potencia de Ω, es una sigma-algebra?

Medida de Probabilidad• Ahora podemos dar una definición formal • Dado un conjunto Ω, y una sigma-algebra C, una medida de probabilidad P es una función P: C → R que satisface:

1. P(Ω) = 12. P(A) ≥ 0, para todo A є C3. Si A1, A2, … , An є C son disjuntos

P(A1 U A2 U … U An) = P(A1) + P(A2) + … + P(An)

Medida de Probabilidad• Dado un conjunto Ω, y una sigma-algebra F y una medida de probabilidad P

(Ω, C, P) se denomina Espacio de Probabilidad

(Ω, C) se denomina Espacio Medible

C es la Familia de los Eventos Medibles

Probabilidad “and the real world”• La definición anterior busca construir un modelo matemático para la incertidumbre, que permita

• razonar (consistentemente) bajo incerteza• hacer predicciones en ambientes inciertos

• Para muchos propósitos podemos pensar en probabilidad como la frecuencia con que se ve un resultado si observamos el fenómeno múltiples veces.

Noción frecuentista (ó empírica)• Supongamos que repetimos un experimento (u observamos un fenómeno) N veces y de éstas, NA veces observamos un resultado contenido en el evento A

NN

AP AN ∞→= lim)(

Noción frecuentista (ó empírica)• Evolución de la frecuencia relativa del número de caras obtenido en el lanzamiento de una moneda en 100 ocasiones (simulado en un computador).

Noción teórica (ó a-priori)• Si tenemos un experimento que puede ocurrir de N posibles formas, nuestro espacio muestral es finito Ω• Una sigma algebra posible es Pow(Ω)• Una medida de probabilidad “natural” es

donde |A| es la cardinalidad de A.(Ω, Pow(Ω) , P) es un espacio de probabilidad válido

|Ω|||||

)(A

NA

AP ==

Noción teórica (ó a-priori)• Por ejemplo, si lanzamos un dado regular de seis caras• Definir espacio muestral y una sigma-álgebra• Definir una medida de probabilidad• Evaluar la probabilidad de obtener un resultado par

21

63

|6,5,4,3,2,1||6,4,2|

)6,4,2( ===P

Noción teórica (ó a-priori)• La noción teórica o a-priori es una de las más utilizadas para “enseñar” probabilidades, pues requiere “lápiz, papel y pensamiento”

• Se calculan todas las posibilidades favorables a un evento y todas las formas en que algo puede ocurrir (requiere saber combinatoria!)

posibles ResultadosA evento al favorables Resultados

)( =AP

Noción teórica (ó a-priori)

Permutaciones:Número de maneras distintas de sacar r elementos de lote de n cuando el orden importa y sin repetición.

- - - - -

1 2 3 4 r

)!rn(!n

)r,n(P =

1 2 3 4 5 ≠ 2 3 4 5 1

Noción teórica (ó a-priori)

Combinaciones:Número de maneras distintas de sacar r elementos de lote de n cuando el orden no importa.

- - - - -

1 2 3 4 r

)!(!

!),(

rnr

nrnC

1 2 3 4 5 = 2 3 4 5 1

Noción frecuentista (ó empírica)• ¿Cuál es la probabilidad de que al seleccionar dos alumnos tengamos que los dos tienen apellidos con A?

• ¿Cuál es la probabilidad de que al tirar 6 dados obtengamos el mismo número?

• Si repartimos un mazo de 52 cartas (de póker) entre 4 jugadores, cuál es la probabilidad de que a cada uno le toque un as. ¿Cuál es la probabilidad de que 1 obtenga una escala perfecta? ¿Cuál es la probabilidad de que 1 obtenga una escala de poker?

Noción frecuentista (ó empírica)• ¿Cuál es que en esta sala exista una persona que cumpleaños el mismo día que yo?

• ¿Cuál es la probabilidad de que en esta sala dos personas cumplan años el mismo día?

Noción teórica (ó a-priori)• Otro ejemplo:

45

Se toma al azar una esfera de la urna I Se transfiere a la urna II, se mezclan bien. Se elige, aleatoriamente, una esfera de la urna II. ¿cuál es la probabilidad que sea gris?

I II

1

1

2 2

3

3

Noción teórica (ó a-priori)• Otro ejemplo:

46

Traspasar Roja # 1

Traspasar Verde # 1

Traspasar Verde # 2

Distintos resultados del experimento.

1

1

2

1

2

3

2

3

2

3

1

2

3

2

3

I

II

II

II

1

2

3

4

5

6

7

8

9

10

11

12

Noción Bayesiana • Consideremos la siguiente sentencia: “La probabilidad de que el café esté frío es 0.8”

• Es válido querer declarar nuestro grado de incertidumbre acerca de un hecho como éste.

• Podríamos darle una interpretación a la sentencia bajo la noción frecuentista? bajo la noción teórica?

Noción Bayesiana • Consideremos la siguiente sentencia: “La probabilidad de Homero haya escrito la Ilíada es de 0.95”.

• Declaración de un grado de incertidumbre.

• Podríamos darle una interpretación a la sentencia bajo la noción frecuentista? bajo la noción teórica?

Noción Bayesiana • Una última noción de probabilidad es la bayesiana: se entiende probabilidad como un grado subjetivo de certeza (e.g. “opinión de un experto”)

• Lo importante es desarrollar una forma de operar con estos “grados de certeza” para combinarlos y actualizarlos si se tienen nuevas observaciones

• Es perfectamente compatible con la noción frecuentista o teórica: se pueden combinar con “grados subjetivos” existentes previamente