Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad...

49
Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María

Transcript of Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad...

Page 1: Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Inferencia Estadística:5. Probabilidad: Axiomas y Modelos

Ricardo Ñanculef AlegríaUniversidad Técnica Federico Santa María

Page 2: Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Estadística e Incertidumbre

• Métodos para recoletar y analizar datos acerca de un fenómeno acerca del cuál se tiene incertidumbre

• Objetivo: obtener conclusiones

• Entender un fenómeno• Tomar decisiones• Controlar un fenómeno

Page 3: Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Estadística e Incertidumbre

• Ejemplos: Tiempo de espera en el banco, en una caja de supermercado, en la fila del almuerzo.

Page 4: Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Estadística e Incertidumbre

• Ejemplos: Valor de un activo financiero.

Page 5: Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Estadística e Incertidumbre

• Ejemplos: Medidas de un sensor.

Page 6: Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Método Estadístico

1. Recolectar datos.2. Analizar los datos.3. Modelar el fenómeno.4. Sacar conclusiones

Las conclusiones son acerca de los datos, pero queremos proyectarlas hacia el fenómeno!

• Es esto correcto? • Qué confianza atribuir a las proyecciones? • Necesitamos modelar la incertidumbre.

Page 7: Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Probabilidades

• Modelo Matemático para la Incertidumbre .

• Noción Frecuentista: generalización de la idea de “frecuencia” de un suceso o resultado.

Page 8: Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Noción Frecuentista

• Ejemplo: ¿Cuál es la “probabilidad” de que tardemos más de 30 minutos en la cola del almuerzo? si sabemos que son las 13:15 de la tarde.

[0,15] [15,30] [30,45]

11-12 30 0 0 30

12-13 20 20 5 45

13-14 5 35 20 60

55 55 25

Hor

a de

l día

Tiempos de Espera

Page 9: Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Noción Frecuentista

• Ejemplo: En un hospital se tienen los siguientes datos acerca de la recuperación de pacientes en términos de su edad (viejo, joven) y peso (normal, obeso)

Sí / Rápida Sí / Lenta No

Joven / normal 1000 150 50

Joven / anormal 500 300 100

Mayor / normal 400 400 200

Mayor / anormal 200 600 300

Paci

ente

Recuperación

Page 10: Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Noción Frecuentista

•¿Cuál es la “probabilidad” de que un anciano tenga una operación exitosa?

Sí / Rápida Sí / Lenta No

Joven / normal 1000 150 50

Joven / anormal 500 300 100

Mayor / normal 400 400 200

Mayor / anormal 200 600 300

Paci

ente

Recuperación

Page 11: Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Noción Frecuentista

•¿Cuál es la “probabilidad” de que un anciano se recupere rápido si no murió?

Sí / Rápida Sí / Lenta No

Joven / normal 1000 150 50

Joven / anormal 500 300 100

Mayor / normal 400 400 200

Mayor / anormal 200 600 300

Paci

ente

Recuperación

Page 12: Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Noción Frecuentista

•¿Cuál es la “probabilidad” de que un paciente que se recuperó rápido haya sido obeso?

Sí / Rápida Sí / Lenta No

Joven / normal 1000 150 50

Joven / anormal 500 300 100

Mayor / normal 400 400 200

Mayor / anormal 200 600 300

Paci

ente

Recuperación

Page 13: Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Probabilidades

• Necesitamos un modelo matemático de “probabilidad” que nos diga cómo operar con dichas cantidades (una “lógica de la incertidumbre”)

Page 14: Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Espacio Muestral (Ω)

• Conjunto de resultados elementales posibles

• Ejemplo: Si tiramos un dado dos veces, ¿Cuáles son los resultados posibles?

• Primera Tirada: 1,2,3,4,5,6• Segunda Tirada: 1,2,3,4,5,6

Ω = (1,1) (1,2) (1,3) … (2,1) (2,2) … (6,4) (6,5) (6,6)

Page 15: Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Espacio Muestral (Ω)

• Resultados elementales deben:• Ser excluyentes entre sí. • Representar todas las posibilidades (de interés).

• Otro ejemplo: Si medimos el tiempo de espera en una cola de supermercado.

Ω = 0 100

[0,100]

Page 16: Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Espacio Muestral (Ω)

• Otro ejemplo: Si estudiamos la ocurrencia de accidentes en el centro de la ciudad

Ω =

02000

[0,1200] x [0,2000]

1200

Page 17: Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Eventos

• Cualquier subconjunto del espacio muestral se denomina un evento.

• Nos interesa hablar de la “probabilidad” de eventos, por ejemplo: “la probabilidad de que el tiempo de espera sea mayor a 30 minutos y menor a 1 hora”

Ω = 0

Ω= [0, 100]10030 60

E = [30, 60]

Page 18: Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Eventos

• Otro evento: “la probabilidad de que el accidente acurra el sector poniente”

Ω =

02000

[0,1200] x [0,2000]

1200

Page 19: Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Eventos

• Otro evento: “la probabilidad de que el accidente acurra en los ponientes”

Ω =

02000

[0,1200] x [0,2000]

1200

[0,1200] x [0,1400]

Page 20: Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Axiomas • Una medida de probabilidad será entonces una medida de la certeza de un evento (subconjunto del espacio muestral).

• La probabilidad de un evento debiera reflejar la certeza con que obtendremos uno de los resultados del evento

Page 21: Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Axiomas

• ¿Qué propiedades mínimas debiera satisfacer?

Axioma 1. P(Ω) = 1 Axioma 2. P(A) ≥ 0Axioma 3. Si A y B son eventos disjuntos

P(A U B) = P(A) + P(B)

Page 22: Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Axiomas • Queremos construir una medida de certeza. • Un evento es cierto ó incierto sólo en relación a algo sabemos totalmente cierto (pensamos en probabilidad como una generalización de frecuencia)

• Si Ω contiene todos los resultados posibles, entonces la “certidumbre” de que ocurre (el evento) Ω es total

Axioma 1. P(Ω) = 1

Page 23: Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Axiomas • Supongamos que tenemos dos “sacos” de posibles resultados A, B de manera que con certeza P(A) obtenemos un resultado de los que contiene A y con certeza P(B) obtenemos un resultado de B

• Si A y B no repiten resultados, la certeza de tener un resultado en A ó en B es entonces

Axioma 3. P(A U B) = P(A) + P(B)

Page 24: Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Axiomas • El axioma 1 y el axioma 3 implican que

1 = P(Ω) = P(Ф U Ω) = P(Ф) + P(Ω) P(Ф) = 0

• Esto significa que la certeza de que no ocurra ningún resultado es cero. Como cualquier evento contiene a este evento, éste debe ser el menos cierto de todos

Axioma 2. P(A) ≥ 0

Page 25: Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Axiomas

• En resumen, una medida de probabilidad sobre una colección de eventos debiera satisfacer:

Axioma 1. P(Ω) = 1 Axioma 2. P(A) ≥ 0Axioma 3. Si A y B son eventos disjuntos

P(A U B) = P(A) + P(B)

Page 26: Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Implicancias de los Axiomas

1. P(AC) = 1 - P(A)2. Si A B P(A) P(B)3. P(B-A) = P(B) - P(AB)4. P(AB) = P(A) + P(B) - P(AB) P(Ai) P(Ai)

Page 27: Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

¿Qué eventos serán medibles?• Dado un espacio muestral, ¿qué eventos nos interesa medir?. Por supuesto Ω y Ф: pero ¿cuáles más?

• Todos los posibles subconjuntos de Ω?

• Lamentablemente no siempre es posible construir una medida de probabilidad que satisfaga los axiomas y permita medir todos los subconjuntos de Ω.

• Para un ejemplo de esta paradoja, ver los conjuntos de Vitali, donde el espacio muestral es R (los reales)

Page 28: Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Sigma Algebra• A la colección de eventos que sí podemos medir le llamaremos sigma-algebra.

• Un sigma-algebra deberá satisfacer propiedades mínimas de cerradura para que sea útil.

Page 29: Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Sigma Algebra• Como los eventos son subconjuntos, tiene que tener sentido hablar de conjuntos que se obtienen operando esos subconjuntos:

• Complementos, intersecciones, uniones, diferencias• Por ejemplo: En el ejemplo de los dados,¿cuál es la probabilidad de que el primero sea par y (inter) sumen 5?

Page 30: Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Sigma Algebra• Dado un espacio muestral Ω, una sigma-algebra es una colección C de subconjuntos de Ω tal que

1. C ≠ Ф2. Si A є C entonces (Ω - A) є C3. Si A1, A2, … , An є C son disjuntos

A1 U A2 U … U An є C

Page 31: Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Sigma Algebra• Dado un espacio muestral Ω, una sigma-algebra es una colección C de subconjuntos de Ω tal que

1. C ≠ Ф2. Si A є C entonces (Ω - A) є C3. Si A1, A2, … , An є C son disjuntos

A1 U A2 U … U An є C

Page 32: Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Sigma Algebra• Observaciones:

• Cualquier sigma-algebra contiene a Ω?• Cualquier sigma-algebra contiene a Ф? • Cuál es la mínima sigma-algebra?• Si Ω es finito, el conjunto potencia de Ω, es una sigma-algebra?

Page 33: Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Medida de Probabilidad• Ahora podemos dar una definición formal • Dado un conjunto Ω, y una sigma-algebra C, una medida de probabilidad P es una función P: C → R que satisface:

1. P(Ω) = 12. P(A) ≥ 0, para todo A є C3. Si A1, A2, … , An є C son disjuntos

P(A1 U A2 U … U An) = P(A1) + P(A2) + … + P(An)

Page 34: Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Medida de Probabilidad• Dado un conjunto Ω, y una sigma-algebra F y una medida de probabilidad P

(Ω, C, P) se denomina Espacio de Probabilidad

(Ω, C) se denomina Espacio Medible

C es la Familia de los Eventos Medibles

Page 35: Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Probabilidad “and the real world”• La definición anterior busca construir un modelo matemático para la incertidumbre, que permita

• razonar (consistentemente) bajo incerteza• hacer predicciones en ambientes inciertos

• Para muchos propósitos podemos pensar en probabilidad como la frecuencia con que se ve un resultado si observamos el fenómeno múltiples veces.

Page 36: Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Noción frecuentista (ó empírica)• Supongamos que repetimos un experimento (u observamos un fenómeno) N veces y de éstas, NA veces observamos un resultado contenido en el evento A

NN

AP AN ∞→= lim)(

Page 37: Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Noción frecuentista (ó empírica)• Evolución de la frecuencia relativa del número de caras obtenido en el lanzamiento de una moneda en 100 ocasiones (simulado en un computador).

Page 38: Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Noción teórica (ó a-priori)• Si tenemos un experimento que puede ocurrir de N posibles formas, nuestro espacio muestral es finito Ω• Una sigma algebra posible es Pow(Ω)• Una medida de probabilidad “natural” es

donde |A| es la cardinalidad de A.(Ω, Pow(Ω) , P) es un espacio de probabilidad válido

|Ω|||||

)(A

NA

AP ==

Page 39: Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Noción teórica (ó a-priori)• Por ejemplo, si lanzamos un dado regular de seis caras• Definir espacio muestral y una sigma-álgebra• Definir una medida de probabilidad• Evaluar la probabilidad de obtener un resultado par

21

63

|6,5,4,3,2,1||6,4,2|

)6,4,2( ===P

Page 40: Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Noción teórica (ó a-priori)• La noción teórica o a-priori es una de las más utilizadas para “enseñar” probabilidades, pues requiere “lápiz, papel y pensamiento”

• Se calculan todas las posibilidades favorables a un evento y todas las formas en que algo puede ocurrir (requiere saber combinatoria!)

posibles ResultadosA evento al favorables Resultados

)( =AP

Page 41: Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Noción teórica (ó a-priori)

Permutaciones:Número de maneras distintas de sacar r elementos de lote de n cuando el orden importa y sin repetición.

- - - - -

1 2 3 4 r

)!rn(!n

)r,n(P =

1 2 3 4 5 ≠ 2 3 4 5 1

Page 42: Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Noción teórica (ó a-priori)

Combinaciones:Número de maneras distintas de sacar r elementos de lote de n cuando el orden no importa.

- - - - -

1 2 3 4 r

)!(!

!),(

rnr

nrnC

1 2 3 4 5 = 2 3 4 5 1

Page 43: Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Noción frecuentista (ó empírica)• ¿Cuál es la probabilidad de que al seleccionar dos alumnos tengamos que los dos tienen apellidos con A?

• ¿Cuál es la probabilidad de que al tirar 6 dados obtengamos el mismo número?

• Si repartimos un mazo de 52 cartas (de póker) entre 4 jugadores, cuál es la probabilidad de que a cada uno le toque un as. ¿Cuál es la probabilidad de que 1 obtenga una escala perfecta? ¿Cuál es la probabilidad de que 1 obtenga una escala de poker?

Page 44: Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Noción frecuentista (ó empírica)• ¿Cuál es que en esta sala exista una persona que cumpleaños el mismo día que yo?

• ¿Cuál es la probabilidad de que en esta sala dos personas cumplan años el mismo día?

Page 45: Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Noción teórica (ó a-priori)• Otro ejemplo:

45

Se toma al azar una esfera de la urna I Se transfiere a la urna II, se mezclan bien. Se elige, aleatoriamente, una esfera de la urna II. ¿cuál es la probabilidad que sea gris?

I II

1

1

2 2

3

3

Page 46: Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Noción teórica (ó a-priori)• Otro ejemplo:

46

Traspasar Roja # 1

Traspasar Verde # 1

Traspasar Verde # 2

Distintos resultados del experimento.

1

1

2

1

2

3

2

3

2

3

1

2

3

2

3

I

II

II

II

1

2

3

4

5

6

7

8

9

10

11

12

Page 47: Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Noción Bayesiana • Consideremos la siguiente sentencia: “La probabilidad de que el café esté frío es 0.8”

• Es válido querer declarar nuestro grado de incertidumbre acerca de un hecho como éste.

• Podríamos darle una interpretación a la sentencia bajo la noción frecuentista? bajo la noción teórica?

Page 48: Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Noción Bayesiana • Consideremos la siguiente sentencia: “La probabilidad de Homero haya escrito la Ilíada es de 0.95”.

• Declaración de un grado de incertidumbre.

• Podríamos darle una interpretación a la sentencia bajo la noción frecuentista? bajo la noción teórica?

Page 49: Inferencia Estadística: 5. Probabilidad: Axiomas y Modelos Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Noción Bayesiana • Una última noción de probabilidad es la bayesiana: se entiende probabilidad como un grado subjetivo de certeza (e.g. “opinión de un experto”)

• Lo importante es desarrollar una forma de operar con estos “grados de certeza” para combinarlos y actualizarlos si se tienen nuevas observaciones

• Es perfectamente compatible con la noción frecuentista o teórica: se pueden combinar con “grados subjetivos” existentes previamente