Estadística. - Grado en Biología. Universidad de Alcalá ... · Estadística. GradoenBiología....

32
Estadística. Grado en Biología. Universidad de Alcalá. Curso 2017-18. Capítulo 3: Probabilidad. Fernando San Segundo. Actualizado: 2017-09-29 Capítulo 3: Probabilidad. Estadística. Fernando San Segundo. Actualizado: 2017-09-29 1 / 32

Transcript of Estadística. - Grado en Biología. Universidad de Alcalá ... · Estadística. GradoenBiología....

Estadística.

Grado en Biología. Universidad de Alcalá. Curso 2017-18.

Capítulo 3: Probabilidad.

Fernando San Segundo. Actualizado: 2017-09-29

Capítulo 3: Probabilidad. Estadística.Fernando San Segundo. Actualizado: 2017-09-29 1

/ 32

Introducción.Recuerda que nuestro objetivo básico es hacer Inferencia, para obtener informaciónsobre una población a partir de los datos de una muestra.Para que ese procedimiento funcione es preciso que la muestra se haya obtenido alazar. Y para entender bien el azar y sus consecuencias matemáticas, necesitamosconocer un poco el lenguaje de la Teoría de la Probabilidad.En este capítulo sentaremos las bases de ese lenguaje y en el próximo introduciremosla noción de variable aleatoria, que viene a ser la representación teórica de unexperimento en el que de alguna manera interviene el azar o la incertidumbre.

Capítulo 3: Probabilidad. Estadística.Fernando San Segundo. Actualizado: 2017-09-29 2

/ 32

Probabilidad e intuición.La paradoja del cumpleaños.¿Cuántas personas tiene que haber en una habitación para que la probabilidad de que doscompartan fecha de cumpleaños sea superior al 50%?Hay 366 días en el año (como mucho), así que en una sala con 367 personas esaprobabilidad es del 100%. Si hay menos personas la probabilidad disminuye. ¿Pero cuándoes del 50%?Mucho antes de lo que la mayoría de nosotros esperamos:

n = 50fechas = sample(1:366, n, replace = TRUE)length(unique(fechas)) # Si es menor que n es que hay coincidencias

## [1] 48

La respuesta está en la última página de esta presentación.

Capítulo 3: Probabilidad. Estadística.Fernando San Segundo. Actualizado: 2017-09-29 3

/ 32

Otro ejemplo: el problema de Monty Hall.En este enlace de la Wikipedia podéis encontrar (mucha) información sobre elproblema.Para ilustrar el problema nosotros vamos a recurrir a este excelente simulador delproblema programado en GeoGebra por Manuel Sada.

Capítulo 3: Probabilidad. Estadística.Fernando San Segundo. Actualizado: 2017-09-29 4

/ 32

Los juegos del Caballero de Méré.Vamos a empezar nuestro viaje al mundo de la Probabilidad con dos preguntas que tienenun lugar importante en la historia de la teoría, pero que además siguen siendo interesantes.En el siglo dieciocho, el Caballero de Méré planteó a los matemáticos Pascal y Fermat elsiguiente problema. Hay dos juegos de azar basados en los dados, en los que el Caballeroapostaba su dinero.

En el primer juego se lanza un dado 4 veces y el jugador gana la apuesta si obtiene almenos un 6 en las 4 tiradas.En el segundo juego se lanzan dos dados 24 veces y el jugador gana la apuesta siobtiene al menos un 6 doble en las 24 tiradas.

El Cabllero de Méré quería saber si alguno de esos dos juegos era más favorable que elotro, porque el pensaba que eran iguales en ese sentido. Su razonamiento era:

En el primer juego: la probabilidad de un 6 en una tirada es 16 . En cuatro tiradas,

4 · 16 = 23 .

En el segundo juego: la probabilidad de un 6 doble en una tirada de dos dados es 136 .

En 24 tiradas, 24 · 136 = 2

3 .

Capítulo 3: Probabilidad. Estadística.Fernando San Segundo. Actualizado: 2017-09-29 5

/ 32

Simulando el primer juego del Caballero de Méré en R.Vamos a simular 1000 partidas del primer juego con este código:

# Generamos 4000 tiradas del dado (1000 partidas, 4 tiradas por partida)dado4000 = sample(1:6, 4000, replace = TRUE)# Las agrupamos en partidas cada cuatro tiradas.deMere1 = matrix(dado4000, ncol = 4, byrow = TRUE)# Localizamos las apariciones del 6.esSeis = (deMere1 == 6)# Contamos cuantas apariciones del seis hay en cada partida.cuantosSeis = rowSums(esSeis)# Localizamos aquellas partidas con al menos un 6.partidasGanadoras = (cuantosSeis > 0)# Y medimos la proporcion de partidas ganadoras.(proporcion = table(partidasGanadoras)/length(partidasGanadoras))

## partidasGanadoras## FALSE TRUE## 0.468 0.532

Si ejecutas esta simulación unas cuantas veces verás que la proporción de partidasganadoras está lejos de los 2

3 que esperaba el Caballero.

Capítulo 3: Probabilidad. Estadística.Fernando San Segundo. Actualizado: 2017-09-29 6

/ 32

Y simulando el segundo juego.Para el segundo juego de nuevo vamos a simular 1000 partidas, mediante el siguientecódigo. Fíjate en que usamos los números del 1 al 36 para representar los posiblesresultados de tirar 2 dados, donde 36 corresponde al 6 doble.

# Generamos 24000 tiradas del dado (1000 partidas, 24 tiradas por partida)dado24000 = sample(1:36, 24000, replace = TRUE)# Los agrupamos en partidas cada 24 tiradas.deMere2 = matrix(dado24000, ncol = 24, byrow = TRUE)# Localizamos las apariciones del 36 (representa 6 doble).es36 = (deMere2 == 36)# Contamos cuantas apariciones del 36 hay en cada partida.cuantos36 = rowSums(es36)# Localizamos aquellas partidas con al menos un 36.partidasGanadoras = (cuantos36 > 0)# Y medimos la proporcion de partidas ganadoras.(proporcion = table(partidasGanadoras)/length(partidasGanadoras))

## partidasGanadoras## FALSE TRUE## 0.503 0.497

De nuevo, ejecuta esta simulación unas cuantas veces para comprobar lo confundido queestaba el pobre Caballero. . .

Capítulo 3: Probabilidad. Estadística.Fernando San Segundo. Actualizado: 2017-09-29 7

/ 32

Regla de Laplace.El primer avance importante en la comprensión moderna de la Probabilidad es laRegla de Laplace. Esta regla se aplica cuando estamos interesados en un fenómenoo experimento aleatorio (que sucede al azar; lanzar una moneda, un dado , etc.)Suponemos que hay n resultados elementales diferentes y que son equiprobables.Entonces la probabilidad de un suceso A (que en general no será elemental) se calculaasí:

P(A) = número de sucesos elementales favorables a Anúmero total de sucesos elementales

Ejemplos:

Lanzamos un dado. Los sucesos elementales son los números 1, 2, 3, 4, 5, 6 y si eldado no está cargado, son equiprobables. Si el suceso A es “obtener un múltiplo de 3”entonces los sucesos elementales son 2 (el 3 y el 6) y por lo tanto P(A) = 2

6 = 13 .

Si introducimos en una caja 366 bolas numeradas con los números del 1 al 366 ysacamos una bola al azar, ¿cuál es la probabilidad de que esa fecha corresponda almes de octubre?

Capítulo 3: Probabilidad. Estadística.Fernando San Segundo. Actualizado: 2017-09-29 8

/ 32

Vamos a llamar abiertas a las letras mayúsculas de este alfabeto que no contienenningún bucle, y las llamaremos cerradas si tienen uno más bucles (por ejemplo M esabierta y P es cerrada).

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

Si elegimos una letra al azar, ¿cuál es la probabilidad de que sea abierta?

Un primer paso para entender lo que le pasaba al Caballero de Méré. Lanzamos undado dos veces. ¿Cuáles son los sucesos elementales equiprobables? ¿Cuál es laprobabilidad de sacar al menos un 6 en las dos tiradas? De Méré habría dicho que es16 + 1

6 = 13 . ¿Cuál es la probabilidad de que los dados sumen 7?

Capítulo 3: Probabilidad. Estadística.Fernando San Segundo. Actualizado: 2017-09-29 9

/ 32

Regla de Laplace y frecuencias relativas.Hemos aprendido a obtener la tabla de frecuencias relativas a partir de una muestra(recuerda, esto es útil en el caso de factores o variables cuantitativas discretas). Ydijimos entonces que estas frecuencias estaban cerca del concepto de probabilidad. LaRegla de Laplace nos ayuda a entender mejor esa idea.En concreto, supongamos que la tabla de frecuencias relativas de la muestra es:

Valor xi : x1 x2 · · · xkFrecuencia relativa f ′i : f ′1 f ′2 · · · f ′k

Entonces, si elegimos un elemento de la muestra al azar, de manera que todos loselementos sean equiprobables, la probabilidad de que ese elemento valga xi esprecisamente la frecuencia relativa f ′i .

Capítulo 3: Probabilidad. Estadística.Fernando San Segundo. Actualizado: 2017-09-29 10

/ 32

El papel de la Combinatoria.Para usar la Regla de Laplace a menudo necesitaremos las herramientas de laCombinatoria. Por ejemplo, en nuestro Tutorial 3 aparecen estos dos ejercicios:

Se escogen al azar 3 lámparas de entre 15 (sin remplazamiento) y sabemos que deesas 15, hay 5 que son defectuosas. ¿Cuál es la probabilidad de que al menos una delas 3 elegidas sea defectuosa?

Hallar la probabilidad de que al tirar tres dados aparezca el seis en uno de los dados(no importa cuál), pero solo en uno de ellos.

Vamos a tratar de aprender el mínimo de Combinatoria necesario para el resto del curso,pero sin entretenernos demasiado. ¡La Combinatoria puede llegar a ser muy complicada!

Capítulo 3: Probabilidad. Estadística.Fernando San Segundo. Actualizado: 2017-09-29 11

/ 32

Limitaciones de la Regla de Laplace.El uso de la Combinatoria supone muchas veces una dificultad técnica y práctica paraaplicar la Regla de Laplace. Pero hay otros casos donde las dificultades son teóricas.Ejemplo 1: Elegimos un número x al azar en el intervalo [0, 1]. ¿Cuál es laprobabilidad de que se cumpla 1

3 ≤ x ≤ 23?

Ejemplo 2: Supongamos que tenemos un cuadrado de lado 4 y en su interiordibujamos un círculo de radio 1, centrado en el cuadrado, como en la Figura.

Si tomamos un punto al azar dentro del cuadrado ¿cuál es la probabilidad de que esepunto caiga dentro del círculo? Este es un ejemplo típico de Probabilidad Geométrica.

Capítulo 3: Probabilidad. Estadística.Fernando San Segundo. Actualizado: 2017-09-29 12

/ 32

Los axiomas de Kolmogorov.Para dotar a la Probabilidad de unos fundamentos sólidos, Kolmogorov propuso unadefinición axiomática.

Inicialmente tenemos un espacio muestral Ω, que representa el conjunto de todos losposibles resultados de un experimento aleatorio. Un suceso aleatorio es unsubconjunto del espacio muestral (se excluyen los subconjuntos muy raros).En el espacio muestral tenemos que haber definido una función probabilidad que leasigna un número a cada suceso aleatorio y que tiene que cumplir estos axiomas:

1. siempre se cumple que 0 ≤ P(A) ≤ 1.2. si A1 y A2 son sucesos aleatorios disjuntos (o incompatibles), es decir siA1 ∩ A2 = ∅ (esto equivale a decir que es imposible que A1 y A2 ocurran ala vez) entonces

P(A1 ∪ A2) = P(A1) + P(A2).

3. La probabilidad del espacio muestral completo es 1. Es decir, P(Ω) = 1.

Un aspecto destacable es que estos axiomas no nos dicen como definir la función deProbabilidad, solo establece las reglas mínimas que debe cumplir para merecerse esenombre.

Capítulo 3: Probabilidad. Estadística.Fernando San Segundo. Actualizado: 2017-09-29 13

/ 32

Ejemplo:En el caso del círculo dentro del cuadrado podemos proceder así.

El espacio muestral son los (infinitos) puntos (x , y) del cuadrado. Un suceso aleatorioes una “figura” A dibujada dentro de ese cuadrado, que no sea “demasiado rara”.Nuestra función de probabilidad en este caso se basa en la noción de área:

P(A) = área de Aárea del cuadrado = área de A

16 .

Por ejemplo, para el círculo de radio 1 obtenemos P(A) = π

16 ≈ 0.1963.

GeoGebra: Cap03-MonteCarloAreaCirculo.ggb

Capítulo 3: Probabilidad. Estadística.Fernando San Segundo. Actualizado: 2017-09-29 14

/ 32

Propiedades adicionales de la Probabilidad y diagramas de Venn.Los axiomas de la Probabilidad tienen varias consecuencias que serán muy útiles en lapráctica para calcular probabilidades. Por ejemplo:

1 La probabilidad del suceso imposible (suceso vacío, representado por ∅ o también ∅)es 0:

P(∅) = 02 Si Ac es el suceso complementario de A (lo contrario de A) entonces

P(Ac ) = 1− P(A)

3 Una generalización del segundo axioma. Si A1 y A2 son sucesos aleatorioscualesquiera,

P(A1 ∪ A2) = P(A1) + P(A2)− P(A1 ∩ A2).4 Si A ∪ B (es decir, si B ocurre siempre que ocurre A) entonces:

P(A) ≤ P(B)

Estas propiedades permiten simplificar muchos cálculos de probabilidad, como veremos enlos ejercicios. Por ejemplo, en el problema de las lámparas, si A es “al menos una esdefectuosa”, es más sencillo trabajar con Ac , que es “ninguna es defectuosa”.

Capítulo 3: Probabilidad. Estadística.Fernando San Segundo. Actualizado: 2017-09-29 15

/ 32

Diagramas de Venn.Los diagramas de Venn son útiles para representar gráficamente las propiedades de laprobabilidad. Por ejemplo el axioma de la unión se representa así:

Donde la zona rayada (una o dos veces) es la unión A1 ∪ A2, mientras que la zonadoblemente rayada corresponde a la intersección A1 ∩ A2. Si piensas que la probabilidad escomo el área, verás que al calcular

P(A1) + P(A2)

la probabilidad / área de la intersección A1 ∩ A2 se ha incluido dos veces en la suma.

Capítulo 3: Probabilidad. Estadística.Fernando San Segundo. Actualizado: 2017-09-29 16

/ 32

Introducción a la idea de Probabilidad Condicionada.La noción de probabilidad condicionada sirve para reflejar los cambios en el valor dela probabilidad de un suceso que se producen cuando tenemos información parcialsobre el resultado de un experimento aleatorio.

Ejemplos:1 Lanzo dos dados y sin enseñarte el resultado te pregunto. ¿Cuál es la probabilidad de

que la suma sea 7? Ahora repito el experimento, pero antes de enseñarte los dados losmiro y te garantizo que ninguno de los dados es un 1. Sabiendo esto ¿calcularías lamisma probabilidad?

2 En el ejemplo de las letras abiertas y cerradas la probabilidad de que una letra elegidaal azar sea abierta es 20/26. Pero supongamos que ahora te garantizo que la letraque hemos elegido es una vocal. Sabiendo esto ¿cuál es entonces la probabilidad deque la letra sea abierta?

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

Hemos repetido la frase “sabiendo esto” para insistir en que la Probabilidad Condicionadatiene que ver con la información adicional de la que disponemos sobre el resultado de unexperimento aleatorio.

Capítulo 3: Probabilidad. Estadística.Fernando San Segundo. Actualizado: 2017-09-29 17

/ 32

Definición de Probabilidad Condicionada.

La probabilidad del suceso A condicionado por el suceso B es:

P(A|B) = P(A ∩ B)P(B)

suponiendo que P(B) 6= 0 (si es 0 la probabilidad condicionada no está definida).

Es recomendable interpretar el símbolo P(A|B) así:

probabilidad de A sabiendo que ocurre B

Ejemplos:1 En el caso de los dados los sucesos elementales favorables a A ∩ B (suman 7 y

ninguno de ellos es 1) son (5, 2), (4, 3), (3, 4), (2, 5). Y los sucesos elementalesfavorables a B son 25. Así que:

P(A|B) =

4362536

=425

2 En el de las letras cerradas y abiertas es P(A|B) = 35 . Compruébalo.

Usaremos simulaciones con R para comprobar estos resultados.

Capítulo 3: Probabilidad. Estadística.Fernando San Segundo. Actualizado: 2017-09-29 18

/ 32

La Regla del Producto para la Probabilidad Condicionada.La fórmula de la Probabilidad Condicionada se puede escribir así:

Regla del Producto

P(A ∩ B) = P(B) · P(A|B)

Esta versión es interesante porque, a menudo, calcular la intersección es más complicadoque calcular probabilidades condicionadas (en las que disponemos de informaciónadicional).Ejemplo: tenemos tres cajas con bolas blancas y negras. La caja 1 tiene 6 bolas blancas y10 negras, la caja 2 tiene 4 bolas blancas y 11 negras; finalmente la caja 3 tiene 7 bolasblancas y 4 negras. Elegimos una caja al azar y extraemos una bola de esa caja, también alazar. ¿Cuál es la probabilidad de extraer una bola negra procedente de la caja 3?Usando la Regla del Producto:

P(bola blanca ∩ caja 3) = P(bola blanca | caja 3) · P(caja 3) = 711 ·

13

Piensa en como responderías a esta pregunta usando la Regla de Laplace. Sugerimos queempieces por pensar en cuál es la lista de sucesos elementales equiprobables.

Capítulo 3: Probabilidad. Estadística.Fernando San Segundo. Actualizado: 2017-09-29 19

/ 32

Otro ejemplo de uso de la Regla del Producto de las probabilidades condicionadas.La Regla del producto se puede extender a intersecciones de más de dos sucesos. Porejemplo, para tres sucesos:

P(A1 ∩ A2 ∩ A3) = P(A1) · P(A2|A1) · P(A3|A1 ∩ A2)

Ejemplo:Podemos usar esta fómrula para terminar el problema de las lámparas defectuosas.Recuerda que en un lote de 15 lámparas hay 5 defectuosas. Elegimosal azar 3 lámparas(sin remplazamiento) y queremos calcular la probabilidad del suceso A, que es “al menosuna de las 3 es defectuosa”. Ya hemos dicho que es más fácil pensar en el suceso Ac :“ninguna de las 3 es defectuosa”Fijate en que Ac es la intersección de los sucesos A1 ∩ A2 ∩ A3 donde:

Ai = la lámpara elegida en la posición i no es defectuosa.

Así, usando la fórmula:

P(A1 ∩ A2 ∩ A3) = P(A1) · P(A2|A1) · P(A3|A1 ∩ A2) = 1015 ·

914 ·

813 ≈ 0.2637

Así queP(A) = 1− P(Ac ) ≈ 0.7363

Capítulo 3: Probabilidad. Estadística.Fernando San Segundo. Actualizado: 2017-09-29 20

/ 32

Un ejemplo importante: tablas de contingencia para pruebas diagnósticas.Vamos a analizar una prueba diagnóstica para cierta enfermedad. Estas pruebas noson infalibles. A veces la prueba dice que una persona está enfermeda cuando no esasí. Es lo que se llama un falso positivo. Y viceversa, si La prueba dice que lapersona no está enferma, aunque de hecho lo esté, entonces tenemos un falsonegativo- Estas situaciones se resumen en tablas de contingencia.

Ejemplo:Imagínate que tenemos una población de 10000 personas, con estos resultados de laprueba:

Padecen la enfermedadSí No Total

Resultado de la Prueba Positivo 192 158 350Negativo 4 9646 9650Total 196 9804 10000

El tipo de preguntas que nos interesan son:1 Si una persona de esa población (elegida al azar) ha dado positivo en la prueba ¿cual

es le probabilidad de que esté enfermo?2 Recíprocamente, si una persona de esa población (elegida al azar) está enferma ¿cual

es le probabilidad de que el resultado de la prueba sea positivo?

Se trata en ambos casos de calcular probabilidades condicionadas. Hay un ejemplointeresante en la última página de este documento.

Capítulo 3: Probabilidad. Estadística.Fernando San Segundo. Actualizado: 2017-09-29 21

/ 32

Sucesos independientes.Una consecuencia muy importante de la idea de Probabilidad Condicionada es que nospermite definir la noción de independencia.

Dos sucesos A y B son independientes si

P(A|B) = P(A)

Eso significa que el hecho de saber que ha ocurrido B no afecta al cálculo deprobabilidad para A.Regla del producto para sucesos independientes: Usando la definición deprobabilidad condicionada, es fácil ver que la independencia equivale a

P(A ∩ B) = P(A)P(B)

A menudo se toma esto como definición de independencia (yo prefiero la otra versión).Demostrar que dos sucesos son independientes puede ser muy complicado. Pero amenudo tendremos razones para suponer que lo son y entonces usaremos esaindependencia para calcular probabilidades. Volveremos sobre esto más adelante.¡Nunca confundas sucesos independientes con sucesos incompatibles! Los sucesosincompatibles no pueden ser independientes.

Capítulo 3: Probabilidad. Estadística.Fernando San Segundo. Actualizado: 2017-09-29 22

/ 32

Ejemplo importante: un problema de urnas y bolas de colores.Tenemos dos urnas cada una con bolas de dos colores, blancas y negras. La urna 1tiene 11 bolas blancas y 9 negras. La urna 2 tiene 7 bolas blancas y 15 negras.Lanzamos un dado. Si el resultado es 2 o menos, elegimos la urna 1 y en otro casoelegimos la urna 2. Y a continuación extraemos una bola al azar de la urna elegida.¿Cuál es la probabilidad de que la bola extraída sea negra?Este tipo de preguntas son situaciones típicas del Teorema de las ProbabilidadesTotales. Pero en el libro (pág. 67) puedes ver varios ejemplos de la aplicación de esteTeorema más allá de urnas y bolas.Y en este documento puedes ver un ejemplo del uso de este teorema en Genética:http://web.mit.edu/7.03/documents/Lecture_5.pdfEn general el teorema se puede aplicar para analizar la probabilidad de un resultadoque se puede alcanzar por varios caminos.

Capítulo 3: Probabilidad. Estadística.Fernando San Segundo. Actualizado: 2017-09-29 23

/ 32

El Teorema de las Probabilidades Totales.Se trata de descomponer el espacio muestral completo en una serie de sucesos B1, . . . ,Bkque reúnan estas características:

(1) Ω = B1 ∪ B2 ∪ · · · ∪ Bk .

(2) Bi ∩ Bj = ∅, para cualquier par i 6= j.(3) P(Bi ) 6= 0 para i = 1, . . . , k.

Regla de las probabilidades totales.

Si los sucesos B1, . . . ,BK cumplen las condiciones (1), (2) y (3) entonces paracualquier suceso A se cumple:

P(A) = P(B1)P(A|B1) + P(B2)P(A|B2) + · · ·+ P(Bk )P(A|Bk ).

Capítulo 3: Probabilidad. Estadística.Fernando San Segundo. Actualizado: 2017-09-29 24

/ 32

El ejemplo de las urnas y las bolas, resuelto.Llamaremos

B1 = elegimos urna 1, B2 = elegimos urna 2

A = la bola es negra

Entonces, al elegir la urna tenemos:

P(B1) = 26 , P(B2) = 4

6Y una vez elegida la urna, las probabilidades condicionadas de bola negra son:

P(A|B1) = 920 , P(A|B2) = 15

22Así que, usando el teorema:

P(A) = P(B1)P(A|B1) + P(B2)P(A|B2) = 26

920 + 4

61522 = 133

220

Capítulo 3: Probabilidad. Estadística.Fernando San Segundo. Actualizado: 2017-09-29 25

/ 32

Teorema de Bayes. Probabilidad de una causa.El Teorema de Bayes se aplica en el mismo tipo de situaciones que el Teorema de lasProbabilidades Totales, cuando tenemos un suceso A que se puede alcanzar pordistintos caminos B1,B2, . . . ,Bk . Pero en este caso sabemos el resultado (sabemosque el suceso de hecho ha ocurrido) y nos preguntamos por la probabilidad de cadauno de esos caminos posibles.Fíjate en que sabemos que el suceso ha ocurrido. Así que lo que tratamos de calculares una probabilidad condicionada (una probabilidad “sabiendo que. . . ”)

Teorema de Bayes.

Si los sucesos B1, . . . ,Bk cumplen las condiciones (1), (2) y (3), entonces paracualquier j de 1 a k se tiene:

P(Bj |A) =P(Bk)P(A|Bk)

P(A)=

P(Bk)P(A|Bk)P(B1)P(A|B1) + P(B2)P(A|B2) + · · ·+ P(Bk)P(A|Bk)

.

Capítulo 3: Probabilidad. Estadística.Fernando San Segundo. Actualizado: 2017-09-29 26

/ 32

Ejemplo del Teorema de Bayes.Volviendo al anterior ejemplo de las urnas con bolas blancas y negras. Supongamosque sabemos que la bola elegida es negra. ¿Cuál es la probabilida de que proceda dela primera urna?Nos piden que calculemos una probabilidad condicionada.

P(urna 1|bola negra)

Con el lenguaje de ese ejemplo es P(B1|A). Y el Teorema de Bayes dice que esto es:

P(B1 |A) = P(A |B1) · P(B1)P(A |B1) · P(B1) + P(A |B2) · P(B2) =

920 ·

26

920 ·

26 + 15

22 ·46

≈ 0.3976

Ya habíamos calculado todas las probabilidades que intervienen para el Teorema de lasProbabilidades Totales (el cálculo que hicimos allí aparece aquí como el denominadorde esta fórmula).

Capítulo 3: Probabilidad. Estadística.Fernando San Segundo. Actualizado: 2017-09-29 27

/ 32

Segundo ejemplo del Teorema de Bayes.Una persona recibe un resultado positivo en una prueba diagnóstica para unaenfermedad muy grave. El laboratorio informa de que esa prueba tiene una porcentajede falsos positivos del 6% y un porcentaje de falsos negativos del 3.8%. Además, sesabe que el porcentaje de personas afectadas en la población es un 2%.¿Cómo depreocupada debería estar esa persona?Se trata de calcular la probabilidad condicionada:

P(enfermo|test positivo)

Y usando el Teorema de Bayes:

P(enfermo|test positivo) =P(test positivo|enfermo)P(enfermo)

P(test positivo|enfermo)P(enfermo) + P(test positivo|sano)P(sano)

Sabemos que P(enfermo) = 0.02 y por tanto P(sano) = 0.98. Además la probabilidadP(test positivo|sano) es la probabilidad de un falso positivo, que es 0.06. Finalmente:

P(test positivo|enfermo) = 1− P(test negativo|enfermo)

Y esa última probabilidad es la un falso negativo, que es 0.038. AsíP(test positivo|enfermo) = 0.962 Sustituyendo los valores en la fórmula, laprobabilidad de que esa persona esté realmente enferma es aprox. del 25%.

Capítulo 3: Probabilidad. Estadística.Fernando San Segundo. Actualizado: 2017-09-29 28

/ 32

Una vuelta de tuerca al problema de las lámparas y la Combinatoria.Recuerda el problema: tenemos 15 lámparas, de las que 5 que son defectuosas. Seescogen 3 lámparas al azar y sin remplazamiento y queremos calcular la probabilidadde que al menos una de las 3 elegidas sea defectuosa.Es importante darse cuenta de que la diferencia entre usar o no usarremplazamiento es crucial. En cambio, a efectos de la probabilidad da igual sacarlas tres lámparas “a la vez” o una tras otra. Puedes usar la Regla de Laplace paracalcularlo de las dos maneras: la diferencia es que la lista de casos favorables yposibles se construye de manera distinta.Por ejemplo, si piensas en sacar las lámparas por orden entonces todos estos seiscasos en los que has extraído las lámparas 1, 8 y 12 te parecerán distintos:

(1, 8, 12), (1, 12, 8), (8, 1, 12), (8, 12, 1), (12, 1, 8), (12, 8, 1)

Y sucedería lo mismo con cualquier otra terna de lámparas (porque 3! = 6).En cambio para alguien que piensa en elegir tres lámparas a la vez, todos esos casos sereducen a uno. Y eso significa que esa persona cuanta seis veces menos casos posibles,pero también seis veces menos casos favorables. En definitiva, las dos maneras decontar casos posibles y favorables son distintas, pero conducen a la misma fracción,porque simplemente hay que simplificar un factor 6 en el numerador y el denominador.El código R de esta sesión permite construir la lista completa de casos favorables yposibles de ambos procedimientos para comprobar todo esto.

Capítulo 3: Probabilidad. Estadística.Fernando San Segundo. Actualizado: 2017-09-29 29

/ 32

Más sobre Combinatoria.

Permutaciones sin repetición de n elementos tomados en grupos de k.Dados n elementos, ¿cuántas formas hay de elegir k (sin repetir), teniendo en cuenta elorden en que se eligen?

Per(n, k) = n!(n − k)! =

k factores︷ ︸︸ ︷n · (n − 1) · (n − 2) · · · (n − k + 1)

En el caso especial en que elegimos n de n estamos pensando en todas las formas dereordenar los n elementos. Y hay Per(n) = n! formas de hacer esto.

Combinaciones sin repetición de n elementos tomados en grupos de k.Dados n elementos, ¿cuántas formas hay de elegir k (sin repetir), si no tenemos encuenta el orden en que se eligen?

C(n, k) =(nk

)= n!

k! (n − k)! =

k factores︷ ︸︸ ︷n · (n − 1) · (n − 2) · · · (n − k + 1)

k · (k − 1) · (k − 2) · · · 2 · 1︸ ︷︷ ︸k factores

Capítulo 3: Probabilidad. Estadística.Fernando San Segundo. Actualizado: 2017-09-29 30

/ 32

Ejemplo de uso de esas fórmulas.Volviendo una vez más al ejemplo de las lámparas. Como ya hemos discutido antes,basta con calcular la probabilidad del suceso contrario: ninguna defectuosa entre lastres elegidas.Si tenemos en cuenta el orden de extracción, entonces en la Regla de Laplace usamospermutaciones para calcular los casos posibles (denominador) y favorables(numerador). El denominador es simplemente Per(15, 3), el número de formas deelegir 3 elementos entre 15 teniendo en cuenta el orden. El denominador esPer(10, 3), porque ahora tenemos que elegir tres entre las 10 no defectuosas.

P(ninguna defectuosa entre las tres elegidas) =Per(10, 3)Per(15, 3)

=10 · 9 · 8

15 · 14 · 13

Si no tenemos en cuenta el orden, entonces en la Regla de Laplace usamoscombinaciones. El denominador (casos posibles) es C(15, 3), y el denominador (casosfavorables) es C(10, 3). Igual que antes, pero ignorando el orden.

P(ninguna defectuosa entre las tres elegidas) =C(10, 3)C(15, 3)

=

10 · 9 · 83 · 2 · 1

15 · 14 · 133 · 2 · 1

=10 · 9 · 8

15 · 14 · 13

igual que antes.

Capítulo 3: Probabilidad. Estadística.Fernando San Segundo. Actualizado: 2017-09-29 31

/ 32

Advertencia.Cuando se hace muestreo sin remplazamiento el orden no afecta al cálculo deprobabilidades. En cambio si el muestreo es con remplazamiento es necesario teneren cuenta el orden para calcular correctamente las probabilidades. Por ejemplo, al lanzarun dado dos veces seguidas (es un muestreo con remplazamiento, los números nodesaparecen) tienes que considerar lso resultados (2, 3) y (3, 2) como distintos. Porque silos consideras iguales, entonces no serán equiprobables con, por ejemplo, el resultado (5, 5)(que solo puede ocurrir de una manera).

Respuesta a la paradoja del cumpleaños.Basta con que haya 22 personas en la sala para que la probabilidad de que dos cumplanaños el mismo día sea superior al 50%.

Capítulo 3: Probabilidad. Estadística.Fernando San Segundo. Actualizado: 2017-09-29 32

/ 32