PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no...

169
PROBABILIDA Y ESTADÍSTICA LA OBRA CONTIENE EL DESARROLLO TEMÁTICO DEL PROGRAMA DE ESTUDIO DE LA CARRERA DE INGENEIRÍA EN COMUNICACIONES Y ELECTRÓNICA DE LA ESIME ZACATENCO IPN. FRANCISCO MUÑOZ APREZA Profesor Tiempo Completo T “C” ISTITUTO POLITÉCNICO NACIONAL

Transcript of PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no...

Page 1: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Página 1 de 169

PROBABILIDA Y ESTADÍSTICA LA OBRA CONTIENE EL DESARROLLO TEMÁTICO DEL PROGRAMA DE ESTUDIO DE LA CARRERA DE INGENEIRÍA EN COMUNICACIONES Y ELECTRÓNICA DE LA ESIME ZACATENCO IPN.

FRANCISCO MUÑOZ APREZA Profesor Tiempo Completo T “C”

ISTITUTO POLITÉCNICO NACIONAL

Page 2: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Índice General

a) Bienvenida b) Introducción

1.- Estadística descriptiva 2.- Probabilidad clásica 3.- Funciones de probabilidad de variables aleatorias discretas 4.- Funciones de probabilidad de variables aleatorias continuas 5.- Distribuciones de probabilidad multivariable

Page 3: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

BIENVENIDA El Sistema de Enseñanza Aprendizaje de Alto Rendimiento Académico SEAARA te da la bienvenida a una forma de aprender los elementos teórico – prácticos de la probabilidad y la estadística, con la confianza de que en cada una de sus líneas podrás encontrar una forma comprensible de entender y asimilar los desarrollos lógicos – operativos que fundamentan sus postulados

Page 4: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Introducción Todas las disciplinas del saber humano que sistematizan su actuar está influenciado por el azar, siendo como lo es la vida misma azarosa el estudio y comprensión del pensamiento probabilístico es fundamental para poder predecir con mayor certeza las consecuencias de los diferentes actuares en la vida. En este sentido desde que el humano encontró que en los juegos de azar existía una relación de los casos favorables entre los casos posibles, se dio a la tarea de construir toda una teoría que le permitiera predecir. A partir de este momento el desarrollo de las teorías probabilísticas y de las técnicas estadísticas para asirse del comportamiento de las variables empezó a contar con múltiples tablas de frecuencia y con ello comprendió la importancia de la información que arrojaba la media y la desviación estándar y la varianza. Así crece y se desarrollan las distribuciones probabilísticas ya sean de variables aleatoria discretas y las variables aleatorias continuas. Surgen entonces con fuerza académica importante los estudios empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la empíria surgen La distribución de probabilidad binomial, Poisson, normal, exponencial y toda una constelación con que podemos analizar todos los comportamientos azarosos de la vida en todas sus manifestaciones. He aquí , un material que conjuga la teoría con la practica esperando que con ella se podrá comprender mejor lo que es y para que sirve la Estadística y la probabilidad.

Page 5: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Objetivo general El alumno resolverá problemas teórico prácticos que involucren fenómenos probabilísticos. Objetivos particulares

El alumno resolverá ejercicios que involucren fenómenos probabilísticos.

.

El alumno será capaz de realizar una investigación de campo de fenómenos empíricos y extraer de sus resultados conclusiones con alto grado de confiabilidad.

El alumno aplicará loa métodos y técnicas estadísticas para analizar problemas reales.

El alumno utilizará los elementos que se desprendan de la investigación de campo para elaborar sus tablas de frecuencia, calcular las medidas de tendencia central y de desviación..

El alumno empleará las resultados de la investigación de capo para modelarlos en las diferentes distribuciones de probabilidad existentes.

El alumno será eficiente para predecir los posibles comportamientos de las variables que contenga la investigación de campo.

Page 6: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

I ESTADÍSTICA DESCRIPTIVA Y MUESTREO Índice 1.- Estadística descriptiva 1.1.- Características del muestreo 7 a) Terminología del muestreo (estadísticos , parámetros ) 7 b) Símbolos estadísticos 7 c) Error estándar 7 d) error muestral 8 E) Método de selección de la muestra 8 f) Muestreo simple 8 g) Muestreo doble 9 h) Muestreo múltiple 9

i) Muestreo aleatorio simple, y sistemático, estratificado y por conglomerados. 9

1.1.1.- Levantamiento de la encuesta 10 1.1.2.- Uso del SPSS 17 para la elaboración de las tablas de frecuencia 10

1. 2.- Tabla de Frecuencia

1.2.1 Definición de tabla de frecuencia 11 1. 2.2 Frecuencias Acumuladas 11 1. 2.3 Frecuencias Relativas 11 1.2.4 .Escala ordinal 11

1. 2.5.- Escala nominal 11 1.2.5 Determinación del tamaño de la muestra 11 1.2.6.- Determinación del número de intervalos 11 1.2.7.- Definición de límite superior e inferior 12 1.2.8.- Ejemplos 12 1. 2.9 Ejercicios 14

1. 3.- Representación gráfica de las Tablas de Frecuencias

1. 3.1 Gráfica de polígonos de frecuencia 15 1. 3.2 Gráfica de pastel 16

1. 3.3 Gráfica de cilindros 16 1. 3.4 Gráfica de conos 17 1.3.5.- Ejercicios 17

1. 4.- Medidas de Tendencia Central

Page 7: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

1. 4.1 Teoría Elemental 19 1. 4.2 Moda 19

1. 4.3 Media 19 1. 4.4 Mediana 19 1. 4.5 Características de la media, moda y ,mediana 20 1.4.6.- Madia geométrica 21 1.4.7.- Histograma 21 1.4.8.- Cuartiles 21 1. 4.9 .- Porcentiles 21 1. 4.10.- Varianza 21 1.4.11.- Desviación estándar 22 1.4.12.- Coeficiente de variación 22 1.4.13.- Cálculo de datos agrupados 22

Page 8: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

2.- .- Estadística descriptiva

Un poco de historia Richard de Fornival (1200 – 1250) calcula los diferentes valores para la suma de dos dados, con lo que da un primer paso en lo que vendría a ser la teoría de las probabilidades. El italiano Lucas Pacioli (1445 – 1517) es el iniciador de las probabilidades con su propuesta “ Un premio de 22 ducados se dará cuando se alcancen 60 puntos y se suspende cuando un equipo lleve 50 y el otro 30” Otro italiano Girolamo Cardano ( 1501 – 1576) da su aportación con su obra “ El libro de los juegos de azar”, en tanto el italiano Nicolás Tataglia ( 1499 – 1557) propone “ si un equipo asignado a y el otro b y si se juegan n puntos el premio total es p” Galileo Galilei ( 1564 – 1642) italiano de origen publica su teorema de las medidas de los errores.

Lucas Pacioli

Girolamo Cardano

Nicolás Tartagli

Galileo Galilei

Page 9: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Introducción Esta Modulo I está diseñado para que el alumno comprenda los fundamentos y aplicaciones de la Estadística descriptiva. Se abordarán los temas en dos vertientes; la primera a partir de los fundamentos teóricos y aplicaciones y la segunda mediante un Muestreo por encuestas.

1.- Características del muestreo

Al tomar una cantidad de elementos de una población para poder contar con criterios de decisión, estamos tomando una muestra de ella.

Del tamaño de la población (N) se pueden extraer varias muestras. Un cierto estadístico puede ser calculado para cada una de las muestras posibles extraídas de la población. Una distribución del estadístico obtenida de esta manera es llamada la distribución del estadístico.

En estadística un muestreo es la técnica para la selección de una muestra a partir de una población.

a).- Terminología para el muestreo

Los términos usados en inferencia estadística son:

Estadístico: medida usada para describir alguna característica de una muestra (media aritmética, mediana. desviación estándar)

Parámetro: representación del estadístico.

b).- Los símbolos usados para representar los estadísticos y los parámetros;

Medida Símbolo para el

estadístico Símbolo para el

parámetro

Media X µ

Desviación estándar S s

Número de elementos

N N

Proporción P P

Page 10: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Al elegir una muestra buscamos encontrar sus propiedades las que al ser extrapolables a la población nos permitan obtener resultados similares a los que se obtendrían de realizase un estudio de toda la población.

En el muestreo el tamaño de la muestra es más pequeño que el tamaño de la población por lo que se puede extraer dos o más muestras de ésta.. Al conjunto de muestras que se pueden obtener de la población se denomina espacio muestral. La variable que asocia a cada muestra su probabilidad de extracción, sigue la llamada distribución muestral

c).- Error Estándar: La desviación estándar de una distribución, en el muestreo de un estadístico, es el error estándar del estadístico.

De esta forma, la desviación estándar de las medias de todas la muestras posibles del mismo tamaño, extraídas de una población, es llamada el error estándar de la media.

d).- Error muestral o error de muestreo: La diferencia entre el resultado obtenido de una muestra y el resultado que deberíamos de obtener de la población se llama el error muestral o error de muestreo. Un error de muestreo ocurre cuando no se lleva a cabo la encuesta completa de la población, sino que se toma una muestra de ella para estimar sus características.

El error muestral es medido por el error estadístico, en términos de probabilidad, bajo la curva normal. El resultado de la media indica la precisión de la estimación de la población basada en el estudio de la muestra. Mientras más pequeño sea el error muestral, mayor es la precisión de la estimación.

e).- Métodos de selección de muestras.

Una muestra debe ser representativa si va a ser usada para estimar las características de la población. Los métodos para seleccionar una muestra representativa son numerosos, dependiendo del tiempo, dinero y habilidad disponibles para tomar una muestra y la naturaleza de los elementos individuales de la población.

Los métodos de selección de muestras pueden ser clasificados de acuerdo a:

1. El número de muestras tomadas de una población dada para un estudio y

2. La manera usada en seleccionar los elementos incluidos en la muestra. Los métodos de muestreo basados en los dos tipos de clasificaciones son expuestos en seguida.

Métodos de muestreo clasificados de acuerdo con el número de muestras tomadas de una población.

Page 11: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Bajo esta clasificación, hay tres tipos comunes de métodos de muestreo.

Estos son:

f).- Muestreo simple: Este tipo de muestreo toma solamente una muestra de una población dada para el propósito de inferencia estadística. Puesto que solamente una muestra es tomada, el tamaño de muestra debe ser lo suficientemente grandes para extraer una conclusión. Una muestra grande muchas veces cuesta demasiado dinero y tiempo.

g).-Muestreo doble: Bajo este tipo de muestreo, cuando el resultado del estudio de la primera muestra no es decisivo, una segunda muestra es extraída de la misma población. Las dos muestras son combinadas para analizar los resultados. Este método permite a una persona principiar con una muestra relativamente pequeña para ahorrar costos y tiempo. Si la primera muestra arroja una resultado definitivo, la segunda muestra puede no necesitarse.

h).- Muestreo múltiple: El procedimiento bajo este método es similar al expuesto en el muestreo doble, excepto que el número de muestras sucesivas requerido para llegar a una decisión es más de dos muestras.

i).-Muestreo Aleatorio: Una muestra se dice que es extraída al azar cuando la manera de selección es tal, que cada elemento de la población tiene igual oportunidad de ser seleccionado. Una muestra aleatoria es también llamada una muestra probabilística son generalmente preferidas por los estadísticos porque la selección de las muestras es objetiva y el error muestral puede ser medido en términos de probabilidad bajo la curva normal. Los tipos comunes de muestreo aleatorio son el muestreo aleatorio simple, muestreo sistemático, muestreo estratificado y muestreo de conglomerados.

A. Muestreo aleatorio simple. Una muestra aleatoria simple es seleccionada de tal manera que cada muestra posible del mismo tamaño tiene igual probabilidad de ser seleccionada de la población. Para obtener una muestra aleatoria simple, cada elemento en la población tenga la misma probabilidad de ser seleccionado, el plan de muestreo puede no conducir a una muestra aleatoria simple. Por conveniencia, este método pude ser reemplazado por una tabla de números aleatorios. Cuando una población es infinita, es obvio que la tarea de numerar cada elemento de la población es infinita, es obvio que la tarea de numerar cada elemento de la población es imposible. Por lo tanto, ciertas modificaciones del muestreo aleatorio simple son necesarias. Los tipos más comunes de muestreo aleatorio modificado son sistemático, estratificado y de conglomerados.

B. Muestreo sistemático. Una muestra sistemática es obtenida cuando los elementos son seleccionados en una manera ordenada. La manera de la selección depende del número de elementos incluidos en la población y el tamaño de la muestra. El número de elementos en la población es, primero, dividido por el número deseado en la muestra. El cociente indicará si cada décimo, cada onceavo, o cada centésimo elemento en la población va a ser

Page 12: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

seleccionado. El primer elemento de la muestra es seleccionado al azar. Por lo tanto, una muestra sistemática puede dar la misma precisión de estimación acerca de la población, que una muestra aleatoria simple cuando los elementos en la población están ordenados al azar.

C. Muestreo Estratificado. Para obtener una muestra aleatoria estratificada, primero se divide la población en grupos, llamados estratos, que son más homogéneos que la población como un todo. Los elementos de la muestra son entonces seleccionados al azar o por un método sistemático de cada estrato. Las estimaciones de la población, basadas en la muestra estratificada, usualmente tienen mayor precisión (o menor error muestral) que si la población entera muestreada mediante muestreo aleatorio simple. El número de elementos seleccionado de cada estrato puede ser proporcional o no proporcional al tamaño del estrato en relación con la población.

D. Muestreo de conglomerados. Para obtener una muestra de conglomerados, primero dividir la población en grupos que son convenientes para el muestreo. En seguida, seleccionar una porción de los grupos al azar o por un método sistemático. Finalmente, tomar todos los elementos o parte de ellos al azar o por un método sistemático de los grupos seleccionados para obtener una muestra. Bajo este método, aunque no todos los grupos son muestreados, cada grupo tiene una igual probabilidad de ser seleccionado. Por lo tanto la muestra es aleatoria.

Una muestra de conglomerados, usualmente produce un mayor error muestral (por lo tanto, da menor precisión de las estimaciones acerca de la población) que una muestra aleatoria simple del mismo tamaño. Los elementos individuales dentro de cada "conglomerado" tienden usualmente a ser iguales.

Page 13: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

1.1.1.- Levantamiento de la muestra Una vez que se ha diseñado la población de estudio, el cuestionario y características de éste, el tamaño de la muestra y el tipo de muestreo a aplicar, se procede al levantamiento de la muestra la cual deberá de ser aleatoria. 1.1.2.- El uso del programa SPSS Para sistematizar la información recabada durante el levantamiento del muestreo existen programas que simplifican los cálculos de las medidas de tendencia central y de desviación así como la elaboración de las tablas de frecuencia que preceden a la elaboración de las funciones de distribución de probabilidad ya sean de variables aleatorias discretas o continuas, de una variable o multivariables.

1.2.- Tablas de frecuencia

1.2.1.- Definición de tabla de Frecuencia: Una tabla de frecuencia es el conjunto de datos organizados con base en la información contenida en una muestra.

1.2.2.- Definición de frecuencia relativa: La frecuencia Relativa fi/n : es una frecuencia particular entre el número total de observaciones.

1.2.3.- Definición de escala ordinal. Una escala Ordinal: es aquella escala representada por valores numéricos

Ejemplo: {1, 2. 3.....}; < 1, 5, >,.

1.2.4.- Definición de escala nominal Una escala Nomina: es aquella escala representada por valores no numéricos

Page 14: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Ejemplo < masculino, femenino >.

1.2.5.- Determinación del tamaño del intervalo: La fijación de este tamaño dependerá de las necesidades del investigador, puede ser todos del mismo tamaño o de tamaños desiguales.

1.2.6.- Determinación del número de intervalos de clase: A medida que el número de intervalos de clase disminuye, la información es menos precisa pero su tratamiento analítico es mayor. El número de intervalos se sugiere que sea entre 5 y 15 dependiendo de las necesidades de investigador. 1.2.7- Definición Límite superior e inferior: son los existentes en un intervalo de clase < límite inferior, límite superior >.

1.2.8.- Ejemplos Para elaborar este tipo de tabla se van sumando las frecuencias de cada una de los intervalos de clase. Su utilidad consiste en que podemos conocer el comportamiento del proceso estadístico de los intervalos de clase con respecto a la primera variable.. En los intervalos de clase, por ejemplo < 13 a 15 > “Edad en que entró a trabajar “ el 13 representa el límite inferior y el 15 el límite superior. En este cuadro el investigador organizó su información en 7 intervalos de clase sacrificando precisión en la información pero ganó claridad analítica en ella.

Page 15: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Cuadro 1

Edad a que entró a Trabajar el trabajador

Edad Frecuencia

9 – 12 72

13 - 15 153

16 – 17 190

18 – 20 313

21 – 25 45

26 en adelante 9

No contestó 30

Total 812

Al analizar los datos vemos que están agrupados por intervalos de clase ordinal, de conformidad con la necesidad que el investigador tiene de conocer parámetros que le permitan inferir acerca del trabajo infantil < 9 a 12 >, de la pubertad (13 a 15 ), de la adolescencia (18 a 20 ) y la juventud <21 a 25 > teniendo un intervalo mixto <26 en adelante> y uno nominal <no contestó>. Tabla de frecuencia acumulada Para elaborar una tabla de frecuencia acumulada del cuadro 1 se van sumando las frecuencias de cada uno de los intervalos. Ahí la utilidad para el investigador consiste en que puede conocer en cada uno de los intervalos el comportamiento total. Detecta en particular que 225 trabajadores se iniciaron en el trabajo asalariado entre los 9 y 15 años de edad.

Cuadro 2

Edad de inicio laboral del asalariado

Clase Frecuencia Acumulada

9 – 12 72

9 - 15 225

9 – 17 415

9 – 20 728

9 – 25 773

9 ó 26 en adelante 782

No contestó

Total 782

Tablas de frecuencia relativa

Page 16: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

La utilidad para el investigador de representar sus datos mediante una tabla de frecuencias relativas, consiste en que ésta da claridad sobre el comportamiento de cada intervalo de clase respecto al total. De tal forma si se desea conocer el peso que tiene en la rama del vidrio en los trabajadores que iniciaron una actividad remunerada en la época de la adolescencia vemos que representa el 38.54 %. Cuadro 3

Tamaño de la muestra 812 Inicio en labores asalariadas

Clase Frecuencia

9 – 12 8.8

13 – 15 18.84

16 – 17 23.39

18 – 20 38.54

21 – 25 5.54

26 en adelante 1.1

No contestó 3.7

T o t a l 100.00

1.2.9.- Ejercicios 1.- ¿Qué utilidad tendría utilizar la frecuencia acumulada en los cuadros 4,5 y 6 2.- ¿Qué utilidad tendría utilizar la frecuencia relativa en los cuadros 4,5,y 6 ?. 3.- ¿Qué ventajas tiene el utilizar frecuencias de amplitud total en los cuadros 4,5 y 6 ? 4.- ¿Tiene sentido la frecuencia de amplitud total en los cuadros 4,5 y 6?

Page 17: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Cuadro 4

Cuadro 5

Tamaño de la Muestra 812

Sexo Frecuencia

Masculino 712

Femenino 67

No Contestó 33

Total 812

Cuadro 6

Tamaño de la Muestra 812

Estado Civil Frecuencia

Soltero 206

Casado 544

Viudo 13

Divorciado 15

Unión Libre 28

No Contestó 6

Total 812

Tamaño de la muestra 812 Edad

Edad Frecuencia

0 – 17 12

18 – 20 60

21 – 25 143

26 – 30 171

31 - 35 148

36 – 40 137

41 – 45 61

46 - 50 52

51 - 55 21

55 o más 5

No contestó 2

Total 812

Page 18: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

1.3.- Representación gráfica de las tablas de frecuencia El visualizar el comportamiento de los datos de las tablas de frecuencia mediante diagramas de barras, gráficas de líneas, diagramas circulares, polígonos de frecuencia rinden beneficios analíticos al investigador 1.3.1.- Gráfica de polígonos de frecuencia

1.3.2.- Gráfica de pastel

Page 19: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

1.3.3.- Gráfica de cilindro 1.3.4.- Gráfica de conos

Page 20: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

El utilizar una u otra representación visual va a ser importante en la medida que describa a la información con mayor claridad y facilite la interpretación. Se debe tener cuidado con la escala con las cuales elaboren las gráficas; si se usa una escala errónea el gráfico arrojará una falsa idea en su comportamiento. 1.3.5.- Ejercicios 1.- Elabore la gráfica del cuadro 7 y 8. 2.- ¿Qué tipo de escalas se utilizan en los cuadros 7 y 8?. 3.- ¿Qué ventajas le ve usted en elaborar una tabla de frecuencias acumuladas en los cuadros 7 y 8 ?. 4.- ¿Qué análisis se desprende de los gráficos de los cuadros 7 y 8 ?. Cuadro 7

Salario Semanal

Clase Frecuencia

Hasta $ 125 31

$126 – $ 250 194

$251 – $ 375 224

$376 – $500 123

$510 ó más 240

No contestó 0

Total 812

Nota La presentación de los intervalos de clase en el salario semanal esta dada en combinación ordinal y nominal < hasta 125 >, < 501 ó más >. En el polígono de frecuencia podemos deducir que la mayor concentración de los trabajadores se localiza en los niveles salariales de 4 salarios mínimos ó más. Además de peso de los trabajadores que perciben hasta un salarios mínimo prácticamente inexistente.

Page 21: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Cuadro 8

Antigüedad

Años Frecuencia

0 – 1 143

2 – 5 290

6 – 10 183

11 – 15 86

16 – 20 56

21 – 25 35

26 – 29 12

300 ó más 7

Total 812

1.4.- Medidas de tendencia central

Las medidas de ubicación proporcionan información sobre el lugar hacia donde existe la tendencia central dentro de un grupo de números. Las medidas de ubicación presentadas en esta unidad para datos no agrupados son la media, la mediana, y la moda.

1.4.1.- Media: La media aritmética, promedio o media, es calculada sumando todos los números de un conjunto de números (xi) y después dividiéndolos por el número de observaciones (n) del conjunto.

µ = xi /n

La media es sensible a los valores extremos; es decir, los datos extremadamente grandes o pequeños pueden causar que la media se ubique más cerca de uno de los datos extremos.

1.4.2.- Media Ponderada: en algunos casos, los datos de una muestra o población son ponderados de acuerdo a su importancia.

1.4.3.- Mediana: La mediana es el valor medio de una grupo ordenado de observaciones. Si existe un número par de observaciones correspondientes al grupo puede haber dos medianas

La mediana es normalmente utilizada para resumir los resultados de una distribución. Si la distribución es sesgada , la mediana es un buen indicador de medida para saber donde los datos observados se encuentran concentrados.

Page 22: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Generalmente, la mediana proporciona una mejor medida que la media cuando las observaciones son extremadamente grandes o pequeñas

La media tiene dos ventajas sobre la mediana. Es más estable, y uno puede calcular la media de dos o más muestras.

1.4.4- Moda: La moda es el valor más frecuente en un sistema de observaciones.

Los datos pueden tener dos modas. En este caso, decimos que los datos son bimodales, y los grupos de observaciones con más de dos modos están referidos como multimodales.

Observe que la moda no es una medida útil de ubicación, porque puede haber más de una moda o quizás ninguna.

Page 23: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

1.4.5.- Características de la Moda, Mediana y Media

Moda Mediana Media

Es el valor mas frecuente en la distribución.

Es el valor del punto medio de la selección

Es el valor de mayor concentración de la muestra

Su valor es establecido por la frecuencia predominante, no por los valores en la distribución.

El valor de la media es fijado por su posición en la selección, y no refleja valores individuales.

La suma de las desviaciones en cualquier lado de la media son iguales.

Este es el valor más común.

La distancia agregada entre la mediana y cualquier otro punto de la muestra es menor que en cualquier otro punto.

Esta refleja la magnitud de cada valor.

Una distribución puede tener más de 2 modas.

Cada selección tiene solo una mediana.

Una muestra tiene solo una media.

No puede ser manipulada algebraicamente.

No puede ser manipulada algebraicamente.

Pueden ser manipuladas algebraicamente.

Es inestable, puede ser influenciada en el proceso de agrupación.

Es estable , al agrupar los datos no se afecta su apreciación.

Es estable en cuanto a al procedimiento para agrupar ya que éste no afecta la apreciación.

La moda no refleja el grado de modalidad.

No es aplicable para datos cualitativos.

Podría ser calcula igualmente cuando los valores individuales son desconocidos, si se posee la suma de los valores y el tamaño de la muestra.

Puede ser calculada cuando los extremos de los valores de los grupos son abiertos.

Puede ser calculado cuando los valores extremos son abiertos.

No puede ser calculado de una tabla de frecuencia cuando sus valores extremos son abiertos.

Page 24: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

1.4.6.- La Media Geométrica: La media geométrica (G) de n valores no negativos es la enésima raíz del producto de los n valores.

Si algunos valores son muy grandes en magnitud y otros muy pequeños, la media geométrica proporciona una mejor representación de los datos que un simple promedio.

1.4.7.-Histogramas: Analizando la Homogeneidad de la Población

Un histograma es una representación gráfica de una estimación para la densidad (para variables aleatorias continuas) o la función de probabilidad total (para variables aleatorias discretas) de la población.

Las características geométricas del histograma nos permiten descubrir información útil sobre los datos, por ejemplo:

1. La localización del “centro” de los datos. 2. El grado de dispersión. 3. La sección a la cual se sesga, es decir, cuando no cae

simétricamente en ambos lados del pico. 4. El grado de agudeza del pico. Cómo se levanta y baja la

pendiente.

Las medidas de variación más comunes son: varianza, desviación estándar, y el coeficiente de variación.

1.4.8.- Cuartiles: Cuando requerimos sean divididos en cuartos, Q1... Q4, conocidos como cuartiles. El primer cuartíl (Q1) es el valor donde están 25% de los valores mas pequeños y en el otro 75% los más grandes. El segundo cuartíl (Q2) es el valor donde están 50% de los valores mas pequeños y en el otro 50% los más grandes. En el tercer cuartíl (Q3) es el valor donde están 75% de los valores mas pequeños y en el otro 25% los más grandes.

1.4.9.- Porcentajes: Los porcentajes tienen la ventaja que pueden ser subdivididos en 100 porciones. Los porcentajes y los cuartiles son más convenientes de leer cuando son tomados de una función de distribución acumulativa.

1.4.10.- Varianza: Es una importante medida de variabilidad.

La varianza es el promedio de las desviaciones estándar elevadas al cuadrado de cada una de las observaciones con respecto a la media.

Var(x) = (xi - ) 2 / (n - 1), de donde n por lo menos es igual a 2.

Page 25: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

La varianza es una medida de dispersión entre valores de los datos. Por lo tanto, mientras más grande sea la varianza, menor será la calidad de los datos.

Desviación Estándar:

Ambas, la varianza y la desviación estándar proporcionan la misma información; una siempre puede ser obtenida de la otra .

La desviación estándar es la raíz cuadrada de la varianza, esta siempre es expresada en las mismas unidades que el conjunto de datos:

Desviación estándar= = (Varianza) ½

1.4.12.- Coeficiente de Variación: El coeficiente de variación (CV) es la desviación relativa absoluta con respecto al tamaño , siempre que sea cero, expresado en porcentaje:

CV =100 |S/ | %

El CV es independiente de las unidades de medida. En la estimación de un parámetro, cuando su CV es menos del 10%, la estimación se asume aceptable. En el caso contrario, digamos, 1/CV se llama el Cociente de señal de ruido.

El coeficiente de variación se utiliza para representar la relación de la desviación estándar hacia la media,.

1.4.13.- Cálculo de Estadísticos Descriptivos para Datos Agrupados:

.

Los datos agrupados son derivados de informaciones ordinarias, y consisten en frecuencias (cálculo de valores ordinarios) tabulados con las clases en las cuales ocurren.

Los límites de las clases representan los valores más pequeños (inferiores) y más grandes (superior) que la clase contendrá.

Page 26: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Las fórmulas para los estadísticos descriptivos son mucho más simples para los datos agrupados.

Page 27: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

2.- Probabilidad clásica

2.1.. Teoría de conjuntos

2.1.1.- Un poco de historia 24

2.1.2.- Nociones de conjuntos 24

2.1.3.- Igualdad de conjuntos 25

2.1.4.- Unión 25

2.1.5.- Intersección 26

2.1.6.- Complemento 26

2.1.7.- Diferencia 27

2.1.8.- Conjunto vacío 27

2.1.9.- Conjunto universal 28

2.1.10- Ejemplos 28

2.1.11.- Producto cartesiano 29

2.1.12.- Conjunto potencia 30

2.1.13.- Ejemplos 30

2.1.14.- Simbología 33

Page 28: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

2.- PROBABILIDAD CÁSICA

2.1.- Teoría de conjuntos: El concepto de conjunto es fundamental en el análisis matemático toda vez que nos permite encontrar relaciones, implícita o explícitamente, en todas las ramas de las matemáticas. En su forma explícita, los principios y terminología de los conjuntos se utilizan para construir proposiciones matemáticas más claras y precisas y para explicar conceptos abstractos como el infinito. Definición de Conjunto “Un conjunto es una agrupación de elementos bien definidos”

Ejemplo de conjuntos:

S1 = {2, 4}; S2 = {2, 4, 6, …, 2n, …} = {todos los enteros pares};

2.1.2.- Notaciones de conjuntos Es usual denotar los conjuntos por letras mayúsculas. Los elementos de los conjuntos se representan por letras minúsculas A = { 1,3,5,7,9,11 } Separando los elementos por comas y encerrándolos entre llaves {}. Esta es llamada forma tabular de un conjunto. Pero si se define un conjunto enunciando propiedades que deben tener sus elementos. Ejemplo: Sea B el conjunto de todos los numero pares, entonces se emplea una letra, por lo general x, para representar un elemento cualquiera y se escribe

Un poco de historia El matemático alemán Georg Cantor en el siglo XIX formalizó por primera vez la teoría de conjuntos.

Page 29: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

B={x/xa los números pares } lo que se lee “B es el conjunto de los números x tales que x es par” se dice que esta es la forma de definición por comprensión o constructiva de un conjunto. Téngase en cuenta que la barra vertical se lee “ Tales Que” . si un objeto x es el elemento de un conjunto A, es decir, si A contiene a x como uno de sus elementos, se escribe.

x A que se puede leer también “x pertenece a A” ó “x esta en A”. Si por el contrario un objeto x no es elemento de un conjunto A, es decir, si A no contiene a x entre sus elementos, se escribe

x A Es costumbre que en los escritos matemáticos poner una línea vertical o una oblicua “/” tachando un símbolo para indicar lo opuesto o la negación del significado de símbolos. Decimos que el elemento P pertenece al conjunto S si P está contenido en el conjunto S.

Decimos que el conjunto A está contenido en el conjunto S si todos los

elementos del conjunto A son elementos del conjunto S.

2.1.3.- Igualdad o identidad de conjuntos

El conjunto A es igual al conjunto B si ambos tienen los mismo elementos, es

decir, si cada elemento en A pertenece también a B, y si cada elemento en a B

pertenece a A. Se denota la igualdad de los conjuntos A = B.

Decimos que la identidad de dos conjuntos A Y B se da, cuando A está

contenido en B y B está contenido en A.

Ejemplo

Sean. A={1,2,3,4 } y B={3,1,4,2 }, entonces A=B, porque los elementos 1,2,3,4

de A pertenece a B y cada uno de los elementos 3,1,4 y 2 de B pertenece a A.

Debemos de observar que en un conjunto el orden de aparición de sus elementos no cambia su contenido.

Page 30: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

2.1. 4.- .UNIÓN La unión de los conjuntos A y B es el conjunto de todos los elementos que pertenecen a A o a B o a ambos. Se denota la unión de A y B por A U B = { x / x en A ό x en B }

el cual se lee “A unión B”.

2.1.5.- Intersección La intersección de los conjuntos A y B es el conjunto de los elementos comunes en A Y B, esto es, aquellos elementos que pertenecen a A y que también pertenecen a B. Se denota la intersección de A y B por: A ∩ B = { x / x Є A y x Є B } Que se lee “A intersección B”

Page 31: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

2.1.6.- Complemento El complemento de un conjunto, es el conjunto de elementos que no pertenecen a A, es decir la diferencia del conjunto universal U y del A. Se denota el complemento de A por:

A' = { x / x A } 2.1.7.- Diferencia La diferencia de los conjuntos A y B es el conjunto de elementos que pertenecen a A pero no a B. Se denota la diferencia de A y B por:

A ─ B = { x / x Є A y x B } Que se lee “A diferencia B” o simplemente “A menos B”

Page 32: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

2.1.8- Definición de conjunto vacío

El conjunto vacío es un conjunto sin elementos. Φ = { }

2.1.9.- Conjunto Universal

El Conjunto Universal es el conjunto que tiene todos los elementos. U = { Todos los elementos que están contenidos en el diagrama de Venn } Es importante señalar que el conjunto universal se debe definir en primer lugar y todos los demás conjuntos deberán estar contenidos en él.

Page 33: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

2.1.10- Ejemplos 1.- Si definimos que el Conjunto Universal está definido por los diez número dígitos entonces U = { 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 } 2.- Si el Conjunto Universal está definido por los números dígitos entonces U = { 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 }

3.- Ejemplo:

Sea U={ x / 0< x < 2} A={x /1/2 < x < 1 }

B={x / ¼< x < 3/2 } C= {x / 1/3 < x < 3/2 }

Entonces AUB = { x / x Є A ó x Є B} = { x / ¼ < x < 3/2 } A∩B ={x / x Є A y x Є B } = { x / ½ < x < 1}

Ā= {x / x A , x Є (U - A)} = { x / 0 < x < ½ } U { 1 < x < 2} Con base en el desarrollo anterior Calcula (AUB)C , (A∩B)C , AC∩B , A∩BC , AC∩ BC , ACUBC , CC , A∩C , ACUCC , ACUC. Solución

(AUB)C = { x / x AUB, x Є (U- AUB) } = { x / (0 < x < ¼) U (3/2 < x < 2)}

(A∩B)C = { x / x A∩B, x Є U – (A∩B) } = { x / (0 < x < 1/2) U (1 < x < 2)}

AC∩B = { x / x A y x Є B} = { x / (1/4 < x < 1/2) U (1 < x < 3/2)}

A∩BC = { x/ x Є A y x B} = { Ø }

AC∩ BC = { x / x A y x B} = { x / (0 < x < 1/4) U (3/2 < x < 2)}

ACUBC = { x / x A ó x B} ={ x / (0 < x < 1/2) U (1 < x < 2)}

/

Page 34: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

CC = { x / x C , x Є (U – C)} = { x / (0 < x < 1/3) U (3/2 < x < 2)}

A∩C = { x / x Є A y x ЄC} = { x /1/2 < x < 1 }

ACUCC = { x / x A y x C } = { x / (0 < x < 1/2) U (1 < x < 2)}

ACUC = { x / x A ó x Є C } = { x / 1/3 < x < 3/2 }

2.1.11.- Producto cartesiano

Definición:

El producto cartesiano de un conjunto E por el conjunto F, es el conjunto de

todas las parejas ordenadas ( x , y ) tales que x E , y F .

El producto cartesiano de E y F, se escribe como E × F

Ejemplo:

si A = {1, 2} y B = {x, y, z}

entonces:

A × B = {(1, x), (1, y), (1, z), (2, x), (2, y), (2, z)}.

B × A = {(x, 1), (y, 1), (z, 1), (x, 2), (y, 2), (z, 2)}.

Page 35: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

En este caso, A × B = B × A, pues al ser pares ordenados, el par (1, x) es

distinto del par (x, 1).

2.1.12.- Conjunto Potencia La familia de todos los subconjuntos S se llama conjunto de potencia de S. Se le designa por

s2 Ejemplo:

Si entonces b},{a,M }},b{},a{},b,a{{2M si un conjunto S es infinito digamos que S tenga n elementos, entonces el conjunto potencia de S tendrá n2 elementos, como se puede demostrar. Esta es una razón, para llamar conjunto de potencia de S la clase de los subconjuntos de S y para denotarla por s2 . 2.1.13.-Ejemplos

1.- Sea el conjunto universal 01,01,,|),( 21 yxDyDxyxu y

Zyx, . Sea:

}10|,{ 21 yxDyDxA

}|,{ 2

21 yxDyDxB

}10|,{ 22

21 yxDyDxC

}2|,{ 2

21 xDyDxD

}1022|,{ 21 yxDyDxE

Determinar u , A , B , C , D y E .

Solución:

Page 36: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

)}6,6(),5,6(),4,6(),3,6(),2,6(

),1,6(),5,5(),4,5(),3,5(),2,5(),1,5(),6,4(),5,4(),4,4(),3,4(),2,4(),1,4(),6,3(),5,3(),4,3(),3,3(

),2,3(),2,3(),1,3(),6,2(),5,2(),5,2(),4,2(),3,2(),2,2(),1,2(),6,1(),5,1(),4,1(),3,1(),2,1(),1,1{(u

)}6,6(),5,6(),4,6(),6,6(),6,5(),6,4{(A

)}6,6(),5,6(),4,6(),3,6(),6,5(),5,5(),4,5(),3,5(),6,4(),5,4(),4,4(

),3,4(),6,3(),5,3(),4,3(),3,3(),2,3(),6,2(),5,2(),4,2(),3,2(),2,2(),6,1(),5,1(),4,1(),3,1(),2,1{(B

)},31(),2,2(),1,2(),3,1(),2,1(),1,1{(C

)}3,6(),2,4(),1,2{(D

uE )...}5,1(),4,1(),1,3(),1,2(),1,1{(

2.- Sean los conjuntos:

90,| xRxxu

}93|{3| xxxxA

}30|{3| xxxxB

6| xAxC

}9830|{8 ,3| xxxxoxxD

Encontrar 'A , BA , )'(' CBA , )'( cBA , )'( CAB .

Solución:

BxxxxAxxA }30{}93{}|{'

}90,|{ xRxxBA

} 64y 93)( ó 93|{)'( xxxxxCBA

AxxxxAxcBA }93|{}64| ó {)'(

BxxxBCAB }30{}6430{)'(

Page 37: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Problemas propuestos 1.- Escriba los elementos de los siguientes conjuntos:

A) Sea el conjunto de enteros entre 1 y 50 y que además cumplen con ser divisible entre 8.

Respuesta: 48,40,32,24,16,88

,501|

Zx

xxA

B) Sea B el conjunto de las x que cumplen con 0122 xx

Respuesta: 4,3,012| 2 ZxxxxB

C) Sea C el conjunto de las x que cumplen con 0542 xx

Respuesta: 5,1,054| 2 ZxxxxC

D) Sea E el conjunto donde x es un continente.

OceaníaAsiaáfricaEuropaAméricaD

ContinentexxD

,,,,

|

2.- Sea el conjunto universal un intervalo de 0 a 15 obtener: a) El conjunto A todas x > 10.

El conjunto B todas las x de por lo menos 1 hasta 4. El conjunto C todas las x de por lo menos 7 a lo más 9. El conjunto D las x < 2 o x > 8. El conjunto E las x > 8 y x < 10.

b) B’ c) B’ ∩ D’ d) A U (C∩E’)

Respuesta:

RxxxRxxxA

U

,1510|,10|

15,14,13,12,11,10,9,8,7,6,5,4,3,2,1,0

( ]

RxxxB ,41|

[ ]

RxxxC ,97|

0 2 4 6 8 10 12 14

0 2 4 6 8 10 12 14

Page 38: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

[ ]

RxxoxxRxxoxxD ,15820|,82|

[ ) ( ]

RxxxRxxyxxE ,108|,108|

[ ]

RxxoxxRxBxxB ,15410|,||

84,8215410|

|

||

||

xxRxxxyxoxxxDB

DxyBxxDB

RxxoxxECAU ,151087||

0 2 4 6 8 10 12 14

0 2 4 6 8 10 12 14

0 2 4 6 8 10 12 14

Page 39: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

2.1.14.- Simbología

Simbología

Є Pertenece.

Conjunto vacío.

U Unión.

∩ Intersección.

| Representa un conjunto con sus elementos.

≤ menor igual que.

≥ mayor igual que.

< menor que.

= igual.

exactamente igual.

Por lo menos significa mayor o igual que

A lo más significa menos o igual que

Al menos: significa mayor o igual que

No más: significa menos o igual que

Igual a = Relación entre dos cantidades del mismo valor.

Page 40: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Un poco de historia Al Buruni ( 973 – 1048) matemático árabe creador del análisis combinatorio Thomas Bayes ( 1702 – 1765) matemático ingles que nos deja su Teorema de Bayes para el análisis de la probabilidad condicional.

Al Buruni

Thomas Bayes

2.1 La probabilidad es una disciplina matemática que se aborda desde tres enfoques: a) El contenido lógico formal. La probabilidad es analizada desde un punto de vista axiomático por lo que establece un conjunto de reglas. b)Antecedentes intuitivos. La intuición y la experiencia física son interdependientes, es un problema del que necesitamos ocuparnos. c)Aplicaciones En las aplicaciones, los modelos matemáticos abstractos sirven de instrumentos; además, diferentes modelos pueden describir la misma situación empírica. La forma en que se aplican las teorías matemáticas no depende de

Page 41: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

ideas preconcebidas; es una técnica con un fin determinado, que depende y cambia con la experiencia. Tipos de experimentos

2.2.1.- Experimentos

2.2.1.1.- Experimento determinístico:

Son aquellos eventos que se cumplen inexorablemente y cuya probabilidad de

ocurrencia es 1

Ejemplo de ello es “Todos los humanos nos vamos a morir”.

2.2.1.2.- Experimentos no determinísticos: son aquellos eventos cuya

probabilidad de ocurrencia se encuentra en 0 P(E) 1.

A este tipo de experimentos corresponde “Al arrojar un dado legal cual es la

probabilidad de que aparezca un dos”

El problema que planea la definición de probabilidad

Definición de probabilidad

Al utilizar el modelo probabilística en otro tipo de problemas surgió un

problema nodal por resolver, esto es, se requería saber contar tanto los casos

favorables como los posibles.

Para responder a esta necesidad surgieron las técnicas del conteo, las que

podemos agrupar en: espacio muestral, análisis combinatorio y los diagramas

de árbol.

P(x) = casos favorables / casos posibles

Page 42: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Ejemplo

En una urna hay 30 bolas: 10 rojas, 5 azules y 15 blancas. Hallar la

probabilidad de que al extraer una bola al azar ésta sea de color.

Podemos observar que son 30 los casos posibles entonces: P(roja) = 10/30 = 1/3 P(azul) = 5/30 = 1/6

2.2.3.- Espacio Muestral

Comencemos por la técnica del espacio muestral, esta técnica se recomienda

utilizarla cuando el número de eventos posibles sea del orden de no más de 50.

2.2.4.- Definición: “Un evento simple es un evento que no se puede

descomponer”.

A cada evento simple le corresponde uno y sólo un punto muestral. 2.2.5- Ejemplos de espacios muestrales Ejemplo 1: Exprese simbólicamente el espacio muestral S que consiste en todos los puntos (x,y) dentro de una circunferencia de radio 3 con centro en el punto (2,-3) {(x,y)/ (x - 2)2 + (y + 3)2 < 9} Ejemplo 2: Supongamos que en un sistema físico aislado hay tres moléculas M1, M2 y M3 cada una con cero, una o dos unidades de energía, la suma de sus energías es dos. Supóngase que todas las distribuciones de energía entre las tres moléculas son igualmente probables. Constrúyase un modelo matemático para esta situación. ¿Cuántos eventos elementales hay? ¿Cuántos eventos elementales son favorables al evento “M1 tendrá energía cero”? ¿Cuál es su probabilidad?. M1 (0,1,2) (0,0,0) (0,0,1) (0,0,2) (0,1,0) (0,1,1) (0,1,2) (0,2,0) (0,2,1) (0,2,2)

2.2.3.1.- Definición: “Un espacio muestral es el conjunto

de todos los puntos muestrales de un experimento”

Page 43: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

M2 (0,1,2) (1,0,0) (1,0,1) (1,0,2) (1,1,0) (1,1,1) (1,1,2) (1,2,0) (1,2,1) (1,2,2) M3 (0,1,2) (2,0,0) (2,0,1) (2,0,2) (2,1,0) (2,1,1) (2,1,2) (2,2,0) (2,2,1) (2,2,2) Como la suma de sus energías es dos, entonces: (0,0,2) (0,1,1) (0,2,0) (1,0,1) (1,1,0) (2,0,0) por lo tanto,

a) Hay 6 eventos elementales.

b) “M1 tendrá energía cero”: (0,0,0) por lo tanto, cada uno tiene probabilidad de 1/6, entonces:

(0,0,2) (0,1,1) (0,2,0) =1/6 + 1/6 + 1/6 = 3/6

c) Su probabilidad es: Pr (C) = 3/24 / 6/24 = 3/6 = ½ 2.2.6.- Más ejemplos 1.- Constrúyase un modelo para el experimento de lanzar un par de dados no cargados. b)¿Cuántos eventos elementales favorables para el evento “caerá un total de ocho puntos por los dos dados”? c)¿Cuál es la probabilidad de tirar “ojos de víbora”(Un total de 2 puntos)?. d)¿Cuál es la probabilidad de tirar 7 u 11? e)¿Cuál es la probabilidad de tirar 2,3 o 12?. f) Supóngase que un dado es rojo, el otro es blanco. ¿cuál es la probabilidad de que el numero de puntos del dado rojo sea menor que el numero de puntos del dado blanco? El espacio muestral es: { (1,1)(1,2)(1,3)(1,4)(1,5)(1,6) (2,1)(2,2)(2,3)(2,4)(2,5)(2,6) (3,1)(3,2)(3,3)(3,4)(3,5)(3,6) (4,1)(4,2)(4,3)(4,4)(4,5)(4,6)

Respuesta y solución

Page 44: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

(5,1)(5,2)(5,3)(5,4)(5,5)(5,6) (6,1)(6,2)(6,3)(6,4)(6,5)(6,6{)

a) existen 36 eventos diferentes y es una suposición que los dados no están cargados

a) total de eventos 36 probabilidad de 1/36 b) p(b)= 5 c) p©=1/36

d) p(7)=6/36 +P(11)=6/36+2/36=8/36=2/9 e) P(2)=1/36 +P(3)=3/36 +P(12)=1/36=4/36=1/9 f) P(f)=15/36=5/12 2.- Encontrar el espacio muestral de preguntarle a tres mujeres si ve la telenovela.

NNNNNSNSNNSSSNNSNSSSNSSSS ,,,,,,,

3.- ¿Cuál será el espacio muestral si se quiere obtener de un grupo de personas ?

MMMMMHMHMMHHHMMHMHHHMHHHS ,,,,,,,

4.- Encontrar el espacios muestral del siguiente experimento:

Comienzo

D N

D N D N

D

N

N

D

D

N

N

D

Respuesta y solución

Respuesta y solución

Respuesta y solución

Page 45: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Sea D : articulo defectuoso y N : articulo no defectuoso.

Se inspeccionan 3 artículos si se encuentran o no defectuosos:

},,,,,,,{ NNNNNDNDDNDDDNNDNDDDNDDDS

5.-Si se lanzan dos monedas legales al mismo tiempo :

a) Cual es la probabilidad de que caigan 2 soles b) Que caiga un águila o un sol o águila y sol

S = { A A,AS, SA,SS} a) P(A y A) = P(A∩A) =P(A)*P(A) = ½ * ½ = 1/4 b) P(S y A) o P(A y S) = (1/2 * 1/2) + (1/2 * 1/2) = 1/2

Para tres monedas: S = {AAA,AAS,ASA,ASS,SAA,SAS,SSA,SSS}

a) Probabilidad de que caiga SSA P(SSA) = P(S∩S∩A) = P(S)*P(S)*P(A) = 1/2*1/2*1/2 = 1/8

b) Probabilidad de que salgan 2 soles y 1 águila P(SSA) o P(SAS) o P(ASS) = 1/8*1/8*1/8 = 3/8 2.2.7.- La probabilidad desde el punto de vista de la frecuencia relativa: Si un experimento se repite un número grande (N) de veces y de éstas el evento A ocurre n veces la probabilidad de A es: P(A) = na / N A cada punto muestral se le asigna P(Ej) tal que: 1.- 0 < P(Ej) < 1

2.- P(E) = 1 S

Respuesta y solución

Page 46: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

2.2.8.- Ejemplos 1.- Una urna contiene 20 canicas blancas numeradas del 1 al 20, 10 canicas rojas numeradas del 1 al 10, 40 canicas amarillas numeradas del 1 al 40 y 10 canicas azules numeradas del 1 al 10. Se revuelven las canicas en la urna para que todas tengan probabilidad de ser seleccionadas.

a) ¿Cuál es la probabilidad de seleccionar una canica azul ó blanca? b) ¿Cuál es la probabilidad de obtener una canica 1, 2, 3,4 ó 5? c) ¿Cuál es la probabilidad de obtener una canica roja ó amarilla y

numeradas de 1, 2, 3, 4? d) ¿Cuál es la probabilidad de sacar un 5,15,25 ó un 35? e) ¿Cuál es la probabilidad de seleccionar una canica blanca con un

número mayor que 12 ó amarilla y con un número mayor que 26?

80

835,25,16,5

20

84,3,2,1

80

205,4,3,2,1

80

30

)101(),401(),101(,201

P

amarillaorojaP

P

blancasoazulesP

azulesamarillasrojasblancasS

80

222612 amarillaoblancaP

2.- Cuantas palabras de 5 letras se pueden formar con la palabra acasa si no tomamos en cuenta el orden Se tienen 5! = 120 permutaciones si no tomamos en cuenta el orden.

206

120

!3

!5

4.- Se van a construir en cuatro ciudades 8 hoteles, 4 condominios y 12 casas ¿Cuál es el espacio muestral?

Page 47: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

a) ¿Cuál es la probabilidad de tener un hotel? b) ¿Cuál es la probabilidad de tener un condominio? c) ¿Cuál es la probabilidad de tener una?

2

1

24

12

24

8

24

8

24

DTP

DTConCP

HP

S

5.- En una escuela 100 estudiantes tienen las siguientes asignaturas , 54 estudiaron matemáticas, 69 historia y 35 ambas materias. Si se selecciona aleatoriamente uno de estos estudiantes encuentre la probabilidad de que: a) Se haya dedicado a matemáticas o historia. b) No haya cursado ninguna de estas materias. c) Haya estudiado historia pero no matemáticas.

6.- La probabilidad de que una moneda al ser lanzada aparezca cara y cruz son 0.52 y 0.48 respectivamente. Si la moneda se lanza 3 veces ¿Cuáles son las probabilidades de sacar: a) Solo caras b) Dos cruces y una cara en ese orden

a) P(C C C) = P(C)*P(C)*P(C) = (0.52)(0.52)(0.52) = 0.14060

b) P(Z Z C) = P(Z)*P(Z)*P(C) = (0.48)(0.48)(0.52) = 0.1198

100

34

100

35

100

69

88

12

100

88

100

35

100

54

100

69

100

35)(

100

54

100

69

_________

MHPHP

MHP

MHPMPHPMHP

MHP

MP

HP

Page 48: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

7.- Se lanzan dos dados legales en donde se registran el conjunto de todos los pares posibles que se pueden observar entonces defina los siguientes subconjuntos de S. A: el número en el segundo dado es par. B: la suma de los dos números es par. C: al menos un número en el par ordenado es impar. (1,1) (2,1) (3,1) (4,1) (5,1) (6,1) (1,2) (2,2) (3,2) (4,2) (5,2) (6,2) (1,3) (2,3) (3,3) (4,3) (5,3) (6,3) (1,4) (2,4) (3,4) (4,4) (5,4) (6,4) (1,5) (2,5) (3,5) (4,5) (5,5) (6,5) (1,6) (2,6) (3,6) (4,6) (5,6) (6,6) A =: (1,2),(1,4),(1,6),(2,2),(2,4),(2,6),(3,2),(3,4),(3,6) (4,2),(4,4),(4,6),(5,2),(5,4),(5,6),(6,2),(6,4),(6,6) B =: (1,1),(1,3),(1,5),(2,2),(2,4),(2;6),(3,1),(3;3),(3,5) (4,2),(4,4),(4,6), (5,1),(5,3),(5,5),(6,2),(6,4),(6,6) C =: (1,1),(1,2),(1,3),(1,4),(1,5),(1,6),(2;1),(2,3),(2,5) (3,1),(3,2),(3,3),(3,4),(3,5),(3,6),(4,1),(4,3),(4,5) (5,1),(5,2),(5,3),(5,4),(5,5),(5,6),(6,1),(6,3),(6,5) A n B = (2,2),(4,2),(6,2),(2,4),(4,4),(6,4),(2,6),(4,6)(6,6) _ A n B =(1,2),(3,2),(5,2),(1,4),(3,4),(5,4),(1,6),(3,6),(5,6) _ A u B = (1,1),(2,1),(3,1),(4,1),(5,1),(6,1),(1,3),(2,3),(3,3) (4,3),(5,3),(6,3),(1,5),(2,5),(3,5),(4,5),(5,5),(6,5) (2,2),(2,4),(2,6),(4,2),(4,4),(4,6),(6,2),(6,4)(6,6) 2.2.9.- Eventos independientes Definición: Se dice que dos eventos son independientes si cumplen alguna de las condiciones:

i) PA/B) = P(A) ii) P(B/A) = P(B) iii) P(A∩B) = P(A)P(B

Caso contrario los eventos son dependientes 2.2.10.- Eventos mutuamente excluyentes

Page 49: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Si A y B son mutuamente excluyentes entonces P(A∩B) = 0 y Ejemplos 1.- Si A y B son eventos mutuamente excluyentes y P(A) = 0.3 y P(B)=0.5 encuentre:

a) P(AUB) b) P(A|) c) P(A|UB)

8.05.03.0 BPAPBAP

7.0|| AxxAP

5.05.07.0|| BxyAxxBAP

2.- Una persona al llegar a una intersección tiene tres opciones, dar vuelta a la derecha, a la izquierda, o seguir de frente.

B A

B A

P(AUB)= P(A) +P(B)

Page 50: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

a) Obtenga el espacio muestral del experimento. b) Determine la probabilidad de que la persona de vuelta, suponiendo que

todos los puntos maestrales tienen la misma probabilidad.

3

2

3

1

3

1

3

1

3

1

3

1

,,

VIPVDPVIVDPVP

FP

VIP

VDP

FVIVDS

3.- En una empresa su personal tiene las siguientes características

Empleado Desempleado

Hombre 460 40 500

Mujer 140 260 400

600 300 900

Obtener:

a) P(M) b) P(M|Desempleado) c) P(Desempleados) d) P(M ó Desempleados) e) P(Empleados|Hombres)

500

460)|(

90

44)(

3

1

900

300)(

300

260)|(

9

4

900

400

HombresEmpleadosP

osDesempleadóMP

osDesempleadP

osDesempleadMP

MP

Page 51: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

2.2.11.- Técnica de conteo 2.2.12.- Principio fundamental del Conteo: Si un evento puede realizares de n1 maneras diferentes, y si, continuamos el procedimiento, con n2 maneras diferentes, y n3 maneras diferentes, y así sucesivamente, entonces el número de maneras en que los eventos pueden realizarse en el orden indicado es producto n1· n2 · ·n3...... 2.2.11.1.- Notación Factorial n!. = n(n-1)(n-2)………..1 es el producto de los enteros positivos desde 1 hasta n inclusive 0! = 1. 2.2.12.2.- Definición de Combinaciones El número de combinaciones de n objetos tomados de r veces a la vez, es el número de subconjuntos no ordenados de tamaño r que se pueden formar con los n objetos está dada por:

rn C )!(!

!

rnr

n

2.2.12.3.- Definición de Permutaciones Son la cantidad de manera en que podamos ordenar n objetos diferentes tomados de r a la vez está dada por:

)!(

!),(

rn

nrnP

2.2.12.4.- Teorema. El numero de permutaciones de n objetos de los cuales n1 son iguales, n2 son iguales, ..., nr son iguales, es

!!···2!1

!

nrnn

n

Page 52: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

2.2.12.5.- Ejemplos

Ejemplo 1.- Cuantas permutaciones se pueden hacer con 4 personas..

Solución:

244 nP

Ejemplo 2.- De cuantas maneras se pueden seleccionar a 3 personas en 20

sillas.

Solución:

1140320 CCrn

Ejemplo 3.- ¿Cuántos combinaciones diferentes se pueden formar con dos

matemáticos y un psicólogo con 4 matemáticos y 3 psicólogos.

Solución:

4C2 3C1 = 18

5.- En una mano de póquer que consta de 5 cartas, encuentre la probabilidad de tener:

a) Tres ases Solución: Número de formas en que se pueden repartir una mano póquer es

2598960552 CCrn

Si un juego de póquer tiene a ases entonces De esas 5 cartas debo recibir tres ases y otras dos cualesquiera Por lo tanto

4C3 48C2 21120

Page 53: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Por lo tanto

008126.2598960

21120) (

Posibles

Favorablesasestresp

6.- Se invierte con una tasa del .6 en bonos, y en fondos de inversión con una tasa del .3 y en ambos instrumentos con una tasa del .15. encuentre:

a) La probabilidad de que invierta ya sea en bonos o en fondos de inversión.

b) En ninguno de los instrumentos. Solución: Sea L: Bonos l y M: fondos de inversión.

a)

15.)(

3.)(

6.)(

LMp

Mp

Lp

75.

15.3.6.

)()()()(

MLpMpLpMLp

b) 25.)()( CCC MLpMLp

7.- En un paquete de 52 cartas de un naipe inglés. a) ¿Cuál es la probabilidad de sacar un as?

P(as) = 4 /52 = 1/ 13

b) La probabilidad de sacar un rey rojo

P(Rey Rojo) = 2/52 =1/26

c) Probabilidad de sea una figura negra P(Fig. Negra) = 26/52 = ½

d) Probabilidad de que sea par P(par) = (13)(13) 5C2 ) / 52C5 = 0.000652

e) Probabilidad de un Full P(Full) = (13)(12) 5C3 5C2) / 52C5 = 6 x 10-3

8- En una urna hay 20 bolitas y solo 5 premiadas, ¿Cuál es la probabilidad de sacar las 5 bolitas con premio?, obtener el recorrido de la variable. Solución:

20C5 = 15504 maneras de sacar 5 bolitas.

Page 54: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

P(x) = eventos posibles / total de eventos

x = numero de bolitas ganadoras.

x = 0 , 1 , 2 , 3 , 4 , 5

15 5 5 0* 1001(0)

15504 5168

C CP

15 4 5 1* 2275(1)

15504 5168

C CP

15 3 5 2* 2275(2)

15504 7752

C CP

15 2 5 3* 175(3)

15504 2584

C CP

15 1 5 4* 25(4)

15504 5168

C CP

15 0 5 5* 1(5)

15504 15504

C CP

La probabilidad de sacar las 5 bolitas ganadoras es 1/15504 2.2.12.6.- Axiomas de probabilidad Sean S cualquier espacio muestral y A cualquier evento de éste. Se llamara función de probabilidad sobre el espacio muestral S a P(A) si satisface los siguientes axiomas.

1.- p(A) 0 para todo A S 2.- p(S) =1

3.- p(A+B) = p(A) + p(B) si AB = Teoremas importantes a.- p( A´ ) = 1- p(A)

b.- p(A) 1 para todo A S

Page 55: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

c.- p() = 0. d.- p(A+B) p(A) + p(B) -p(AB)

e.- p(A1+A2+... An) = p(A1) + p(A2) + ...p(An ) si Ai Aj = para ij

f.- p(A) p(B) si A B

g.- P() = 0 2.2.12.7.- Diagramas de Árbol 1.- Una persona puede sobrevivir a una operación en un 55% de los casos. Si el paciente sobrevive, la probabilidad de que su cuerpo rechace el medicamento es del 20%. ¿Cuál es la probabilidad de que sobreviva a estas etapas críticas? P(salvarse) = (0.55) ( 0.80) = 0.44

P

0.55

Sobreviva

0.45

No

sobreviva

0.2

Su cuerpo

rechace

0.8

Su cuerpo No

rechace

Page 56: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

2.3.- PROBABILIDAD CONDICIONAL

2.3.1.- Definición.

Sean A y B dos sucesos tales que P(A)>0. Denotamos por P(B\A) la

probabilidad de B dado que A ha ocurrido.

P(B/A) = P( A B) / P(A)

2.3.2.- Ejemplos 1.- Los resultados de una investigación de campo arrojan la siguiente información del comportamiento de trabajadores:

Antigüedad Eficiente Deficiente Total mas de 10 años

(A) 16 4 20

menos de 10 años (B)

10 20 30

Total 26 24 20

a) ¿Cuál es la probabilidad de que se seleccione a un trabajador efic que

ha operado más de diez años?

5420165020

50162016 //

/

/

)A(P

)ABS(P/)A|BS(P

b) ¿Cuál es la probabilidad de que un trabajador con menos de 10 años

sea eficiente?

3/130/1050/30

50/10

)(

)()|(

BP

BBSPBBSP

2.- El 80% de los productos están a tiempo para ser vendidos y el 72% se

entregan a tiempo al comprador.¿Cuál es la probabilidad de que una orden se

entregue a tiempo dado que estuvo lista para ser vendida?

A = es el evento de que este a tiempo para ser vendida B = es el evento de que se venda a tiempo

P(B|A) = P(A∩B)/P(A) = 0.72 / 0.80 = 0.9

Page 57: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

2.4.- Teorema de Bayes Teorema de Bayes Supongamos que S = Bi U B2 U ……U Bk en donde P(Bj ) > 0 I = 1,2,…….,k y Bi ∩ Bj = ø para i ╪ j Entonces P( Bj / A ) = P(Ai /Bj ) /

Ejemplo

Los exámenes del laboratorio de una clínica privada resultan correctos en el 95% de los casos de infección cuando la infección esta presente. Estos exámenes arrojan un resultado "positivo" que es falso en el 1% de las personas sanas que se someten al examen, es decir, que si la persona esta sana entonces el examen le puede decir con una probabilidad .01 que ella esta enferma. Además se sospecha que el 5% de la población tiene esa infección.

¿Cual es la probabilidad de que una persona tenga la infección dado que recibió un resultado positivo ?

Solución.

Si D: La persona tiene la infección y

E: El resultado del examen es positivo,

la interrogante será P(D/E) ?.

Esto significa que solo el 83,3% de las personas cuyos resultados fueron positivos tienen la infección. Ejemplo Hombres y las mujeres tienen preferencias diferentes ante un producto, el 70% de las mujeres lo prefieren mientras que el 40% de los hombres es lo hace solamente del 40. De pregunta a un grupo de 20 personas, 15 mujeres y 5 hombres su preferencia una respuesta escogida al azar de las 20 resultó negativa. ¿Cuál es la probabilidad de que haya sido contestada por un hombre? SOLUCION:

Page 58: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

M+ = 70% H+ = 40% M_ = 30% M_ = 60%

P ( x H ) = ( 25 ) ( 60 ) = 0.4 (25)(60) +(75)(30) Ejemplo Una empresa aplica dos métodos en la preparación de sus trabajadores con el 20% y 10% de porcentaje de fracaso. E el segundo método se utiliza solamente en el 30% y en el otro el 70%. Un trabajador entrenado no logro aprenderlo correctamente ¿Cuál es la probabilidad de que haya recibido el entrenamiento en el primer método ? (tomando a x como el trabajador)

82.0)1.0)(3.0()2.0)(7.0(

)20.0)(7.0()|(

)|()()|()(

)|()()|(

3.0)(

7.0)(

1.0)|(

2.0)|(

xAP

BxPBPAxPAP

AxPAPxAP

BP

AP

BxP

AxP

BxóAxxBA

Page 59: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Modulo III.- Variable aleatoria discreta y sus distribuciones de probabilidad

Contenido

a) Variables aleatorias Definición de una variable aleatoria, definición de una variable aleatoria discreta, definición de función de probabilidad de una v.a.d. b) Distribución de probabilidad Binomial, definición de ensaño Bernulli,

definición de variable aleatoria binomial. c) Distribución de probabilidad Geométrica, serie geométrica, definición de

v.a. geométrica, función de probabilidad geométrica. d) Distribución de probabilidad Poisson, proceso Poisson, v.a. Poisson,

Función de probabilidad Poisson. e) Valor esperado, varianza, desviación estandar, de una v.a.d. definición

de valor esperado de una v.a.d. definición de valor esperado de la función de una v.a.d. cáculo del valor esperado de las distribuciones binomial, geométrica y de Poisson.

f) Propiedades del valor esperado g) Definición de varianza y desviación estandar. h) Teoremas i) Función generatriz de momentos, definición del i-esimo momento de una

v.a. respecto al origen, definición del i-esimo momento de una v.a. respecto a su media, definición de función generatriz de momentos, teoremas.

j) Usando la función generatriz de momentos calcular las variables de esta para la binomial, geométria y Poisson.

Page 60: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Página 1 de 169

Un poco de historia A mediados del siglo XVI los franceses Balasier Pascal (1623 – 1662) publica problemas relacionados con diferentes juegos de azar, Pierre de Fernand (1601 – 1665) plantea la teoría moderna de probabilidades y el holandés Christian Huygens ( 1629 – 1695) publica el razonamiento relativo a los juegos de azar. El siglo XVI es importante para el desarrollo de la probabilidad ya que Jacobo Bernoulli (1654 – 1705) publica el arte de las conjeturas y la ley de los grandes números y el francés Abraham Moivre (1667 – 1754) plantea “ “ Una fracción en la que el numerador es igual al número de apariciones del suceso y el denominador es igual al número total de casos en el que el suceso pueda o no ocurrir” además calcula la ecuación de a distribución normal. Niklaus Bernuolli (1687 – 1759) expone que “ La frecuencia de nacimientos de niños es mayor que la de las niñas en una proporción de 18 a 17” y e inglés James Stirling ( 1692 – 1770) demuestra que B =

Balasie Pascal

Pierre de Fernand

Christian Huygens

Jacobo Bernulli

Page 61: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

VARIABLE ALEATORIA DISCRETA: CASO 1.- Si X es una variable aleatoria discreta y Y es igual a H(X), entonces Y es también una variable aleatoria discreta. Supóngase que los valores posibles de X pueden enumerar como x1,x2... ,xn... con seguridad, los valores posibles de Y se pueden enumerar como y1= H(x1), y2= H(x2),... (Algunos de los valores anteriores pueden ser iguales, pero esto e no impide el hecho de que esos valores pueden enumerarse.). Una variable aleatoria discreta lo es, si los valores que toma se pueden contar , es decir, provienen de un espacio muestral numerable finito o infinito. DEFINICIÓN: Sea X una variable aleatoria, si el número de valores posibles de X es finito o infinito numerable se dice que X es una variable aleatoria discreta. Esto es, se pueden notar los valores posibles de X como x1,x2,... xn. Y la lista de ellas dependerá del total de valores tomando en consideración. Ejemplos: * El número de radios vendidos en un mes * El número de accidentes ocurridos en una fábrica Función de probabilidad de una v.a. d. La Función de probabilidad de una v.a.d. es la función que representa las probabilidades asociadas a cada valor posible de una variable aleatoria discreta. La función f definida de esta forma como hemos visto se le conoce como función de probabilidad de la variable aleatoria X. La distribución de probabilidad de X será la colección de partes[xi, f(xi)] con i=1, 2.... PROBLEMÁS

Sea el experimento de observar el sexo del primer recién nacido en un tiempo determinado. Calcular S ,X, f y F.

Solución: S = { M,H} X = Rx= {0,1} ahora obtenemos f y F X = xi o 1 f(xi) ½ ½ F(xi) ½ 2/2

Page 62: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Hallar S, X, f, F. De la variable aleatoria (uno de los niños que nacen en tres

partos normales) Solución:

S = {MMM,MMH,MHM,HMM,MHH,HMH,HHM,HHH}

X= {0,1,2,3}

Obteniendo f y F

X = xi 0 1 2 3

.f(xi) 1/8 3/8 3/8 1/8

F(xi) 1/8 4/8 7/8 8/8

Ejemplo

Sea

.c.o.e

,,,XX

K

)X(P

0

4321

a) Encontrar K para ser una función de probabilidad. b) Graficarla. c) Encontrar E(x), VAR(X), r.

d) Hacer un intervalo de I = 2r

a) k = ?

P(1) = K = 12/25 P(2) = K/2 = 6/25 P(3) = K/3 = 4/25 P(4) = K/4 = 3/25

Page 63: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

= K(25/12) K = 12/25

b) E(X), VAR(X), r

E(X) = X P(X) E(X) = 1 (12/25) + 2 (6/25) + 3 (4/25) + 4 (3/25) E(X) = 12/25 + 12/25 + 12/25 + 12/25 = 48/25 E(X2) = X2 P(X) = 12 (12/25) + 22 (6/25) + 32 (4/25) + 42 (3/25) E(X2) = 12/25 + 24/25 + 36/25 + 48/25 = 24/5

VAR (X) = E(X2) - 2 = (24/5) – (48/25)2 = 1.1136 r = (VAR(X))1/2 = 1.0552

c) Hacer un intervalo de I = 2r

I = { -0.1905 , 4.0305 }

Page 64: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

LA DISTRIBUCIÓN BINOMIAL.

La Distribución Binomial es una de las distribuciones discretas de la probabilidad más útil. Sus áreas de aplicación incluyen inspección de calidad, ventas, mercadotecnia, medicina, investigación de opciones. Un proceso de manufactura que produce un determinado producto en el que algunas unidades se encuentran defectuosas, si este proceso es constante durante un periodo razonable y, si como procedimiento de rutina, se selecciona aleatoriamente un determinado número de unidades, entonces las proposiciones de probabilidad con respecto al número de artículos defectuosos pueden hacerse mediante el empleo de la distribución binomial. CARACTERISTICAS DE UNA DISTRIBUCIÓN BINOMIAL

1.- El experimento consiste en n ensayos idénticos 2.- Cada ensayo produce uno de dos resultados posibles. Uno llamado éxito y otro fracaso. 3.- La probabilidad de éxito es p y es constante para todos los ensayos. La probabilidad de falla es q= 1-p 4.- Los ensayos son independientes 5.- El experimento se interesa en los y aciertos observados en los n ensayos.

Definición: Sea X una variable aleatoria que representa el número de éxitos en n ensayos y p la probabilidad de éxito con cualquiera de éstos. Se dice entonces que X tiene una distribución de probabilidad

xnx ppxxn

n

)1(!)!(

! x = 0,1,2,......n.

p(x: n , p) =

0 para cualquier otro 0 1 p

valor Los parametros de la distribución binomial son n y p. Estos definen una familia de distribuciones binomiales, donde cada miembro tiene la función de probabilidad determinada. Como la que se muestra a continuación. La distribución binomial tiene una gráfica

Page 65: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Ejemplos Calcular la probabilidad que s indica mediante el empleo de la binomial : Sea n = 5 y p =0.4 entonces:

p(x; 5 , 0.4) = xx

xx

5)6.0()4.0(!)!5(

!5

x = 0,1,2,3,4,5; p(0;5,0.4)=

0778.0)6.0()4.0(!0)!05(

!5 50

p(1;5,0.4)=

2592.0)6.0()4.0(!1)!15(

!5 151

p(2; 5 , 0.4) =

3456.0)6.0()4.0(!2)!25(

!5 252

p(3; 5 , 0.4) =

2304.0)6.0()4.0(!3)!35(

!5 353

p(4; 5 , 0.4) =

0768.0)6.0()4.0(!4)!45(

!5 454

p(5; 5 , 0.4) =

0102.0)6.0()4.0(!4)!45(

!5 555

La probabilidad de que una variable aleatoria X sea menor o igual a un valor especifico de x, se determina por la función de distribución acumulativa.

p(X x ) = F(x; n, p) =

x

i

ini

i

n pp0

)1()(

Page 66: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Sea n = 10 y p = 0.3. La probabilidad de que X pueda ser cuatro es: p(X 4 ) = F(4; 10, 0.3) = 0.8497 La probabilidad de que X sea menor de dos es : p(X>2) = p( 6172.0)3.0,10;2(1)2(1)3 FXp )

Sea Y una variable aleatoria binomial entonces:

E(y) = np

V(y) = npq

Ejercicios.

1.- Una moneda es lanzada 20 veces. Calcule el número más probable de salidas de cara y cual es la probabilidad de que salga ese número.

Solución:

El número más probable de caras es evidentemente n p =10. Y la probabilidad de que salga 10 veces es:

2.- La probabilidad de que un alumno de la ESIME Zacatenco se recupere de una materia que reprobó es del 0.04.

a) ¿Cuál es la probabilidad de que de 10 alumnos reprobados se a lo sumo de ellos se recuperen.?

b) ¿ Cuál es la probabilidad de que al menos 7 de los 10 alumnos se recuperen?

Solución:

a) P(X=0) + P(X=1) + P(X=2) + P(X=3) = .66 + .27 + .05 + .0058 = .9995

b) P(X=7) + P(X=8) + P(X=9) = .00055

Page 67: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

3.- Un foco tiene una probabilidad de 0.2 de funcionar más de 500 hrs. Si se prueban 20 focos , ¿cuál es la probabilidad de que exactamente k de ellos funcionen más de 500 hrs. K=0, 1, 2, ..., 20? solución: Si X es el número de tubos que funcionan más de 500 hrs. Se tiene una distribución binomial. Donde:

P=0.2 Q=1-P=0.8

P(X)= XNKQPX

N

P(X=K)= KK

k

208.02.0

20

Sustituyendo los valores de K: P(X=0)=0.012 P(X=1)=0.058 P(X=2)=0.137 P(X=3)=0.205 P(X=4)=0.218 P(X=5)=0.175 P(X=6)=0.109 P(X=7)=0.055 P(X=8)=0.022 P(X=9)=0.007 P(X=10)=0.002 P(X=K)=0+ Las probabilidades para X>10 son menores de 0.001

Page 68: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Un problema de aplicación empírica

U n estudio aplicado a académicos de la ESIE Zacatenco en el mes de febrero de 2010

respecto a que si ganan lo suficiente para vivir arroja los siguientes resultados: 1- De 409 encuestas levantadas en forma aleatoria dentro de este grupo se toman 20 de

ellas. Por lo tanto: tenemos que n=20 número de ensayos

2- Tenemos (S) éxito [Si considera que gana lo suficiente]. Tenemos (F) fracaso [No considera que gana lo suficiente].

3.- Al analizar la tabla de frecuencias.

4.- Probabilidad de éxito P(S)=p=.235 , la Probabilidad de fracaso q=.765

[Los eventos son independientes] porque el que un profesor conteste que no gana lo

suficiente no implica el tipo de respuesta de otro.

Desarrollo de la distribución Binomial:

De acuerdo a las características

i) Existen n ensayos iguales

ii) Existe éxito y fracaso

iii) P(y) = 0.235 , q(y) = .765

iv) Los eventos son independientes

v) Y es el número de éxitos

Por cumplir con las condiciones de una distribución binomial elaboremos su tabla de

probabilidades.

Tabla de Distribución Binomial:

y

N

p

n-

y

q

0 20 1 0,235 1 20 0,765 0,00471225 0,004712254

Gana lo suficiente

Frequency Percent Valid

Percent

Cumulative

Percent

si 96 23,5 23,5 23,5

no 313 76,5 76,5 76,5

Total 409 100 100 100

Page 69: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

1 20 20 0,235 0,235 19 0,765 0,00615981 0,028951104

2 20 190 0,235 0,055225 18 0,765 0,00805204 0,084488025

3 20 1140 0,235 0,01297788 17 0,765 0,01052554 0,155723027

4 20 4845 0,235 0,0030498 16 0,765 0,01375888 0,203305062

5 20 15504 0,235 0,0007167 15 0,765 0,01798546 0,199850205

6 20 38760 0,235 0,00016843 14 0,765 0,0235104 0,153479733

7 20 77520 0,235 3,958E-05 13 0,765 0,03073255 0,094294738

8 20 125970 0,235 9,3013E-06 12 0,765 0,04017327 0,047070331

9 20 167960 0,235 2,1858E-06 11 0,765 0,05251408 0,019279351

10 20 184756 0,235 5,1366E-07 10 0,765 0,06864586 0,006514657

11 20 167960 0,235 1,2071E-07 9 0,765 0,08973315 0,001819304

12 20 125970 0,235 2,8367E-08 8 0,765 0,11729824 0,000419153

13 20 77520 0,235 6,6663E-09 7 0,765 0,15333103 7,92366E-05

14 20 38760 0,235 1,5666E-09 6 0,765 0,20043272 1,21703E-05

15 20 15504 0,235 3,6814E-10 5 0,765 0,26200355 1,49544E-06

16 20 4845 0,235 8,6514E-11 4 0,765 0,3424883 1,43557E-07

17 20 1140 0,235 2,0331E-11 3 0,765 0,44769713 1,03763E-08

18 20 190 0,235 4,7777E-12 2 0,765 0,585225 5,31249E-10

19 20 20 0,235 1,1228E-12 1 0,765 0,765 1,71783E-11

20 20 1 0,235 2,6385E-13 0 0,765 1 2,6385E-13

Gráfica correspondiente:

Ahora de acuerdo a estos valores obtenidos propongamos un problema:

Queremos saber cuál es la probabilidad de que al menos 12 encuestados de los 20, estén

de acuerdo con lo que ganan:

Solución:

Da do que se desea saber la probabilidad de que al menos 12 personas de la 20 estén de

acuerdo con lo que ganan tenemos.

Page 70: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Por lo tanto:

Conclusión:

La probabilidad de que al menos 12 académicos de los 20 tomados estén de acuerdo con

lo que ganan es de .00052 lo que implica a decir que la mayoría de los académicos no

están conformes con lo que ganan.

Nota si se suman los valores que aparecen en la tabla se verifica que la suma de las

probabilidades desde 12 a 20 es igual a 0.00052

Page 71: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

LA DISTRIBUCIÓN DE PROBABILIDAD GEOMÉTRICA. La variable a aleatoria que tiene distribución geométrica se define para un

experimento que es muy similar al experimento binomial. También se refiere a

pruebas idénticas e independientes, y cada uno puede tener dos resultados,

éxito o fracaso. La probabilidad de tener éxito es igual a p y es constante para

cada prueba. Sin embargo, la variable aleatoria geométrica Y es el número de

la prueba en la cual ocurre el primer éxito, en lugar del número de éxitos que

ocurren en n pruebas. Entonces el experimento consiste en una serie de

pruebas que termina al obtener el primer éxito. Por consiguiente, el

experimento podría terminar en la primera prueba al obtener el éxito o podría

seguir indefinidamente.

La distribución de probabilidad geométrica se usa frecuentemente como modelo para las distribuciones de longitud de tiempos de espera. Por ejemplo, supongamos que se da mantenimiento periódico al motor de un avión comercial de tal manera que sus diferentes partes se cambian en distintos momentos y por eso tiene tiempos de servicio diferentes. Entonces, puede ser razonable suponer que probabilidad de p, de falla del motor durante cualquier intervalo de una hora Y hasta el primer mal funcionamiento o descompostura.

Características

i) No se contempla el numero de ensayos iguales ii) Existe éxito y fracaso iii) La probabilidad de éxito es p y la de fracaso es 1-p = q iv) Los eventos son independientes v) Y es el primer éxito

Definición Una variable aleatoria y tiene una distribución geométrica si y solo sí:

P(y) = qy-1p con y = 1,2, 3…..

Page 72: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Definición : Sea y una variable aleatoria con distribución de probabilidad geométrica entonces:

E(y) = 1/p

V(y) = (1-p) / p2

Ejemplos

Un lector óptico lee mal el precio en el .001 de los casos

a) Cuál es la distribución de probabilidad para y.

b) ¿Qué probabilidad hay de que el lector leerá bien por lo menos los primeros cinco precios?

c) ¿Qué inferencia haría usted acerca de lo que el fabricante asegura, explique.

Solución.

a) Geométrica p(y)=pqy-1 P(y)=(0.001) (0.999)y-1

b) p(y)= (0.001)(0.999)1-1 + (0.001)(0.999)2-1 + (0.001)(0.999)3-1 +

(0.001)(0.999)4-1 + (0.001)(0.999)5-1 = 4.99 x 10-3

p(y 5)= 1- p(51 p(y)) = 0.775

c) Que no sería confiable lo que nos dice la probabilidad del fabricante.

Una aplicación empírica

De un estudio acerca de las condiciones en que viven y estudian los estudiantes de la ESIME Zacatenco en el mes de abril de 2011, se encontró que el 63.3% no tenía apagones en su casa habiación.

Planteamiento del problema:

Se desea conocer la probabilidad de que a la cuarta encuesta tomada de los encuestados

se obtenga éxito de sacar a un encuestado que tenga luz sin apagones.

Por la tanto tenemos:

1- El éxito se considera que [tenga luz sin apagones].

El fracaso se considera que [tenga luz con apagones].

Page 73: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

De a la tabla de frecuencias correspondiente a los que tienen luz sin apagones y con apagones

luz

19 27,9 63,3 63,3

11 16,2 36,7 100,0

30 44,1 100,0

38 55,9

68 100,0

sin apagones

con apagones

Total

Valid

Sy stemMissing

Total

Frequency Percent Valid Percent

Cumulat iv e

Percent

Por lo tanto:

Probabilidad de éxito p=.633 → Probabilidad de fracaso q=1-p=.367

Aplicando la Distribución Geométrica:

Obtenemos la tabla y grafica correspondiente de la Distribución Geométrica.

Tabla de Distribución Geométrica

x P Q x-

1

1 0,633 0,367 0 1 0,633

2 0,633 0,367 1 0,367 0,232311

3 0,633 0,367 2 0,134689 0,085258

4 0,633 0,367 3 0,049430 0,031289

5 0,633 0,367 4 0,018141 0,011483

6 0,633 0,367 5 6,65E-03 4,20E-03

7 0,633 0,367 6 2,44E-03 1.54E-03

8 0,633 0,367 7 8,96E-04 5,67E-04

9 0,633 0,367 8 3,29E-04 2,08E-04

10 0,633 0,367 9 1,20E-04 7,59E-5

Grafica Correspondiente:

Page 74: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Conclusión:

La probabilidad de que a la cuarta encuesta tomada se obtenga a:

De con la grafica obtenida podemos observar que la distribución geométrica tiene un

comportamiento exponencial (que decrece rápidamente a 0 conforme la variable

aumenta).

Page 75: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Distribución de Probabilidad Poisson

Definición y propiedades de la distribución de Poisson. Definición Sea X una variable aleatoria con una distribución discreta y que el valor de X es un entero no negativo.. Se dice que X tiene una distribución de

Poisson con media ( > 0 )si la f.p de X es la siguiente:

Características

i) X no está en función de el numero de ensayos iguales ii) Existe éxito y falla iii) X no está en función de la probabilidad de éxito iv) Los eventos son independientes v) X está en función de su media vi) X está en función del tiempo, volumen, área o cualquier forma

caprichosa

Un proceso de Poisson tiene las siguientes características: El número de éxitos en un intervalo de tiempo o región específicos es independiente del número de éxitos en cualquier otro intervalo ajeno de tiempo o región del espacio considerado. La probabilidad de que un éxito ocurra en un intervalo de tiempo o espacio muy corto es proporcional a la longitud del intervalo o tamaño de la región y no depende del número de resultados que ocurren fueran de esta intervalo o región. La probabilidad de que más de un resultado ocurra en ese intervalo de tiempo tan corto o regiones tan pequeñas que es despreciable. La distribución de Poisson a menudo servirá como una distribución de probabilidad apropiada para variables aleatorias tales como el número de llamadas telefónicas recibidas por una central telefónica durante un periodo de tiempo fijo, el número de partículas atómicas emitidas por un a fuente radiactiva que golpea un cierto punto durante un periodo de tiempo fijo o el número de defectos en una longitud especifica de un cinta magnética de grabación. Ejercicios :

Un experimento revela que en promedio se observan 2.5 exposiciones de imagen.

Page 76: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

a) Suponiendo una distribución de Poisson, calcule la probabilidad de observar exactamente una exposición de imagen si éstas son independientes.

b) c) Suponiendo una distribución de Poisson, calcule la probabilidad de

observar cuando más dos exposiciones de imagen independientes durante la observación.

SOLUCION: Tanto la media como la varianza de una variable aleatoria de Poisson son iguales a λ. Por tanto, en este problema será:

μ = λ = 2.5; σ² = λ = 2.5 por lo tanto σ = √2.5 = 1.58

a) Queremos conocer la probabilidad de que se observe exactamente una exposición de imagen l. La distribución de probabilidad de “y” es:

P(y) = (λy/y!) ℮

Entonces,

P(y=1) = (2.51/1!) ℮

-2.5 = (2.5)(.082085)/(1) = 0.20521

b) Queremos conocer la probabilidad de que se observe cuando más dos exposiciones de imagen l

P(y ≤ 1) = P(0) + P(1) +P(2) P(y ≤ 1) = (2.5* 0)(.082085)/(0!) + (2.5* 1)(.082085)/(1!) + (2.5* 2)(.082085)/(2!) P(y ≤ 1) = (1)(.082085)/(1) + (2.5)(.082085)/(1) + (6.25)(.082085)/(2∙1) P(y ≤ 1) = 0.082085 + 0.20521 + 0.25651 P(y ≤ 1) = 0.543805 En una encuesta realizada en el Instituto Politécnico Nacional a los alumnos de educación superior se encontró que el 25% de los encuestados manifestaron que se vende droga en las escuelas ubicadas en las colonias donde tienen su residencia.

Calcular la probabilidad de que 5 de los encuestados manifiesten que en las escuelas de

su colonia venden drogas.

Según nuestras encuestas realizadas nos arrojo el porcentaje siguiente.

Page 77: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Col Venta drose

5 6,6 25,0 25,0

15 19,7 75,0 100,0

20 26,3 100,0

56 73,7

76 100,0

si

no

Total

Valid

Sy stemMissing

Total

Frequency Percent Valid Percent

Cumulativ e

Percent

En este caso k es 5 y , λ, el valor esperado de los encuestados que nos dijeron que se

venden droga es del 25% .

Tabla de la distribución de Poisson

k ℮-λ

λk y! (λ

k/k!) (λk/k!) ℮-λ

0 5,6E-09 1 1 1 5,6E-9

1 5,6E-09 19 1 19 1,06E-7

2 5,6E-09 361 2 180.5

1,01E-6

3 5,6E-09 6859 6 41154 6,40E-6

4 5,6E-09 130321 24 3127704 3,04E-5

5 5,6E-09 2476099 120 2,9E08 1,15E-4

6 5,6E-09 47045881 720 3,3E10 3,65E-4

7 5,6E-

09

893871739 5040 4,50E12 9,93E-4

8 5,6E-09 1,6E10 40320 6,45E14 2,22E-3

9 5,6E-09 3,22E11 362880 1,16E17 4,96E-3

10 5,6E-09 6,13E12 3628800 2,22E19 9,45E-3

11 5,6E-09 1,16E14 39916800 4,65E21 0,0162

12 5,6E-09 2,21E15 479001600 1,05E24 0,0248

13 5,6E-09 4,20E16 6227020800 2,61E26 0,0377

14 5,6E-09 7,99E17 87178291200 6,96E28 0,0513

15 5,6E-09 1,51E19 1,30767E+12 1,96E31 0,0650

16 5,6E-09 2,88E20 2,09228E+13 6,01E33 0,0771

17 5,6E-09 5,48E21 3,55687E+14 1,94E35

0,086

18 5,6E-09 1,04E23 6,40237E+15 6,65E38 0,091

19 5,6E-09 1,97E24 1,21645E+17 2,38E41 0.0911

20 5,6E-09 3,75E25 2,4329E+18 9,11E43 0,086

Por lo tanto, la probabilidad deseada es

Page 78: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

P(5;19)=

Gráfica de la distribución de Poisson

De acuerdo al resultado obtenido la probabilidad de que un encuestado nos diga que se

venden drogas en las escuelas es muy pequeña.

Page 79: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

DISTRIBUCIÓN HIPERGEOMETRICA

La distribución Binomial es importante en muestreos con reemplazo.

Supongamos que queremos conocer el número de elementos defectuosos presentes en una muestra de ‘n’ elementos, extraídos de N elementos sin reemplazo entonces: la probabilidad de escoger x elementos se comportan como una distribución hipergeométrica.

Definición Una variable aleatoria Y tiene una distribución hipergeométrica si y sólo sí:

P(y) = rCy N-nCn-y / NCn

Con media E(x) = nx/N

Varianza V(x)= n(x/N)(N-x/N)(N-n/N-1)

Ejemplo

Una empresa tiene 30 cargadores de baterías idénticas, de las cuales 5 son defectuosas, se seleccionan al azar 10 de las 30 ¿ Cuál es la probabilidad de que 2 de las 10 sean defectuosas

P(x) = 5C2 25C8 / 30C10

P(y) =

Aplicación En la encuesta aplicada a los profesores de educación media del IPN se encontró que de 409 encuestados 133 trabajan además en el sector privado, se toman 20 de estas encuestas al azar. Cuál es la probabilidad de que 10 de estas encuestas sean

de docentes que trabajan además en el sector privado.

Por la tanto tenemos:

1- De las 409 encuestas levantadas a docentes se toman 20 de ellas:

Entonces tenemos N=409 y n=20.

2- El éxito se considera que [trabaje en el sector privado]. El fracaso se considera que [no trabaje en el sector privado].

Page 80: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

De acuerdo a la tabla de frecuencias correspondiente a los docentes y a la pregunta de si trabaja en el sector privado:

Institución privada

Frequency

si 133

No 136

no

contestó

140

Total 409

Tenemos: M (número de éxitos)=133 N-M (número de fracasos) =409-133=276 X=10 (éxito que se quiere probar) Aplicando la Distribución Hipergeométrica

Obtenemos la tabla y gráfica correspondiente de la Distribución Hipergeométrica siguientes.

Tabla Distribución Hipergeométrica

X N n M N-

M

n-

x

1 409 20 133 276 19 133 1,03E+29 4,39E+33 1,3699E+31 3,12E-

03

2 409 20 133 276 18 8778 7,65E+27 4,39E+33 6,7152E+31 1,53E-

02

3 409 20 133 276 17 383306 5,32E+26 4,39E+33 2,0392E+32 4,65E-

02

4 409 20 133 276 16 1,25E+07 3,47E+25 4,39E+33 4,3227E+32 9,85E-

02

5 409 20 133 276 15 3,20E+08 2,13E+24 4,39E+33 6,816E+32 1,55E-

01

6 409 20 133 276 14 6,80E+09 1,22E+23 4,39E+33 8,296E+32 1,89E-

01

7 409 20 133 276 13 1,24E+11 6,49E+21 4,39E+33 8,0476E+32 1,83E-

01

8 409 20 133 276 12 1,95E+12 3,20E+20 4,39E+33 6,24E+32 1,42E-

01

Page 81: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

9 409 20 133 276 11 2,72E+13 1,44E+19 4,39E+33 3,9168E+32 8,92E-

02

10 409 20 133 276 10 3,74E+14 5,99E+17 4,39E+33 2,2403E+32 5,10E-

02

11 409 20 133 276 9 3,77E+15 2,24E+16 4,39E+33 8,4448E+31 1,92E-

02

12 409 20 133 276 8 3,83E+16 7,53E+14 4,39E+33 2,884E+31 6,57E-

03

13 409 20 133 276 7 3,57E+17 2,24E+13 4,39E+33 7,9968E+30 1,82E-

03

14 409 20 133 276 6 3,06E+18 5,81E+11 4,39E+33 1,7779E+30 4,05E-

04

15 409 20 133 276 5 2,42E+19 1,28E+10 4,39E+33 3,0976E+29 7,06E-

05

16 409 20 133 276 4 1,79E+20 2,36E+08 4,39E+33 4,2244E+28 9,62E-

06

17 409 20 133 276 3 1,23E+21 3,46E+06 4,39E+33 4,2558E+27 9,69E-

07

18 409 20 133 276 2 7,94E+21 37950 4,39E+33 3,0132E+26 6,86E-

08

19 409 20 133 276 1 4,80E+22 276 4,39E+33 1,3248E+25 3,02E-

09

20 409 20 133 276 0 2,73E+23 1 4,39E+33 2,73E+23 6,22E-

11

Gráfica

Page 82: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

MODULO IV.- Variable aleatoria continua y sus distribuciones de probabilidad. Índice 4.1.- Variable aleatoria continua Definición de función de distribución acumulada, función de densidad de una v.a.c. propiedades de la función de distribución acumulada, valor esperado, varianza y desviación estadar de una v.a.c. definición de valor esperado de una v.a.c, propiedades del valor esperado de una v.a.c. esperanza de una función de una v.a.c. la varianza y desviación estandar de v.a.c. teoremas. 4.2.- Distribución uniforme 4.3.- Distribución normal 4.4.- Distribución Beta 4.5.- Distribución Gamma 4.6.-Distribución T 4.7.- Distribución F 4.8.- Distribución ji cuadrada 4.9.- Distribución exponencial

Page 83: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

4.1.- Variable aleatoria continua Definición: Se dice que X es una variable aleatoria continua, si existe una función f, llamada función de densidad de probabilidad (fdp) de X, que satisface la siguientes condiciones: 1) 0)( xf para toda x,

2) 1)(

dxxf

3) Para cualquier a, b, tal que , ba tenemos

b

adxxfbXaP .)()(

Definición de función de distribución acumulativa Sea Y cualquier variable aleatoria. La función de distribución de Y, denotada por F(y) está dada por:

F(y) = P( Y y) - < y < Sea X una variable aleatoria, discreta o continua. Definimos que F es la función de distribución acumulativa de la variable aleatoria X. Ejemplo Supongamos que Y tiene una distribución binomial con n= 2 y p= .5 Encontrar F(y) y 2-y P(y) = (2Cy) ( .5) ( .5) y= 0,1,2 Por lo que: p(0) = ¼ p(1) = ½ p(2) = ¼ Entonces

F8y) = P( Y y) = 0 para y<0

= ¼ para 0 y 1

= ¾ para 1 y 2

= 1 para y 2

Page 84: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Propiedades de F(y)

1.- lim F(y) = F(- ) = 0

y -

2.- .- lim F(y) = F( ) = 1

y -

3.- F(yb) F(ya) si yb > ya

Definición. Sea Y una variable aleatoria con función de distribución F(y). Se dice que Y es

continua si F(y) es continua para - < y < Definición: de función de densidad Sea Fy) la función de distribución de una variable aleatoria continua Y. Entonces la función de densidad f(y) está dada por : f(y) = dF(y)/ dy y F(y) = f(t) dt Siempre y cuando exista la derivada. Propiedades de función de densidad f(y)

1.- f(y) o para cualquier valor de y 2.- f(y)dy = 1

Se dice que X es una variable aleatoria continua, si existe una función f, llamada función de densidad de probabilidad (fdp) de X, que satisface las condiciones de arriba mencionadas. Definición de valor esperado El valor esperado de una variable aleatoria continua Y es:

Page 85: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

E(Y) = yf(Y) dy Siempre que la integral exista

Propiedades importantes del valor esperado de una variable aleatoria. 1) Si X = C, donde C es una constante , entonces E(X) = C. Propiedades del valor esperado de una variable aleatoria continua Sea c una constante y sean g(Y) , g1(Y), g2(Y) ... gk(Y) funciones de una variable aleatoria Y. Entonces:

1.- E(c) = c 2.- E ( cg(Y) ) = cE(g(Y) 3.- E (g(Y) + g1(Y)+ g2(Y)+ ... +gk(Y) = = E (g(Y) +E( g1(Y)+ E g2(Y)+ ... +E(gk(Y)

La varianza de una v.a.c.

2 2

V(Y) = E( Y - )

Encuentre la varianza para una variable aleatoria tipo gamma La desviación estadar es la raíz cuadrada de la varianza Ejemplo 1

Sea

.c.o.e

XKe)x(f

X

0

03

a) Encontrar K. b) Encontrar F(X). c) Encontrar el valor de:

P (X 1/2)

Page 86: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

P (1 X 1.5)

P (X 58) P (X = 10)

P (1/2 X 50)

a) Encontrar K

Kee

Ke

KdXeKdXKeX

XX

3

1

3303

0

0 0

333

K=3 ; f(X) = 3e-

3X

b) Encontrar F(X).

F(X) = 033

0

3

0333 ee

xedte x

tx t

= 1-e-3x

c)

P (X 1/2) = P (0 X 1/2) = F (½) – F (0) = ( 1 – e- (1/2) (3) ) – 0 = 0.7769

P (1 X 1.5) = F (1.5) – F (1) = ( 1 – e- (1.5) (3) ) - ( 1 – e- (3) ) = 0.0387

P (X 58) = P (0 X 1/2) = F () – F (58) = 1 – 1 = 0 P (X = 10) = F (10) – F (10) = 0

P (1/2 X 50) = F (50) – F (1/2) = 1 – 0.7769 = 0.2231 Ejemplo 2 Sea

.C.O.E

XxK)x(f

0

10

a) Encontrar K. b) F(x) y expresarla en intervalos c) Con la función acumulativa encontrar:

P(x 1/2)

P(x 1/3)

P(1/3 x 0.9) P(x = 1/5)

d) E(x) e) E(x2) f) VAR (x)

g)

Page 87: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Solución

a) k//

k/

xkdxxkdxxk

///

3223

1

0

1

23

23231

0

1

0

21

b) F(x) = 23

0 0

2321

023232323

/x x/

/ xx

/

t/dtt/dtt/

0 0 x

F(x) = x3/2 0 x 1

1 x 1 c)

P(x 1/2) = P(- x 1/2) = F(1/2) – F(- ) = (1/2)3/2 – 0 = 0.3535

P(x 1/3) = P(1/3 x) = F(1/3) – F(- ) = (1/3)3/2 -0 = 0.1924

P(1/3 x 0.9) = F(0.9) – F(1/3) = (0.9)3/2 – (1/3)3/2 = 0.6613 P(x = 1/5) = F(1/5) – F(1/5) = 0

d) E(x)=

53125

23

0

1

25232323

2525

1

0

231

0/

/

/

/

x/dxx/dxx/x /

//

= 3/5 = 0.6

e) E(x2) =

0

1

27232323

271

0

251

0

2

/

x/dxx/dxx/x

//

= ((3/2)/(7/2)) (17/2) = 3/7 = 0.4285

f) VAR (x) = E(x2) - 2 = 3/7 – (3/5)2 = 68.57x10-3

g) = )x(VAR = (68.57x10-3) = 0.2618

Ejemplo 35

Calcule y 2 para la variable aleatoria continua de f(y) que se enuncia. Luego

calcule P( - 2 < y < + 2 ) y compare el resultado con la regla empírica.

0 y 1

10 y 1

)(2

2

y

y

ec

ec

yf

0

2y

0

2y

dy ec

1dy edx f(x)

Page 88: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

414

12222211 00

0

2

0

2

0

2

0

2

ccc

eec

eec

ec

ec

dyec

dyec

yyyy

a)

0

y dy yf(y)E(y)μ

0

0

2y

2y

dy e 4

ydy e

4

y

144

14eye 2

4

1dy ye

4

10 0

2y

2y

2y

144

14e2ye

4

1dyye

4

1

0

2y

2y

2y

011

b) 2

y dy (y) fμy(y) V

2

2

y

dy ey 4e y 2dy ey4

1 ey

4

22

y2

y22

y0

2

0

2y

2

8164

24242

4

10

2222

yyy

eyeey

dyeydyeydyyfyyvyy

2

0

2222

4

1

4

1)(0)(

Page 89: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

DISTRIBUCIÓN UNIFORME Definición. Una variable aleatoria Y tiene una distribución de probabilidad Uniforme sí y sólo sí: La función de densidad es:

La función de distribución de probabilidad es:

Decimos que X está distribuida uniformemente en el intervalo [a, b]. Ejemplo 1 Supóngase que una despachadora automática de un líquido nunca da menos de 6 cm3 ni más de 10cm3 y cualquier cantidad de liquido entre 6 y 10cm3 tiene la misma probabilidad de ocurrir. Al despachar cierta cantidad, determinar la probabilidad de que sea:

a) 7cm3

b) 6cm3 c) cualquier cantidad de entre {7 a 9}cm3 d) el promedio t desviación estándar que tiene la despachadora

automática.

4

1

610

1

)x(f

a) P(x = 6) = 066416

64141

6

6

/x/dx/

b) P(7 x 10) = 43710414110

7//dx/

c) P(6 x 9) = 436941419

6//dx/

d) E(x) = 82

610

34

12

6102

/)x(VAR

Ejemplo 2

Page 90: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Considere la temperatura ambiental promedio para una región de Polonia se distribuye de igualmente entre los niveles que vende -20°C a 20°C para un invierno cualquiera:

a) Probabilidad de que la temperatura sea 10°C

b) 10°C y 5°C c) {-10°C a 10°C}

40

1

2020

1

)x(f

a) P(-20 x 20) =

43201040120

10401401

10

20//x/dx/

b) 10°C y 5°C = P(5 x 10) =

815104015

10401401

10

5//x/dx/

c) P(-10 x 10) =

21101040110

10401401

10

10//x/dx/

Ejemplo 3

Una función uniforme se cree que tiene una maquina que fabrica tornillos entre

los valores de 5 y 12mm.

a) Encuentre la función de densidad, haga su grafica, encuentre su media y desviación estándar e indique sus valores en la grafica.

b) ¿Cuál es la probabilidad de que los tornillos sus dimensiones sean menores de 8mm?

c) ¿Cuál es la probabilidad de que los tornillos sean mayores a 9mm? d) Si una constructora desea tornillos de 6 a 9.5 mm, ¿Cuál es la

probabilidad de encontrar esos tornillos en esa producción? Solución a:

Page 91: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

0.142 5 12( )

0 . . .

xf x

e o c

178.5

2 2

a b

2 2( ) (12 5)

( ) 4.0812 12

b aVAR x

r = 2.02 Solución b:

88

5 5

( 8) 0.142 0.142 0.426P x dx x

Solución c:

1212

9 9

( 9) 0.142 0.142 0.426P x dx x

Solución d:

99

6 6

(6 9) 0.142 0.142 0.426P x dx x

Ejemplo 4 Sea

f(x) = 502030

1

2050

11

xpaara

ab

Encontrar A,B,C

Page 92: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

A) 35

xdx30

1

30

135

20

= 2

1

30

15

30

20

30

35

20

B) (x < 25 o x > 45) = P(x < 25 U x > 45 ) = P( 4525 x )

45

xdx30

1

30

145

25

3

2

30

20

30

25

30

45

25 C) 5.1

)(XE = 352

5020

2

ba

66.875

7512

30

12

2050

12

222

VAR

abVAR

Ejemplo 5 El tiempo y entre dos pausas en una terminal de edición en pantalla completa (esto es, el tiempo necesario para que la terminal procese un comando de edición y haga las correcciones en la pantalla) se distribuye uniformemente entre .5 y 2.25 segundos.

a. calcule la media y la varianza de y

b. localice el intervalo 2 en una gráfica de la distribución de

probabilidad y calcule P ( - 2 < y < + 2 ). Compare su resultado con la regla empírica.

c. ¿Qué probabilidad hay de que la terminal procesará un comando de edición y hará las correcciones apropiadas en la pantalla en menos de un segundo?

Como

Page 93: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

uniforme adprobabilid de ónDistribuciβ

1

punto otrocualquier en 0

βxααβ

1

f(x)

= 2.25 seg = 0.5 seg - = 2.25 – 0.5 = 1.75 seg

punto otrocualquier en 0

2.25x .5 0.5714 (x) f

a) 1.3752

2.250.5

2

βαμx

Varianza 2552.05.025.212

1αβ

12

1 222

x

b)

P ( -2 < y < + 2) = 1.375 – 2 ( 0.505) = 0.365 1.375 + 2 (0.505) = 2.385

P(0.365 < y < 2.385) =

2.385

0.365

2.385

0.365

dy 0.5714dx F(x)

154221.2.02 x 0.5714y 0.5714dy

2.385

0.365

2.385

0.365

1 1

0.5

1

0.5

dy0.5714dy 0.5714dy (y) F1)(y P

8570.2y 0.57141

10.5

Ejemplo 6

y

0.5714

.5 2.25

Page 94: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Se ha construido un circuito, se encontró que este estaba construido uniformemente en el intervalo (0,1). a. Indique la media y a varianza de la trayectoria del circuito. b. Calcule a probabilidad de que la trayectoria esté entre .2 y .4. c. ¿esperaría usted observar una trayectoria que excediera .995?. solución:

2.)2.4)(.()4.02.0(

11

)(

2886.12/1

083.12/112

)(

5.2

10

22

2

yfaP

abyf

ab

ba

Page 95: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

La distribución exponencial. Definición. Se dice que una variable aleatoria continua X que toma todos los valores no negativos tiene una distribución exponencial con parámetros 0

si su fdp está dada por:

,)( xexf x>o

=0 para cualquier otro valor. Una integral inmediata indica que:

1)(0

dxxf

y, por tanto, la ecuación representa un fdp. La distribución exponencial desempeña un papel importante en la descripción de una gran clase de fenómeno, especialmente en el área de la teoría de la confiabilidad. Gráfica de la distribución exponencial

Propiedades de la distribución exponencial.

a) La función de la distribución exponencial está dada por:

0,1)()(0

xedtexXPxF xx

t

= 0 para cualquier otro valor.

Page 96: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Por tanto, xexXP )(

b) El valor esperado de X se obtiene como sigue:

dxexXE x

0)(

Ejemplo 1

Un enfermo de gripa tiene tos a un promedio de 5

6 de accesos de tos por

minuto. Calcular la probabilidad de que en un momento dado transcurra más de 1 minuto hasta el segundo acceso de tos dado que el acceso ocurrió.

1 1 1

5

6

1

5

6

5

6

6

5

5

6

5

6

5

6)1(

xu

xx

eduedxedxexP

3012.03012.005

6

5

6

ee

F(t)

t

Page 97: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

dxdu

xu

5

6

5

6

*

Ejemplo 2 La duración (en horas) de la unidad central de proceso de cierto tipo de microcomputadora es una variable aleatoria exponencial con parámetro

=1,000. a. Calcule la media y la varianza de la duración de la unida central de proceso. b. ¿Qué probabilidad hay de que una unidad centra de proceso tendrá una

duración de por lo menos 2,000 horas? c. ¿Qué probabilidad hay de que una unidad centra de proceso tendrá una

duración de cuando más 1,500 horas? Solución:

a) =1000 2=2=1000000

b)P(2000)=e-y/ = e-2000/1000 = .135 c)P(y<1500)=1-e-1500/1000 = .7768 Ejemplo 3 El número accidentes por hora en una planta industrial está distribuido

exponencialmente con una media de =.5. a. ¿Qué probabilidad hay de que al menos un accidente ocurrirá en una hora

escogida al azar en la planta industrial?. b. ¿qué probabilidad hay de que menos de dos accidentes ocurrirán en una

hora escogida al azar en la planta industrial? Solución: a)P(1)=e-1/.5 = .1353 b)P(y<2)=1-e-2/.5 =.98168

Page 98: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Caso práctico Caso II.- De los estudiantes de nivel medio superior, de una muestra de 100 alumnos se

encontró que en sus hogares viven en promedio de 5.31 personas ¿Cuál es la

probabilidad de que vivan hasta 5 personas?

Solución:

Page 99: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

DISTRUBUCION NORMAL. La distribución normal o campana de Gauss es una distribución más importantes y de mayor aplicación en la estadística inferencial por medio de la cual y bajo ciertas condiciones los Investigadores Generalizan los resultados obtenidos en una muestra a toda la población. Es una distribución probabilística para una variable aleatoria continua, la cual tiene simetría perfecta, forma de campana unimodal. La mediana y la moda de la distribución son todas iguales y están localizadas al centro de la distribución. Las medidas de la varianza. Función de densidad de probabilidad normal esta dada por:

2

2

1

22

1

x

x exf

Si es la media y es la varianza de una variable aleatoria normal Y,

entonces la formula f(y), la cual usamos para trazar curva normal de

distribución, es:

3 x 3 x

22

2

2

1

2

13

2

1

3 r

q

r

q

x kekekef

22

2

2

1

2

13

2

1

3 r

q

r

q

x kekekef

Page 100: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

En donde e es la base de los logaritmos naturales elevada a la potencia. Gráficamente:

- + x Observamos que:

1) La curva es simétrica respecto al valor de la media.

2) Tiene un máximo en x = E [X ] = cuyo valor es:

2

1

2

1

2Xfx

3) Si la curva es aguisada ( Los datos están concentrados alrededor de la

media con poca dispersión.

4) En x = +- se tienen los puntos de inflexión de la curva ya que:

)() xfa

12

1)()

2

2

1

2dxedxxfxb

x

YZ

Page 101: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

DISTRIBUCIÓN NORMAL ESTANDAR. Si estandarizamos todas las mediciones en una distribución normal que tiene

una medida y una desviación estándar , llamamos a la distribución resultante distribución normal estándar. Esta tiene una media igual a 0 y una varianza y desviación estándar iguales a 1. Ejemplo 1 Las edades de un grupo de 30 personas están distribuidas normalmente con medida de 19 años y la probabilidad de que la edad de una persona seleccionada al azar se encuentra entre 18 y 20 años es de 0.4371. a) Calcula la varianza de las edades. b) Calcula la probabilidad de que la edad de una persona sea mayor de 21

años c) Calcula el numero aproximado de personas mayores a 21 años. Solución:

X es una v.a.n (19,)

Page 102: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

0779.3

7544.157.

1

7157.)57(.

2

43421.112

1

192019182018)

4321.02018`

Z

z zZ

XPXPa

P

X es v.a.n. ( 19,3.0779)

1075.08925.01

)14.1(11399.1

2121)

ZZZ

XPXPb

C) 30 p(x> 21) = 30(0.1075) = 3.225 Ejemplo 2 Suponga que la temperatura (C°) esta distribuida con esperanza 50° y varianza 4° ¿Cuál es la probabilidad de que la temperatura esté entre 48° y 53°. E [t]= 50 V [t]= 4 P[48<t<53]

7745.

1587.09332.

)'00.1()50.1

2

5048

2

5053

ZZ

ZZ

Ejemplo 3

Page 103: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Suponga que una distribución normal tiene una media de 100 y una desviación estándar de 10¿Cuál es la probabilidad de que una media escogida aleatoriamente pueda estar entre 100 y 110? Solución: Z= 110-100 10 --------- =--- =1.00 10 10 Z = 100, encontramos el numero 0.3413. Este numero representa el área entre la media (100) y un segmento de recta a una desviación estándar hacia la derecha de la media (110) por la tanto la probabilidad de que una observación caiga en el intervalo es de 0.3413. Ejemplo 4

El 30% de los estudiantes de ESIME Zacatenco duermen menos de 7.2horas. diarias, mientras que el 40% duermen menos de 7.5 horas diarias. Si se supone que el sueño tiene una distribución normal, cual es la media y la distribución Standard del No, de horas de sueño diarias

88.72.7)111.1(525.0

111.127.0

3.0

3.027.0

02.7525.05.7255.0

2.7525.0

05.7255.0

02.7525.0

05.7255.0...................................02.7525.0

5.755.0.........................................2.7525.0

5.7255.0..........................................

2.7525.0

3974.026.0.............................................2981.0053

255.04013.025.0...........................525.03015.052.0

11

XZ

Ejemplo 5

Page 104: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Se observo durante largo periodo que la cantidad semanal gastada en el

mantenimiento y en las reparaciones en cierta fabrica tiene: = 400 pesos, y = 20. si el presupuesto es de 450 pesos.

a) Cuál es la probabilidad de que los costos reales sean mayores que el propuesto.

b) Cuál es la probabilidad de que los costos reales sean menores que el propuesto..

= 400 = 20

a) P (x 450) =

z.PzPxP 52

20

400450450

%...FF 62099380152

b) P (x 450) =

522020

400450

20

40004500 .zPzPxP

%...F.F 19702280993802052

Ejemplo 6 Los módulos conectores deben tener una longitud de entre .304 y .322 pulgadas para funcionar correctamente. Cualquier módulo cuya longitud se salga de estos límites está “fuera de especificación”.

a. Si los conectores producidos por el proveedor seguían una distribución

aproximadamente normal con una media de = .3015 pulgadas y una

desviación estándar de = .0016 pulgadas. Calcule la probabilidad de que el proveedor produzca un componente fuera de especificación.

b. Si los conectores tienen una media de = .3146 pulgadas y una

desviación estándar de = .0030 pulgadas. Calcule la probabilidad de producir un componente fuera de especificación.

= 0.3015 = 0.0016

= 0.304 b = 0.322

=

μx= Variable Aleatoria Normal Estándar

a) P ( a < x < b ) = F ( 0.355 ) – F ( 0.304) =

1.5625φ12.8125φ

0.0016

0.3150.304φ

0.0016

0.30150.322φ

Page 105: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

= 1-0.9406 = 0.0594 1-P ( a < x < b ) = 1 – 0.0594 = 0.9406

b)

= 0.3146 = 0.003 P ( a < x < b ) = F ( 0.322) – F ( 0.304)=

3.53φ2.466φ

0.0030

0.31460.304φ

0.0030

0.31460.322φ

= 0.9931-0 1-P (a < x < b ) 1- 0.9931 = 0.0069 Ejemplo 7 La fuerza que actúa sobre una columna está normalmente distribuida con

media de = 15 kips, y desviación estándar de = 1.25. ¿Cuál es la

probabilidad de que la fuerza?

a) Sea a lo sumo 17 kips.

b) Sea entre 12 y 17 kips.

a) P(y 17) z = (17 – 15) / 1.25 = 2 / 1.25 = 1.6

valor en las tablas = 0.9452.

b) P(12 y 17) z1 = (12 – 15) / 1.25 = -3 / 1.25 = -2.4

valor en tablas = 0.0082

z2 = (17 – 15) / 1.25 = 2 / 1.25 = 1.6

valor en tablas = 0.9452

Page 106: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

0.5 – 0.0082 = 0.4918

0.5 – 0.9452 = 0.4452

P = 0.4918 + 0.4452 = 0.937

Ejemplo 8

Una maquina despachadora de café sirva un promedio de 200 mililitros por vaso. Si la cantidad de bebida se distribuye normalmente con una desviación estandar igual a 15 mililitros

a) ¿Que fracción de los vasos contendrán más de 224 mililitros de café? b) ¿Cuál es la probabilidad de que un vaso contenga entre 191 y 209

mililitros de café? c) La probabilidad de que un vaso tenga mas de 230 mililitros. d) El 25% de 1000 botellas es de 250

Aquí se tiene una distribución normal con una media=200ml. Y uns

desviación estandar =15ml.

2

x2

e2

1)x(f

Haciendo cambio de variable:

15

200xxz

a) La probabilidad de que un vaso tenga más de 224ml. Se obtiene primero calculando:

6.115

200224z

Así la probabilidad será:

6.1

6.12

x

2

x

0548.09452.01e2

11dxe

2

1P

22

a) La probabilidad de que un vaso contenga entre 191 y 209ml.

Page 107: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

6.015

200191Z191

6.015

200209Z209

045147257.02743.0e2

1e

2

1e

2

1 6.02

x6.02

x6.0

6.0

2

x 222

c) La probabilidad de que un vaso tenga mas de 230ml.

215

200230z

Así la probabilidad será:

2

2

x

0228.09772.01e2

11P

2

Caso práctico

En una encuesta llevada a cabo en la ciudad de México se encontró que

los encuestados han estado desempleados, con una media de 1 años y una

desviación estándar de 1 año. ¿Qué porcentaje de los encuestados ha

estado desempleados por más de 3 años.

Z = 3-1

1 Por lo tanto el 97.72% de

los encuestados, han estado desempleados por más de 3 años

=2

P(x>3)= P(x>2) =1-P(x>2) =1-0.9772 =0.0228 P(x>3)= P(x>2) PKDKDKD P(x>3)= P(x>2)

Page 108: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Caso II.- Se ha encontrado que el tiempo medio en el cual los encuestados han estado

sin drenaje reflejan una media de 3.51 años y una desviación estándar de 1.899 años

¿Qué porcentaje de encuestados han estado sin drenaje por lo menos 3 años?

σ=1 2.28%

P(x>3)= 1-0.0228 =0.9772

97.72%

Page 109: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Encuestas tomadas 100

Media 3.51

Mediana 3

Moda 3

Desv. Tip 1.899

Varianza 3.606

Rango 13

Mínimo 2

Máximo 15

0 0.0322

1 0.0934

2 0.2148

3 0.3974

4 0.4013

5 0.3775

6 0.2177

7 0.0951

Page 110: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

DISTRIBUCIÓN DE PROBABILIDAD JI CUADRADA La distribución de probabilidad ji cuadrada es igual a la diferencia entre las frecuencias observadas y las frecuencias esperadas al cuadrado divididas por las frecuencias esperadas en cada celda sumadas a lo largo de todas las celdas .

Definición Sean Y1 , Y2 …… Yn una muestra aleatoria de tamaño n de una distribución normal. Entonces Z = ( Yi - μ ) / σ son variables aleatorias normales estándar e independientes, i = 1,2,…….., n y

Gráfica de la distribución Ji cuadrada

2

22 1

Sn

Page 111: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Ejemplo 1 En el estudio de un taller, se obtuvo un conjunto de datos para determinar si la proporción de artículos defectuosos producidos por los trabajadores era la misma durante el día, la tarde o la noche. Se encontraron los siguientes datos: 950 945 950

2.- La experiencia nos indica que podemos utilizar un nivel de significancia de 0.025 para determinar si la proporción de artículos defectuosos es la misma para los tres turnos.

Solución Sea que p1, p2 y p3 frecuencias observadas de artículos defectuosos para los turnos del día, la tarde y la noche, respectivamente. Utilicemos el procedimiento de los 6 pasos: Paso 1. Ho : p1 = p2 = p3 hipótesis nula Paso 2. H1: p1, p2 y p3 no son todas iguales. Hipótesis alternativas

Paso 3. ( = 0.025.) Paso 4. Región crítica: X

2 > 7.378 para v = 2 grados de libertad.

Paso 5. Cálculos: En relación a las frecuencias observadas O1 = 45 y O2 = 55 Se encuentra: O1 =(950)(170)/2835=57 O2 =(945)(170)/2835=56.7

Todas las otras frecuencias observadas se encuentran por sustracción y se muestran en la tabla anterior Ahora,

X2= (45- 57.9) 2 + (55-56.7) 2 + (70 – 56.3) 2

57 56.7 56.3 + (905 - 893) 2 + (890 - 888.3) 2 + (870 - 883.7) 2 893.0 888.3 883.7

Turno

Día Tarde Noche

Defectuosos No defectuosos

45 905

55 890

70 870

Page 112: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

= 6.29

P0.04 Paso 6 Decisión: No se rechaza H0 en a = 0.025. pero debemos concluir que ello no implica que la proporción de artículos defectuosos producidos es la misma para todos los turnos.

Problema 2

- Los siguientes son los pesos, en decagramos, de 10 paquetes de semillas de pasto distribuidas por cierta compañía: 46.4, 46.1, 45.8, 47.0, 46.1, 45.9, 45.8, 46.9, 45.2 y 46. Encuentre un intervalo de confianza de 95% para la varianza de todos los paquetes de semillas de pasto que distribuye esta compañía, suponga una población normal.

Solución:

Primero se calcula la desviación estándar y la varianza de la muestra para en seguida calcular la desviación estándar que es s2= 0.286.

Para obtener un intervalo de confianza de 95% se elige un = 0.05. Después con el uso de la tabla con 9 grados de libertad se obtienen los valores de X2.

Se puede observar en la gráfica anterior que el valor de X2 corre en forma normal, esto es de izquierda a derecha.

Por lo tanto, el intervalo de confianza de 95% para la varianza es:

Page 113: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Gráficamente:

Se observa que la varianza corre en sentido contrario, pero esto es sólo en la gráfica. La interpretación quedaría similar a nuestros temas anteriores referentes a estimación. Con un nivel de confianza del 95% se sabe que la varianza de la población de los pesos de los paquetes de semillas de pasto esta entre 0.135 y 0.935 decagramos al cuadrado.

3.- Los seis de las evaluaciones de un examen de física fueron 9.54, 9.61, 9.32, 9.48, 9.70 y 9.26. Estimar la varianza de los resultados de la población usando un nivel de confianza del 90%.

Solución:

Al calcular la varianza de la muestra se obtiene un valor de s2= 0.0285.

Se busca en la tabla los valores correspondientes con 5 grados de libertad, obteniéndose dos resultados. Para X2

(0.95,5)= 1.145 y para X2(0.0,5)= 11.07.

Entonces el intervalo de confianza esta dado por:

y

Page 114: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

4.- Una tabla de 250 números aleatorios de 250 se muestra en la siguiente tabla ¿Difiere significativamente la distribución observada de la distribución esperada al nivel de 0.01?

Digito 0 1 2 3 4 5 6 7 8 9

Frecuencia Observada

17 31 29 18 14 20 35 30 20 36

Frecuencia Esperada

25 25 25 25 25 25 25 25 25 25

SOLUCION: X2 = (17 - 25)2 / 25 + (31 - 25)2 / 25 + (29 - 25)2 / 25 + (18 - 25)2 / 25 +….. + (36 - 25)2 / 25 = 23.3 El valor critico de X2

0.99 pata v = k – 1 = 9 grados de libertad es de 21.7; como 23.3 > 21.7 se deduce que la distribución observada difiere significativamente de la esperada al nivel de significación del 0.01. Caso práctico.-

Supóngase que el tiempo de desempleo es un cierto número de años con una desviación

estándar de 2.48. Si se toma una muestra al azar de 30 desempleados encuentre la

probabilidad de que la varianza muestral sea mayor que S2=3.35.

El valor de 39.17 se busca en la tabla en el renglón de 29 grados de libertad. en con

Consecuencia el valor de la probabilidad es P(S2>3.35)

17.39

48.2

35.313012

22

Sn

Page 115: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

DISTRIBUCION "F" FISHER

Ejemplos

1.- Si s=12 y s=22 representan las varianzas de las muestras aleatorias independientes de tamaño n1= 25 y n2 = 31, tomadas de poblaciones normales con varianzas uno 10 y varianza dos = 15, respectivamente, encuentre

P(s12/s22 > 1.26).

Solución:

Page 116: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Calcular el valor de Fisher:

F= (S1/ S2)2 (2/1)

2 = (1.26) ( 15/10) = 1.89

Buscando en la tabla de Fisher 30 grados de libertad para la varianza 2 con 24 grados de libertad para la varianza uno el valor de Fisher de 1.89 se obtiene un área de 0.95, pero esta área correspondería a la probabilidad de que las relaciones de varianzas muestrales fueran menor a 1.26, por lo que se calcula su complemento que sería 0.05, siendo esta la probabilidad de que s12/s22 > 1.26.

2.- La probabilidad de tener una unidad defectuosa en una línea de ensamblaje es de 0.05. Si el conjunto de unidades terminadas constituye un conjunto de ensayos independientes.

1. ¿Cuál es la probabilidad de que en 10 unidades 2 se encuentren defectuosas?

2. ¿Y de que a lo sumo 2 se encuentren defectuosas?

3. ¿Cuál es la probabilidad de que por lo menos una se encuentre

defectuosa? SOLUCION

1. Procedemos a calcular:

P(n10, 0, 05 =2) = (2/10) X 0.052 X (1 – 0.05)8 = 0.0746

2. Se tiene que:

P(n10, 0, 05 ≤ 2) = ∑(10/i) X 0.05i X (1- 0.05)10-i = 0.9884

3. Y por ultimo:

Page 117: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

P(n10, 0, 05 ≥ 1) = 1- P(n10, 0, 05 = 0) = 1 – (10/0) X 0.050 X (1 – 0.05)10-0 = 1 – 0.5987 = 0.4013

3.- Se toman 2 muestras de tamaños 8 y 10 de dos poblaciones normalmente distribuidas con varianzas respectivas 20 y 36. Hallar la probabilidad de que la varianza de la primera sea el doble que la de la segunda. Solución:

Tenemos N1 =8, N2=10, __3620 2

2

2

1 y

2

2

2

1

2

2

2

1 85.1)36)(9/(10

)20)(7/(8

S

S

S

SF

El número de grados de libertad para el numerador y el denominador son V1 =N1-1 = 8-1 =7y V2 = N2-1 = 10-1=9. Ahora bien:

70.3)2)(85.1(85.12

2

2

1 S

SF

Page 118: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

DISTRIBUCIÓN GAMMA

Definición distribución gamma es una distribución de probabilidad continua con dos parámetros k y λ cuya función de densidad para valores x > 0 es

Con Γ = k-1

El valor esperado y la varianza de una variable aleatoria X de distribución gamma son

E[X] = k / λ = kθ V[X] = k / λ2 = kθ2

El tiempo hasta que el suceso número k ocurre en un Proceso de Poisson de intensidad λ es una variable aleatoria con distribución gamma

EJEMPLOS: 1.- Un animal sobrevive x tiempo si es expuesto a 240 rad de radiación gamma

con α=8 y β=15 el tiempo esperado de supervivencia es E(X)=(8)(15)=120 semanas, en tanto que V(X)= (8)(15)2=1800

σ = 1800 =42.43 semanas, si la experiencia nos dice que α=8.5 y

β=13.3 que E(x) = (8)(15) = 120 semanas, que la V(x) = 8(15)2 = 1800 en tanto que σ = 42.43

La probabilidad de que el animal sobreviva entre 60 y 120 semanas.

;);;()(

xFxFxXP

P(60 ≤ X ≤ 120) = P(X ≤ 120) – P(X ≤ 60) = F(120/15 ; 8) – F(60/15 ; 8) = F(8 ; 8) – F(4 ; 8) = .547 - .051 = 0.496 la probabilidad de que un ratón sobreviva por lo menos 130 semanas es:

Page 119: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

P(X ≥ 120) = P(X < 120) =1– (X ≤ 30) = 1 - F(30/15 ; 8) = 0.999 2.- El tiempo de reacción X a cierto estímulo de un hombre seleccionado al azar, tiene una distribución gamma estándar con α = 2 s. Puesto que P (a ≤ X ≥ b) = F(b) – F(a) Cuando X es continua, P (3 ≤ X ≥ 5) = F(5;2) – F(3;2) = .960 - .801 = .159 La probabilidad de que el tiempo de reacción sea más de 4 s es: P(X > 4) = 1 - P (X ≤ 4) = 1 - F(4;2) = 1 - .908 = .092 3.- El tiempo de mantenimiento de una maquina sigue una distribución gamma de α = 3 y β = 2. Si el nuevo operador tarda 14 minutos en verificar una maquina ¿El tiempo en realizar el cheque de mantenimiento discrepa con la experiencia anterior? La media es: µ = α β y σ2 = α β2 Entonces. µ = α β = (3) (2) = 6 σ2 = α β2 = (3) (4) = 12

46.312 14 - 6 = 8 minutos

En el ejemplo Y =14 minutos excedentes de 6 minutos por lo tanto K =46.3

8

Page 120: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

DISTRIBUCIÓN T Una de las distribuciones que tiene mayor uso en el análisis de datos provenientes de experimentos científicos es la llamada t de Student. La distribución t es simétrica, con media cero y de forma semejante a la normal estándar.

Definición Si Z es una variable N(0,1), y si X2 ~ X2(v) y es independiente de

de Z, entonces la variable aleatoria definida por: La distribución t de Student con v grados de libertad: La distribución t, se aproxima cada vez más a la normal a medida que se tienen más grados de libertad. La principal diferencia entre ambas es que la distribución de t tiene más área en las colas que la N(0,1).

Page 121: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

EJEMPLO: 1.- Una empresa realizo un estudio del nivel de nicotina para una muestra de 220 cigarrillos producido por otra empresa de acuerdo a os siguientes resultados

22.5 26.7 28.1 24.5 23.9

25.2 23.6 23.4 24.6 24.3

26.0 22.7 23.6 24.1 25.2

25.8 24.7 24.8 27.3 27.0

La media es:

9.2420

0.27...5.22

x

La desviación estándar:

53.119

))9.240.27(...)9.245.22((

1

)( 22

n

xxs

El intervalo de confianza de 95% por lo que 025.02

05.0 se localiza en el

renglón 19 que corresponden a los grados de libertad n-1 = 20-1 = 19 El valor de t es 2.093.

Page 122: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Por lo tanto

62.2518.24

72.09.2472.09.24

20

53.1*093.29.24

20

53.1*093.29.24

** 2/2/

n

stx

n

stx

Esto es con probabilidad 0.95 el nivel medio de la nicotina de la marca competidora esta entre 24.18 y 25.65 2.- Los estudiantes de la ESIME Zacatenco tienen en promedio un IQ mayor que 100. Se toma una muestra aleatoria de tamaño 16 de los estudiantes y se encuentra que la media muestral es x = 106. La desviación típica estimada (σ) es de 10 puntos. ¿Responden estos datos a la afirmación hecha? La prueba se hace como sigue: Hipótesis nula, H0: μ = 100 Hipótesis alternativa, H1: μ > 100 El estadístico t será: t = x – μ / σ / √n = 106 – 100 / 10/ √16 = 2.4 Y tendremos una distribución de t con Ø = 16 – 1 = 15 grados de libertad. Si admitimos α = 2.5 por cierto, como esta es una prueba unilateral o de un extremo, obtenemos P(-2.13 < t < 2.13│Ø = 15) = 0.95 Como t = 2.4, la probabilidad de elegir una muestra con x 0 106, o mayor, de una población con μ = 100 será menor que 2.5 por cierto. Por tanto, la diferencia entre x y μ es significativa y rechazamos la hipótesis nula de μ = 100 y aceptamos la alternativa de μ > 100. Ejemplo 3:

El valor t con = 14 grados de libertad que deja un área de 0.025 a la izquierda, y por tanto un área de 0.975 a la derecha, es t0.975=-t0.025 = -2.145

Page 123: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Si se observa la tabla, el área sombreada de la curva es de la cola derecha, es

por esto que se tiene que hacer la resta de . La manera de encontrar el

valor de t es buscar el valor de en el primer renglón de la tabla y luego

buscar los grados de libertad en la primer columna y donde se intercepten y

se obtendrá el valor de t.

Page 124: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

D I S T R I B U C I O N D E P R O B A B I L I D A D B E T A .

Características:

Posee 2 parámetros, definida en el intervalo cerrado 0 X y X 1

Definición: Una V. A. Y tiene una distribución de probabilidad beta sí:

10;),(

)1()(

11

yB

yyyf

Donde:

)(

)()()1(),( 1

1

0

1

dyYyB

Si Y es una V. A. con distribución de probabilidad Beta con parámetros α > 0 y

β > 0, entonces:

)(YE

)1()()(

2

2

YV

Page 125: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Esta distribución se puede utilizar como un modelo del porcentaje de impurezas

presentes en un producto químico o cantidad de tiempo que una maquina esta

en reparación

Problemas

1.- Un distribuidor de llenado de un tanque de agua ha observado que el llenado se puede modelar con una distribución beta con α = 4 y β = 2. Calcular el valor esperado de esa proporción. ¿Será muy probable que el llenado sea por lo menos el 90% de su capacidad? SOLUCION: De acuerdo con los datos mencionados, sea X la proporción del suministro total del llenado, E (X) = α / α + β = 4 / 6 = 2 / 3 Para la segunda parte, lo que interesa es: 1 P(X > 0.9) = ∫0.9 [Г(4 + 2) / Г(4) Г(2)] x3(1 - x)dx 1

Page 126: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

= 20 ∫0.9 (x3 – x4)dx = 20 (0.004) = 0.08

Por lo tanto No es muy probable que se suministre el llenado en el 90% Caso práctico

El porcentaje de alumnos que cuentan con habitación propia sigue una distribución beta

con α = 2, β = 5. Calcule la probabilidad de que más de 10% de los alumnos cuenten

con habitación propia.

La función de densidad de probabilidad de la distribución beta continua es:

Donde

Solución:

La función de densidad de probabilidad queda:

La función de distribución de probabilidad queda:

x F(x)=

0 0 0

0.05 1.2217 0.032773

0.10 1.9683 0.114265

0.15 2.3490 0.223515

0.20 2.4576 0.344640

0.25 2.3730 0.466064

0.30 2.1609 0.579825

0.35 1.8743 0.680920

0.40 1.5552 0.766720

0.45 1.2353 0.836432

0.50 0.9375 0.890625

0.55 0.6766 0.930801

0.60 0.4608 0.959040

0.65 0.2926 0.977678

0.70 0.1701 0.989065

0.75 0.0878 0.995361

Page 127: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

0.80 0.0384 0.998400

0.85 0.0129 0.999601

0.90 0.0027 0.999945

0.95 1.7812E-4 0.999998

1.00 0 1

La probabilidad de que más de 10% de los alumnos cuenten con habitación propia.

Page 128: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

MODULO V.- Distribución de probabilidad bivariada. Contenido a)Variable aleatoria bivariada Variable aleatoria bivariada discreta, variable aleatoria bivariada continua, función de densidad de porbabilidad conjunta y discreta, función de distribución acumulada y sus propiedades, propiedades de la función de densidad conjunta, b) Distribución de probabilidad marginal y de probabilidad condicional, definición de función de probabilidad marginal caso discreto, definición de función de probabilidad marginal caso continuo, definición de función de probabilidad condicional caso discreto, función de probabilidad condicional caso continuo,. c) Variables aleatorias independientes Definición de variables aleatorias independientes caso discreto, definición de variables aleatorias independientes caso continuo. d) Valor esperado de una función de variables aleatorias Definición de valor esperado de una función de v.a.d, definición de valor esperado de una constante por una función de variables aleatorias, valor esperado de una constante, el valor esperado d ela suma de funciones de variables aleatorias, el valor esperado de las variables aleatorias independientes. e) La covarianza de dos variables aleatorias. Definición de covarianza de dos variables aleatorias, teorema f) Teorema central del límite g) Regresión lineal h) Regresión no lineal

Page 129: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

VARIABLES ALEATORIAS BIVARIADAS DISCRETAS. Las variables aleatorias bivariadas discretas son funciones de distribución de probabilidad bivariada Definición Sean Y1 , Y2 dos variables aleatorias discretas La función de probabilidad conjunta para las variables está dada por: P(y1 , y2 ) = P (Y1 = y1 , Y2 = y2 )

, Si (X,Y) es una variable aleatoria bivariada su función de distribución de

probabilidad p(x,y) debe satisfacer:

1) 0<p(x,y) < 1

2) p(x,y)= 1 Para todos los valores de (x, y) ≠ 0

x y

Ejemplo

Sean X y Y dos variables aleatorias continuas con función de densidad de probabilidad conjunta dada por:

( x + y ) , 0 < x , y < 1,

0 , para cualquier otro valor Graficar la función de densidad de probabilidad conjunta, determinar la función de distribución acumulativa conjunta y obtener la probabilidad conjunta de que X < 1/2 y Y < 3/4 .

f (x,y) = {

( x + y ) dy dx = (xy + y / 2) dx = ( x + ½ ) dx = 1

Page 130: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Entonces:

esto es cuando 0 < x, y < 1 F (1/2, 3/4) = (1/2)(1/2)(3/4)(1/2 + 3/4) = 15/64 2 = xy + y / 2 2 1 1

Ejercicio 1

Sean X y Y las desviaciones horizontal y vertical respectivamente, de un individuo con respecto a su lugar de trabajo. En donde X y Y son variables aleatorias, independientes cada una, con una

distribución normal bivariada, medias 0yx y varianzas iguales.

¿Cuál es la máxima desviación estándar de X y Y, que permita tener una probabilidad de 0.99 de que el hombre se encuentre a no más de 500 milímetros de su lugar de trabajo tanto en dirección vertical como horizontal?

F(x, y) = (u + v) dv du = (uy + y / 2) du = xy + (x + y) / 2

0

Page 131: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Como yx , la probabilidad conjunta es:

P ( -500 < X < 500, -500 < Y <500 ) = P ( -500 < X < 500 ) P ( -500 < Y < 500 )

=

500500500500ZPZP

=

2

2 500500

ZP

Puesto que por hipótesis es:

99.0500500

2

2

ZP

99499.0500500

ZP

ó

0025.0500

2

ZP

pero

0025.081.2 ZP

Por lo tanto 500/σ = 2.81 y 94.177 yx milímetros.

Page 132: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

FUNCIONES DE DENSIDAD DE PROBABILIDAD CONJUNTAS DISCRETAS Y CONTINUAS. FUNCIONES DE DENSIDAD DE PROBABILIDAD CONJUNTAS DISCRETAS. Una distribución conjunta es discreta, si cada variable aleatoria tiene

distribución marginal discreta. En este caso el espectro conjunto estará

compuesto de un numero finito de parejas (m ,n).

FUNCIONES DE DENSIDAD DE PROBABILIDAD CONJUNTAS CONTINUAS. Una distribución conjunta es continua si su función de repartición Fxy (x,y) es continua para todos los valores de x,y ; y además posee segundas derivadas parciales mixtas (excepto quizás en un conjunto finito o infinito numerable de puntos), en tal caso la derivada parcial mixta (cualquiera de ellas puesto que son iguales) se denomina función de densidad conjunta:

xy

)y,x(F

yx

)y,x(F)y,x(f

xy

2

xy

2

xy

Ejemplo Se lanzan al aire tres monedas independientemente. Una de las variables de interés es Y1=el número de casos. Sea Y2 la cantidad de dinero ganado en una apuesta que se realiza de la siguiente manera. Si la primera cara ocurre en el primer lanzamiento, se ganará 1 dólar. Si la primera cara ocurre en las tiradas 2 y 3 dólares, respectivamente. Si no cae una cara, se perderá 1 dólar (es decir se ganará 1 dólar).

a) Determine la función de probabilidad conjunta para Y1 y Y2. b) ¿Cuál es la probabilidad de que ocurran menos de tres caras y que se

gane 1 dólar o menos? [es decir obtenga F(2,1)]

Page 133: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

espacio muestral:

xxx

xcx

cxx

ccx

cxc

xxc

xcc

ccc

321

P = 1 / 8

Y1

Y2 0 1 2 3

1 0 1/8 2/8 1/8

2 0 1/8 1/8 0

3 0 1/8 0 0

-1 1/8 0 0 0

21)1,2()1,2(

)1,2(

),(),(

21

21

yyPF

F

bYaYPbaF

Page 134: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

p x y( )x y

30

p x y( ) 1 a 15a

a 1a a 89a a por lo tanto a:1/89

Si la distribución de probabilidad conjunta de X y Y esta dada por: f (x, y) = a(x2 + y2) para x = -1,0,1,3 ; y = -1,2,3 a) Encuentre el valor de a. p(-1,1) = 2a p(0,-1) = a p(1,-1) = 2a p(3,-1) = 10a p(-1,2) = 5a p(0,2) = 4a p(1,2) = 5a p(3,2) = 13a p(-1,3) = 10a p(0,3) = 9a p(1,3) = 10a p(3,3) = 18a

-1 0 1 3

-1 2/89 1/89 2/89 10/89

2 5/89 4/89 5/89 13/89

3 10/89 9/89 10/89 18/89

P(x ≤ 1, y >2 ) = p(-1,3) + p(0,3) + p(1,3) = 1/89 ( 10 + 9 + 10 ) = 29/89 P(x = 0, y ≤ 2) = p(0,-1) + p(0,2) = 1/89 (1 + 4 ) = 5/89 p( x + y > 2) = = p(0,3) + p(1,2) + p(1,3) + p(3,2) + p(3,3) = 1/89 (9+5+10+13+18) = 55/89 Función de probabilidad conjunta Dada a) Determine que es una función de probabilidad. b) Determinar lo siguiente: P(x + y ≤ 3) ; P( x =1│y =2) ; P(2x + y > 1) ; P(2x + y ≤ 2) ; P(3x, 2y) ; F(2,2) ; F(1,2) ; F(3,1)

0 1 2 3

0 0 1/30 2/30 3/30

1 1/30 2/30 3/30 4/30

2 2/30 3/30 4/30 5/30

a)

Page 135: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

p x y( ) 1 a 15a

= p(0,0) + p(0,1) + p(0,2) + p(1,0) + p(1,1) + p(1,2) + p(2,0) + p(2,1) + p(2,2) + p(3,0) + p(3,1) + p(3,2) = 1/30 + 2/30 +1/30 +2/30 +3/30 +2/30 +3/30 +4/30 +3/30 + 4/30 + 5/30 = 30/30 = 1

Por lo tanto, podemos afirmar que es una función de probabilidad b) P(x + y ≤ 3) = p(0,0) + p(0,1) + p(0,2) + p(1,0) + p(1,1) + p(1,2) + p(2,0) + p(2,1) + p(3,0) = 1/30 ( 1 + 2 + 1 + 2 + 3 + 2 + 3 + 3 ) = 17/30 P( x =1│y =2) = p(x∩y) / h(y) = p(1,2)/ h(2) = 3/30 / 14/30 = 3/14 P(2x + y > 1) = p(0,2) + p(1,1) + p(1,2) + p(2,0) + p(2,1) + p(2,2) + p(3,0) + p(3,1) + p(3,2) = 1/30 ( 2 + 2 + 3 + 2 + 3 + 4 + 3 + 4 + 5 ) = 28/30 P(2x + y ≤ 2) = p(0,1) + p(0,2) + p(1,0) = 1/30 ( 1 + 2 + 1 ) = 4/30 P(3x, 2y) = p(0,0) + p(0,2) + p(3,0) + p(3,2) = 1/30 ( 2 + 3 + 5 ) = 10/30 = 1/3 F(2,2) = p(0,0) + p(0,1) + p(0,2) + p(1,0) + p(1,1) + p(1,2) + p(2,0) + p(2,1) + p(2,2) = 1/30 (1 + 2 + 1 + 2 + 3 + 2 + 3 +4 ) = 18/30 F(1,2) = p(0,0) + p(0,1) + p(0,2) + p(1,0) + p(1,1) + p(1,2) = 1/30 (1 + 2 + 1 + 2 + 3 ) = 9/30 F(3,1) = p(0,0) + p(0,1) + p(1,0) + p(1,1) + p(2,0) + p(2,1) + p(3,0) + p(3,1) = 1/30 (1 + 1 + 2 + 2 + 3 + 3 + 4 ) = 16/30 = 8/15

Page 136: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

FUNCIONES DE DISTRIBUCION ACUMULADAS CONJUNTAS Y SUS PROPIEDADES. Se define la función de distribución de probabilidad acumulativa conjunta como:

FXY (x,y):= P[X x , Y y] Que cumple con las propiedades:

i) FXY (-, -) = 0

ii) FXY (, ) = 1

Sí x1 < x2 -------- FXY (x1,y) FXY (x2,y)

Sí y1 < y2--------- FXY (x1,y1) FXY (x2,y2)

0 FXY (x,y) 1 PROPIEDADES DE LAS FUNCIONES DE DENSIDAD CONJUNTA.

0 gxy (m,n) 1

1)n,m(g)n,m( xy

)n,m(g)n,m( xy

b) DISTRIBUCIONES DE PROBABILIDAD MARGINAL Y DE PROBABILIDAD CONDICIONAL Con cada variable aleatoria bidimensional (X,Y) asociamos dos variables aleatorias unidimensionales llamadas X y Y, respectivamente. Es decir; podemos interesarnos por la distribución de probabilidad de X o por la distribución de probabilidad de Y. Definición de función de probabilidad marginal caso discreto

En el caso discreto procedemos así: puesto que X = xi debe ocurrir con Y = yj para una j, y puede ocurrir con Y = yj para solo una j, tenemos:

P(xi) = P ( X = xi) = P(X = xi, Y = y1 o X = xi, Y = y2 o ……) =

1

),(j

ji yxp

La función p definida para x1, x2, ……, representa la distribución marginal de probabilidad de X.

Page 137: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Análogamente definimos q(yj) = p(Y = Yj) =

1

),(1j

ji yxp como la distribución

marginal de probabilidad de Y.

Ejemplo

De un grupo de tres perredistas, dos priistas y un independiente, debe seleccionarse al azar para integrar un comité de dos personas. Sea Y1 el número de perredistas y Y2 el número de priistas en el comité. Encuentre la distribución marginal de Y1. Para encontrar P1(y1), se tiene que sumar para todos los valores Y2, entonces

esta probabilidades están dadas por los totales de las columnas (por tablas).

P1(0) = p ( 0,0) + p (0,1) + p (0,2) = 0 + 2/15 + 1/15 = 3/15 Y1 Y2 0 1 2 Total 0 0 3/15 3/15 6/15 1 2/15 6/15 0 8/15 2 1/15 0 0 1/15 Total 3/15 9/15 3/15 1 P1 ( 1) = 9/15, p1(2) = 3/15 La distribución marginal de Y2 está dada por los totales de los renglones.

Page 138: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

0 x 18 x y

0 y x

0 en otro caso

Ejercicio 1

Se recibe reguladores de voltaje de dos marcas, B1 y B2; el 75% de los reguladores son de la marca B1 y el resto a B2. El porcentaje de reguladores defectuosos que reciben de B1 es 8% y el de B2 es el 0%. Determinar la probabilidad de que funcione correctamente un regulador de voltaje.

Como B1 y B2 son conjuntos disjuntos entonces.

P (A) = P ( A B1) + P (A B2),

P (A B1) = P (B1)P(A/B1)

P (A B2) = P (B2)P(A/B2) P(B1) =0.75, P (B2) = 0.25, P (A/B1) =0.92, y P (A/B2) =0.9; Sustituyendo P (A) = P (B1)P (A/B1) + P (B2)P (A/B2) = 0.75(0.92) + 0.25(0.90) = 0.915 Definición de función de probabilidad marginal caso continuo.

En el caso continuo procedemos como sigue: sea f la fdp conjunta de la variable aleatoria bidimensional continua (X,Y). Definimos g y h, las funciones densidad de probabilidad marginales de X y Y, respectivamente, como sigue:

.),()(;),()( dxyxfyhdyyxfxg

Estas fdp corresponden a las fdp básicas de las variables aleatorias unidimensionales de X y Y, respectivamente. Ejemplo Encuentre f (x │y) y f (y│x) si

f(x,y)

Page 139: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

p xIy( )f x y( )

h y( )

p xIy( )8 x y

4 y

p yIx( )f x y( )

g x( )

p yIx( )8x y

4x3

VARIABLES ALEATORIAS INDEPENDIENTES Los eventos A y B son variables aleatorias independientes si el resultado de X perteneciente a A de ninguna manera influye en el resultado de Y perteneciente a B. La independencia de variables aleatorias discretas requiere que p(y1, y2) = p1(y1)p2(y2) para cada elección (y1, y2). Caso contrario las variables aleatorias son dependientes. Ejemplo 1 La probabilidad de que un hombre vivirá 10 años más de los que tiene es de 1/4 y la probabilidad de que su esposa vivirá 10 años más de su edad actual es de 1/3. Hallar la probabilidad de que:

Ambos estén vivos dentro de 10 años. Al menos uno estará vivo a los 10 años. Ninguno estará vivo a los 10 años. Solamente la esposa este viva dentro de 10 años.

años. 10 enirá esposa viv lsu 3

1)(

años. 10 en vivirá hombre el 4

1)(

BP

AP

Ambos estén vivos dentro de 10 años.

Puesto que A y B son eventos independientes

P(AB)=P(A)P(B)=(1/4)(1/3)=1/12. Al menos uno esté vivo dentro de 10 años.

Page 140: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

P(AB) = P(A) + P(B) - P(AB)=(1/4) + (1/3) - (1/12) = 0.5. Ninguno esté vivo dentro de 10 años. P(Ac)=1-P(A)=1-(1/4)=3/4 P(Bc)=1-(1/3)=2/3 Puesto que A y B son independientes

P(Ac Bc)= P(Ac ) P(Bc)=(3/4)*(2/3)=0.5

Solamente la esposa esté viva dentro de 10 años.

Ac y B son independientes entonces:

P(Ac B)= P(Ac)P(B)= (3/4)*(1/3)=0.25

Definición de Variable Aleatoria independientes caso discreto. a) Sea (X,Y) una variable aleatoria bidimensional discreta. Entonces X y Y son independientes si y solo si p(xi | yj) = p(xi) para toda i y j (o lo que es equivalente, si y solo si q(yj | xi) = q(yj) Definición de Variable Aleatoria independientes caso continuo Sea (X,Y) una variable aleatoria bidimensional continua. Entonces X y Y son independientes si y sólo si g(x | y) = g(x). El Valor esperado de una función de variables aleatorias Ejemplo Las ventas A de un producto no influyen sobre las ventas B de otro, además la venta mensual proviene del 10% del volumen de A y el 15% del de B. Si en promedio las ventas del producto A ascienden a $10 000 con una desviación estándar de $2000 y las de B a $8000 con una desviación estándar de $1000, obténgase el valor esperado y la desviación estándar del ingreso mensual del vendedor. Sean x e y 2 V.A. que representan el volumen de ventas de A y B. Tenemos:

Suponiendo 8000)(

10000)(

yE

xE

Page 141: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

σ(x) = 2000 σ(y) = 1000

Se tiene: 2200$)15.01.0(

)(15.0)(1.0)15.01.0(

yxE

yExEyxE

Y

62500)15.01.0(

)(0225.0)(01.0)15.01.0(

yxVar

yVarxVaryxVar

Con desviación estándar de $250. VALOR ESPERADO DE UNA FUNCION DE V.A.

Ejemplo 1.- Si Y1 y Y2 tiene una densidad conjunta

F(y1, y2) = 2y1 10;0 21 yy

0 en cualquier otro punto. Hallar el valor esperado Y1 SOLUCION

E(Y1) = 1

0

2

1

0

111 )2( dydyyy

1 1

= 1

0

132y dy2 = 2

1

0

2dy = 2

3 0 3 0 3 El valor E(Y1) = 2/3

2.- Si la función de densidad de una variable aleatoria X esta dada por:

Page 142: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

forma. otra de 0

2x0 x)x(f

21

encontrar el valor esperado:

3

4

6

xdx

2

xdx

2

xxdx)x(xF)X(E

2

0

32

0

22

0

x

3.- Si la función de probabilidad conjunta de dos variables aleatorias discretas X, Y esta dada por:

)2(),( yxcyxf , donde x, y pueden tomar todos los valores enteros tales

que: 0),(,30,20 yxyfyx de otra forma.

a) Hallar el valor de la constante c. b) Hallar P(X=2, Y=1).

c) Hallar P(X 1, Y2). Obteniendo la tabla muestral:

y x

0 1 2 3 Total

0 0 c 2c 3c 6c 1 2c 3c 4c 5c 14c 2 4c 5c 6c 7c 22c

Total 6c 9c 12c 15c 42c

Tenemos: a)

42

1

142

)2(

c

c

yxc

b)

42

55)1,2( cyxP

c)

Page 143: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

1 2

),()2,1(x y

yxfyxP

42

124

24

)654()432(

c

cccccc

7

4)2,1( yxP

Page 144: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

DEFINICION DE COVARIANZA DE DOS VARIABLES ALEATORIAS.

Sean X & Y v.v.a.a. definidas sobre un mismo . Se define la covarianza

entre X & Y como: COV [X , Y]:= E[(X - x) (Y- Y)]

Ejemplo 1

Encuentre E(T), donde T es el tiempo entre llamadas telefónicas consecutivas

al centro de reservaciones y 0,2 2 tetf t

T . ¿Cuál es la interpretación de

este valor?

Implícitamente, 0tfT , para t < 0. es necesario saber que:

2

0

1

cdtte ct

de lo anterior se sigue que

0

22 dttedtttfTE t

T

( Pues 0tfT para t<0 y t

T etf 22

2

1

2

12

2

Como T es el tiempo que transcurre entre dos llamadas consecutivas, E(T)=1/2 significa que se recibe una llamada telefónica cada medio minuto.

TEOREMA COV (X1 , X2) = E (X1 X2) - E(X1) E(X2)

Si X1 tiene promedio 1 y X2 tiene promedio 2, entonces:

COV (X1 , X2) = E (X1 X2) - 1 2

Si X1 y X2 son variables aleatorias independientes, entonces E (X1 X2) -

E(X1) E(X2) TEOREMA SI X1 Y X2 SON INDEPENDIENTES, ENTONCES COV (X1,X2)=0

La inversa no es necesariamente valida, es decir, una covarianza cero no quiere decir que las variables sean independientes. Es claro que E(X1) = E(X2) = 0 y que también E (X1 X2) = 0, y por lo

tanto la covarianza de este teorema es igual a cero.

Page 145: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

0 x 18 x y

0 y x

0 en otro caso

Ejemplo 1

Si lo atletas hombres y las atletas mujeres que terminaron una carrera

puede describirse por.

f(x,y) Pruebe que es una función de densidad conjunta.

f x y( )

0

1

x

0

x

y8x y

d

d

f x y( ) 8

0

1

xxx

2

2

d

f x y( ) 8x

4

8

f x y( ) 1

Encontrar g(x) y h(y) para verificar si son variables independientes

g x( )

0

x

y8x y

d

4x3

0 x 1

g x( )0 En otro Caso

h y( )

0

1

x8x y

d

4y 0 y x

h y( )0 En otro Caso

para verificar si son variables independientes f (x, y) = g(x).h(y)

Page 146: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

0 x 2x 1 3 y2

4 0 y 1

0 en otro caso

g x( ) h y( ) ; f x y( ) 8 x y Para f (1,1), tenemos que: 8 ≠ 16, por lo tanto, son variables dependientes 2.- Verificar si la siguiente función es una función de densidad

f(x,y)

3.-Encontrar el coeficiente de correlación

f x y( )

0

2

x

0

1

yx 1 3 y

2

4

d

d 1

f x y( )1

4 0

2

x

0

1

yx 1 3 y2

d

d

1

f x y( )1

4 0

2

x

0

1

yx

d

d

0

2

x

0

1

y3 x y2

d

d

1

f x y( )1

4 0

2

xx

d

0

1

y1

d

3

0

2

xx

d

0

1

yy2

d

1

f x y( )1

42 1( ) 3 2

1

3

1

f x y( ) 1

Page 147: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

0 x 2

1 0 y 1

2y x

0 en otro caso

x y( )0

73

960

1

1201095

Cov x y( )5

6

4

3

5

8

cov x y( ) E x y( ) E x( ) E y( )

E x y( )

0

2

x

0

1

yx yx 1 3y

2

4

d

d

y( ) var y( )var y( )7

15

25

64

var y( ) E y2( ) E y( )2

E y2( )

0

1

yy2 1

2

3

2y

2

d E y( )

0

1

yy1

2

3

2y

2

d

E y2( )

0

1

yy2

h y( )

dE y( )

0

1

yy h y( )

d

x( ) var x( ) var x( ) 216

9

var x( ) E x2( ) E x( )2

E x2( )

0

2

xx2 1

2x

d E x( )

0

2

xx1

2x

d

E x2( )

0

2

xx2

g x( )

dE x( )

0

2

xx g x( )

d

4.- Dada la Función:

Page 148: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

f(x,y) Verificar si es una función de densidad

f x y( )

0

2

x

0

x

2

y1

d

d

f x y( )

0

2

xx

2

d

f x y( )x

4

4

f x y( )4

4

5.- verificar si las siguientes funciones son variables independientes

f x y( )4

4

g x( )

0

x

2

y1

d

x

20 x 2

g x( )

0 En otro Caso

h y( )

0

2

x1

d

2 0 y x

h y( )

0 En otro Caso

p xIy( )f x y( )

h y( ) p xIy( )

1

2

Para f(1,1) = 1 g(1).h(1) = 1

son variables independientes

Page 149: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

0 x 3a x y( )

0 y 3

0 en otro caso

Probabilidad conjunta Determine la probabilidad de que al menos 1/8 de las mujeres que se inscribieron en el maratón la finalizaron si se sabe que exactamente la mitad de los atletas hombres la terminaron.

p xIx( )

0

1

x

1

8

x

y8 x y

d

d

g x( )

p xIx( )0

1

x4 x x2 1

8

2

d

1

2

p xIx( ) 4

x4

4

1

64

x2

2

1

2

p xIx( ) 4

1

4

1

128

1

2

6.-- Demuestre que no hay un valor K para el cual: f(x, y) = k y (2y-x) para x = 0,3; y = 0,1,2. p(0,0) = 0 p(3,0) = 0 p(0,1) = 2k p(3,1) = -k p(0,2) = 8k p(3,2) = 2k No existe valor de k, pues no se cumple la condición en la cual p(x,y) ≥ 0 para p(3,1), por lo tanto, no puede ser esta una función de probabilidad 7.-Sea la función:

Page 150: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

0 x 31

27x y( )

0 y 3

0 en otro caso

a) Encuentre el valor de a

f x y( )

0

3

x

0

3

ya x y( )

d

d f x y( ) a

0

3

x

0

3

yx y( )

d

d

f x y( ) a

0

3

xx

d

0

3

y1

d

0

3

x1

d

0

3

yy

d

f x y( ) a9

23 3

9

2

1 27a por lo tanto a1

27

f(x,y) b) p(1≤x≤2, 1≤y≤x2)

p x y( )1

27 1

2

x

1

2

yx y( )

d

d

f x y( ) a

1

2

xx

d

1

2

y1

d

1

2

x1

d

1

2

yy

d

f x y( ) a3

21 1

3

2

d) E(x), E(y), y las derivaciones estandar para ambas variables.

Page 151: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

g x( )1

27 0

3

yx y( )

d

1

9x

1

6 0 x 3

g x( )

0 En otro Caso

h y( )1

27 0

3

xx y( )

d

1

6

1

9y

0 x 3h y( )

0 En otro Caso

E x( )

0

3

xx g x( )

d E x2( )

0

3

xx2

g x( )

d

E x( )

0

3

xx1

9x

1

6

d E x2( )

0

3

xx2 1

9x

1

6

d

var x( ) E x2( ) E x( )2

var x( )15

4

49

16 x( ) var x( )

E y( )

0

3

yy h y( )

d E y2( )

0

3

yy2

h y( )

d

E y( )

0

3

yy1

6

1

9y

d E y2( )

0

3

yy2 1

6

1

9y

d

var y( ) E y2( ) E y( )2

var y( )15

4

49

16 y( ) var x( )

Page 152: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

p x y( ) a x y

a 1 a 15a por lo tanto a:1/15

p x y( ) ax

y

8.- Determinar el valor de la constante A, de tal manera que las siguientes funciones representen una distribución de probabilidad conjunta para las variables aleatorias discretas X, Y. b) P(x, y) = a(x-y) x = -2, 0, 2 y = -2,3 c) P(x ,y) = a ( x / y ) x = 1, 2 y = 1,2 e) P(x ,y) = a(x2 + y2 ) para las parejas (1,1), (1,3), (2,3) b) p(-2,-2) = 0 p(0, 3) = 3a p(-2, 3) = 5a p(2,-2) = 4a = p(0, -2) = 2a p(-2, 3) = a

-2 0 2

-2 0 2/15 4/15

3 5/15 3/15 1/15

P(x≤2, y=1) = 0 P(x>2, y≤1) = 0 P(x > y ) = p(0,-2) + p(2,-2) = 2/15 + 4/15 = 6/15 P(x + y = 4) = 0 F(2,2) = p(x≤2, y≤2) = p(-2,-2) + p(0,-2) + p(2,-2) = 0 + 2/15 + 4/15 = 6/15 F(1,3) = p(x≤1, y≤3) = p(-2,-2) + p(-2,3) + p(0,-2) + p(0,3) = 0 + 5/15 + 2/15 + 3/15 = 10/15 c)

Page 153: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

a 1a a9

2a a por lo tanto a:2/9

p x y( ) a x2

y2

1

1

x 1

1

y

p x y( )

p(1,1) = a p(2,1) = 2a p(1,2) = a/2 p(2,2) = a =

1 2

1 2/9 4/9

2 1/9 2/9

P(x≤2, y=1) = p(1,1) + p(1,2) = 2/9 + 4/9 = 6/9 = 2/3 P(x>2, y≤1) = 0 P(x > y ) = p(2,1) = 4/9 P(x + y = 4) = p(2,2) = 2/9 F(2,2) = p(x≤2, y≤2) = p(1,1) + p(1,2) + p(2,1) + p(2,2) = 2/9 + 1/9 + 4/9 + 2/9 = 9/9 =1 F(1,3) = p(x≤1, y≤3) = p(1,1) + p(1,2) = 2/9 + 1/9 + 3/9 = 1/3 9.- Dada la siguiente distribución:

-1 1 H(y)

-1 1/8 1/2 5/8

0 0 1/4 1/4

1 1/8 0 1/8

G(x) 2/8 3/4 1

a) Compruebe que es una distribución de probabilidad: = 1/8 +1/8 + 0 + 4/8 + 2/8 + 0 = 8/8 = 1

Por lo tanto, es una función de probabilidad

Page 154: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

E x( )

1

1

x

x g x( )

E y( )

1

1

y

y h y( )

h

E x2

1

1

x

x2

g x( )

E x2

1

1

x

x2

g x( )

E y2

1

1

y

y2

h y( )

h

Var x( ) E x2 E x( )

2

Var y( ) E y2 E y( )

2 E

x( ) Var x( )

y( ) Var y( )

E x y( )

1

1

x 1

1

y

xy p x y( )

b) Calcule las marginales h(-1) = 5/8 g(-1) = 2/8 g(x) h( 0) = 1/4 h(x) g( 1) = 3/4 h( 1) = 1/8 c) Determine si son variables independientes o dependientes si p(x,y) = g(x) . h(y) son independientes p(-1,1) = 1/8 ; g(x)=( 2/8 ) ;h(y) = ( 5/8 ) 1/8 ≠ 10/64 por lo tanto, son variables dependientes d) Calcule la media para cada variable = (-1)(2/8) + (1)(6/8) = 4/8 = 1/2 = (-1)(5/8) + (0)(2/8) + (1)(1/8) = -4/8 = -1/2 e) Calcula la varianza y la desviación estándar para ambas variables = (-1)2(2/8) + (1)2(6/8) = 4/8 = 1 = (-1)2(5/8) + (0)2(2/8) + (1)2(1/8) = 6/8 = 3/4

= 1 – (1/2)2 = 3/4

= 3/4 – (-1/2)2 = 2/4 = 1/2

= 0.866 = 0.707 f) Covarianza

Page 155: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

x y( )Cov x y( )

x( ) y( )

x y( )

0 x 26 x y

8 2 y 4

0 en otro caso

Cov x y( ) E x y( ) x( ) y( ) ; E(x,y) = (-1)(-1)p(-1,-1) + (-1)(0)p(-1,0) + (-1)(1)p(-1,1) + (1)(-1)p(1,-1) + (1)(0)p(1,0) + (1)(1)p(1,1) = (1)(1/8) + (-1)(1/8) + (-1)(4/8) + (1)(0) = -4/8 = -1/2 Cov(x,y) = ( -1/2 ) – [ ( 3/4) . (1/2) ] = -1/4 g) Coeficiente de correlación

= ( -1/4 ) / [ (0.866) (0.707) ] = -0.408

10.-Dada la siguiente función, determine lo siguiente: f(x,y) a) Que es una función de densidad.

f x y( )

0

2

x

2

4

y6 x y

8

d

d

f x y( )1

8 0

2

x

2

4

y6

d

d

0

2

x

2

4

yx

d

d

0

2

x

2

4

yy

d

d

f x y( )1

86

0

2

x1

d

2

4

y1

d

0

2

xx

d

2

4

y1

d

0

2

x1

d

2

4

yy

d

Por lo tanto, es una función de probabilidad b) g(x), h(y)

Page 156: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

g x( )

2

4

y6 x y

8

d

3

4

1

4x 0 x 2

g x( )

0 En otro Caso

h y( )

0

2

x6 x y

8

d

5

4

1

4y 2 y 4

h y( )

0 En otro Caso c) f (x, y) = g(x).h(y)

g x( ) h y( ) factor

3 x( ) 5 y( ) 15 3y 5x xy f x y( )

6 x y

8

Evaluando para f(1,1) ½ = ½

f(x,y) = g(x) . h(y) por lo tanto son variables independientes d) E(x), E(y)

Page 157: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Cov x y( ) E x y( ) x( ) y( )

E x( )

0

2

xx g x( )

d

E x( )

0

2

xx3

4

1

4x

d5

6

E y( )

2

4

yy h y( )

d

E y( )

2

4

yy5

4

1

4y

d17

6

e) VAR (x), VAR (y), E(x2 ), E(y2 )

E x2( )

0

2

xx2

g x( )

d E y2( )

2

4

yy2

h y( )

d

E x2( )

0

2

xx2 3

4

1

4x

d E y2( )

2

4

yy2 5

4

1

4y

d

var x( ) E x2( ) E x( )2

var y( ) E y2( ) E y( )2

var x( ) 125

36 var y( )

25

3

289

36

f) Cov (x, y )

E x y( )

x0

x1

x

y0

y1

yxy f x y( )

d

d

Cov x y( ) E x y( ) E x( ) E y( )

Cov x y( )7

3

5

6

17

6

Page 158: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

x y( )Cov x y( )

x( ) y( )

x( ) var x( )

y( ) var y( )

g) Coeficiente de correlación.

x y( )

1

36

1

611

1

611

h) p(1<y<3 │x =2)

p yIx( )f x y( )

g x( )

x

p yIx( )0

2

x

1

3

y6 x y

8

d

d

1

4

6

p yIx( ) 6xx2

2 2x

x

p yIx( ) 12 2 4( ) 6

Page 159: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

TEOREMA DEL LÍMITE CENTRAL El Teorema Central del Límite dice que si tenemos un grupo numeroso de variables independientes y todas ellas siguen el mismo modelo de distribución la suma de ellas se distribuye según una distribución normal. Ejemplo: la variable "tirar una moneda al aire" sigue la distribución de Bernouilli. Si lanzamos la moneda al aire 50 veces, la suma de estas 50 variables (cada una independiente entre si) se distribuye según una distribución normal. Este teorema se aplica tanto a suma de variables discretas como de variables continuas.

EJEMPLO 1. Se lanza una moneda al aire 100 veces, si sale cara le damos el valor 1 y si sale cruz el valor 0. Cada lanzamiento es una variable independiente que se distribuye según el modelo de Bernoulli, con media 0,5 y varianza 0,25. Calcular la probabilidad de que aparezcan más de 60 caras.

La variable suma de estas 100 variables independientes se distribuye, por tanto, según una distribución normal.

Media = 100 ( 0,5) = 50

Varianza = 100 ( 0,25 ) = 25

Para ver la probabilidad de que salgan más de 60 caras calculamos la variable normal tipificada:

Sea 5 la desviación típica de esta distribución.

Por lo tanto:

P (X > 60) = P (Y > 2,0) = 1- P (Y < 2,0) = 1 - 0,9772 = 0,0228

Es decir, la probabilidad de que al tirar 100 veces la moneda salga más de 60 caras es tan sólo del 2,28%.

EJEMPLO 2. La renta media del ingreso de los habitantes de un país se distribuye uniformemente entre 4,0 millones pesos y 10,0 millones de pesos Calcular la probabilidad de que al seleccionar al azar a 100 personas la suma de sus rentas supere los 725 millones de pesos.

Cada renta personal es una variable independiente que se distribuye según una función uniforme. Por ello, a la suma de las rentas de 100 personas se le puede aplicar el Teorema Central del Límite.

Page 160: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

La media y varianza de cada variable individual es:

σ = (4 + 10 ) / 2 = 7

Var(y) = (10 - 4)^2 / 12 = 3

Por tanto, la suma de las 100 variables se distribuye según una normal cuya media y varianza son:

Media: n * σ = 100 * 7 = 700

Varianza: n * σ2= 100 * 3 = 300

Para calcular la probabilidad de que la suma de las rentas sea superior a 725 millones pesos, comenzamos por calcular el valor equivalente de la variable normal tipificada:

Luego:

P (X > 725) = P (Y > 1,44) = 1 - P (Y < 1,44) = 1 - 0,9251 = 0,0749

Es decir, la probabilidad de que la suma de las rentas de 100 personas seleccionadas al azar supere los 725 millones de pesoss es tan sólo del 7,49%

EJEMPLO 3. En una asignatura la probabilidad de que pase un alumno al pizarrón es del 10%. A lo largo del semestre se tienen 100 clases de esa asignatura. ¿Cuál es la probabilidad de pase un alumno al pizarrón más de 15 veces?

Pasar al pizarrón es una variable independiente que sigue el modelo de distribución de Bernoulli:

"Pasar al pizarrón", le damos el valor 1 y tiene una probabilidad del 0,10

"No salir a la pizarra", le damos el valor 0 y tiene una probabilidad del 0,9

La media y la varianza de cada variable independiente es:

σ = 0,10

σ2 = 0,10 * 0,90 = 0,09

Por tanto, la suma de las 100 variables se distribuye según una normal cuya media y varianza son:

Media : n * σ = 100 * 0,10 = 10

Varianza : n * σ 2= 100 * 0,09 = 9

Page 161: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Para calcular la probabilidad de que un alumno pase al pizarrón más de 15 veces, calculamos el valor equivalente de la variable normal tipificada:

Luego:

P (X > 15) = P (Y > 1,67) = 1 - P (Y < 1,67) = 1 - 0,9525 = 0,0475

Es decir, la probabilidad de tener que salir más de 15 veces a la pizarra a lo largo del curso es tan sólo del 4,75%.

EJEMPLO 4.- Los resultados de las pruebas finales de todos los alumnos del último año de las vocacionales del IPN tienen una media de 60 y una varianza de 64. Una muestra de 100 alumnos tuvo una media de 58. ¿Puede afirmarse que esta vocacional sea inferior? Calculemos la probabilidad de que la media muestral sea a lo más 58 cuando n = 100 SOLUCIÓN Sea Y la media de una muestra aleatoria de n = 100 calificaciones

de una población con = 60 y 2 = 64. Se desea aproximar P(Y 58).

Sabemos del Teorema que /Yn es aproximadamente una variable

aleatoria normal estándar, que denotaremos por Z. Por tanto:

0062.5.2100/64

605858

ZPZPYP

. Ya que la probabilidad es tan pequeña, es poco probable que se pueda considerar a esa generación estudiada como una muestra aleatoria de una

población con =60 y 2 =64. Se puede afirmar que la calificación promedio

para esta vocacional es menor que el promedio global de = 60.

Page 162: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Regresión lineal Una regresión lineal es aquella que se puede modelar como Ŷ = a + b( X ) Con el menor error posible entre Ŷ e Y Por tanto:

Si b>0, las dos variables aumentan o disminuyen a la vez; Si b<0, cuando una variable aumenta, la otra disminuye.

Por tanto, en el caso de las variables peso y altura lo lógico será encontrar que b>0.

Tenemos que calcular las cantidades a y b a partir de un conjunto de n observaciones ( x1 , y1 ) ……………………. ( x2 , y2 )

De forma que se minimice el error. Las etapas en que se divide el proceso que vamos a desarrollar son: 1. Dadas dos variables X, Y, sobre las que definimos

Ŷ = a + b( X )

Medimos el error que se comete al aproximar Y mediante calculando la suma de las diferencias entre los valores reales y los aproximados al cuadrado

2. Una aproximación de Y, se define a partir de dos cantidades a y b. Vamos a calcular aquellas que minimizan la función

3. Posteriormente encontraremos fórmulas para el cálculo directo de a y b que sirvan para cualquier problema.

Page 163: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Regresión de Y sobre X

Para calcular la recta de regresión de Y sobre X nos basamos en la figura.

Los errores a minimizar son las cantidades

Una vez que tenemos definido el error de aproximación mediante la relación, las cantidades que lo minimizan se calculan derivando con respecto a ambas e igualando a cero (procedimiento de los mínimos cuadrados):

Se denomina ecuaciones normales. La primera se escribe como

Page 164: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Sustituyendo se tiene que

Lo que nos da las relaciones buscadas:

La cantidad b se denomina coeficiente de regresión de Y sobre X.

Regresión de X sobre Y

Las mismas conclusiones se sacan cuando intentamos hacer la regresión de X sobre Y, pero ¡atención!: Para calcular la recta de regresión de X sobre Y es totalmente incorrecto despejar de

Pues esto nos da la regresión de X sobre , que no es lo que buscamos. La

regresión de X sobre Y se hace aproximando X por , del modo

Donde:

Figura: Los errores a minimizar son las cantidades

Page 165: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

Ejemplo 1. En una muestra de 1.500 individuos se recogen datos sobre dos medidas antropométricas X e Y. Los resultados se muestran resumidos en los siguientes estadísticos:

Obtener el modelo de regresión lineal que mejor aproxima Y en función de X. Utilizando este modelo, calcular de modo aproximado la cantidad Y esperada cuando X=15.

Solución:

Lo que se busca es la recta, que mejor aproxima los valores de Y (según el criterio de los mínimos cuadrados) en la nube de puntos que resulta de representar en un plano (X,Y) las 1.500 observaciones. Los coeficientes de esta recta son:

Así, el modelo lineal consiste en:

Por tanto, si x=15, el modelo lineal predice un valor de Y de:

Page 166: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

En este punto hay que preguntarse si realmente esta predicción puede considerarse fiable. Para dar una respuesta, es necesario estudiar propiedades de la regresión lineal que están a continuación.

Propiedades de la regresión lineal

Una vez que ya tenemos perfectamente definida , (o bien ) nos preguntamos las relaciones que hay entre la media y la varianza de esta y la de Y (o la de X). La respuesta nos la ofrece la siguiente proposición:

Proposición

En los ajustes lineales se conservan las medias, es decir

En cuanto a la varianza, no necesariamente son las mismas para los

verdaderos valores de las variables X e Y y sus aproximaciones y , pues sólo se mantienen en un factor de r2, es decir,

Ejemplo 2. De una muestra de ocho observaciones conjuntas de valores de dos variables X e Y, se obtiene la siguiente información:

Calcule:

1. La recta de regresión de Y sobre X. Explique el significado de los parámetros.

2. El coeficiente de determinación. Comente el resultado e indique el tanto por ciento de la variación de Y que no está explicada por el modelo lineal de regresión.

Page 167: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

3. Si el modelo es adecuado, ¿cuál es la predicción para x=4.

Solución:

1. En primer lugar calculamos las medias y las covarianza entre ambas variables:

Con estas cantidades podemos determinar los parámetros a y b de la recta. La pendiente de la misma es b, y mide la variación de Y cuando X aumenta en una unidad:

Al ser esta cantidad negativa, tenemos que la pendiente de la recta es negativa, es decir, a medida que X aumenta, la tendencia es a la disminución de Y. En cuanto al valor de la ordenada en el origen, a, tenemos:

Así, la recta de regresión de Y como función de X es:

2. El grado de bondad del ajuste lo obtenemos a partir del coeficiente de

determinación:

Es decir, el modelo de regresión lineal explica el de la variabilidad de

Y en función de la de X. Por tanto queda un de variabilidad no explicada. 3. La predicción que realiza el modelo lineal de regresión para x=4 es:

La cual hay que considerar con ciertas reservas, pues como hemos visto en el apartado anterior, hay una razonable cantidad de variabilidad que no es explicada por el modelo.

Page 168: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

la cual hay que considerar con ciertas reservas, pues como hemos visto en el apartado anterior, hay una razonable cantidad de variabilidad que no es explicada por el modelo.

Ejemplo: vamos a calcular la recta de regresión de la siguiente serie de datos de altura y peso de los alumnos de una clase. Vamos a considerar que la altura es la variable independiente "x" y que el peso es la variable dependiente "y" (podíamos hacerlo también al contrario):

Alumno Estatura Peso Alumno Estatura Peso Alumno Estatura Peso

x x x x x x x x x

Alumno 1

1,25 32 Alumno

11 1,25 33

Alumno 21

1,25 33

Alumno 2

1,28 33 Alumno

12 1,28 35

Alumno 22

1,28 34

Alumno 3

1,27 34 Alumno

13 1,27 34

Alumno 23

1,27 34

Alumno 4

1,21 30 Alumno

14 1,21 30

Alumno 24

1,21 31

Alumno 5

1,22 32 Alumno

15 1,22 33

Alumno 25

1,22 32

Alumno 6

1,29 35 Alumno

16 1,29 34

Alumno 26

1,29 34

Alumno 7

1,30 34 Alumno

17 1,30 35

Alumno 27

1,30 34

Alumno 8

1,24 32 Alumno

18 1,24 32

Alumno 28

1,24 31

Alumno 9

1,27 32 Alumno

19 1,27 33

Alumno 29

1,27 35

Alumno 10

1,29 35 Alumno

20 1,29 33

Alumno 30

1,29 34

El parámetro "b" viene determinado por:

b =

(1/30) * 1,034

----------------------------------------- = 40,265

(1/30) * 0,00856

Y el parámetro "a" por:

a = 33,1 - (40,265 * 1,262) = -17,714

Por lo tanto, la recta que mejor se ajusta a esta serie de datos es:

Page 169: PROBABILIDA Y ESTADÍSTICA€¦ · empíricos que dan origen a los muestreos paramétricos y no paramétricos. Ya partir de ellos, una vez que se comprendió la esencia misma de la

y = -17,714 + (40,265 * x)

Esta recta define un valor de la variable dependiente (peso), para cada valor de la variable independiente (estatura):

Estatura Peso

x X

1,20 30,6

1,21 31,0

1,22 31,4

1,23 31,8

1,24 32,2

1,25 32,6

1,26 33,0

1,27 33,4

1,28 33,8

1,29 34,2

1,30 34,6