Unidad # 1 Distribuciones Fundamentales Para El Muestreo

38
Estadística Inferencial 1 I.T.S.R 3er semestre Ing. Industrial Elaboró: MDCD. Ing. Alejandro Arana Paredes UNIDAD # 1 DISTRIBUCIONES FUNDAMENTALES PARA EL MUESTREO La estadística es una ciencia formal que estudia la recolección, análisis e interpretación de datos de una muestra representativa, ya sea para ayudar en la toma de decisiones o para explicar condiciones regulares o irregulares de algún fenómeno o estudio aplicado, de ocurrencia en forma aleatoria o condicional. Sin embargo, la estadística es más que eso, es decir, es la herramienta fundamental que permite llevar a cabo el proceso relacionado con la investigación científica. La palabra viene del latín “statisticus” que significa “del estado”. Las estadísticas como las conocemos hoy día tomaron en desarrollarse varios siglos y muchas mentes privilegiadas. John Graunt (1620-1674), un inglés que estudiaba los expedientes de los nacimientos y muertes descubrió que nacían más niños que niñas, pero también encontró que por estar los hombres más expuestos a accidentes ocupacionales , a enfermedades y la guerra, el número de hombres y mujeres en la edad de casarse era más o menos la misma. Graunt fue el primero en publicar sobre el análisis estadístico y su trabajo llevó al desarrollo de las ciencias actuariales utilizadas por las compañías de seguros. Se usa para la toma de decisiones en áreas de negocios o instituciones gubernamentales. La estadística se divide en dos grandes áreas: La estadística descriptiva: se dedica a la descripción, visualización y resumen de datos originados a partir de los fenómenos de estudio. Los datos pueden ser resumidos numérica o gráficamente. Ejemplos básicos de parámetros estadísticos son: la media y la desviación estándar, tabla de frecuencia. Algunos ejemplos gráficos son: histograma, pirámide poblacional, gráfico circular, etc. La estadística inferencial: se dedica a la generación de los modelos, inferencias y predicciones asociadas a los fenómenos en cuestión teniendo en cuenta la aleatoriedad de las observaciones y Se usa para modelar patrones en los datos y extraer inferencias acerca de la población bajo estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas si/no (prueba de hipótesis), estimaciones de unas características numéricas (estimación), pronósticos de futuras observaciones, descripciones de asociación (correlación) o modelamiento de relaciones entre variables (análisis de regresión). Ambas ramas (descriptiva e inferencial) comprenden la estadística aplicada En todas las ingenierías se usa para control de calidad: (muestreo de aceptación y gráficos de control). También en todas y específicamente en civil y mecánica, para calcular la cantidad de replicaciones de un ensayo para conseguir una precisión dada. Cuando se cambia de materia prima, máquinas, método productivo y similar se usa en test de hipótesis para ver si hubo cambios significativos. También se usa para proyecciones de series de tiempo como por ejemplo para hallar la demanda esperada para el próximo período

description

UNIDAD 1 ESTADISTICA INFERENCIAL 1

Transcript of Unidad # 1 Distribuciones Fundamentales Para El Muestreo

Page 1: Unidad # 1 Distribuciones Fundamentales Para El Muestreo

Estadística Inferencial 1 I.T.S.R 3er semestre Ing. Industrial

Elaboró: MDCD. Ing. Alejandro Arana Paredes

UNIDAD # 1 DISTRIBUCIONES FUNDAMENTALES PARA EL MUESTREO

La estadística es una ciencia formal que estudia la recolección, análisis e interpretación de datos de una muestra representativa, ya sea para ayudar en la toma de decisiones o para explicar condiciones regulares o irregulares de algún fenómeno o estudio aplicado, de ocurrencia en forma aleatoria o condicional. Sin embargo, la estadística es más que eso, es decir, es la herramienta fundamental que permite llevar a cabo el proceso relacionado con la investigación científica. La palabra viene del latín “statisticus” que significa “del estado”. Las estadísticas como las conocemos hoy día tomaron en desarrollarse varios siglos y muchas mentes privilegiadas. John Graunt (1620-1674), un inglés que estudiaba los expedientes de los nacimientos y muertes descubrió que nacían más niños que niñas, pero también encontró que por estar los hombres más expuestos a accidentes ocupacionales , a enfermedades y la guerra, el número de hombres y mujeres en la edad de casarse era más o menos la misma. Graunt fue el primero en publicar sobre el análisis estadístico y su trabajo llevó al desarrollo de las ciencias actuariales utilizadas por las compañías de seguros.

Se usa para la toma de decisiones en áreas de negocios o instituciones gubernamentales. La estadística se divide en dos grandes áreas:

• La estadística descriptiva: se dedica a la descripción, visualización y resumen de

datos originados a partir de los fenómenos de estudio. Los datos pueden ser

resumidos numérica o gráficamente. Ejemplos básicos de parámetros estadísticos

son: la media y la desviación estándar, tabla de frecuencia. Algunos ejemplos

gráficos son: histograma, pirámide poblacional, gráfico circular, etc.

• La estadística inferencial: se dedica a la generación de los modelos, inferencias y

predicciones asociadas a los fenómenos en cuestión teniendo en cuenta la

aleatoriedad de las observaciones y Se usa para modelar patrones en los datos y

extraer inferencias acerca de la población bajo estudio. Estas inferencias pueden

tomar la forma de respuestas a preguntas si/no (prueba de hipótesis), estimaciones

de unas características numéricas (estimación), pronósticos de futuras

observaciones, descripciones de asociación (correlación) o modelamiento de

relaciones entre variables (análisis de regresión).

Ambas ramas (descriptiva e inferencial) comprenden la estadística aplicada

En todas las ingenierías se usa para control de calidad: (muestreo de aceptación y gráficos de control). También en todas y específicamente en civil y mecánica, para calcular la cantidad de replicaciones de un ensayo para conseguir una precisión dada. Cuando se cambia de materia prima, máquinas, método productivo y similar se usa en test de hipótesis para ver si hubo cambios significativos. También se usa para proyecciones de series de tiempo como por ejemplo para hallar la demanda esperada para el próximo período

Page 2: Unidad # 1 Distribuciones Fundamentales Para El Muestreo

Estadística Inferencial 1 I.T.S.R 3er semestre Ing. Industrial

Elaboró: MDCD. Ing. Alejandro Arana Paredes

1.1 Introducción a la Estadística Inferencial

La estadística inferencial es una parte de la estadística que comprende los métodos y procedimientos que por medio de la inducción determina propiedades de una población estadística, a partir de una pequeña parte de la misma. La Estadística inferencial o Inferencia estadística estudia cómo sacar conclusiones generales para toda la población a partir del estudio de una muestra, y el grado de fiabilidad o significación de los resultados obtenidos. La Estadística Inferencial se refiere al proceso de lograr generalizaciones a cerca de las propiedades del todo, población, partiendo de lo específico, muestra las cuales llevan implícitos una serie de riesgos. Para que éstas generalizaciones sean válidas la muestra deben ser representativa de la población y la calidad de la información debe ser controlada, además puesto que las conclusiones así extraídas están sujetas a errores, se tendrá que especificar el riesgo o probabilidad que con que se pueden cometer esos errores. La estadística inferencial es el conjunto de técnicas que se utiliza para obtener conclusiones que sobrepasan los límites del conocimiento aportado por los datos, busca obtener información de un colectivo mediante un metódico procedimiento del manejo de datos de la muestra. Se usan esencialmente para determinar la probabilidad de que una conclusión sacada a partir de los datos de una muestra sea cierta en la población muestreada. Las poblaciones pueden ser ventas, personal de una empresa, consumidores de un producto, etc. El proceso conocido como inferencia estadística, requiere consideraciones de cómo fue seleccionada la muestra y cuánto varían las observaciones de una muestra a otra. De esta manera, los métodos de selección de los individuos que se usarán en la investigación son de considerable importancia para la obtención de resultados y conclusiones válidas. El requisito fundamental de una buena muestra es que sea representativa de la población que se trata de describir

Page 3: Unidad # 1 Distribuciones Fundamentales Para El Muestreo

Estadística Inferencial 1 I.T.S.R 3er semestre Ing. Industrial

Elaboró: MDCD. Ing. Alejandro Arana Paredes

La estadística inferencial comprende aspectos importantes como:

La toma de muestras o muestreo, que se refiere a la forma adecuada de considerar una muestra que permita obtener conclusiones estadísticamente válidas y significativas.

La estimación de parámetros o variables estadísticas, que permite estimar valores poblacionales a partir de muestras de mucho menor tamaño.

El contraste de hipótesis, que permite decidir si dos muestras son estadísticamente diferentes, si un determinado procedimiento tiene un efecto estadístico significativo, etc.

El diseño experimental(es una técnica estadística que permite identificar y cuantificar las causas de un efecto dentro de un estudio experimental)

La inferencia bayesiana(las evidencias u observaciones se emplean para actualizar o inferir la probabilidad de que una hipótesis pueda ser cierta.)

Los métodos no paramétricos(Prueba de X2 de Bondad de Ajuste, Prueba de Kolmogorov-Smirnov con una Muestra, Prueba de Kolmogorov-Smirnov con dos Muestras, Prueba de Rangos de Wilcoxon, Prueba de Wilcoxon-Mann-Whitney con Dos Muestras, Prueba de Kruskal-Wallis con k Muestras, Prueba de los Signos, Prueba de la Mediana, entre otras)

La estadística inferencial puede dar respuestas a muchas de las necesidades que la sociedad actual puede requerir. Su tarea fundamental es el análisis de los datos que se obtienen a partir de experimentos, con el objetivo de representar la realidad y conocerla. La estadística inferencial se centra en tomar una pequeña muestra representativa de la población y a partir de ésta, infiere que el resto de la población tiene el mismo comportamiento.

Page 4: Unidad # 1 Distribuciones Fundamentales Para El Muestreo

Estadística Inferencial 1 I.T.S.R 3er semestre Ing. Industrial

Elaboró: MDCD. Ing. Alejandro Arana Paredes

1.2 Muestreo: Introducción al muestreo y Tipos de muestreo

Muestreo: Significa la Selección de un conjunto de personas o cosas que se consideran

representativos del grupo al que pertenecen, con la finalidad de estudiar o determinar las características del grupo. En estadística se conoce como muestreo a la técnica para la selección de una muestra a partir de una población. Al elegir una muestra aleatoria se espera conseguir que sus propiedades sean extrapolables a la población. Este proceso permite ahorrar recursos, y a la vez obtener resultados parecidos a los que se alcanzarían si se realizase un estudio de toda la población. Cabe mencionar que para que el muestreo sea válido y se pueda realizar un estudio adecuado (que consienta no solo hacer estimaciones de la población sino estimar también los márgenes de error correspondientes a dichas estimaciones), debe cumplir ciertos requisitos. Nunca podremos estar enteramente seguros de que el resultado sea una muestra representativa, pero sí podemos actuar de manera que esta condición se alcance con una probabilidad alta.

En el muestreo, si el tamaño de la muestra es más pequeño que el tamaño de la población, se puede extraer dos o más muestras de la misma población. Al conjunto de muestras que se pueden obtener de la población se denomina espacio muestral. La variable que asocia a cada muestra su probabilidad de extracción, sigue la llamada distribución muestral

Tipos de

Page 5: Unidad # 1 Distribuciones Fundamentales Para El Muestreo

Estadística Inferencial 1 I.T.S.R 3er semestre Ing. Industrial

Elaboró: MDCD. Ing. Alejandro Arana Paredes

MUESTREO NO PROBABILÍSTICO Es aquél para el que no se puede calcular la probabilidad de extracción de una determinada

muestra. Por tal motivo, se busca seleccionar a individuos que tienen un conocimiento

profundo del tema bajo estudio y se considera que la información aportada por esas

personas es vital para la toma de decisiones. A veces, para estudios exploratorios, el

muestreo probabilístico resulta excesivamente costoso y se acude a métodos no

probabilísticos, aun siendo consciente de que no sirven para realizar generalizaciones, pues

no se tiene certeza de que la muestra extraída sea representativa, ya que no todos los

sujetos de la población tienen la misma probabilidad de ser elegidos

1. Muestreo por cuotas Es la técnica más difundida sobre todo en estudios de mercado y sondeos de opinión. En primer lugar es necesario dividir la población de referencia en varios estratos definidos por algunas variables de distribución conocida (como el género o la edad). Posteriormente se calcula el peso proporcional de cada estrato, es decir, la parte proporcional de población que representan. Finalmente se multiplica cada peso por el tamaño de n de la muestra para determinar la cuota precisa en cada estrato. Se diferencia del muestreo estratificado en que una vez determinada la cuota, el investigador es libre de elegir a los sujetos de la muestra dentro de cada estrato. Ejemplo: En un estudio en donde el investigador quiere comparar el rendimiento académico de los diferentes niveles de clases del secundario, su relación con el género y la situación socioeconómica, el investigador identifica primero los subgrupos. Por lo general, los subgrupos son las características o variables del estudio. El investigador divide a toda la población en niveles de clase, cruzados con el género y el nivel socioeconómico. Luego, toma nota de las proporciones de estos subgrupos en toda la población y a continuación hace un muestreo de cada subgrupo

Page 6: Unidad # 1 Distribuciones Fundamentales Para El Muestreo

Estadística Inferencial 1 I.T.S.R 3er semestre Ing. Industrial

Elaboró: MDCD. Ing. Alejandro Arana Paredes

2. Muestreo de bola de nieve Indicado para estudios de poblaciones clandestinas, minoritarias o muy dispersas pero en

contacto entre sí. Consiste en identificar sujetos que se incluirán en la muestra a partir de

los propios entrevistados. Partiendo de una pequeña cantidad de individuos que cumplen

los requisitos necesarios, servirán como localizadores de otros con características análogas.

Este tipo se emplea muy frecuentemente cuando se hacen estudios con poblaciones "marginales", delincuentes, sectas, determinados tipos de enfermos, etc.

3. Muestreo subjetivo por decisión razonada En este caso las unidades de la muestra se eligen en función de algunas de sus

características de manera racional y no casual. Una variante de esta técnica es el muestreo

compensado o equilibrado, en el que se seleccionan las unidades de tal forma que la media

de la muestra para determinadas variables se acerque a la media de la población. La cual

funciona en base a referencias o por recomendación después se reconoce por medio de la

estadística.

Page 7: Unidad # 1 Distribuciones Fundamentales Para El Muestreo

Estadística Inferencial 1 I.T.S.R 3er semestre Ing. Industrial

Elaboró: MDCD. Ing. Alejandro Arana Paredes

4. Muestreo Discrecional

Se lleva acabo de acuerdo el criterio del investigador, los elementos son elegidos sobre lo que él cree que pueden aportar al estudio. Los sujetos se seleccionan a base del conocimiento y juicio del investigador. El investigador selecciona a los individuos a través de su criterio profesional. Puede basarse en la experiencia de otros estudios anteriores o en su conocimiento sobre la población y el comportamiento de ésta frente a las características que se estudian.

5. Muestreo de Conveniencia

Consiste en seleccionar a los individuos que convienen al investigador para la muestra. Esta conveniencia se produce porque al investigador le resulta más sencillo examinar a estos sujetos, ya sea por proximidad geográfica, por ser sus amigos, etc. Es el tipo de muestreo que pretende seleccionar unidades de análisis que cumplen los requisitos de la población objeto de estudio, sin embargo, no son seleccionadas al azar. Se utiliza preferentemente en estudios exploratorios. Las pruebas pilotos, también usan con frecuencia éste tipo de muestreo

Page 8: Unidad # 1 Distribuciones Fundamentales Para El Muestreo

Estadística Inferencial 1 I.T.S.R 3er semestre Ing. Industrial

Elaboró: MDCD. Ing. Alejandro Arana Paredes

MUESTREO PROBABILÍSTICO Es el muestreo en el cual todos los elementos de la población tienen la posibilidad de ser seleccionados, suele ser más objetivo que el determinístico, pero también más costoso, requiere más tiempo y es más difícil de aplicar. Solo estos métodos de muestreo probabilisticos nos aseguran la representatividad de la muestra extraida y son por tanto los mas recomendable

1. Muestreo aleatorio simple Para obtener una muestra, se numeran los elementos de la población y se seleccionan al azar los n elementos que contiene la muestra.

2. Muestreo aleatorio sistemático

En un muestreo aleatorio sistemático se elige un individuo al azar y a partir de él, a intervalos constantes, se eligen los demás hasta completar la muestra. Suponemos que queremos saber la opinión sobre un profesor de una clase de 60 personas. Dichas personas están ordenadas por orden alfabético en la lista de alumnos de clase. Para realizar la encuesta, seleccionamos a 12 personas. Por lo tanto, N=60 y n=12. El intervalo fijo entre

sujetos es: 𝑘 =𝑁

𝑛=

60

12= 5

Ahora elegimos al azar un número entre 1 y k = 5. Suponemos que nos sale i = 2. La muestra resultado mediante el muestreo sistemático será:

Page 9: Unidad # 1 Distribuciones Fundamentales Para El Muestreo

Estadística Inferencial 1 I.T.S.R 3er semestre Ing. Industrial

Elaboró: MDCD. Ing. Alejandro Arana Paredes

3. Muestreo estratificado Se divide la población en clases o estratos y se escoge, aleatoriamente, un número de individuos de cada estrato proporcional al número de componentes de cada estrato. Ejemplo: En una fábrica que consta de 600 trabajadores queremos tomar una muestra de 20. Sabemos que hay 200 trabajadores en la sección A, 150 en la B, 150 en la C y 100 en la D.

Page 10: Unidad # 1 Distribuciones Fundamentales Para El Muestreo

Estadística Inferencial 1 I.T.S.R 3er semestre Ing. Industrial

Elaboró: MDCD. Ing. Alejandro Arana Paredes

4. Muestreo por etapas múltiples Esta técnica es la única opción cuando no se dispone de lista completa de la población de

referencia o bien cuando por medio de la técnica de muestreo simple o estratificado se

obtiene una muestra con unidades distribuidas de tal forma que resultan de difícil acceso.

En el muestreo a estadios múltiples se subdivide la población en varios niveles ordenados

que se extraen sucesivamente por medio de un procedimiento de embudo. El muestreo se

desarrolla en varias fases o extracciones sucesivas para cada nivel. (otra muestra si se

necesitan más datos).

Por ejemplo, si tenemos que construir una muestra de profesores de primaria en un país

determinado, éstos pueden subdividirse en unidades primarias representadas por

circunscripciones didácticas y unidades secundarias que serían los propios profesores. En

primer lugar extraemos una muestra de las unidades primarias (para lo cual debemos tener

la lista completa de estas unidades) y en segundo lugar extraemos aleatoriamente una

muestra de unidades secundarias de cada una de las primarias seleccionadas en la primera

extracción.

5. Muestreo por conglomerados En el muestreo por conglomerados, en lugar de seleccionar a todos los sujetos de la población inmediatamente, el investigador realiza varios pasos para reunir su muestra de la población. Se utiliza cuando la población se encuentra dividida, de manera natural, en grupos que se supone que contienen toda la variabilidad de la población, es decir, la representan fielmente respecto a la característica a elegir, pueden seleccionarse sólo algunos de estos grupos o conglomerados para la realización del estudio. Dentro de los grupos seleccionados se ubicarán las unidades elementales, por ejemplo, las personas a encuestar, y podría aplicársele el instrumento de medición a todas las unidades, es decir, los miembros del grupo, o sólo se le podría aplicar a algunos de ellos, seleccionados al azar. Este método tiene la ventaja de simplificar la recogida de información muestral. Cuando, dentro de cada conglomerado seleccionado, se extraen algunos individuos para integrar la muestra, el diseño se llama muestreo bietápico.

Page 11: Unidad # 1 Distribuciones Fundamentales Para El Muestreo

Estadística Inferencial 1 I.T.S.R 3er semestre Ing. Industrial

Elaboró: MDCD. Ing. Alejandro Arana Paredes

1.3 Teorema del límite central

El teorema del límite central o teorema central del límite indica que, en condiciones muy generales, la distribución de la suma de variables aleatorias tiende a una distribución normal cuando la cantidad de variables es muy grande. Este teorema, perteneciente a la teoría de la probabilidad, encuentra aplicación en muchos campos relacionados, tales como la inferencia estadística o la teoría de renovación. El teorema en un curso de estadística inferencial para pregrado se puede enunciar de la siguiente forma: TEOREMA: Sea 𝑋1, 𝑋2, … … … . . , 𝑋𝑛 una muestra aleatoria de una población cuya distribución tiene por media 𝜇 y por desviación estándar 𝜎. Entonces si n es suficientemente grande la variable aleatoria:

�̅� =∑ 𝑋𝑖

𝑛𝑖=1

𝑛

Tiene una distribución aproximadamente normal con media 𝜇�̅� = 𝜇 𝑦 𝜎�̅� =𝜎

√𝑛 de esta

forma la variable:

𝑍 =�̅� − 𝜇

𝜎

√𝑛

Se distribuye aproximadamente normal estándar conforme n se hace grande. DATOS: 𝑍 = 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎

�̅� = 𝑚𝑒𝑑𝑖𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 𝜇 = 𝑚𝑒𝑑𝑖𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙

𝜎 = 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟

𝑛 = 𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎

NOTA: Para poder determinar la probabilidad de una muestra aleatoria es preciso hacer uso de las tablas de distribución normal estándar

Page 12: Unidad # 1 Distribuciones Fundamentales Para El Muestreo

Estadística Inferencial 1 I.T.S.R 3er semestre Ing. Industrial

Elaboró: MDCD. Ing. Alejandro Arana Paredes

Ejemplo # 1. Una empresa eléctrica industrial fabrica focos que tienen una duración que se distribuye aproximadamente en forma normal, con media de 800 horas y desviación estándar de 40 horas. Encuentre la probabilidad de que una muestra aleatoria de 16 focos tenga una vida promedio de menos de 775 horas.

Solución: De acuerdo con el enunciado, se conoce la variable 𝑋𝑖 como la duración del i-esimo foco en la muestra tomada. Así la variable aleatoria 𝑋𝑖 proviene de una población con media 𝜇 = 800 Horas y desviación 𝜎 = 40 ℎ𝑜𝑟𝑎𝑠. De esta forma por el teorema del límite central, si se toman muestras de esta población de tamaño n = 16 y se calculan sus promedios la variable aleatoria �̅� se distribuye aproximadamente normal con media 𝜇�̅� = 800 y desviación 𝜎�̅� = 40. El problema requiere el cálculo de la probabilidad.

DATOS:

�̅� = 725

𝜇 = 800

𝜎 = 40

𝑛 = 16

Sustituimos en la formula

𝑃(�̅� < 775) = 𝑃 (�̅�−𝜇

𝜎

√𝑛

)

= 𝑃 (775−800

40

√16

)

= 𝑃 (775−800

10)

= 𝑃(𝑍 < −2.5) Buscar valor en la tabla de distribución normal estándar

= 0.0062

= 0.62%

Page 13: Unidad # 1 Distribuciones Fundamentales Para El Muestreo

Estadística Inferencial 1 I.T.S.R 3er semestre Ing. Industrial

Elaboró: MDCD. Ing. Alejandro Arana Paredes

1ra. ACTIVIDAD DE APRENDIZAJE

Resolver los siguientes ejercicios por el Teorema de Limite Central

Ejercicio # 1. La renta media de los habitantes de un país se distribuye uniformemente entre 4.0 millones ptas. y 10.0 millones ptas. Calcular la probabilidad de que al seleccionar al azar a 100 personas la suma de sus rentas supere los 725 millones ptas., si la media es de 700 y su desviación

estándar de 173 ptas. Sol. 7.49%

Ejercicio # 2. En un proceso químico la cantidad de cierto tipo de impurezas en el producto es difícil de controlar y por ello es una variable aleatoria. Se especula que la cantidad media de población de impurezas es de 0.20 gramos por gramo del producto. Se sabe que la desviación estándar es 0.1 gramos por gramos del producto. Se realiza un experimento para aprender más con respecto a la especulación de que 𝝁 = 𝟎. 𝟐. El proceso se lleva a cabo 50 veces en un laboratorio y el promedio de la muestra �̅� que sea menor resulta ser 0.23 gramos por gramos. Un ingeniero industrial quiere especular la cantidad media de impurezas es 0.20 gramos por gramos. Utilice el teorema de límite central para su respuesta. Sol: 1.74%

Ejercicio # 3 Las bolsas de sal envasadas por una máquina tienen μ = 500 g y σ = 35 g. Las bolsas se empaquetaron en cajas de 100 unidades. Calcular la probabilidad de que la media de los pesos de las bolsas de un paquete sea menor que 495 g. Sol: 7.64%

Page 14: Unidad # 1 Distribuciones Fundamentales Para El Muestreo

Estadística Inferencial 1 I.T.S.R 3er semestre Ing. Industrial

Elaboró: MDCD. Ing. Alejandro Arana Paredes

1.4 Distribuciones fundamentales para el muestreo 1.4.1 Distribución muestral de la media Una distribución muestral de medias se define como el conjunto de toda la media que se pueden calcular en todas las muestras posibles que se pueden extraer con o sin reemplazo de una determinada población. Recordemos que la media es el promedio aritmético de las medias del conjunto de datos; ya sea de la población o de la muestra:

𝝁 =∑ 𝑿𝒊

𝑵𝒊=𝟏

𝑵 (Media poblacional)

Varianza Es el promedio de la suma de los cuadrados de las desviaciones. Se entiende por desviación la diferencia de una media respecto a la media:

𝝈𝟐 =∑ (𝑿𝒊 − 𝝁)𝑵

𝒊=𝟏𝟐

𝑵

Como puede verse la varianza es una medida de dispersión, indica en promedio que tan alejados están los datos respecto a la media.

Desviación estándar Es la raíz cuadrada de la varianza: 𝝈 = √𝝈𝟐

Por simplicidad, en las expresiones anteriores se su prime el subíndice, así como los límites de las sumatorias quedando de la siguiente manera:

𝝁 =∑ 𝒙

𝑵 𝒚 𝝈𝟐 =

∑(𝒙 − 𝝁)𝟐

𝑵

𝝁𝒙=

�̅�𝟏.𝒇𝟏+�̅�𝟐.𝒇𝟐+⋯…….+�̅�𝒏.𝒇𝒏𝑵

𝜎�̅�2 =

(�̅�1−𝜇)2(𝑓1)+(�̅�2−𝜇)2(𝑓2)+..(�̅�𝑛−𝜇)2(𝑓𝑛)+

𝑁

Cuando la distribución de X es normal la distribución de la media muestral es normal con media m

y desviación estándar sin importar el tamaño de la muestra: 𝝈

√𝒏

El tamaño de la muestra depende del grado de no normalidad de la población. Sin embargo, una regla empírica señala que una muestra de tamaño 30 es suficiente, en la mayoría de las situaciones, para aplicar el teorema del límite central.

Resolvamos un ejemplo donde se calcule las muestras posibles que se pueden

extraer con y sin reemplazo de una determinada población

Media poblacional Varianza

poblacional

Media de todas la medias Varianza de la Media

muestral

Page 15: Unidad # 1 Distribuciones Fundamentales Para El Muestreo

Estadística Inferencial 1 I.T.S.R 3er semestre Ing. Industrial

Elaboró: MDCD. Ing. Alejandro Arana Paredes

Ejemplo # 1. Con Reemplazo Calcule las muestras posibles de la función de distribución de la media muestral de una pequeña población conformada por el número de huevos de N=5 tortugas Laúd que desovaron en cierta playa.

- El número de huevos por tortuga fue de 68 70 72 74 y 76 - El número de muestras posibles de tamaño n = 2 con sustitución es de 25

(68,68), (68,70), (68,72), (68,74), (68,76), (70,68), (70,70), (70,72), (70,74), (70,76), (72,68), (72,70), (72,72), (72,74), (72,76), (74,68), (74,70), (74,72), (74,74), (74,76), (76,68), (76,70), (76,72), (76,74), (76,76)

SOLUCIÓN Cuáles son los valores que podríamos esperar encontrar ya que el número de huevos que produce cada tortuga es una variable continúa…

0

0.04

0.08

0.12

0.16

0.2

68 69 70 71 72 73 74 75 76

�̅� f f~

68 1 0.04

69 2 0.08

70

5

75 2 0.08

76 1 0.04

x 68 70 72 74 76

68 68 69 72

70 69

72

74 75

76 72 75 76

Construyendo su

distribución de

frecuencia tendríamos

Representándolo en un

histograma

Page 16: Unidad # 1 Distribuciones Fundamentales Para El Muestreo

Estadística Inferencial 1 I.T.S.R 3er semestre Ing. Industrial

Elaboró: MDCD. Ing. Alejandro Arana Paredes

Media de la poblacional 𝝁 =∑ 𝒙

𝑵

𝝁 =𝟔𝟖+𝟕𝟎+𝟕𝟐+𝟕𝟒+𝟕𝟔

𝟓=

𝟑𝟔𝟎

𝟓= 𝟕𝟐

La varianza de la población es 𝝈𝟐 =∑(𝒙−𝝁)𝟐

𝑵

𝝈𝟐 =(𝟔𝟖−𝟕𝟐)𝟐+(𝟕𝟎−𝟕𝟐)𝟐+(𝟕𝟐−𝟕𝟐)𝟐+(𝟕𝟒−𝟕𝟐)𝟐+(𝟕𝟔−𝟕𝟐)𝟐

𝟓=

𝟏𝟔+𝟒+𝟎+𝟒+𝟏𝟔

𝟓

𝝈𝟐 =𝟒𝟎

𝟓= 𝟖

Calculamos ahora la media de todas las medias:

25

)1(76)2(75)3(74)4(73)5(72)4(71)3(70)2(69)1(68x

25

7615022229236028421013868

𝝁�̅� =

𝟏𝟖𝟎𝟎

𝟐𝟓= 𝟕𝟐

Por lo tanto: 𝝁�̅� = 𝝁

Calculamos ahora la varianza de la media muestral:

25

)5(7272)4(72713727027269)1(726822222

2

x

25

1727627275)3(7274)4(72732222

25

161812404121816

4

25

100

Por lo tanto:

nx

22

4 =8

2

𝟒 = 𝟒

Los resultados anteriores se obtuvieron suponiendo que el muestreo es con reemplazo o que las muestras se han extraído de una población finita.

Page 17: Unidad # 1 Distribuciones Fundamentales Para El Muestreo

Estadística Inferencial 1 I.T.S.R 3er semestre Ing. Industrial

Elaboró: MDCD. Ing. Alejandro Arana Paredes

Ejemplo # 1. Sin reemplazo En el ejemplo, bajo un muestreo sin reemplazo, el número de muestras posibles es 10

(las que están por encima de la diagonal en la tabla).

El número de muestras de tamaño n en una población de tamaño N está dado por la combinación:

)!(!

!

nNn

N

n

N

En el ejemplo:

10!3!2

!5

2

5

Con medias

10

)1(75)1(74)2(73)2(72)2(71)1(70)1(69x

10

7574146144142706972

10

720

Y ahora la varianza de la media muestral

10

27273)2(7272)2(7271)1(72701726922222

2

x

10

)1(7275)1(727422

10

9420249 310

30

En este caso la varianza de la media muestral no es igual a la varianza poblacional entre el tamaño

de la muestra. Sin embargo, existe una relación entre estas y está dada por:

1

22

N

nN

nx

34

34

15

25

2

8

1

2

N

nN

n

Por lo tanto 𝟑 = 𝟑

x 68 70 72 74 76

68 68 69 70 71 72

70 69 70 71 72 73

72 70 71 72 73 74

74 71 72 73 74 75

76 72 73 74 75 76

(68,70), (68,72), (68,74), (68,76), (70,72), (70,74), (70,76), (72,74), (72,76), (74,76)

69, 70, 71, 72, 71, 72, 73, 73, 74, y 75, respectivamente y las medias de estas son:

Page 18: Unidad # 1 Distribuciones Fundamentales Para El Muestreo

Estadística Inferencial 1 I.T.S.R 3er semestre Ing. Industrial

Elaboró: MDCD. Ing. Alejandro Arana Paredes

2da. ACTIVIDAD DE APRENDIZAJE

Resolver los siguientes ejercicios de Distribución muestral de la media Ejercicio # 1. Se eligen muestras ordenadas de tamaño 2, con reemplazo, de la población de valores 0, 2, 4 y 6. Encuentre: a) μ= la media poblacional. b) 𝜎2= la varianza poblacional. c) 𝝁�̅�= la media de la distribución de todas las medias. d) 𝜎�̅�

2 la varianza de la media muestral e) Además, grafique las frecuencias para la población y para la distribución muestral de medias. Sol: 𝝁 = 𝟑, 𝝈𝟐 = 𝟓, 𝝁�̅� = 𝟑, 𝜎�̅�

2 = 2.5

Ejercicio # 2. Se eligen muestras ordenadas de tamaño 2, sin reemplazo, de la población de valores 0, 2, 4 y 6. Encuentre: a) μ= la media poblacional. b) 𝜎2= la varianza poblacional. c) 𝝁�̅�= la media de la distribución de todas las medias.

d) 𝜎�̅�2 la varianza de la media muestral

e) Además, grafique las frecuencias para la población y para la distribución muestral de medias. Sol: 𝝁 = 𝟑, 𝝈𝟐 = 𝟓, 𝝁�̅� = 𝟑, 𝜎�̅�

2 = 2.5

Page 19: Unidad # 1 Distribuciones Fundamentales Para El Muestreo

Estadística Inferencial 1 I.T.S.R 3er semestre Ing. Industrial

Elaboró: MDCD. Ing. Alejandro Arana Paredes

1.4.2 Distribución muestral de la diferencia de medias

Suponga que se tienen dos poblaciones distintas, la primera con media 𝜇1 y desviación estándar 𝜎1 , y la segunda con media 𝜇22 y desviación estándar 𝜎2 . Más aún, se elige una muestra aleatoria de tamaño n1 de la primera población y una muestra independiente aleatoria de tamaño n2 de la segunda población; se calcula la media muestral para cada muestra y la diferencia entre dichas medias. La colección de todas esas diferencias se llama distribución muestral de las diferencias entre medias o la distribución muestral del estadístico �̅�1 − �̅�2

Suponga que se eligen muestra ordenadas de tamaño 2, con reemplazo, de la población de valores 0, 2, 4 y 6.

La distribución es aproximadamente normal para n1 30 y n2 30. Si las poblaciones son normales,

entonces la distribución muestral de medias es normal sin importar los tamaños de las muestras.

En ejercicios anteriores se había demostrado que 𝜇 = 𝜇�̅� y que 𝜎�̅� −𝜎

√𝑛 , por lo que no es

difícil deducir que 𝜇�̅�1 − 𝜇�̅�2 = 𝜇1 − 𝜇2 y que 𝜎�̅�1−�̅�2 = √𝜎1

2

𝑛1+

𝜎22

𝑛2 .

La fórmula que se utilizará para el cálculo de probabilidad de la distribución muestral de diferencia de medias es:

𝑧 =(�̅�1 − �̅�2) − (𝜇1 − 𝜇2)

√𝜎1

2

𝑛1+

𝜎22

𝑛2 .

Page 20: Unidad # 1 Distribuciones Fundamentales Para El Muestreo

Estadística Inferencial 1 I.T.S.R 3er semestre Ing. Industrial

Elaboró: MDCD. Ing. Alejandro Arana Paredes

Ejemplo # 1. En un estudio para comparar los pesos promedio de niños y niñas de sexto

grado en una escuela primaria se usará una muestra aleatoria de 20 niños y otra de 25 niñas. Se sabe que tanto para niños como para niñas los pesos siguen una distribución normal. El promedio de los pesos de todos los niños de sexto grado de esa escuela es de 100 libras y su desviación estándar es de 14.142, mientras que el promedio de los pesos de todas las niñas del sexto grado de esa escuela es de 85 libras y su desviación estándar es de 12.247 libras. Si �̅�1 representa el promedio de los pesos de 20 niños y �̅�2es el promedio de los pesos de una muestra de 25 niñas, encuentre la probabilidad de que el promedio de los pesos de los 20 niños sea al menos 20 libras más grande que el de las 25 niñas.

Solución: Datos:

𝜇1 = 100 libras 𝜇2= 85 libras 𝜎1 = 14.142 libras

𝜎2= 12.247 libras n1 = 20 niños n2 = 25 niñas

𝑝(�̅�1 − �̅�2)20) =?

𝑧 =(�̅�1 − �̅�2) − (𝜇1 − 𝜇2)

√𝜎1

2

𝑛1+

𝜎22

𝑛2 .

=20 − (100 − 85)

√(14.142)2

20 +(12.247)2

25 .

= 1.25

Buscamos en la tabla de distribución normal estándar 1.25=0.89435 Como el valor 1.25 no es mayor que los 20 le restamos 1 al resultado

1-0.89435 = 0.10565

Por lo tanto, la probabilidad de que el promedio de los pesos de la muestra de niños sea al menos 20 libras más grande que el de la muestra de las niñas es 0.1056.

Page 21: Unidad # 1 Distribuciones Fundamentales Para El Muestreo

Estadística Inferencial 1 I.T.S.R 3er semestre Ing. Industrial

Elaboró: MDCD. Ing. Alejandro Arana Paredes

3ra. ACTIVIDAD DE APRENDIZAJE Resolver los siguientes ejercicios de Distribución muestral de la diferencia de medias Ejercicio # 1. Uno de los principales fabricantes de televisores compra los tubos de rayos catódicos a dos compañías. Los tubos de la compañía A tienen una vida media de 7.2 años con una desviación estándar de 0.8 años, mientras que los de la B tienen una vida media de 6.7 años con una desviación estándar de 0.7. Determine la probabilidad de que una muestra aleatoria de 34 tubos de la compañía A tenga una vida promedio de al menos un año más que la de una muestra aleatoria de 40 tubos de la compañía B. Sol: 0.23%

Ejercicio # 2 Se prueba el rendimiento en km/L de 2 tipos de gasolina, encontrándose una desviación estándar de 1.23km/L para la primera gasolina y una desviación estándar de 1.37km/L para la segunda gasolina; se prueba la primera gasolina en 35 autos y la segunda en 42 autos.

a) ¿Cuál es la probabilidad de que la primera gasolina de un rendimiento promedio mayor de 0.45km/L que la segunda gasolina?

b) ¿Cuál es la probabilidad de que la diferencia en rendimientos promedio se encuentre entre 0.65 y 0.83km/L a favor de la gasolina 1?.

Solución: En este ejercicio no se cuenta con los parámetros de las medias en ninguna de las dos poblaciones, por lo que se supondrán que son iguales. Sol: a) 6.42%

b) 1.17 %

Ejercicios # 3. Uno de los principales fabricantes de radios compra cables a dos empresas. Los cables de la empresa A tienen una vida media de 4.2 años con una desviación estándar de 0,4 años, mientras que los de la empresa B tienen una vida media de 3.5 años con una desviación estándar de 0,9.Determine la probabilidad de que una muestra aleatoria de 63 tubos de la empresa A tenga una vida promedio de al menos 2 año más que la de una muestra aleatoria de 60 cables de la empresa B

Page 22: Unidad # 1 Distribuciones Fundamentales Para El Muestreo

Estadística Inferencial 1 I.T.S.R 3er semestre Ing. Industrial

Elaboró: MDCD. Ing. Alejandro Arana Paredes

1.4.3 Distribución muestral de la proporción

Existen ocasiones en las cuales no estamos interesados en la media de la muestra, sino que queremos investigar la proporción de artículos defectuosos o la proporción de alumnos reprobados en la muestra. La distribución muestral de proporciones es la adecuada para dar respuesta a estas situaciones. Esta distribución se genera de igual manera que la distribución muestral de medias, a excepción de que al extraer las muestras de la población se calcula el estadístico proporción (p=x/n en donde “x” es el número de éxitos u observaciones de interés y “n” el tamaño de la muestra) en lugar del estadístico media.

Una población binomial está estrechamente relacionada con la distribución muestral de proporciones; una población binomial es una colección de éxitos y fracasos, mientras que una distribución muestral de proporciones contiene las posibilidades o proporciones de todos los números posibles de éxitos en un experimento binomial, y como consecuencia de esta relación, las afirmaciones probabilísticas referentes a la proporción muestral pueden evaluarse usando la aproximación normal a la binomial, siempre que np≥ 5 y n(1-p) ≥5. Cualquier evento se puede convertir en una proporción si se divide el número obtenido entre el número de intento. La fórmula que se utilizará para el cálculo de probabilidad en una distribución muestral de proporciones está basada en la aproximación de la distribución normal a la binomial. Esta fórmula nos servirá para calcular la probabilidad del comportamiento de la proporción en la muestra.

𝒛 =𝒙−𝒏𝒑

√𝒏𝒑𝒒

𝒛 =𝒑−𝑷

√𝒑𝒒

𝒏

Aproximación de la distribución

normal a la binomial

Distribución muestral de proporciones

Page 23: Unidad # 1 Distribuciones Fundamentales Para El Muestreo

Estadística Inferencial 1 I.T.S.R 3er semestre Ing. Industrial

Elaboró: MDCD. Ing. Alejandro Arana Paredes

Ejemplo # 1. Se ha determinado que 60% de los estudiantes de una universidad grande

fuman cigarrillos. Se toma una muestra aleatoria de 800 estudiantes. Calcule la probabilidad de que la proporción de la muestra de la gente que fuma cigarrillos sea menor que 0.55.

Solución: Este ejercicio se puede solucionar por dos métodos. El primero: Aproximación de la distribución normal a la binomial

Datos: n=800 estudiantes p=0.60 x= (0.55).(800) = 440 estudiantes p(x<440) = ? Media= np= (800)(0.60)= 480

𝒁 =𝒙−𝒏𝒑

√𝒏𝒑𝒒

𝒁 =𝟒𝟑𝟗.𝟓−𝟒𝟖𝟎

√𝟖𝟎𝟎(𝟎.𝟔𝟎)(𝟎.𝟒𝟎)= −𝟐. 𝟗𝟐

p(x<440) = 0.0017. Este valor significa que existe una probabilidad del 0.17% de que al extraer una muestra de 800 estudiantes, menos de 440 fuman cigarrillos buscando su valor en la tabla de distribución normal estándar

Solución: 2do Método: Utilizando la fórmula de la distribución muestral de proporcione n=800 estudiantes P=0.60 p=0.55 p(p<0.55) = ?

𝑧 =𝑝−𝑃

√𝑝𝑞

𝑛

=0.549375−0.60

√(0.60)(0.40)

800

= −𝟐. 𝟗𝟐

Observe que este valor es igual al obtenido en el método de la aproximación de la distribución normal a la binomial, por lo que si lo buscamos en la tabla de “z” nos da la misma probabilidad de 0.0017.

q = 1-0.60=0.40

Page 24: Unidad # 1 Distribuciones Fundamentales Para El Muestreo

Estadística Inferencial 1 I.T.S.R 3er semestre Ing. Industrial

Elaboró: MDCD. Ing. Alejandro Arana Paredes

4ta. ACTIVIDAD DE APRENDIZAJE Resolver los siguientes ejercicios de Distribución muestral de la Proporción Ejercicio # 1. Un medicamento para malestar estomacal tiene la advertencia de que algunos usuarios pueden presentar una reacción adversa a él, más aún, se piensa que alrededor del 3% de los usuarios tienen tal reacción. Si una muestra aleatoria de 150 personas con malestar estomacal usa el medicamento, encuentre la probabilidad de que la proporción de la muestra de los usuarios que realmente presentan una reacción adversa, exceda el 4%.

a) Resolverlo mediante la aproximación de la normal a la binomial b) Resolverlo con la distribución muestral de proporciones

Sol: a)16.85% b) 16.85%

Ejercicio # 2. Se sabe que la verdadera proporción de los componentes defectuosos fabricados por una firma es de 4%, y encuentre la probabilidad de que una muestra aleatoria de tamaño 60 tenga: a) Menos del 3% de los componentes defectuosos. Sol: 23.27%

Ejercicio # 3. Disponemos de los datos del I.N.E sobre el aumento del empleo durante el año 98, el cual se encuentra en un 45%. Si tomamos una muestra aleatoria de 200 ciudadanos. ¿Cuál es la probabilidad de que al menos el 50% tenga empleo? Sol: 8.7%

Page 25: Unidad # 1 Distribuciones Fundamentales Para El Muestreo

Estadística Inferencial 1 I.T.S.R 3er semestre Ing. Industrial

Elaboró: MDCD. Ing. Alejandro Arana Paredes

1.4.4 Distribución muestral de la diferencia de proporciones Muchas aplicaciones involucran poblaciones de datos cualitativos que debe compararse utilizando proporciones o porcentajes. A continuación se citan algunos ejemplos: •Educación.- ¿Es mayor la proporción de los estudiantes que aprueban matemáticas que las de los que aprueban inglés? •Medicina.- ¿Es menor el porcentaje de los usuarios del medicamento A que presentan una reacción adversa que el de los usuarios del fármaco B que también presentan una reacción de ese tipo? •Administración.- ¿Hay diferencia entre los porcentajes de hombres y mujeres en posiciones gerenciales. •Ingeniería.- ¿Existe diferencia entre la proporción de artículos defectuosos que genera la máquina A a los que genera la máquina B?

Cuando el muestreo procede de dos poblaciones binomiales y se trabaja con dos proporciones muestrales, la distribución muestral de diferencia de proporciones es aproximadamente normal para tamaños de muestra grande (n1 p1 ≥ 5, n1 q1 ≥ 5, n2 p2 ≥ 5 y n2 q2 ≥ 5). Entonces p1 y p2 tienen distribuciones muestrales aproximadamente normales, así que su diferencia p1 –p2 también tiene una distribución muestral aproximadamente normal.

Cuando se estudió a la distribución muestral de proporciones se comprobó que:

𝑃 = 𝜇𝑝 𝑦 𝑞𝑢𝑒 𝜎𝑝 = √𝑝𝑞

𝑛 por lo que no es difícil deducir que: 𝜇𝑝1 − 𝜇𝑝2 = 𝑃1 − 𝑃2 y que:

𝜎𝑝1−𝑝2= √

𝑃1𝑞1

𝑛1+

𝑃2𝑞2

𝑛2

La fórmula que se utilizará para el cálculo de probabilidad del estadístico de diferencia de proporciones:

𝒛 =(𝑝1 − 𝑝2) − (𝑃1 − 𝑃2)

√𝑃1𝑞1

𝑛1 +

𝑃2𝑞2

𝑛2

Page 26: Unidad # 1 Distribuciones Fundamentales Para El Muestreo

Estadística Inferencial 1 I.T.S.R 3er semestre Ing. Industrial

Elaboró: MDCD. Ing. Alejandro Arana Paredes

Ejemplo # 1.

Los hombres y mujeres adultos radicados en una ciudad grande del norte difieren en sus opiniones sobre la promulgación de la pena de muerte para personas culpables de asesinato. Se cree que el 12% de los hombres adultos están a favor de la pena de muerte, mientras que sólo 10% de las mujeres adultas lo están. Si se pregunta a dos muestras aleatorias de 100 hombres y 100 mujeres su opinión sobre la promulgación de la pena de muerte, determine la probabilidad de que el porcentaje de hombres a favor sea al menos 3% mayor que el de las mujeres

Solución:

Datos: PH= 0.12 1- 0.12=0.88=q1 PM= 0.10 1- 0.10=0.90=q2

nH= 100 nM= 100 p (pH – p M ≥ 0.03) = ?

Se recuerda que se está incluyendo el factor de corrección de 0.5 por ser una distribución binomial y se está utilizando la distribución normal

𝒛 =(𝑝1 − 𝑝2) − (𝑃1 − 𝑃2)

√𝑃1𝑞1

𝑛1 +

𝑃2𝑞2

𝑛2

=𝟎.𝟎𝟐𝟓−(𝟎.𝟏𝟐−𝟎.𝟏𝟎)

√(0.12)(0.88)

100 +

(0.10)(0.90)

100

= 𝟎. 𝟏𝟏

Buscando en la tabla 0.11 = 0.54395. Por lo tanto 1-0.54395=0.456

Se concluye que la probabilidad de que el porcentaje de hombres a favor de la pena de muerte, al menos 3% mayor que el de mujeres es de 0.456

Page 27: Unidad # 1 Distribuciones Fundamentales Para El Muestreo

Estadística Inferencial 1 I.T.S.R 3er semestre Ing. Industrial

Elaboró: MDCD. Ing. Alejandro Arana Paredes

5ta. ACTIVIDAD DE APRENDIZAJE Resolver los siguientes ejercicios de Distribución muestral de la diferencia de Proporción Ejercicio # 1. Una encuesta del Boston College constó de 320 trabajadores de Michigan que fueron despedidos entre 1979 y 1984, encontró que 20% habían estado sin trabajo durante por lo menos dos años. Supóngase que tuviera que seleccionar otra muestra aleatoria de 320 trabajadores de entre todos los empleados despedidos entre 1979 y 1984. ¿Cuál sería la probabilidad de que su porcentaje muestral de trabajadores sin empleo durante por lo menos dos años, difiera del porcentaje obtenido en la encuesta de Boston College, en 5% o más? Sol: 6.3 %

En este ejercicio se cuenta únicamente con una población, de la cual se están extrayendo dos muestras y se quiere saber la probabilidad de la diferencia de los porcentajes en esas dos muestras, por lo que se debe de utilizar la distribución muestral de proporciones con P1= P2, ya que es una misma población.

Ejercicio # 2. Se sabe que 3 de cada 6 productos fabricados por la máquina 1 son defectuosos y que 2 de cada 5 objetos fabricados por la máquina 2 son defectuosos; se toman muestras de 120 objetos de cada máquina:

a. ¿cuál es la probabilidad de que la proporción de artículos defectuosos de la máquina 2 rebase a la máquina 1 en por lo menos 0.10?

b. ¿cuál es la probabilidad de que la proporción de artículos defectuosos de la máquina

1 rebase a la máquina 2 en por lo menos 0.15?

Solución: a) 0.11% b) 23.57%

Page 28: Unidad # 1 Distribuciones Fundamentales Para El Muestreo

Estadística Inferencial 1 I.T.S.R 3er semestre Ing. Industrial

Elaboró: MDCD. Ing. Alejandro Arana Paredes

1.4.5 Distribución t-Student

En probabilidad y estadística, la distribución t (de Student) es una distribución de probabilidad que surge del problema de estimar la media de una población normalmente distribuida cuando el tamaño de la muestra es pequeño. Las distribuciones t de Student fueron descubiertas por William S. Gosset (1876-1937) en 1908 cuando trabajaba para la compañía de cervezas Guinness en Dublín (Irlanda). Aparece de manera natural al realizar la prueba t de Student para la determinación de las diferencias entre dos medias muestrales y para la construcción del intervalo de confianza para la diferencia entre las medias de dos poblaciones cuando se desconoce la desviación típica de una población y ésta debe ser estimada a partir de los datos de una muestra

El estadístico T tiene una distribución que se denomina distribución T de Student, que está tabulada para 1, 2, 3, ... etc. grados de libertad de la muestra con la cual se calculó la desviación standard. La distribución T tiene en cuenta la incertidumbre en la estimación de la desviación standard de la población, porque en realidad la tabla de T contiene las distribuciones de probabilidades para distintos grados de libertad. La distribución T es más ancha que la distribución normal tipificada Para un número de grados de libertad pequeño. Cuando los grados de libertad tienden a infinito, la distribución T tiende a coincidir con la distribución normal standard. Es decir, en la medida que aumentemos el número de observaciones de la muestra, la desviación standard calculada estará más próxima a la desviación standard de la población y entonces la distribución T correspondiente se acerca a la distribución normal standard. El uso de la distribución T presupone que la población con que estamos trabajando tiene una distribución normal. Si el tamaño de la muestra es n entonces decimos que la distribución t tiene n-1 grados de libertad. Hay una distribución t diferente para cada tamaño de la muestra. Estas distribuciones son una familia de distribuciones de probabilidad continuas. Las curvas de densidad son simétricas y con forma de campana como la distribución normal estándar. Sus medias son 0 y sus varianzas son mayores que 1 (tienen colas más pesadas). Las colas de las distribuciones t disminuyen más lentamente que las colas de la distribución normal. Si los grados de libertad son mayores más próxima a 1 es la varianza y la función de densidad es más parecida a la densidad normal.

Page 29: Unidad # 1 Distribuciones Fundamentales Para El Muestreo

Estadística Inferencial 1 I.T.S.R 3er semestre Ing. Industrial

Elaboró: MDCD. Ing. Alejandro Arana Paredes

Definición: Es una distribución de probabilidad. Se utiliza para hacer estimaciones de la media de una variable, (que está distribuida normalmente), en una población, cuando el tamaño de la muestra es pequeño. También se utiliza para hacer estimaciones de parámetros de las poblaciones a partir de los valores de los estadísticos correspondientes en las muestras, cuando desconoce el valor de la varianza o la desviación estándar de la población Definición de Grados de Libertad: Los valores de los estadísticos en una muestra deben ser valores cercanos a los parámetros correspondientes en las poblaciones. Los grados de libertad representan al número de datos independientes que se pueden tomar de la población para construir la muestra, de tal manera que los valores de los estadísticos en la muestra sean cercanos a los valores de los parámetros correspondientes en la población. Por tanto cuando se escoge una muestra de tamaño n, el número de datos independientes que se pueden tomar de la población para construir la muestra es n-1, ya que el último dato que se escoja, es el que viene a definir el valor del estadístico en la muestra. Podemos concluir entonces que para calcular los grados de libertad, al número que representa el tamaño de la muestra(n) le restamos 1, es decir aplicamos la formula gl=n-1

Propiedades de la Distribución t – student

1. El valor de la media es 0

2. Tiene forma de campana y es simétrica con respecto a la media

3. La distribución t tiene una varianza mayor que 1, pero en la medida en que aumentan los

grados, el valor de la varianza se aproxima a 1, lo cual lleva a que la distribución t se

aproxime a la distribución normal estándar en la medida en que aumenta el valor de los

grados de libertad.

Nota: Podemos Utilizar 2 tabla de Distribución t – Student - Tabla de los Valores de las Área en una cola y área en 2 colas de la gráfica y una columna que son los grados de libertad (los valores encontrados en la tabla corresponden a los valores críticos es decir los que se ubican en el eje horizontal)

𝝁

𝝈

Page 30: Unidad # 1 Distribuciones Fundamentales Para El Muestreo

Estadística Inferencial 1 I.T.S.R 3er semestre Ing. Industrial

Elaboró: MDCD. Ing. Alejandro Arana Paredes

Ejemplo # 1. Encontrar t (12, 0.01)

Solución: Encontrar los valores críticos en la distribución t–Student si el valor de los grados de libertad es 12 (el tamaño de la muestra es 13) y el área en una cola o en dos colas es de 0.01

UNA COLA: Si el área de 0.01 está en una cola, puede estar a la izquierda o a la derecha

Si el área dada es en una cola, entonces buscamos el valor correspondiente en la tabla: que para 12

grados de libertad y un área de una cola de 0.01 el valor critico de t es de: 2.681

DOS COLAS: Si el área de 0.01 está en dos colas, se tiene que en cada cola hay un área de 0.01/2 es decir 0.005

Si el área dada es en dos colas, entonces buscamos el valor correspondiente en la tabla: que para 12 grados de libertad y un área de 0.01 en dos colas , es decir un área de 0.005 en una cola el valor critico de t es de: 3.055

CONCLUSION: Por tanto los valores de t en el eje horizontal son:

-2.68 si el área dada está en la cola izquierda 2.68 si el área dada está en la cola derecha -3.055 y 3.055 si el área dada es dos colas

Cola izquierda Cola derecha

0.01 0.01

0.005 0.005

Cola izquierda Cola derecha Dos colas

Page 31: Unidad # 1 Distribuciones Fundamentales Para El Muestreo

Estadística Inferencial 1 I.T.S.R 3er semestre Ing. Industrial

Elaboró: MDCD. Ing. Alejandro Arana Paredes

Ejemplo # 2. Dada la gráfica, identificar los valores críticos en la distribución t-Student

En este caso debemos hallar el valor de t para una muestra de 𝒏 = 𝟐𝟎 y un área en una cola de 0.05. Obtenemos entonces el valor de los grados de libertad gl= n - 1= 20 - 1= 19 Buscamos el valor correspondiente a t en la tabla es igual a 1.729. Por lo tanto, el valor de t en el eje horizontal

es: -1.73 ya que el área dada está en la cola izquierda.

Ejemplo # 3. Dada la gráfica, identificar los valores críticos en la distribución t - Student

En este caso debemos hallar el valor de t para una muestra de n = 4 y un área en dos colas de 0.10 es decir que en cada cola hay un área de 0.10/2= 0.05. Obtenemos entonces el valor de los grados de libertad gl=n-1=4-1=3. Buscamos el valor correspondiente a t en la tabla es igual a 2.365. Por lo tanto, el valor de t en el eje horizontal es - 2.365 y 2.365 ya que el área dada está en las 2 colas.

𝜶 = 𝟎. 𝟎𝟓 𝒏 = 𝟐𝟎

𝒕

𝟎. 𝟎𝟓

-1.73

𝒕𝟏 𝒕𝟐

𝜶 = 𝟎. 𝟏𝟎 𝒏 = 𝟒

𝟎. 𝟎𝟓

𝟎. 𝟎𝟓

-2.365 2.365

Page 32: Unidad # 1 Distribuciones Fundamentales Para El Muestreo

Estadística Inferencial 1 I.T.S.R 3er semestre Ing. Industrial

Elaboró: MDCD. Ing. Alejandro Arana Paredes

ACTIVIDAD DE APRENDIZAJE Para cada ejercicio, identificar los posibles casos y hacer la gráfica correspondiente

1. Encontrar

A) T(22, 0.025)

B) T(25, 0.05)

C) T(15, 0.01)

D) T(10, 0.10)

E) T(8, 0.02)

2. Dada las gráficas, identificar los valores críticos en la distribución t – Student

𝜶 = 𝟎. 𝟎𝟓 𝒏 = 𝟔

𝜶 = 𝟎. 𝟏𝟎 𝒏 = 𝟖

𝜶 = 𝟎. 𝟎𝟐 𝒏 = 𝟏𝟐

𝜶 = 𝟎. 𝟏𝟎 𝒏 = 𝟏𝟖

𝒕𝟏 𝒕𝟐 𝒕

𝒕 𝒕

A B

C D

Page 33: Unidad # 1 Distribuciones Fundamentales Para El Muestreo

Estadística Inferencial 1 I.T.S.R 3er semestre Ing. Industrial

Elaboró: MDCD. Ing. Alejandro Arana Paredes

1.4.6 Distribución muestral de la varianza

En este tema se analizara las distribución muestra teoría de s2 para muestras aleatorias de poblaciones normales. Como s2 no puede ser negativa, debemos esperar que esta distribución muestral no se una curva normal: y efectivamente se encuentra ligada a una

distribución gamma de parámetros 𝛼 =𝑣

2 𝑦 𝛽 = 2 llamada distribución x cuadrada (chi-

cuadrado). Concretando se tiene que: Si s2 es la varianza de una muestra aleatoria de tamaño n tomada de una población normal que tiene la varianza 𝝈𝟐, entonces:

𝒙𝟐 =(𝒏 − 𝟏)𝒔𝟐

𝝈𝟐

Es un valor de una variable aleatoria que tiene la distribución x-cuadrada con el parámetro v = n -1 Ver tabla que contiene valores seleccionados de x2 para distintos valores de v, llamado de nuevo, numero de grados de libertad, donde x2 es tal que el área bajo la curva de la distribución x – cuadrada(tomada a la derecha) es igual a 𝛼.

En la tabla la columna de la izquierda contiene valores de v, los valores que encabezan las columnas son áreas de la cola derecha de la curva de la distribución x- cuadrada y las entradas son valores de 𝑥𝛼

2. A diferencia de la distribución t, es necesario tabular valores de 𝑥𝛼

2 𝑝𝑎𝑟𝑎 𝛼 > 0.50, que la distribución x – cuadrada no es simétrica.

Page 34: Unidad # 1 Distribuciones Fundamentales Para El Muestreo

Estadística Inferencial 1 I.T.S.R 3er semestre Ing. Industrial

Elaboró: MDCD. Ing. Alejandro Arana Paredes

Veamos un ejemplo: Una compañía de óptica compra cristal para fabricar lentes, y que

experiencias anteriores han demostrado que la varianza del índice de refacciones de esta clase de cristal es 126.0 x 10-4. Para convertir el cristal en lentes de una longitud focal dada, es importante que las distintas piezas de cristal tengan, aproximadamente el mismo índice de refracción; en consecuencia, supondremos que en envió de cristal de esta clase se rechaza si la varianza muestral de 20 piezas seleccionadas al azar excede a 200.0 x 10-4. Suponiendo además que los valores de las muestras se pueden tratar como si provinieran de una población normal con 𝜎2 = 126.0 𝑥10−4, la probabilidad de que en un envió se rechace erróneamente se puede determinar de la manera siguiente.

𝒙𝟐 =(𝒏 − 𝟏)𝒔𝟐

𝝈𝟐

𝒙𝟐 =(20 − 𝟏)200.0𝑥10−4

126.0𝑥10−4= 30.2

𝜎2 = 126.0 𝑥10−4 =√0.0126

2= 0.05

Posteriormente encontramos en la tabla de puntos porcentuales de la distribución x2, que para 19 grados de libertad, 𝑥0.05

2 = 30.1 Entonces la probabilidad de que en un envio bueno se rechace erróneamente, por este criterio, es menor que 0.05

Un problema relacionado muy de cerca con el de encontrar la distribución de la varianza muestral es el de encontrar la distribución de la razón de las varianzas de dos muestras aleatorias independiente. Este problema es importante porque aparece en pruebas en las queremos determinar si dos muestras provienen de poblaciones que tienen varianzas iguales. Si esto ocurre, las dos muestras tendrán aproximadamente, la misma varianza; esto es, su razón será, aproximadamente, 1. Para determinar si la razón de dos varianzas de muestras es muy pequeño o muy grande se utiliza el siguiente teorema: Si 𝑠1

2 𝑦 𝑠22 son las varianzas de muestras aleatorias independiente de tamaños 𝑛1𝑦 𝑛2

respectivamente, tomadas de dos poblaciones normales que tienen la misma varianza, entonces:

𝐹 =𝑠1

2

𝑠22

Es un valor de una variable aleatoria que tiene la distribución F con parámetros 𝑉1 = 𝑛1 − 1 y 𝑉2 = 𝑛2 − 1. La distribución F tiene los dos parámetros 𝑉1 que representa los grados de libertad de la varianza de la muestra del numerador, y 𝑉2 que representa los grados de libertad de la varianza de la muestra del denominador; al referirnos a una distribución F particular, damos siempre en primer lugar los grados de libertad del numerador

Page 35: Unidad # 1 Distribuciones Fundamentales Para El Muestreo

Estadística Inferencial 1 I.T.S.R 3er semestre Ing. Industrial

Elaboró: MDCD. Ing. Alejandro Arana Paredes

Page 37: Unidad # 1 Distribuciones Fundamentales Para El Muestreo

Estadística Inferencial 1 I.T.S.R 3er semestre Ing. Industrial

Elaboró: MDCD. Ing. Alejandro Arana Paredes

TABLA DE DISTRIBUCIÓN NORMAL ESTANDAR

Page 38: Unidad # 1 Distribuciones Fundamentales Para El Muestreo

Estadística Inferencial 1 I.T.S.R 3er semestre Ing. Industrial

Elaboró: MDCD. Ing. Alejandro Arana Paredes

TABLA DE DISTRIBUCIÓN NORMAL ESTANDAR