TEMA 10.- INTRODUCCIÓN A LA ESTADÍSTICA...

47
ESTADÍSTICA GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL Tema 10. Introducción a la Estadística Inferencial. 161 G. L. 2 8 200 -5 -4 -3 -2 -1 0 1 2 3 4 5 TEMA 10.- INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIAL - De la Estadística Descriptiva a la Estadística Inferencial. - El Modelo Estadístico. - Estadísticos y Estimadores. - Ley de los Grandes Números. - Distribución muestral. - Estimadores en modelos normales y proporciones. - Distribuciones muestrales en modelos normales. - Distribuciones muestrales para muestras grandes. n t William S. Gosset (Student)

Transcript of TEMA 10.- INTRODUCCIÓN A LA ESTADÍSTICA...

Page 1: TEMA 10.- INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALvalentin/ging/materiales_web/Tema10-11_resaltado.pdf · de la estadÍstica descriptiva a la estadÍstica inferencial ESTADÍSTICA

ESTADÍSTICA GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E

INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL

Tema 10. Introducción a la Estadística Inferencial. 161

G. L.28200

-5 -4 -3 -2 -1 0 1 2 3 4 5

TEMA 10.- INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIAL

- De la Estadística Descriptiva a la Estadística Inferencial. - El Modelo Estadístico. - Estadísticos y Estimadores. - Ley de los Grandes Números. - Distribución muestral. - Estimadores en modelos normales y proporciones. - Distribuciones muestrales en modelos normales. - Distribuciones muestrales para muestras grandes.

ntWilliam S. Gosset (Student)

Valentín
Resaltado
Valentín
Resaltado
Valentín
Resaltado
Valentín
Resaltado
Valentín
Resaltado
Valentín
Resaltado
Valentín
Resaltado
Valentín
Resaltado
Valentín
Resaltado
Valentín
Resaltado
Valentín
Resaltado
Valentín
Resaltado
Page 2: TEMA 10.- INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALvalentin/ging/materiales_web/Tema10-11_resaltado.pdf · de la estadÍstica descriptiva a la estadÍstica inferencial ESTADÍSTICA

ESTADÍSTICA GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E

INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL

Tema 10. Introducción a la Estadística Inferencial. 162

DE LA ESTADÍSTICA DESCRIPTIVA A LA ESTADÍSTICA INFERENCIAL

ESTADÍSTICA DESCRIPTIVA Analiza muestras describiéndolas y resumiéndolas gráfica y numéricamente. Ayuda a plantear modelos para la población que podrían explicar el comportamiento de la muestra.

CÁLCULO DE PROBABILIDADES Da forma matemática a la idea de “modelo” y nos permite explicar y manejar la variabilidad. Describe diferentes clases de modelos teóricos para las variables aleatorias de interés en una población. Conocer el modelo de una población, proceso o sistema sometido a variabilidad o aleatoriedad es muy útil para conocer sus propiedades y prever su comportamiento. Nos surge una duda fundamental: ¿Cómo podemos saber cuál es el modelo de cada población?

ESTADÍSTICA MATEMÁTICA O INFERENCIAL Cuando queremos estudiar un fenómeno aleatorio (población): Lo más habitual es que no conozcamos el modelo teórico del mismo. Pero seguramente podremos observarlo, tomar una muestra y describirla.

Utilizando la información dada por una pequeña parte de la población (la muestra disponible) …

¿Se puede inferir el comportamiento de toda ella (conocer el modelo)?

La Estadística Inferencial permite dar este paso validando o refutando las conjeturas de la Estadística Descriptiva: Validar un posible modelo para la población. Estimar parámetros de ese modelo.

valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
Page 3: TEMA 10.- INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALvalentin/ging/materiales_web/Tema10-11_resaltado.pdf · de la estadÍstica descriptiva a la estadÍstica inferencial ESTADÍSTICA

ESTADÍSTICA GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E

INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL

Tema 10. Introducción a la Estadística Inferencial. 163

EL MODELO ESTADÍSTICO En todos los problemas de la Estadística Inferencial encontraremos los siguientes ingredientes:

1.- Población en estudio. - X variable aleatoria de interés definida sobre la población. - PX ley de probabilidad desconocida de la v. a. X. - Tenemos interés en conocer, hasta donde sea posible, la ley de X (o sus parámetros).

2.- Muestra representativa de la población: X1, …, Xn. - Habitualmente tendremos una muestra aleatoria simple (m.a.s.), formada por v.a. independientes

e igualmente distribuidas (i.i.d.), con la misma ley de X. - Los datos o realizaciones de la muestra, x1, …, xn contienen información sobre PX.

3.- El OBJETIVO es extraer la información que contienen los datos acerca de PX: - Obtener una aproximación razonable del modelo de X (normal, exponencial…) - Estimar los parámetros u otras cantidades de interés de ese modelo ( P(a<X<b), mediana...) - Comparar la ley de X en esta población con la ley en otra población de interés (efecto innovación)

La Estadística Inferencial aporta metodología para conseguir este objetivo mediante técnicas de: - Estimación (puntual o por intervalos) para asignar valores a un parámetro desconocido - Contraste o Test de Hipótesis (paramétricos, de ajuste …) para decidir entre dos opciones

A veces sabemos que la ley PX está en una determinada familia (normal, exponencial…) y el problema es sólo determinar (estimar o contrastar) los parámetros : , , … Decimos entonces que estamos ante un Problema o Modelo Paramétrico.

valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
Page 4: TEMA 10.- INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALvalentin/ging/materiales_web/Tema10-11_resaltado.pdf · de la estadÍstica descriptiva a la estadÍstica inferencial ESTADÍSTICA

ESTADÍSTICA GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E

INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL

Tema 10. Introducción a la Estadística Inferencial. 164

EJEMPLO: Una planta industrial envasa detergente en polvo en paquetes que se etiquetan con: CONTENIDO 4 Kg.

El proceso viene siguiendo un patrón normal y se considera bajo control mientras cumpla: =4.01 Kg. y =0.005 Kg.

Pero el proceso se puede desajustar (aumento o disminución de o , aparición de asimetría, etc.) e interesa poder chequear en cualquier momento el estado del proceso de envasado.

La Estadística Inferencial aporta herramientas para dar respuesta a preguntas naturales como éstas: 1. ¿Cuánto valen y ?

(ESTIMACIÓN PUNTUAL)

2. ¿Entre qué valores se encuentran y con ciertas garantías de acierto (95% ó 99%)?(ESTIMACIÓN por INTERVALOS DE CONFIANZA)

3. ¿Los datos soportan que =4.01, o por el contrario son más creíbles si =5.01?¿Los datos soportan que <0.005, o quizás será≥0.005?(CONTRASTE DE HIPÓTESIS PARAMETRICOS)

4. ¿El modelo es normal?(TEST DE AJUSTE)

Para responder a estas preguntas tendremos que tomar una muestra de la variable X = Contenido envasado y estudiar la información que nos aporta s obre el modelo poblacional. Surgen entonces otras preguntas adicionales:

5. ¿De qué tamaño tiene que ser la muestra para garantizar cierta confianza?, ¿Cómo elijo la muestra?(MUESTREO)

valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
Page 5: TEMA 10.- INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALvalentin/ging/materiales_web/Tema10-11_resaltado.pdf · de la estadÍstica descriptiva a la estadÍstica inferencial ESTADÍSTICA

ESTADÍSTICA GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E

INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL

Tema 10. Introducción a la Estadística Inferencial. 165

EJEMPLO: Dos proveedores A y B suministran a un fabricante el mismo producto químico cuya característica de interés es la pureza (en %), que es una variable aleatoria con distribución supuestamente normal. El fabricante está interesado en comparar los productos suministrados por ambos proveedores comparando los parámetros en ambos casos (a través de AB y A /B).

De nuevo se nos plantean una serie de interrogantes naturales a los que sólo podremos dar respuesta mediante el uso de las técnicas estadísticas apropiadas:

1. ¿Cuánto valen aproximadamente y en cada caso? (ESTIMACIÓN)

2. ¿Entre qué valores se encuentran con ciertas garantías de acierto AB y A /B (95 % ó 99%)? (INTERVALOS DE CONFIANZA)

3. ¿Es realmente cierto AB, o quizás AB? Análogamente: ¿Realmente AB, o quizásAB? (CONTRASTE DE HIPÓTESIS)

4. ¿Los modelos son normales? (TEST DE AJUSTE)

Para responder a estas preguntas tendremos que tomar muestras de la variable X = Pureza para cada uno de los proveedores y estudiar la información que nos aportan sobre los modelo de ambas poblaciones. Surgen entonces otras preguntas adicionales:

5. ¿De qué tamaño tienen que ser las muestras?, ¿Cómo elijo las muestras? (MUESTREO)

valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
Page 6: TEMA 10.- INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALvalentin/ging/materiales_web/Tema10-11_resaltado.pdf · de la estadÍstica descriptiva a la estadÍstica inferencial ESTADÍSTICA

ESTADÍSTICA GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E

INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL

Tema 10. Introducción a la Estadística Inferencial. 166

ESTADÍSTICOS Y ESTIMADORES Estadístico. Es cualquier función de la muestra. ),...,( 1 nXXTT . (Es una v.a.; depende del azar).

Operando los valores 1,..., nX X de la muestra, extraemos la in formación que ésta posee sobre la población (sobre la ley PX desconocida, sus parámetros u otras características de interés).

Ejemplos de estadísticos: ...;;)(1;1;; 2

1

2

11

22

11 MeXX

nSX

nXXTXT

n

ii

n

ii

n

ii

n

ii

Estimadores. Para aproximar o estimar un parámetro desconocido, , en una población, se elige un estadístico apropiado, ),...,(ˆˆ

1 nXX . Se dice entonces que el estadístico es un estimador de .

Ejemplos de estimadores: 2

11)(1ˆ;1ˆ XX

nSX

nX

n

ii

n

ii

(serán usados habitualmente como estimadores de los parámetros y , respectivamente).

Para obtener un estimador adecuado para un parámetro utilizaremos este sencillo razonamiento: - Cualquier parámetro de interés resulta de realizar alguna “operación” sobre la población. - El estimador se construye realizando una “operación” paralela sobre la muestra.

Ejemplos: PARÁMETRO ESTIMADOR

media poblacional

n

i in XX1

1 media muestral varianza poblacional

n

i in XXS1

2122 )( varianza muestral p = proporción poblacional p = proporción muestral

mediana poblacional Me mediana muestral

Valentín
Resaltado
Valentín
Resaltado
Valentín
Resaltado
Valentín
Resaltado
Valentín
Resaltado
Valentín
Resaltado
Valentín
Resaltado
Valentín
Resaltado
Valentín
Resaltado
Valentín
Resaltado
Valentín
Resaltado
Valentín
Resaltado
Valentín
Resaltado
Valentín
Resaltado
Valentín
Resaltado
Valentín
Resaltado
Valentín
Resaltado
Page 7: TEMA 10.- INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALvalentin/ging/materiales_web/Tema10-11_resaltado.pdf · de la estadÍstica descriptiva a la estadÍstica inferencial ESTADÍSTICA

ESTADÍSTICA GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E

INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL

Tema 10. Introducción a la Estadística Inferencial. 167

0

2

4

6

8

Ley de los Grandes Números

Ley de probabilidad de X n para n grande

.0)(2

2

2 nn

nn

XVarXP

.00 cadaparaXP nn

LEY DE LOS GRANDES NÚMEROS

Es la justificación matemática de la aproximación de la media poblacional por la muestral X :

X variable aleatoria con =EX< y 2=Var(X) <. (población con ley desconocida) X1, ..., Xn, ... realizaciones independientes de X. (muestra aleatoria de la población)

X Xn n ii

n

1

1 satisface 2( ) , ( ) / , /XE X Var X n n , es decir:

X toma valores centrados en el parámetro a estimar (es un estimador insesgado). La dispersión (varianza) de X tiende a 0 al crecer n (hay un “n” en el denominador).

X converge hacia

n

PnX (estimador consistente), en el sentido:

La prueba se basa en la Desigualdad de Chebyshev:

Interpretación probabilística de la LGN: Promediando un número suficientemente grande de observaciones de un experimento, se obtiene un valor que dista de la media poblacional una distancia tan pequeña como queramos, con una probabilidad tan alta como queramos.

valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
Page 8: TEMA 10.- INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALvalentin/ging/materiales_web/Tema10-11_resaltado.pdf · de la estadÍstica descriptiva a la estadÍstica inferencial ESTADÍSTICA

ESTADÍSTICA GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E

INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL

Tema 10. Introducción a la Estadística Inferencial. 168

Aplicación estadística de la Ley de los Grandes Números: La LGN Justifica que el valor concreto observado para la media muestral, xX se pueda utilizar como estimación del parámetro con el siguiente argumento:

Por las propiedades probabilísticas de la v.a. X y la aplicación de la Ley de los Grandes Números sabemos que muy probablemente X tomará un valor próximo a (parámetro desconocido); por lo tanto, una vez realizado el muestreo y obtenido el valor numérico concreto (conocido) que toma la v.a. X ( )X x , está justificado concluir que dicho valor es una aproximación razonable del parámetro

Ley de los Grandes Números para otros estadísticos definidos a través de promedios: El razonamiento anterior se puede hacer exte nsivo de manera no muy complicada a todos los estadísticos muestrales definidos como promedios (varianza muestral, proporciones muestrales, …). La LGN también permite concluir que dichos estadísticos muestrales proporcionan aproximaciones o estimaciones naturales de los correspondientes parámetros poblacionales definidos como promedios de alguna función en la población (varianza, probabilidad de un suceso, …). Glivenko-Cantelli: Fn --> F

Ley de los Grandes Números para otros estadísticos en general: Existen otras LGN que justifican las aproximaci ones de otros parámetros poblacionales que no adoptan directamente la forma de promedios, a partir de los correspondientes estadísticos muestrales que tampoco adoptan la forma de promedios.

Page 9: TEMA 10.- INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALvalentin/ging/materiales_web/Tema10-11_resaltado.pdf · de la estadÍstica descriptiva a la estadÍstica inferencial ESTADÍSTICA

ESTADÍSTICA GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E

INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL

Tema 10. Introducción a la Estadística Inferencial. 169

DISTRIBUCIÓN DE ESTADÍSTICOS Y ESTIMADORES

Obtener estimadores de los parámetros más comunes puede ser “fácil”, pero no es suficiente. La muestra es aleatoria, es decir presenta variabilidad de unas ocasiones a otras. Cualquier estadístico o estimador T es también una v. a. por ser función de la muestra aleatoria. T, como toda v.a., seguirá su propia distribución o ley de probabilidad . El resultado de la estimación en cada ocasión concreta no tiene ningún valor por sí mismo si no

valoramos la precisión de esa estimación (la variabilidad del estimador). Para ello necesitamos conocer la ley de probabilidad del estadístico que estamos empleando. La ley de probabilidad de un estadístico a veces recibe el nombre de distribución muestral. Conocer la distribución de los estadísticos es imprescindible para:

- Conocer sus propiedades. - Poder compararlos entre sí. - Establecer la precisión de las estimaciones. - Valorar los riesgos de error de los procesos inferenciales.

Ejemplo: El editor de una revista profesional de ingeniería desea estimar el salario medio () de los graduados en Ingeniería Industrial en su primer empleo. Por razones de coste y tiempo necesario para el estudio, en lugar de crear una base de datos completa de la última promoción de graduados, decide trabajar con una muestra de 25 graduados, de los que obtiene su salario, y pretende utilizar el valor que obtenga de X como estimación de . El editor quiere saber qué posibilidades tiene de que la estimación obtenida se desvíe a lo sumo en 50 € del valor real de . Para ello necesita conocer la distribución de la media muestral para calcular

5050 XP .

valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
Page 10: TEMA 10.- INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALvalentin/ging/materiales_web/Tema10-11_resaltado.pdf · de la estadÍstica descriptiva a la estadÍstica inferencial ESTADÍSTICA

ESTADÍSTICA GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E

INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL

Tema 10. Introducción a la Estadística Inferencial. 170

Distribución de la Población

0 1 2 30

0,2

0,4

0,6

0,8 Distribución de T

Ilustración del concepto de distribución de un estadístico T estimador de un parámetro

............),...,(,...,:

.........),...,(,...,:2),...,(,...,:1

,1,,1,

2,21,2,21,2

1,11,1,11,1

mnmmnmm

nn

nn

txxTxxmMuestra

txxTxxMuestratxxTxxMuestra

12 ttt m

parámetro de interés de la población

valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
Page 11: TEMA 10.- INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALvalentin/ging/materiales_web/Tema10-11_resaltado.pdf · de la estadÍstica descriptiva a la estadÍstica inferencial ESTADÍSTICA

ESTADÍSTICA GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E

INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL

Tema 10. Introducción a la Estadística Inferencial. 171

0

0.25

0.5

0.75

1Distribución de la población

0

1

2

3

4

Distribución de medias muestrales

n=100

n=25

n=4

DISTRIBUCIÓN DE LA MEDIA MUESTRAL

Estamos interesados en estimar la media poblacional=EX a partir de una m.a.s. X1, X2, ..., Xn. Sabemos que X será utilizado como estimador de La LGN justifica la aproximación. Buscamos la distribución de X para poder además calibrar el error de la aproximación:

Si conocemos que la ley de X es normal, N(,), entonces ),( nNX . (ley exacta)

Si la ley de X no es normal, pero n es grande, entonces ),( nNXaprox

por el TCL. (asintótica)

Entonces, podemos calcular la probabilidad de cometer a lo sumo un error en la estimación:

.21

nnn

nnX

nPXPXP

para diferentes tamaños muestrales n= 4, 25, 100

valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Óvalo
Valentín
Óvalo
Page 12: TEMA 10.- INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALvalentin/ging/materiales_web/Tema10-11_resaltado.pdf · de la estadÍstica descriptiva a la estadÍstica inferencial ESTADÍSTICA

ESTADÍSTICA GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E

INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL

Tema 10. Introducción a la Estadística Inferencial. 172

DISTRIBUCIÓN DE nX EN POBLACIONES NO NORMALES.

ILUSTRACIÓN DEL EFECTO LÍMITE CENTRAL (TCL).

Distribución de promedios de observaciones de una v.a. con distribución exp(1).

n=1

0 1 2 3 4 5 6

n=2

0 1 2 3 4 5 6

n=5

0 1 2 3 4 5 6

n=25

0 1 2 3 4 5 6 Distribución de promedios de observaciones de una v.a. con densidad )2,0(,)1(5.1)( 2 xxxf

0 0,4 0,8 1,2 1,6 2 0 0,4 0,8 1,2 1,6 2 0 0,4 0,8 1,2 1,6 2 0 0,4 0,8 1,2 1,6 2

n=1 n=2 n=5 n=25

Page 13: TEMA 10.- INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALvalentin/ging/materiales_web/Tema10-11_resaltado.pdf · de la estadÍstica descriptiva a la estadÍstica inferencial ESTADÍSTICA

ESTADÍSTICA GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E

INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL

Tema 10. Introducción a la Estadística Inferencial. 173

Ejemplo: El editor de una revista profesional de ingeniería desea estimar el salario medio de los graduados en Ingeniería Industrial en su primer empleo. Se conoce que el Salario es una variable con ley normal y =250 €. Se toma una muestra de n=25 titulados de los que obtiene la información sobre su salario. El editor querría que la estimación (media muestral) obtenida a partir de esta muestra le diera un valor que se desvíe a lo sumo en 50 € respecto al valor real con cierta probabilidad controlada.

a) Hallar la probabilidad de que el error esté efectivamente entre 50 €. b) De qué tamaño tiene que ser la muestra para tener garantizado un error máximo de 50 € con

una probabilidad de 0.95.

Solución:

Utilizamos la distribución de la media muestral: ( , ) (0,1)nn

XX N n Nn

a) 50 5050 50 1 (0,1) 1 (1) ( 1) 0.68.250 25025 25

nXP X P P N

n

b) 50 500.95 50 50 1 2 ( 0.2 ).250 250n

nXP X P n

n n n

9796.12.0025.0)2.0(95.0)2.0(21 nnnn .

valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Óvalo
valentin
Óvalo
Page 14: TEMA 10.- INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALvalentin/ging/materiales_web/Tema10-11_resaltado.pdf · de la estadÍstica descriptiva a la estadÍstica inferencial ESTADÍSTICA

ESTADÍSTICA GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E

INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL

Tema 10. Introducción a la Estadística Inferencial. 174

PROBLEMAS BÁSICOS DE ESTADÍSTICA INFERENCIAL

1.-VARIABLES CUANTITATIVAS (POBLACIONES NORMALES)

1.1.- Estudio de una población normal. (Problemas de una muestra) Población: XN(,), Muestra: X1, ...,Xn X , S

1.1.1.- Inferencias sobre la media . 1.1.2.- Inferencias sobre la desviación típica

1.2.- Comparación de 2 poblaciones normales. (Problemas de dos muestras) Población 1: X1N(1, 1), Muestra 1: 1,11,1 ,..., nXX 11 , SX Población 2: X2N(2, 2), Muestra 2: 2,21,2 ,..., nXX 22 , SX

1.2.1.- Comparación de medias: Inferencias sobre 12 (12=0 12). 1.2.2.- Comparación de varianzas: Inferencias sobre 1

2/22 (1

2/22 =1 1=2).

1.3.- Ajuste a la normal. (Fn, Plots ...)

2.- VARIABLES CUALITATIVAS O ATRIBUTOS (PROPORCIONES)

2.1.- Estudio de una proporción. (Problemas de una muestra) Población: X B(p), Muestra: X1, ...,Xn. Xp ˆ

Inferencias sobre la proporción p.

2.2.- Comparación de 2 proporciones p1p2. (Problemas de dos muestras) Población 1: X1 B(p1), Muestra 1: 1,11,1 ,..., nXX 11ˆ Xp Población 2: X2 B(p2), Muestra 2: 2,21,2 ,..., nXX 22ˆ Xp

Inferencias sobre p1p2 (p1p2=0 p1p2).

valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
Page 15: TEMA 10.- INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALvalentin/ging/materiales_web/Tema10-11_resaltado.pdf · de la estadÍstica descriptiva a la estadÍstica inferencial ESTADÍSTICA

ESTADÍSTICA GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E

INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL

Tema 10. Introducción a la Estadística Inferencial. 175

ESTIMADORES DE PARÁMETROS EN MODELOS NORMALES Y PROPORCIONES

1.-VARIABLES CUANTITATIVAS (POBL. NORMALES)

1.1.- Estudio de una población normal.

1.1.1.- Xn

Xii

n

11 estimador de la media .

1.1.2.-

n

ii XX

nS

1

22 )(1

1, S

nX Xii

n

11

2

1 estimadores de y

Nota: Se divide por n1 para conseguir E(S2)= Se llama cuasivarianza o varianza corregida.A partir de ahora siempre las utilizaremos y las llamaremos varianza y desviación típica.

1.2.- Comparación de poblaciones normales con muestras independientes. 1.2.1.- Comparación de medias:

X X1 2 estimador de 12. 1.2.2.- Comparación de varianzas con muestras independientes:

22

21 SS estimador de 2

221

2.-VARIABLES CUALITATIVAS DICOTOMICAS O ATRIBUTOS (PROPORCIONES)

2.1.- Inferencias sobre una proporción p.

n

iiX

nXp

1

1ˆ (proporción muestral) estimador de p.

2.2.- Comparación de 2 proporciones: p1p2. 2121 ˆˆ XXpp estimador de p1p2.

valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
Page 16: TEMA 10.- INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALvalentin/ging/materiales_web/Tema10-11_resaltado.pdf · de la estadÍstica descriptiva a la estadÍstica inferencial ESTADÍSTICA

ESTADÍSTICA GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E

INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL

Tema 10. Introducción a la Estadística Inferencial. 176

DISTRIBUCIONES EN EL MUESTREO DE POBLACIONES NORMALES

1.- Estudio de una población normal.

Parámetro Estimador Distribución Distribución bis Observaciones

X ),( nNX

Xn

N

/( , )0 1 conocida

XS n

tn

/ 1 desconocida

S2 ( )nS n

12

21

2

2.- Comparación de dos poblaciones normales.

Parámetro Estimador Distribución Distribución bis Observaciones

12 X X1 2

2

22

1

21

2121 ,nn

NXX

X X

n n

N1 2 1 2

12

1

22

2

0 1

( )

( , )

1, 2 conocidas

X X

n n

tsP

n n1 2 1 2

1 2

21 1 1 2

( ) 1=2= desconocida

Sn S n S

n np2 1 1

22 2

2

1 2

1 12

( ) ( )

X X

Sn

Sn

t1 2 1 2

12

1

22

2

( )

12 desconocidas

2

11 2

22

22

1

21

21

22

221

21

nnS

nnS

nSnS

22

21

22

21 SS

SS

Fn n12

12

22

22 1 11 2

,

valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Cuadro de texto
[1]
valentin
Cuadro de texto
[3]
valentin
Cuadro de texto
[2]
valentin
Cuadro de texto
[4]
valentin
Cuadro de texto
[5]
valentin
Cuadro de texto
[6]
valentin
Cuadro de texto
[7]
valentin
Cuadro de texto
1M
valentin
Cuadro de texto
2M
valentin
Cuadro de texto
[7]
valentin
Cuadro de texto
útil cuando...
Page 17: TEMA 10.- INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALvalentin/ging/materiales_web/Tema10-11_resaltado.pdf · de la estadÍstica descriptiva a la estadÍstica inferencial ESTADÍSTICA

ESTADÍSTICA GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E

INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL

Tema 10. Introducción a la Estadística Inferencial. 177

Distribución Chi-Cuadrado

G. L.51025

0 5 10 15 20 25 30 35 40 45 500

0,04

0,08

0,12

0,16

dens

idad

Distribución Chi-Cuadrado

0

0,02

0,04

0,06

0,08

0,1

dens

idad

2n

Distribución 2de Pearson (Chi cuadrado)

Se obtiene de sumar cuadrados de variables normales independientes. 2

1

21 )1,0(.,....,... n

n

iiin XNXdiiavXX

: Distribución chi-cuadrado con n grados de libertad.

Aplicación a la estimación de : 212

2

1)1(),(.,....,...

nin

SnNXdiiavXX

Está tabulada. En las tablas encontramos para distintos valores de n y 2,

22, nnn P

2,n

valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Óvalo
Page 18: TEMA 10.- INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALvalentin/ging/materiales_web/Tema10-11_resaltado.pdf · de la estadÍstica descriptiva a la estadÍstica inferencial ESTADÍSTICA

ESTADÍSTICA GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E

INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL

Tema 10. Introducción a la Estadística Inferencial. 178

Distribución t de Student

G. L.28200

-5 -4 -3 -2 -1 0 1 2 3 4 50

0,1

0,2

0,3

0,4

dens

idad

Distribución t de Student

0

0,1

0,2

0,3

0,4

dens

idad

Distribución t de Student.

Se obtiene del cociente n

nn

tN

21

)1,0(

: Distribución t de Student con n grados de libertad.

(siendo el numerador y el denominador independientes) Aparece al estandarizar X cuando sustituimos desconocido por su estimador S (studentización).

22

1 1 12

( -1),... . . . . ., ( , ) ( , ) (0,1) , .n i n nX n S XX X v a i i d X N X N n ó N indeps t

n S n

Está tabulada. En las tablas encontramos para distintos valores de n y ,, nnn ttPt

Para obtener valores en la cola izquierda se usa la simetría: ,1, nn tt . Para valores de n grande: )1,0(Nt

,nt

nt

valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Óvalo
Page 19: TEMA 10.- INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALvalentin/ging/materiales_web/Tema10-11_resaltado.pdf · de la estadÍstica descriptiva a la estadÍstica inferencial ESTADÍSTICA

ESTADÍSTICA GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E

INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL

Tema 10. Introducción a la Estadística Inferencial. 179

g.l. Num, g.l. Denom5,55,2525,525,25

Distribucíón F de Fisher-Snedecor

0 1 2 3 4 50

0,2

0,4

0,6

0,8

1

1,2

dens

idad

Distribucíón F de Fisher-Snedecor

0

0,2

0,4

0,6

0,8

dens

idad

Distribución F de Fisher-Snedecor

Se obtiene del cociente 21

22

11,21

21

nnnn

nn F

: Distribución F con n1 y n2 grados de libertad.

(siendo el numerador y el denominador independientes)

Aplicación a la estimación de 22

21 : 1,12

222

22

22,2,21,2

11,1,11,1

21

11

2

1

),,(.,....,...),,(.....,...

nnin

in FSS

NXdiiavXXNXdiiavXX

Está tabulada. Para distintos valores de n1, n2 y encontramos ,,,,, 212121 nnnnnn FFPF .

Para obtener valores en la cola izquierda se usa: ,,1,, 12211 nnnn FF .

,, 21 nnF

21,nnF

valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Óvalo
Page 20: TEMA 10.- INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALvalentin/ging/materiales_web/Tema10-11_resaltado.pdf · de la estadÍstica descriptiva a la estadÍstica inferencial ESTADÍSTICA

ESTADÍSTICA GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E

INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL

Tema 10. Introducción a la Estadística Inferencial. 180

Ejemplo: Dos modelos de pilas, M1 y M2, están diseñados para tener el mismo voltaje 1.5 V. El Voltaje de una pila elegida al azar es una variable aleatoria con ley normal con =0.01 V para ambos modelos. Para estudiar si las medias 1 y 2 son también iguales, se toman dos muestras de 50 pilas de cada modelo y se mide su voltaje. a) Si las medias son iguales, 12, calcula la probabilidad de que la diferencia entre las medias

muestrales sea mayor de 0.01V. b) Si 12=0.1V, calcula la probabilidad de que las medias muestrales difieran en menos de 0.05V. c) ¿Qué tamaño muestral (n=n1=n2) habría sido suficiente en a) para que la probabilidad calculada

sea menor que 0.05?

Solución:

Conocemos la distribución de la diferencia de medias:

2

22

1

21

2121 ,nn

NXX

a) 1 2 1 21 2 2 2

1 2

1 2

( ) 0.01 0 0.010.01 2 2 5 0.0.0001 0.0001 20.01

50 50 50

X XP X X P

n n

b) .075-25

500001.0

500001.0

1.005.0)(

500001.0

500001.0

1.005.005.005.005.0

2

22

1

21

21212121

nn

XXPXXPXXP

c) 1 20.010.05 0.01 2 1.96 8

0.01 2 2nP X X n

n

.

valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Cuadro de texto
[4]
valentin
Cuadro de texto
[4]
valentin
Óvalo
valentin
Óvalo
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
Page 21: TEMA 10.- INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALvalentin/ging/materiales_web/Tema10-11_resaltado.pdf · de la estadÍstica descriptiva a la estadÍstica inferencial ESTADÍSTICA

ESTADÍSTICA GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E

INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL

Tema 10. Introducción a la Estadística Inferencial. 181

DISTRIBUCIONES ASINTOTICAS (aproximaciones para MUESTRAS GRANDES) MUESTREO DE PROPORCIONES Parámetro Estimador Distribución límite Distribución límite bis Observaciones

p p

npppNp

aprox )1(,ˆ

( )~ ( , )

p pp p

n

N

1

0 1 Sólo para Muestra grande Se basa en TCL

p1p2 p p1 2

2

22

1

112121

)1()1(,ˆˆ

npp

npp

ppNppaprox

( )( ) ( )

~ ( , )p p p p

p pn

p pn

N1 2 1 2

1 1

1

2 2

2

1 10 1

Sólo para

Muestras grandes Se basa en TCL

MUESTREO DE VARIABLES CUANTITATIVAS CUALESQUIERA

Parámetro Estimador Distribución límite Distribución límite bis Observaciones

X ),( nNXaprox

)1,0(~ NnS

X

Sólo para Muestra grande Se basa en TCL

12 X X1 2

2

22

1

21

2121 ,nn

NXXaprox

)1,0(~

2

22

1

21

2121 N

nS

nS

XX

Sólo para Muestra grande Se basa en TCL

valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Cuadro de texto
[8]
valentin
Cuadro de texto
[9]
valentin
Cuadro de texto
[11]
valentin
Cuadro de texto
[10]
valentin
Cuadro de texto
1M
valentin
Cuadro de texto
1M
valentin
Cuadro de texto
2M
valentin
Cuadro de texto
2M
Page 22: TEMA 10.- INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALvalentin/ging/materiales_web/Tema10-11_resaltado.pdf · de la estadÍstica descriptiva a la estadÍstica inferencial ESTADÍSTICA

ESTADÍSTICA GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E

INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL

Tema 10. Introducción a la Estadística Inferencial. 182

Ejemplo: Un proveedor suministra envíos que deberían aceptarse sólo si contienen a lo sumo un 10% de productos defectuosos. Un inspector de calidad acepta envíos siempre que una muestra de tamaño 100 contenga a lo sumo 10 productos defectuosos (10%) y los rechaza en otro caso. a) Si el proceso tiene una tasa de defectos del 10%, hallar la probabilidad de que la proporción muestral se desvíe de este valor en más de 2 puntos porcentuales. b) ¿Hallar la probabilidad de que acepte un envío si la tasa de defectuosos es de un 12%? c) ¿Hallar la probabilidad de que rechace un envío en el que sólo un 8% son defectuosos?

Solución:

Utilizamos la distribución límite

npppNp

aprox )1(,ˆ que nos proporciona el TCL.

a) .593.01)83.0(2

100)1.01(1.0

10.0125.0

100)1.01(1.0

1.0ˆ

100)1.01(1.0

10.0075.012.0ˆ08.002.01,0ˆ

pPpPpP

b) .323.046.0

100)12.01(12.0

12.0105.0

100)12.01(12.0

12.010.0

100)12.01(12.0

12.0ˆ1.0ˆ

pPpP

c)

.18.092.01

10092.0*08.008.0105.01

10092.0*08.008.010.0

10008.0108.0

08.0ˆ1.0ˆ

pPpP

Nota: En todos los casos se ha utilizado la corrección por continuidad.

valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Cuadro de texto
[8]
valentin
Resaltado
valentin
Resaltado
valentin
Óvalo
valentin
Óvalo
valentin
Óvalo
valentin
Resaltado
Page 23: TEMA 10.- INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALvalentin/ging/materiales_web/Tema10-11_resaltado.pdf · de la estadÍstica descriptiva a la estadÍstica inferencial ESTADÍSTICA

ESTADÍSTICA GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E

INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL

Tema 11. Intervalos de Confianza. 183

g.l. Num, g.l. Denom5,55,2525,525,25

Distribucíón F de Fisher-Snedecor

0 1 2 3 4 50

0,2

0,4

0,6

0,8

1

1,2

dens

idad

TEMA 11.- INTERVALOS DE CONFIANZA

- Estimación puntual y por intervalos de confianza. - Intervalos y cotas de confianza. - Interpretación frecuentista de los I.C. - Método general. - Aplicaciones a modelos normales. - Aplicaciones a modelos de proporciones. - Elección del tamaño muestral.

Ronald A. Fisher

Page 24: TEMA 10.- INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALvalentin/ging/materiales_web/Tema10-11_resaltado.pdf · de la estadÍstica descriptiva a la estadÍstica inferencial ESTADÍSTICA

ESTADÍSTICA GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E

INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL

Tema 11. Intervalos de Confianza. 184

ESTIMACIÓN PUNTUAL Y POR INTERVALOS DE CONFIANZA

Obtener una estimación (puntual) de un parámetro es insuficiente:

No calibramos el error que podemos estar cometiendo. Si obtenemos otra estimación basada en otra muestra, el valor será diferente: ¿Cuál es mejor? La probabilidad de “acertar” en una estimación puntual con un estimador es frecuentemente 0.

Siempre que la distribución del estimador sea continua se tiene 0)ˆ()( PpuntualestimaciónlaconAcertarP

Es mucho más informativo un intervalo de valores que cubra el verdadero valor del parámetro con una cierta garantía.

Unas veces tendremos éxito (el intervalo contendrá al verdadero valor del parámetro a estimar, que es un valor fijo pero desconocido) y otras no.

Construiremos este intervalo a partir de la muestra, y sus extremos serán por tanto aleatorios.

Utilizamos un procedimiento de construcción que asegur e una alta probabilidad de éxito; es decir, de que el intervalo construido cubra realmente al valor del parámetro desconocido.

Llamamos confianza o garantía a esa probabilidad de éxito y suele expresarse en %.

Puede lograrse tan cercana al 100% como requiera cada situación, pero a costa de aumentar la amplitud del intervalo y perdiendo por lo tanto precisión.

valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
Page 25: TEMA 10.- INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALvalentin/ging/materiales_web/Tema10-11_resaltado.pdf · de la estadÍstica descriptiva a la estadÍstica inferencial ESTADÍSTICA

ESTADÍSTICA GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E

INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL

Tema 11. Intervalos de Confianza. 185

La confianza o garantía de éxito la fija el investigador: 1- ó bien 100(1-a)%

Habitualmente se usan valores altos, del 95% ó 99%.

El riesgo de error es el valor complementario (100%); queda también fijado Será pequeño. Habitualmente del 5% ó 1%.

Ejemplo: Para estimar un parámetro de una variable crítica para el funcionamiento de una central nuclear nos interesará que sea muy pequeño, =0.001 por ejemplo. En otras ocasiones, como por ejemplo la estimación de un parámetro que afecte a la longitud de las piezas producidas por una máquina, donde las consecuencias de un posible error no serían tan graves, se podrá admitir un mayor riesgo de error, por ejemplo =0.05. Estos intervalos de valores se obtienen a partir de la distribución muestral del estimador usado y se llamarán Intervalos de Confianza. De forma análoga se construyen cotas de confianza (inferiores o superiores)

valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
Page 26: TEMA 10.- INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALvalentin/ging/materiales_web/Tema10-11_resaltado.pdf · de la estadÍstica descriptiva a la estadÍstica inferencial ESTADÍSTICA

ESTADÍSTICA GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E

INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL

Tema 11. Intervalos de Confianza. 186

INTERVALOS Y COTAS DE CONFIANZA:

X variable aleatoria de interés definida sobre la población. parámetro de interés desconocido de la población (de la distribución de la variable X). X1, …, Xn muestra aleatoria simple representativa de la población. (0,1) fijado de antemano. Intervalo de confianza del 100(1 para Es un intervalo formado por dos estadísticos L y U, ),...,(),,...,( 11 nn XXUUXXLL , tal que

1),...,(),...,( 11 nn XXUXXLP . Cota superior de confianza del 100(1 para Viene definida por un estadístico ),...,( 1 nXXUU , tal que 1),...,( 1 nXXUP .

Ejemplo: Inspección de calidad, X=1 (D) ó 0 ( D ). Queremos obtener una cota superior para p=P(D) Cota inferior de confianza del 100(1 para Viene definida por un estadístico ),...,( 1 nXXLL , tal que 1),...,( 1 nXXLP . Ejemplo: X= Rendimiento de un proceso químico. Queremos obtener una cota inferior para Los intervalos y cotas de confianza, además de depender de la muestra, también dependen de la confianza 1- con la que queremos trabajar.

valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Rectángulo
Page 27: TEMA 10.- INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALvalentin/ging/materiales_web/Tema10-11_resaltado.pdf · de la estadÍstica descriptiva a la estadÍstica inferencial ESTADÍSTICA

ESTADÍSTICA GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E

INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL

Tema 11. Intervalos de Confianza. 187

INTERPRETACIÓN FRECUENTISTA DE LOS INTERVALOS DE CONFIANZA Los extremos de los intervalos y cotas de confianza son aleatorios por ser función de la muestra. Dada una muestra concreta ),...,(),...,( 11 nn xxXX (datos), calcularemos los valores de L y U

uxxUlxxL nn ),...,(,),...,( 11 y concluiremos que

1),( confianzaconulóul .

¿Por qué hablamos de confianza y no de probabilidad?

Una vez calculados los extremos L=l y U=u a partir de los datos, no hablaremos de probabilidad. Decir 1),( ulP no tiene sentido ya que el parámetro no es una v. a. sino una cantidad desconocida pero fija. Entonces, calculado el intervalo (l,u), puede ocurrir: Exito: Hemos acertado y el intervalo contiene al parámetro, o bien Fracaso: Hemos fallado y no lo contiene.

“Confiamos” en haber acertado ya que (L,U) satisface 1),...,(),...,( 11 nn XXUXXLP (alto). Si se repitiera muchas veces el muestreo y el cálculo del intervalo (l,u), en promedio una proporción 1 (100(1)%) de las veces el I.C. contendría al parámetro La proporción restante fallaría.

Esto lo indicamos diciendo que el I.C. tiene una confianza (o garantía) 1. Esta interpretación frecuentista de los IC sirve también para las cotas de confianza.

valentin
Resaltado
Page 28: TEMA 10.- INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALvalentin/ging/materiales_web/Tema10-11_resaltado.pdf · de la estadÍstica descriptiva a la estadÍstica inferencial ESTADÍSTICA

ESTADÍSTICA GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E

INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL

Tema 11. Intervalos de Confianza. 188

Distribución de la Población

0 1 2 30

0,2

0,4

0,6

0,8

............),(,...,:

.........),(,...,:2),(,...,:1

,1,

222,21,2

111,11,1

mmmnmm

n

n

ulIxxmMuestra

ulIxxMuestraulIxxMuestra

0 20 40 60 80 100

Ilustración de la interpretación frecuentista de los Intervalos de Confianza para un parámetro

Nota: Las muestras provienen de un experimento de s imulación en el que se han construido I.C. al 95%. Podemos ver que en los 100 primeros tenemos 7 fallos y 93 aciertos. Si seguimos tomando muestras, los porcentajes de aciertos y fallos se estabilizarán en torno a 95% y 5% respectivamente.

parámetro de interés de la población

Page 29: TEMA 10.- INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALvalentin/ging/materiales_web/Tema10-11_resaltado.pdf · de la estadÍstica descriptiva a la estadÍstica inferencial ESTADÍSTICA

ESTADÍSTICA GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E

INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL

Tema 11. Intervalos de Confianza. 189

CONFIANZA Y AMPLITUD (PRECISIÓN) DE UN I.C.

La utilidad práctica de un intervalo viene dada por dos medidas: 1. CONFIANZA: Mide la seguridad o garantía del procedimiento de construcción del intervalo. 2. AMPLITUD: Mide (inversamente) la precisión de la estimación realizada.

A la hora de valorar un I.C. hay que tener en cuenta que nos interesa: Que la confianza sea lo más alta posible. (Por ejemplo, preferiríamos 95% a 90%) Que la amplitud sea lo menor posible. (P. ej., preferiríamos 005,3995,2 a 05,395,2 )

Ambos criterios entran en conflicto: Confianza y amplitud no se pueden controlar a la vez para un tamaño de muestra dado. Una

característica de los I.C. es que si aumenta la confianza aumenta la amplitud (disminuye la precisión).

Se consigue una confianza y amplitud prefijadas eligiendo el tamaño muestral adecuado.

A la amplitud se le suele llamar también “error máximo de estimación”

MÉTODO PARA CONSTRUIR INTERVALOS Y COTAS DE CONFIANZA El método general sigue los siguientes pasos:

1. Elegir un buen estimador del parámetro . 2. Obtener la distribución del estimador . 3. Delimitar una región de probabilidad bajo esta distribución, 4. Despejar .

valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
Page 30: TEMA 10.- INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALvalentin/ging/materiales_web/Tema10-11_resaltado.pdf · de la estadÍstica descriptiva a la estadÍstica inferencial ESTADÍSTICA

ESTADÍSTICA GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E

INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL

Tema 11. Intervalos de Confianza. 190

Aplicación a la obtención de un I.C. para en el modelo N() con conocida:

1. Estimador: X .

2. Distribución del estimador:

).1,0(),( Nn

XnNX

3. Región de probabilidad bajo la distribución muestral:

4. Despejar el parámetro :

nzX

nzX

2/2/ o bien / 2X zn con confianza 1-.

.12/2/

z

nXzP

0

0,1

0,2

0,3

0,4

dens

idad

zz

valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Óvalo
valentin
Óvalo
valentin
Óvalo
valentin
Cuadro de texto
estimador puntual
valentin
Cuadro de texto
E (error máximo de estimación)
valentin
Cuadro de texto
+-
valentin
Línea
valentin
Línea
valentin
Cuadro de texto
[1]
Page 31: TEMA 10.- INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALvalentin/ging/materiales_web/Tema10-11_resaltado.pdf · de la estadÍstica descriptiva a la estadÍstica inferencial ESTADÍSTICA

ESTADÍSTICA GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E

INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL

Tema 11. Intervalos de Confianza. 191

Para obtener cotas de confianza dejamos todo el riesgo de error en una cola:

Cota inferior de confianza : nzXz

nXP

1

Cota superior de confianza : nzXz

nXP

1

Conflicto Confianza-Amplitud: Si aumentamos la confianza 1-, aumenta z/2 y aumenta la amplitud o error máximo E

nzE /2/ .

Se puede diseñar el tamaño muestral para conseguir la confianza y el error deseados:

22/ )/( Ezn .

0

0,1

0,2

0,3

0,4

dens

idad

z

0

0,1

0,2

0,3

0,4

dens

idad

z

valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
Page 32: TEMA 10.- INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALvalentin/ging/materiales_web/Tema10-11_resaltado.pdf · de la estadÍstica descriptiva a la estadÍstica inferencial ESTADÍSTICA

ESTADÍSTICA GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E

INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL

Tema 11. Intervalos de Confianza. 192

Ejemplo: El editor de una revista profesional de ingeniería desea estimar el salario medio de los graduados en Ingeniería Industrial en su primer empleo. Se conoce que el Salario es una variable con ley normal y =250 €. Se toma una muestra de n=25 titulados de los que obtiene la información sobre su salario, resultando €57.1501X .

a) Obtener un I.C. al 95% para . b) Obtener una cota inferior de confianza al 99% para . c) Qué tamaño muestra se necesita en a) para que el error máximo sea de 50€.

Solución:

a) nzX

nzX

2/2/

2525096.157.1501

2525096.157.1501 , o bien

2525096.157.1501 ,

57.159957.1403 o bien €9857.1501 con una confianza del 95%.

b) nzX

€77,138425

25033.257.1501 con una confianza del 99%.

c) .97.04.96)50/25096.1()/( 222/ nEzn

valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Cuadro de texto
[1]
Page 33: TEMA 10.- INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALvalentin/ging/materiales_web/Tema10-11_resaltado.pdf · de la estadÍstica descriptiva a la estadÍstica inferencial ESTADÍSTICA

ESTADÍSTICA GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E

INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL

Tema 11. Intervalos de Confianza. 193

Aplicación a la obtención de un I.C. para en el modelo N():

1. Estimador: 22ˆ S .

2. Distribución del estimador: ( )n

S n

12

21

2

3. Región de probabilidad bajo la distribución muestral:

4. Despejar el parámetro 2 :

22

21,1

222

2,1

)1()1( SnSn

nn

con confianza 1-.

.1)1( 2,12

22

1,1 22

nn

SnP

0

0,02

0,04

0,06

0,08

0,1

dens

idad

Distribución2

1n

22/1,1 n 2

2/,1 n

valentin
Resaltado
valentin
Resaltado
valentin
Óvalo
valentin
Óvalo
valentin
Cuadro de texto
[3]
Page 34: TEMA 10.- INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALvalentin/ging/materiales_web/Tema10-11_resaltado.pdf · de la estadÍstica descriptiva a la estadÍstica inferencial ESTADÍSTICA

ESTADÍSTICA GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E

INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL

Tema 11. Intervalos de Confianza. 194

Para obtener cotas de confianza dejamos todo el riesgo de error en una cola:

Cota inferior de confianza : 22

,1

22,12

2 )1(1)1( SnSnPn

n

Cota superior de confianza : 22

1,1

221,12

2 )1(1)1( SnSnPn

n

Conflicto Confianza-Amplitud: Si aumentamos la confianza 1-, aumenta 2

n-1,/2 y disminuye 2n-1,/2 y por tanto aumenta la

amplitud. En este caso no existe una fórmula explícita para el tamaño muestral.

Distribución Chi-Cuadrado

0

0,02

0,04

0,06

0,08

0,1

dens

idad

21n

2,1 n

Distribución Chi-Cuadrado

0

0,02

0,04

0,06

0,08

0,1

dens

idad

21n

21,1 n

valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
Page 35: TEMA 10.- INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALvalentin/ging/materiales_web/Tema10-11_resaltado.pdf · de la estadÍstica descriptiva a la estadÍstica inferencial ESTADÍSTICA

ESTADÍSTICA GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E

INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL

Tema 11. Intervalos de Confianza. 195

Ejemplo: Se investiga el diámetro de barras de acero fabricadas por máquinas de extrudado, que sigue una distribución normal. Aunque el proceso funciona bien en cuanto al valor medio, se han observado ciertas anomalías que llevan a pensar que tal vez hay algún desajuste que está haciendo que la fabricación tenga mayor variabilidad de la debida con lo que un alto porcentaje del producto puede resultar inservible. El parámetro de interés a controlar en este caso es la varianza. En concreto se quiere que la varianza del proceso sea menor que 0 5. cm2 . Se dispone de una muestra de tamaño n = 18 tal que 22 cm 34.0y cm 63.8 SX . Con estos datos construimos una cota superior de confianza del 95% obteniendo para 2:

Solución: .66.0

67.834.017;95.017;11 2

295.0,17

22

21,1

22

SCSnCn

Conclusión: los datos no soportan que la varianza cumpla las especificaciones que nosotros habíamos establecido para ese proceso.

0 10 20 30 40 500

0,02

0,04

0,06

0,08

95%5%

67.8295.0,17

distribución 217

valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Óvalo
valentin
Óvalo
valentin
Óvalo
valentin
Resaltado
valentin
Cuadro de texto
[3]
Page 36: TEMA 10.- INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALvalentin/ging/materiales_web/Tema10-11_resaltado.pdf · de la estadÍstica descriptiva a la estadÍstica inferencial ESTADÍSTICA

ESTADÍSTICA GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E

INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL

Tema 11. Intervalos de Confianza. 196

INTERVALOS DE CONFIANZA PARA POBLACIONES NORMALES

1.- I.C. para los parámetros de una población normal

PROBLEMA ESTIMADOR DISTRIBUCION INTERVALO DE CONFIANZA 100(1-)% Estimación de conocida X

Xn

N

/( , )0 1 n

zX 2

Estimación de desconocida X

XS n

tn

/ 1 n

StX n 1,2

Estimación de

S ( )n

S n

12

21

2

22

1,21

222

1,2

)1()1( SnSn

nn

2.- Comparación de dos poblaciones normales

PROBLEMA ESTIMADOR DISTRIBUCION INTERVALO DE CONFIANZA 100(1- )%

Comparación de medias y conocidas

21 XX X X

n n

N1 2 1 2

12

1

22

2

0 1

( )

( , )

2

22

1

21

22121 nnzXX

Comparación de medias =desconocidas

21 XX X X

n n

tsP

n n1 2 1 2

1 2

21 1 1 2

( ) 21

2,2212111

21 nnStXX pnn

Comparación de medias desconocidas

21 XX X X

Sn

Sn

t1 2 1 2

12

1

22

2

( )

2

22

1

21

,22121 nS

nStXX

Comparación de varianzas

/

22

21 SS

SS

Fn n12

12

22

22 1 11 2

, 2,1,122

21

22

21

22

21

2,1,112

21,,

1

nnnn

FSS

SS

F Sp definido en la pg. 176

valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Cuadro de texto
[1]
valentin
Cuadro de texto
[2]
valentin
Cuadro de texto
[3]
valentin
Cuadro de texto
[4]
valentin
Cuadro de texto
[5]
valentin
Cuadro de texto
[6]
valentin
Cuadro de texto
[7]
Page 37: TEMA 10.- INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALvalentin/ging/materiales_web/Tema10-11_resaltado.pdf · de la estadÍstica descriptiva a la estadÍstica inferencial ESTADÍSTICA

ESTADÍSTICA GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E

INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL

Tema 11. Intervalos de Confianza. 197

Ejemplo: Una empresa está considerando la fabricación de un nuevo material sobre la base de ciertos cálculos teóricos de su departamento de desarrollo. La propiedad clave del material es su conductividad térmica, que interesa que sea lo menor posible y que el departamento de desarrollo juzga como muy inferior a la del material actualmente utilizado. Para asegurarse, la empresa decide fabricar un total de n=10 unidades del nuevo material. Se quiere obtener una cota superior de confianza para el valor medio de la conductividad térmica de ese material y la empresa además juzga asumible un riesgo =0.05. Supóngase normalidad. Los resultados muestrales obtenidos son

X 44 21. B tu / hr - ft- F0 y Fft--Btu/hr 1.0 0S .

Solución:

La cota superior de confianza del 100(1-)% para se deduce de 1, 1nSP X tn

,

y en nuestro caso particular se tiene 268.44101.0833.121.4405.0,9

nStX

-5 00

0.1

0.2

0.3

0.4

t9,0.05=1.833

P(t > t9,0.05) = 0.05

Distribución tcon 9 g.l.

valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Cuadro de texto
[2]
Page 38: TEMA 10.- INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALvalentin/ging/materiales_web/Tema10-11_resaltado.pdf · de la estadÍstica descriptiva a la estadÍstica inferencial ESTADÍSTICA

ESTADÍSTICA GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E

INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL

Tema 11. Intervalos de Confianza. 198

Ejemplo: A la hora de instalar una nueva factoría de envases se presenta la elección entre dos sistemas de cerrado de envases que se están empleando en fábricas ya instaladas. Se está interesado en la resistencia de esos envases en función del tipo de cerrado de los mismos. Se decide estimar la diferencia entre las resistencias medias mediante un intervalo de confianza del 95%. Para ello se solicitan datos a las factorías que tienen instalados esos sistemas y de la primera responden enviando datos relativos a una muestra de tamaño n1 8 con X1 25 38 . . De la segunda nos llegan datos de una muestra con n2 12 29 y X2 .46 . Además de pruebas anteriores con esos tipos de cerrado se sabe que los modelos son normales y que 1

2 1 21 1 98 . . y 22 .

2

22

1

21

22121 nnzXX

Teniendo en cuenta que X X1 2 = 25.38-29.46 = -4.08 y z z2 0 025 1 96 . . , obtenemos:

978.2182.512

98.18

21.196.108.41298.1

821.196.108.4

21

21

En conclusión, como 0 IC las medias se pueden considerar diferentes con confianza 0.95.

El Error máximo de la estimación es de Emáx=1.102. Si quisiéramos que fuera como máximo de 0.2 unidades entonces deberíamos pedir a cada factoría un tamaño muestral igual a

n

zEmax

2

212

22

2

2

2

1 960 2

1 21 1 98 306 36..

. . .

es decir 307 elementos por población.

valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Cuadro de texto
[4]
Page 39: TEMA 10.- INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALvalentin/ging/materiales_web/Tema10-11_resaltado.pdf · de la estadÍstica descriptiva a la estadÍstica inferencial ESTADÍSTICA

ESTADÍSTICA GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E

INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL

Tema 11. Intervalos de Confianza. 199

Ejemplo: Se tienen dos tipos de lámparas A y B y se desea estudiar cuál de los dos tipos tarda más tiempo en fundirse. Las duraciones se ajustan al modelo normal. Se toma una muestra de 8 lámparas de cada tipo y se obtienen los siguientes datos medidos en días:

86.5,4.35 :B Tipo65.6,7.37 :A Tipo 2211 SXSX .

Se pide valorar la existencia de diferencias en las duraciones medias a partir de un intervalo de confianza del 90% para la diferencia de medias suponiendo varianzas iguales.

Solución:

La expresión del I.C. es: 1 21 2 1 2 2, 21 2

1 1n n pX X t S

n n

X X1 2 37 7 35 2 3 . .4 . ;

28.3914

34.34722.4472

11

21

222

2112

nn

SnSnS p ; t14 0 05 1 761, . .

Sustituyendo los valores en la expresión general obtenemos:

.82.722.34127.6761.13.2

4127.6761.13.2 2121

-5 00

0.1

0.2

0.3

0.4

t14,0.05 = 1.761

0.90.05 0.05

Distribución tcon 14 gradosde libertad

Conclusión: 0 IC, luego con un 90% de confianza no existen diferencias.

valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Cuadro de texto
[5]
Page 40: TEMA 10.- INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALvalentin/ging/materiales_web/Tema10-11_resaltado.pdf · de la estadÍstica descriptiva a la estadÍstica inferencial ESTADÍSTICA

ESTADÍSTICA GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E

INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL

Tema 11. Intervalos de Confianza. 200

Ejemplo: En el ejemplo sobre los dos tipos de lámparas para el que realizamos una comparación de medias en poblaciones normales con varianzas desconocidas pero iguales, construir un intervalo de confianza del 95% para comparar las varianzas y avalar la suposición realizada. (Si el valor 1 pertenece a ese intervalo entonces nuestra suposición de varianzas iguales tendrá argumentos consistentes con que sostenerse. El valor 1 corresponde precisamente a 1 2 ).

Solución:

Tenemos dos muestras de tamaño 8, de modo que 86.5y 65.6 21 SS y el I.C. será:

.42.625.0

95.034.3422.4499.4

34.3422.44

99.4195.0

34.3422.44

34.3422.44195.0

22

21

22

21

025.0,7,722

21

025.0,7,722

21

025.0,7,722

21

22

21

975.0,7,7

CF

FC

SSF

SSFC

0 1 2 3 4 5 60

0.1

0.2

0.3

0.4

0.5

0.6

0.7

F 7,7,0.025 = 4.99

F7,7,0.975 = 0.2

C=0.95

Distribución F7,7 Conclusión: 1 IC, luego se pueden considerar las varianzas iguales.

valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Cuadro de texto
[7]
Page 41: TEMA 10.- INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALvalentin/ging/materiales_web/Tema10-11_resaltado.pdf · de la estadÍstica descriptiva a la estadÍstica inferencial ESTADÍSTICA

ESTADÍSTICA GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E

INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL

Tema 11. Intervalos de Confianza. 201

Aplicación del método general a la obtención de un I.C. para una proporción p:

1. Estimador: Xp ˆ .

2. Distribución del estimador: ).1,0(~/)1(

ˆ1(,~ˆ Nnpp

ppn

pppNp

3. Región de probabilidad bajo esta distribución:

4. Despejar p: n

ppzpp )1(ˆ 2/

. El intervalo no es operativo porque los extremos dependen de p:

Estimamos p(1-p): nppzpp )ˆ1(ˆˆ 2/

con confianza aprox. 1-.

Acotamos p(1-p)1/4: nzpp

41ˆ 2/ con confianza al menos 1-. (I.C. conservador)

.1~/)1(

ˆ2/2/

z

nppppzP

0

0,1

0,2

0,3

0,4

dens

idad

zz

valentin
Resaltado
valentin
Óvalo
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Cuadro de texto
[8]
Page 42: TEMA 10.- INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALvalentin/ging/materiales_web/Tema10-11_resaltado.pdf · de la estadÍstica descriptiva a la estadÍstica inferencial ESTADÍSTICA

ESTADÍSTICA GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E

INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL

Tema 11. Intervalos de Confianza. 202

Para obtener cotas de confianza dejamos todo el riesgo de error en una cola:

Cota inferior de confianza : nppzXpz

nppppP )ˆ1(ˆ

1~)1(

ˆ

Cota superior de confianza : nppzXpz

nppppP )ˆ1(ˆ

1~)1(

ˆ

Conflicto Confianza-Amplitud: Si aumentamos la confianza 1-, aumenta z/2 y aumenta el error máximo

nppzE )1(

2/

.

El tamaño muestral para conseguir la confianza y el error deseados sería:

2

22/ )1(

Eppz

n

.

Si disponemos de un estimador piloto 0p , entonces 200

22/ )ˆ1(ˆ

Eppz

n

Si no disponemos de información sobre p, entonces 2

22/

4Ez

n I.C. conservador, utilizando p(1-p)1/4 (caso más desfavorable p=q=1/2). Poco aconsejable para p y q extremos. Por ejemplo, si p=0.01, pq=0.0099<<1/4.

valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
Page 43: TEMA 10.- INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALvalentin/ging/materiales_web/Tema10-11_resaltado.pdf · de la estadÍstica descriptiva a la estadÍstica inferencial ESTADÍSTICA

ESTADÍSTICA GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E

INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL

Tema 11. Intervalos de Confianza. 203

INTERVALOS DE CONFIANZA BASADOS EN MUESTRAS GRANDES

INTERVALOS DE CONFIANZA PARA PROPORCIONES

PROBLEMA ESTIMADOR DISTRIBUCIÓN MUESTRAL INTERVALO DE CONFIANZA 100(1-)%

Estimación de una proporción p.

p

( )~ ( , )

p pp p

n

N

1

0 1 n

ppzpp )ˆ1(ˆˆ 2

Comparación de proporciones p1p2.

p p1 2 ( )( ) ( )

~ ( , )p p p p

p pn

p pn

N1 2 1 2

1 1

1

2 2

2

1 10 1

2

22

1

1122121

)ˆ1(ˆ)ˆ1(ˆˆˆ

npp

npp

zpppp

INTERVALOS DE CONFIANZA PARA MEDIAS DE POBLACIONES CUALESQUIERA

PROBLEMA ESTIMADOR DISTRIBUCIÓN MUESTRAL INTERVALO DE CONFIANZA 100(1-)% Estimación de

n grande X )1,0(~ NnS

X

n

SzX 2/

Comparación de medias 12, n1, n2 grandes

X X1 2

)1,0(~

2

22

1

21

2121 N

nS

nS

XX

2

22

1

21

22121 nS

nS

zXX

valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Cuadro de texto
[8]
valentin
Cuadro de texto
[9]
valentin
Cuadro de texto
[10]
valentin
Cuadro de texto
[11]
Page 44: TEMA 10.- INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALvalentin/ging/materiales_web/Tema10-11_resaltado.pdf · de la estadÍstica descriptiva a la estadÍstica inferencial ESTADÍSTICA

ESTADÍSTICA GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E

INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL

Tema 11. Intervalos de Confianza. 204

TIPOLOGÍA GENERAL DE LOS INTERVALOS PARA MEDIAS Y PROPORCIONES:

Parámetro = Estimador Parámetro = Estimador

El error máximo de estimación se interpreta como la máxima posible diferencia entre el parámetro (desconocido) y la estimación puntual (conocida y que se usa como centro del intervalo) en el caso de que el I.C. fuese correcto.

TIPOLOGÍA GENERAL DE LOS INTERVALOS PARA VARIANZAS:

Los factores A y B dependen de la confianza y de la distribución del estimador, que a su vez depende del tamaño muestral.

Error máximo de estimación

Parámetro (Estimador A , Estimador B)

Factor de confianza

Desv. típica del estimador

El Factor de confianza depende de: La confianza deseada . La distribución del estimador.

La desviación típica del estimador depende de: El estimador usado. El modelo o población en estudio. El tamaño muestral. Frecuentemente se desconoce y debe estimarse

valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
Page 45: TEMA 10.- INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALvalentin/ging/materiales_web/Tema10-11_resaltado.pdf · de la estadÍstica descriptiva a la estadÍstica inferencial ESTADÍSTICA

ESTADÍSTICA GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E

INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL

Tema 11. Intervalos de Confianza. 205

ELECCIÓN DEL TAMAÑO MUESTRAL

La tabla siguiente muestra las fórmulas para calcular los tamaños muestrales necesarios para conseguir I.C. con una confianza prefijada 1- y un error máximo prefijado Emáx.

PROBLEMA ERROR MÁXIMO TAMAÑO MUESTRAL NECESARIO Estimación de conocida n

zE 2máx 2

máx

222

Ez

n

Estimación de desconocida. S2 estimador piloto. n

StE n 2,1máx Se resuelve por tanteo para n pequeño. Si n grande: 2

222

máxE

Szn

Comparación de medias y conocidas

2

22

1

21

2máx nnzE

2

máx

22

21

22

21

)(E

znn

Comparación de medias =desconocidas. Sp

2 estimador piloto. 212,2máx

1121 nn

StE pnn Se resuelve por tanteo. Para n1 n2 grandes: 2

222

21

2

máx

p

E

Sznn

Comparación de medias desconocidas S1

2 , S22 estimadores piloto. 2

22

1

21

2,máx nS

nS

tE Se resuelve por tanteo. n1 n2 grandes: 2

22

21

22

21

)(

máxE

SSznn

Estimación de una proporción p.

0p estimador piloto nz

npp

zEmáx 41)ˆ1(ˆ

22

2máx

22

2máx

002

2 41)ˆ1(ˆ

Ez

Eppz

n

Comparación de proporciones p1p2. 01p y 0

2p estimadores piloto n1=n2

2

22

1

112,

)ˆ1(ˆ)ˆ1(ˆn

ppn

ppzE axm

2

22

2

02

02

01

012

2

)4141()ˆ1(ˆ)ˆ1(ˆ

máxmáx Ez

Eppppzn

Nota: Caso más desfavorable para estimar proporciones: p=q=1/2 p(1-p)=1/4

Nota: No existen expresiones explícitas para el caso de los I.C. para varianzas.

Page 46: TEMA 10.- INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALvalentin/ging/materiales_web/Tema10-11_resaltado.pdf · de la estadÍstica descriptiva a la estadÍstica inferencial ESTADÍSTICA

ESTADÍSTICA GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E

INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL

Tema 11. Intervalos de Confianza. 206

Ejemplo: Un fabricante de antenas parabólicas quiere ofrecer a sus clientes un periodo de garantía de un año y le gustaría saber, antes de decidirse cuál es la proporción p de antenas que debería reparar gratuitamente en ese caso. Para ello toma una muestra de 100 antenas que se prueban durante un año. De esas 100 antenas se estropean 18.

Solución:

El intervalo de confianza tiene la forma: nppzpp )ˆ1(ˆˆ 2

Sustituyendo los valores obtenemos

.243.0116.0

9.0100

18.0118.065.118.0100

18.0118.065.118.0

p

pC

El Error máximo de la estimación es E max=0.063. Si el fabricante quisiera una precisión mayor en el intervalo de confianza, de forma que el error máximo en la estimación de la proporción fuera de 0.02 podríamos utilizar la muestra inicial que ya tenemos como muestra piloto y experimentar con una muestra adicional de

6.100402.0

65.118.0118.0ˆ1ˆ2

2

2

22

maxE

zppn

,

de modo que deberíamos probar otras 1005 antenas para conseguir la precisión requerida a la estimación.

valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
Page 47: TEMA 10.- INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALvalentin/ging/materiales_web/Tema10-11_resaltado.pdf · de la estadÍstica descriptiva a la estadÍstica inferencial ESTADÍSTICA

ESTADÍSTICA GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E

INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL

Tema 11. Intervalos de Confianza. 207

Ejemplo: En el ejemplo anterior, al considerar que la tasa de fallos en el primer año de vida era excesiva, un distribuidor del producto decide comparar el funcionamiento de las antenas de ese fabricante (A) con las de otro fabricante B. Toma una muestra de 200 antenas de este último y durante el primer año de vida se observan 22 fallos. Comparar las proporciones de fallos mediante un I.C. al 95%. Hallar los tamaños muestrales necesarios para que el error máximo de la estimación con la confianza del 95% sea 0.05

Solución:

El intervalo de confianza tiene la forma: 2

22

1

1122121

)ˆ1(ˆ)ˆ1(ˆˆˆ

npp

npp

zpppp

Sustituyendo los valores obtenemos

.087,007.0

95.0200

11.0111.0100

18.0118.096.111.018.0

21

21

pp

ppC

Como 0 IC, con un 95% de confianza no existen diferencias. Para obtener el tamaño muestral utilizamos los estimadores anteriores como pilotos:

25.37705.0

89.011.082.018.096.1)ˆ1(ˆ)ˆ1(ˆ2

22

221122/21

Eppppznn ,

de modo que deberíamos probar 378 antenas de cada tipo para conseguir la precisión requerida a la estimación.

valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado
valentin
Resaltado