estadística spss

download estadística spss

of 18

description

estadistica

Transcript of estadística spss

1

UNIVERSIDAD DE LIMA

ESCUELA DE NEGOCIOS

1. DISTRIBUCIONES CONOCIDAS PARA MUESTRAS PEQUEASLa estadstica dispone de otras variables aleatorias con distribuciones conocidas cuando el tamao de muestra es pequea; es decir, cuando no se puede aplicar el TLC.

Estas distribuciones son:

: La distribucin Chi cuadrado

t : La distribucin t de Student

F : La distribucin F de Fisher

Haremos un estudio muy breve de cada una de ellas y emplearemos el Minitab para resolver problemas de probabilidad; y ms tarde volveremos a tratarlas en ms detalle.

PROPIEDADES DE ESTAS VARIABLESDistribucin Chi Cuadrado:

P1. Si X ( (n) entonces = n y = 2n ; donde n representa grados de libertadP2. Si Z1, Z2, , Zn son tales que Z1 ( N(0, 1) entonces T = ( (n)

P3. Si

Distribucin t de Student

P1. Si X ( t(n) entonces = 0 y = n/(n-2)donde n representa grados de libertad

P2. entonces la variable T definida como

P3. y entonces

P4. Si

Distribucin F de FisherP1. Si X ( F(m, n) entonces = n /(n-2) y = [2n(n+m-2)] /[ m(n-2)(n-4)] donde n representa los grados de librertad del numerador y m los grados de libertad del denominador.

P2. y entonces

P3. y entonces

A continuacin resolveremos algunos EJERCICIOS referidos a estas variables:

NOTA:

DESARROLLE LOS EJERCICIOS QUE ESTN EN AZUL

01. Para una variable aleatoria X, con distribucin Chi-Cuadrado con 15 gl, encuentre:

a) P(X < 3.89)

b) P(X > 12.495 )

c) P( 1.58 < X < 10 )

02. Para una distribucin Chi-Cuadrado, encuentre el valor de a, en cada caso:

a)

b)

c)

03. Para una v.a. X con distribucin t de Student con 20 grados de libertad, encuentre:

a) P(X < -1.594)

b) P(X > 2.49)

c) P(-1.58 a) = 0.025 b) P( t(15) > a ) = 0.10

c) P(1.476 < t(5) < a ) = 0.07505. Para una v.a. X con distribucin F, con 5 grados de libertad en el numerador y 8 grados de libertad en el denominador, encuentre

a) P(X < 2.86)

b) P(X > 0.875) c) P(0.25 c) = 0.10

d) Si X ( F(4,5), hallar P(X ( 5.19 ) , P( 3.52 ( X ( 15.56) , P(X ( 7.39)

e) Si X ( F(2,3), hallar c de tal manera que P( X ( c ) = 0.05

08. Si X es una variable aleatoria con distribucin Chi Cuadrado con 23 grados de libertad, calcular a y b tal que P(a < X < b ) = 0.95 y P(X < a) = 0.0509. Abra el archivo Grafica de Chi-t-F.xls. Observe la forma de la grfica de cada una de las distribuciones. Modifique el valor de los parmetros de las distribuciones Chi Cuadrado y t de Student y observe cundo su comportamiento es aproximadamente normal.

Modifique los valores de los grados de libertad y observe la grfica resultanteTarea 01

Escriba en la hoja que se les ha distribuido su comentario respecto a las grficas.

010. Tomando en cuenta las grficas que se muestran en el archivo del ejercicio anterior, cul de estas distribuciones es simtrica respecto al eje Y? En cul de estas distribuciones se puede aplicar las propiedades de la distribucin acumulada:

a) F(-k) = P(Z -k ) = P(Z > k) = 1- P(Z k ) = 1 F(k)

b) P(-k Z z ) = 2 F(k) -1011. Sean X, Y, W, U variables aleatorias independientes tales que X ( N(40, 25); Y ( (10); W ( (5); U ( t(7). Hallar el valor de k tal que:a) P[ (X-40) > k ] = 0.10Como X ( N(40, 25), al dividir la expresin entre 25 obtenemos

La expresin del primer miembro es Z lo cual, segn la propiedad 2 de se distribuye con un grado de libertad. Por tanto P( (1) > k/25 ) =.10De donde P( k/25 ) = 0.90

Usando Inverse de Minitab encontramos: k = .

b) P(k < W + Y < 27.488 ) = 0.95

En este caso las W e Y tienen distribucin y como son dos variables, el nmero de grados es de libertad es 2. Luego P( k < (2) < 27.488 ) = 0.95

Usando Minitab, encontramos k = ..

c) P() = 0.90

Qu variable se genera al dividir dos variables ?

d) P( | U | > k ) = 0.20

2. DISTRIBUCIN MUESTRAL DE MEDIAS

TEOREMA DE LA MEDIA MUESTRAL DE MEDIAS ()

Sea X1, X2, ..., Xn es un conjunto de variables aleatorias independientes que conforman una muestra aleatoria de tamao n , tomadas con reposicin, a partir de una poblacin X con y y donde todas las Xi tienen la misma distribucin, por provenir de la misma poblacin, es decir E[Xi] = (i = ( y V[Xi] = = (.

Si es el estadstico denominado Media Muestral de Medias Muestrales, entonces su distribucin es aproximadamente normal con

Y si, aplicando el Teorema del Limite Central, definimos una nueva variable , entonces Z ( N(0, 1).

Comentarios

1. Otra forma de definir Z, la forma usual o prctica es

2. Se puede verificar que

Igualmente

3. Si la distribucin de X es normal, por la propiedad reproductiva de la normal, tendr tambin distribucin normal N(, ) .

4. Si la distribucin de X no es normal, deberemos aplicar el Teorema del Limite Central, mediante el cual, tendr distribucin normal N((, (/n).

5. Finalmente, ser suficiente que n ( 30 para aplicar el Teorema del Limite Central y resolver el problema usando la tabla de la distribucin normal N(0, 1).

Teorema

Sea X1, X2, ..., Xn es un conjunto de variables aleatorias independientes que conforman una muestra aleatoria de tamao n , tomadas sin reposicin, a partir de una poblacin X con y y donde todas las Xi tienen la misma distribucin por provenir de la misma poblacin, es decir E[Xi] = (i = ( y V[Xi] = = (. Si es el estadstico denominado Media Muestral de Medias Muestrales, entonces su distribucin es aproximadamente normal con

Y cuando n 30, podemos aplicar el TLC anterior.

Comentarios:

1. Esto quiere decir que, toda vez que el muestreo se realice sin reposicin, deber usarse este Teorema del Limite Central.

2. Si el tamao poblacional no fuera conocido, se asumir infinito, en cuyo caso, se aplicar el modelo de muestreo con reposicin.

Ejemplo 1Una empresa de inversiones coloca diariamente importantes sumas de dinero en acciones de bolsa, las cuales siguen una distribucin normal. Si el monto promedio de colocacin diaria es de $ 7012, con una desviacin estndar de $ 540, y

a) si se elige aleatoriamente una determinada colocacin de dinero, cul es la probabilidad de que el monto colocado en la bolsa en un da, sea superior a $ 6911?

b) si se elige al azar una muestra de 36 colocaciones, cul es la probabilidad de que la media de la muestra, sea superior a $ 6911?

c) Por qu la probabilidad en b) es mayor que en a)?

Solucin

Sea X la variable aleatoria poblacional definida como Monto de dinero que representa una colocacin.

Segn el problema: ( = 7012 y ( = 540; igualmente X ( N(7012, 532)

a) Usando la distribucin normal N(0, 1), tenemos

Ahora use Minitab para encontrar esta probabilidad sin pasar a N(0, 1).b) Si es la media muestral de medias en una muestra de tamao n = 36, entonces E[]= y

En Minitab encuentre esta probabilidad sin pasar a N(0, 1).

En Excel use

c) La siguiente figura muestra la grfica de las dos variables X y .

Se puede apreciar que el rea naranja es la probabilidad que, cubre casi toda la campana de Gauss, muy prximo a uno; en cambio la P(X > 6911) cubre menor rea bajo la curva del otro color. Por otro lado, siendo la varianza poblacional mayor que el de la media, los datos estn ms dispersos.

Ejemplo 2Una mquina que produce empaques de leche est regulada para producir paquetes cuyo peso se distribuye normalmente con una media de 500 gramos y una desviacin estndar de 10 gramos. Se sabe tambin que a veces la mquina se desajusta, y cuando ello sucede lo nico que se altera es el peso promedio, mantenindose constante su variabilidad. Para mantener la produccin bajo control, se selecciona una muestra de 110 bolsas y luego se pesa. Cul ser la probabilidad de que el peso promedio difiera del promedio de la produccin en menos de 2 gramos?Solucin

Segn los datos: X: Peso de los paquetes de leche. X ( N(, ); n =

Cmo se puede expresar: El peso promedio de la muestra difiera del peso promedio de la produccin en menos de 2 gramos?: .

Segn esto debemos hallar: P( | | > .) P( | | > .) =

Ejercicio 1Calcular la media y varianza de la variable aleatoria X que se distribuye como una normal, si se sabe que P(< 6 ) = 0.0228 y P( > 8 ) = 0.8413 y adems que la media muestral corresponde a una muestra de tamao 4.

Sugerencia:

Ests obligado a pasar a N(0, 1) en ambos casos. Cmo as? Restas la media a ambos miembros y divides entre ; as obtendrs esto significa que se tiene

Ahora usando la opcin de Minitab obtendrs una ecuacin con y . Usando el otro dato, obtendrs la segunda ecuacin, que al resolverlo obtendrs y .Ejemplo 3

Un investigador de mercado desea estimar la media poblacional utilizando muestras extradas aleatoriamente, suficientemente grandes de tal manera que la probabilidad de que la media muestral no difiera de la media poblacional en ms del 25% de la desviacin estndar, sea de 0.95. Qu tamao de muestra debe adoptar para seleccionar la muestra, si sta se hace sin reposicin sobre poblaciones muy grandes?.

Solucin

Sea X la variable definida sobre la poblacin, de tamao N cuya distribucin se define por ( y ( como su media y varianza poblacional, respectivamente.

Sea la media muestral de medias en una muestra de tamao n, donde

.

De acuerdo a los datos del problema tenemos

Dividiendo entre , que es la desviacin de , para obtener Z, tenemos

Usando la tabla N(0, 1) tenemos de donde n = 61.4656.

Ejemplo 4

En la inspeccin de cierto tipo de piezas con fallas se sabe que el costo de inspeccin de cada una es equivalente a 100 veces su longitud. Si la longitud de una pieza tiene una distribucin normal con una media de 12 mm y una desviacin estndar de 0.2 mm, cul es la probabilidad de que el costo promedio diario de la inspeccin sea mayor que $ 1220, si al da se inspecciona 4 piezas?SolucinSea X la longitud de una pieza. X ( N( 12, 0.2 )

Como el costo es 100 veces la longitud, si Y es el costo, entonces Y = 100XSegn esto, el costo promedio lo obtenemos dividiendo a la ecuacin Y = 100X entre 4 (n = 4) obtenemos = 100

Luego P( > 1220) = P( 100> 1220) = P( > 12.20) = 1- P( 12.20) = ..

Ejercicio 2La gerencia general de una cadena de supermercados contempla la posibilidad de abrir una tienda en cierta zona de la ciudad. Para esto realiza un muestreo y decide que abrir la tienda si el gasto promedio muestral de consumo por hogar es superior a S/. 1000. La decisin se tomar en base a una encuesta aplicada a 200 hogares de la zona. Si como resultado de la encuesta se obtiene que el gasto de consumo por hogar tiene una desviacin estndar de S/. 520, Cul ser la probabilidad de que se decida abrir la tienda, si se sabe de estudios anteriores que el gasto promedio de consumo por hogar de la ciudad es de S/. 1100?Nota:

Resuelva los siguientes problemas y compare su solucin con lo que se da en la pgina 55 del archivo Teora de muestreo y distribuciones muestrales.doc.

TAREA 2El promedio de las notas de los estudiantes de un Instituto de Idiomas es una variable aleatoria con ( = 62 y ( = 60. Si se desea tomar una muestra, qu tan grande debe ser su tamao si la probabilidad de que el promedio de las notas sea inferior a 60, debe ser 0.1?

Ejercicio 3Un agente de bolsa dispone de 5 acciones a ser negociadas en un da determinada. Cada accin tiene igual probabilidad de ser seleccionada para su venta; es decir, la funcin de probabilidad es p(x) = 1/5. Construya una distribucin muestral de medias tomando como muestras aleatorias de tamao 2. con y sin reposicin. Luego compare los resultados con la media y varianzas poblacionales.

a) Use el mismo procedimiento expuesto en la pgina 214 del Libro Distribuciones y Estadstica Inferencial de Celestino Garca Or (519.2 / G25D / 1988).3. DISTRIBUCIN MUESTRAL DE PROPORCIONES

DEFINICION

Sea X una variable poblacin que representa el nmero de xitos en la ocurrencia de un evento determinado. Supongamos que se extrae una muestra aleatoria de tamao n. Diremos que es la proporcin de xitos (proporcin de veces que ocurre un evento determinado) en la muestra, la que representa una proporcin muestral.

Usando los mismos criterios analizados para concluir que es una variable aleatoria muestral, podemos decir que es una variable aleatoria muestral definida como la proporcin muestral de proporciones cuya distribucin de probabilidades viene expresada por E[] = p y V[] =

.

Por otro lado, si el muestreo se realiza sin reposicin, la poblacin ya no es Binomial; en este caso X se dice que tiene una distribucin Hipergeomtrica con parmetros ( N, r, n) donde

En este caso

y

En consecuencia podemos plantear el siguiente teorema

TEOREMA DE LA PROPORCION MUESTRAL DE PROPORCIONES ()

Supongamos que se tiene una muestra aleatoria de tamao n, extrada de una poblacin de tamao N, con reposicin, en donde cada elemento se clasifica como xito o fracaso. Si se define a X como el nmero de xitos en la muestra y representa la proporcin de xitos en la muestra, entonces es una variable muestral cuya distribucin de probabilidad viene definida mediante

y donde p representa la proporcin de xitos en la poblacin.

Si el tamao de la muestra es suficientemente grande, entonces

es tal que Z ( N(0, 1).

Comentarios

1. Muchas veces se usa ( en lugar de p para representar la proporcin de xitos en la poblacin.

2. Otra forma de definir Z, la forma usual o prctica, es

3. Si el tamao de muestra es pequeo se debe usar el factor de correccin por continuidad

, la cual se deriva a partir del factor de correccin en la aproximacin binomial por normal, que es .

4. De manera que usando el factor de correccin, tendremos

P(

5. Si se desconoce el tamao poblacional, se asumir que es infinita.

Nota:No se olvide de usar si el muestreo se hace sin reposicin.

Ejemplo 5Al reparar un cierto tipo de mquina empacadora ocasionalmente ocurre una complicacin que requiere asistencia tcnica exterior. Se desea estimar la proporcin de trabajos de reparacin que requieren asistencia tcnica exterior, basndose en una muestra aleatoria simple de 100 trabajos de reparacin terminada recientemente. Suponga que en realidad se requiere asistencia tcnica exterior en un 15% de los trabajos de reparacin; esto es, que la proporcin del proceso es de 0.15.

a) Cul es la media y desviacin estndar de la distribucin muestral de ?

b) Cul es la probabilidad de que est en un intervalo (-0.05, 0.05) centrado en la proporcin del proceso? Qu est entre 0.12 y 0.20?

c) Dentro de qu intervalo caer la proporcin de la muestra el 90% de las veces?. Use lmites simtricos alrededor de la proporcin del proceso.

d) Cul es el intervalo que le corresponde a la parte c) para una muestra aleatoria simple de 400 trabajos? Qu efecto tiene el incremento en el tamao de la muestra?

e) Para una muestra de tamao dado, es la distribucin muestral de ms variable si p est cerca de 0? Si p est cerca de 0.5? Si estuviera cerca de 1?

Solucin

Si p = 0.15 representa la proporcin de veces que se requiere asistencia tcnica ySea n = 100, tamao de la muestra.

Defina a : .................................................Entonces

a)

b) estar en (-0.05, 0.05), centrado en la p significa que | - p | ( 0.05

Luego

Usando el factor de correccin por continuidad y pasando a Z, tenemos

En cuanto a la segunda parte de la pregunta tenemos

c) Supongamos que el intervalo donde debe caer es (-r, r), supuesto simtrico y que est centrado alrededor de la proporcin del proceso, p (sin considerar el FCC).

Entonces

Usando en Normal de Minitab, obtenemos Z = 1.645 e igualando a r/0.035707, tenemos

r = 0.035707x(1.645) = 0.058738

Esto significa que - 0.058738 ( - p ( 0.058738 por lo que al despejar y reemplazamos a p con su valor, encontramos el intervalo de variacin de que es

( .............., ................)

d) Si ahora el tamao de la muestra es de 400 entonces slo se modificar la desviacin estndar de ; esto es,

Luego r = 0.01785x(1.645) = 0.02937

Con lo cual el intervalo pedido ser ( 0.1206, 0.1794)

Comentario:

La longitud del intervalo en c) es 0.1175. La longitud del intervalo en d) es 0.0588. Esto indica que cuanto mayor sea el tamao de muestra menor ser la dispersin de los datos; es decir, la proporcin muestral, , estar ms cerca de p.

e) La variabilidad de una variable aleatoria se mide analizando el valor de su varianza, entre otras formas. Cuanto mayor sea su varianza, mayor variacin(o dispersin) presentar la variable respecto a su valor central. Por otro lado, como la varianza de se define por entonces,

Si p = 0.1

Si p = 0.3

Si p = 0.8

Si p = 0.5

De manera que tendr mayor variabilidad cuando p = 0.5. Es este valor que se deber usar cuando no se conozca la proporcional poblacional.Ejemplo 6En la facultad de Administracin de la Universidad, el 40% de los estudiantes son mujeres. Se desea hacer un estudio sobre la participacin de los estudiantes en las actividades acadmicas y culturales de la facultad. Cul ser la probabilidad de que en una muestra de 100 alumnos se encuentre ms de 35% pero menos de 45% de mujeres?

Solucin

Segn el problema: = .; n = ..;Al hablar de muestra, el porcentaje al que se hace referencia es , la proporcin de la muestra.

Qu se pide? P(.)

Encuentre primero

Luego usando Minitab encuentre P( 0.35 0.45 )

TAREA 3Un proceso para llenar botellas de cerveza presenta una produccin promedio en la que el 10% no estn completamente llenas. Si mediante este proceso de seleccin al azar se toma una muestra de 225 botellas de un lote de 625 envases llenos, Cul ser la probabilidad de que la proporcin muestral de botellas parcialmente llenas se encuentre entre 9% y 11%?

Ejemplo 7Una agencia de publicidad realiza una encuesta a los agentes de compras de 250 compaas industriales. Los resultados indican que el 25% de los compradores reportaron niveles ms altos de nuevos pedidos en Enero de 1998, que en los dos meses anteriores. Suponga que los 250 agentes de la muestra representan una muestra aleatoria de los agentes de compras de las compaas del pas.

a) Describa la distribucin muestral de , definida como la distribucin de compradores del pas con niveles ms elevados de nuevos pedidos en Enero de 1998.

b) Cul es la probabilidad de que difiera de p en ms de 0.01?

Solucin

a) Si se define a , como la proporcin muestral de compradores del pas con niveles ms elevados de nuevos pedidos en Enero de 1998, entonces su distribucin se expresa mediante

y

b) La pregunta planteada la podemos expresar como P( | ........... | > 0.01). Luego

Ejercicio 4El presidente de Distribuidores S.A. cree que el 30% de los pedidos a su empresa provienen de clientes nuevos. Se va a usar una muestra aleatoria simple de 100 empleados para comprobar lo que dice.

a) Suponga que el presidente est en lo correcto y que p = 0.30. Cul es la distribucin muestral de para este estudio?

b) Cul es la probabilidad de que la proporcin muestral est a ( 0.5 o menos de la proporcin poblacional?

Ejercicio 5Si bien la mayora de las personas cree que el desayuno es el alimento ms importante del da, el 25% de los adultos no desayunan. Si para comprobar esta afirmacin se toma una muestra de 200 adultos,

a) cul es la probabilidad de que la proporcin muestral quede a ( 0.03 o menos de la proporcin poblacional?

b) cul es la probabilidad si la proporcin muestral difiere de la proporcin poblacional en a lo ms 0.05?

TAREA 4El gerente financiero de una gran empresa comercial desea contar con informacin sobre la proporcin de clientes a los que no les agrada su nueva poltica de gestin, respecto al tratamiento de los cheques girados con cantidades por debajo de $ 500. Cuntos clientes tendr que incluir en una muestra si desea que la proporcin de la muestra se desve a lo ms en 0.15 de la verdadera proporcin, con una probabilidad de 98%. Considere que para el gerente un cliente al que no le agrada la poltica implementada posee las mismas caractersticas que un cliente al que s le agrada dichas polticas.

EMBED PBrush

Esta propiedad afirma que si un conjunto de variables Xi tienen una determinada distribucin de probabilidad conocida, y se define a otra variable, digamos T tal que T = EMBED Equation.3 X1 + X2 + ...+ Xn entonces la nueva variable T, tendr tambin la misma distribucin con (T= ( 1 + ( 2+ ...+ ( n y ( T = ( 1 + ( 2 + ... + ( n

Evaluemos E[ EMBED Equation.3 ] y V[ EMBED Equation.3 ].

EMBED Equation.3 (Recuerde que X es binomial con E[X] = np )

Del mismo modo

EMBED Equation.3

Aqu hemos usado la propiedad P(-K X K ) = 2 F(K) 1 cuando X ( N(, ).

Ilmer Cndor

Pgina 18 de 18

_1080403854.unknown

_1129448555.unknown

_1173862016.unknown

_1173889377.unknown

_1173896291.unknown

_1173900741.unknown

_1173900856.unknown

_1173906265.unknown

_1173906318.unknown

_1173900909.unknown

_1173900843.unknown

_1173896369.unknown

_1173896031.unknown

_1173896062.unknown

_1173889546.unknown

_1173862442.unknown

_1173889241.unknown

_1173862358.unknown

_1129449321.unknown

_1170268670.unknown

_1173120596.unknown

_1173120824.unknown

_1173121027.unknown

_1170272359.unknown

_1170276640.unknown

_1173120564.unknown

_1170272369.unknown

_1170272207.unknown

_1170272221.unknown

_1170269920.unknown

_1150402827.unknown

_1170268288.unknown

_1170268629.unknown

_1152705877.unknown

_1129449334.unknown

_1129449022.unknown

_1129449128.unknown

_1129448968.unknown

_1080503320.unknown

_1080572265.unknown

_1128229591.unknown

_1129448257.unknown

_1129448492.unknown

_1128230854.unknown

_1129448178.unknown

_1128229624.unknown

_1080572309.unknown

_1080572418.unknown

_1128229514.unknown

_1080572441.unknown

_1080572392.unknown

_1080572294.unknown

_1080536166.unknown

_1080538771.unknown

_1080564324.unknown

_1080564407.unknown

_1080540049.unknown

_1080536315.unknown

_1080503385.unknown

_1080502070.unknown

_1080502373.unknown

_1080502537.unknown

_1080502205.unknown

_1080493369.unknown

_1080501348.unknown

_1080493253.unknown

_1080316718.unknown

_1080401969.unknown

_1080402645.unknown

_1080403844.unknown

_1080402692.unknown

_1080403519.unknown

_1080402661.unknown

_1080402421.unknown

_1080402615.unknown

_1080402187.unknown

_1080317347.unknown

_1080317592.unknown

_1080400194.unknown

_1080398348.unknown

_1080317378.unknown

_1080316999.unknown

_1080317309.unknown

_1080316831.unknown

_1080061795.unknown

_1080139648.unknown

_1080205344.unknown

_1080209271.unknown

_1080139725.unknown

_1080062034.unknown

_1080062167.unknown

_1080057903.unknown

_1080061249.unknown

_1080061355.unknown

_1080061663.unknown

_1080060994.unknown

_1080052412.unknown

_1080057656.unknown

_1080057692.unknown

_1080056555.unknown

_1080056701.unknown

_1080052324.unknown

_1073081645.unknown