TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber...

56
TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL ORIENTE DEL ESTADO DE MÉXICO DIVISIÓN DE CONTADURÍA ELABORACIÓN DE CUADERNILLO DE APUNTES: ESTADÍSTICA ADMINISTRATIVA II ELABORADO POR: ING. MIRIAM MEDINA DELGADO LOS REYES, LA PAZ, ESTADO DE MÉXICO AGOSTO 2010

Transcript of TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber...

Page 1: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

TECNOLOacuteGICO DE ESTUDIOS SUPERIORES DEL ORIENTE DEL ESTADO DE MEacuteXICO

DIVISIOacuteN DE CONTADURIacuteA

ELABORACIOacuteN DE CUADERNILLO DE APUNTES

ESTADIacuteSTICA ADMINISTRATIVA II

ELABORADO POR

ING MIRIAM MEDINA DELGADO

LOS REYES LA PAZ ESTADO DE MEacuteXICO AGOSTO 2010

INDICE Unidad 1 Pruebas de la bondad del ajuste y anaacutelisis de varianza

11 Anaacutelisis Ji-Cuadrada 1 12 Prueba de independencia 1 13 Prueba de la bondad del ajuste 1 14 Tablas de contingencia 4 141 meacutetodo para obtener el estadiacutestico x2 de una tabla de contingencia con dos renglones 4 142 meacutetodo para obtener el estadiacutestico x2 de una tabla de contingencia con maacutes de dos renglones 6 15 Anaacutelisis de varianza 9 151 Aplicaciones de ANOVA 9 152 Inferencia sobre una varianza de poblacioacuten (Anova) 14 153 Inferencia sobre la varianza de dos poblaciones (Anova) 15

Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple 21 Estimacioacuten mediante la liacutenea de regresioacuten 16 211 Diagrama de dispersioacuten 16 212 Meacutetodo de miacutenimos cuadrados 17 213 Interpretacioacuten del error estaacutendar de la estimacioacuten 18 214 Intervalos de prediccioacuten aproximados 19 215 Anaacutelisis de correlacioacuten 22 216 Paquete computacional para la solucioacuten de problemas 22 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten 22 218 Usos de variables ficticias 25 219 Residuales y graacuteficas de residuales 25 Unidad 3 Nuacutemeros iacutendice

31 Elaboracioacuten de iacutendices simples 27 32 Iacutendices agregados de precio 27 33 Relativos eslabonados 28 34 Cambio de periodo base 28 35 Fusioacuten de dos series de nuacutemeros iacutendice 29 36 Iacutendice de precios al consumidor (IPC) 29 37 Deflacioacuten de los valores de series de tiempo 30 38 Iacutendice de precios al productor (IPP) 31 39 Promedios de precios bursaacutetiles de DowJones 31 310 Indice de produccioacuten insustrial 31

Unidad 4 Estadiacutestica no parameacutetrica

41 Escala de medicioacuten 33 42 Meacutetodos estadiacutesticos contra no parameacutetricos 33 43 Prueba de corridas para aleatoriedad 35 431 Concepto de aleatoriedad 35 432 Teoriacutea de corridas 35 4321 Prueba de corridas de una sola muestra 36 4322 Distribucioacuten de muestreo del estadiacutestico r 36 44 Una muestra prueba de signos 38 45 Una muestra prueba de Wilcoxon 40 46 Dos muestras prueba de Mann-Whitney 42 47 Observaciones apareadas prueba de Wilcoxon 45 48 Varias muestras independientes prueba de Krauskal-Wallis 46

INTRODUCCIOacuteN La estadiacutestica administrativa es una materia importante en contaduriacutea ya que permite recopilar organizar representar analizar datos y tomar decisiones asiacute mismo nos da las herramientas necesarias para utilizar el meacutetodo adecuado conforme a la situacioacuten que se estaacute analizando y aplicarlo en el aacuterea contable Este cuadernillo de apuntes tiene como finalidad servir de apoyo al estudiante durante el curso de la materia el cual consta de 4 unidades en donde se proponen algunas praacutecticas para la aplicacioacuten de los temas estudiados y estaacute desarrollado conforme al temario Sin embargo es importante que el alumno consulte maacutes fuentes de informacioacuten con el objetivo de retroalimentar A continuacioacuten se hace una breve semblanza de los temas que se tratan en las unidades Unidad 1 Pruebas de la bondad del ajuste y anaacutelisis de varianza En esta unidad se analizan los siguientes temas anaacutelisis ji-cuadrada pruebas de independencia bondad de ajuste tablas de contingencia y anaacutelisis de varianza para hacer inferencias a partir de una o dos poblaciones Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple En esta unidad realiza el diagrama de dispersioacuten se aplica el meacutetodo de miacutenimos cuadrados para interpretar el error estaacutendar y determinar los intervalos de prediccioacuten asiacute como la solucioacuten de ejercicios de anaacutelisis de correlacioacuten en Excel Asimismo se recaban datos de una empresa para aplicar la regresioacuten lineal y hacer estimaciones futuras

Unidad 3 Nuacutemeros iacutendice En esta unidad se realizan ejercicios para la elaboracioacuten de nuacutemeros iacutendice simple precio agregado y precio al consumidor Asimismo se elaboran iacutendices de precio y cantidad con datos recabados en revistas y otras fuentes Unidad 4 Estadiacutestica no parameacutetrica En esta unidad se contrasta la estadiacutestica parameacutetrica contra la no parameacutetrica asiacute mismo se analizan temas de prueba de corrida de aleatoriedad de una o dos muestras y observaciones apareadas Tambieacuten se recopilan datos para efectuar comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestica no parameacutetrica

Estadiacutestica Administrativa II 1

Unidad 1 Pruebas de la bondad del ajuste y anaacutelisis de varianza 11 Anaacutelisis Ji-Cuadrada Las pruebas Ji-Cuadrada nos permite probar si maacutes de dos proporciones de poblacioacuten pueden ser consideradas iguales Si clasificamos una poblacioacuten en diferentes categoriacuteas respecto a dos atributos (por ejemplo edad y desempentildeo en el trabajo) entonces podemos utilizar una prueba Ji-Cuadrada para los dos atributos son independientes entre siacute 12 Prueba de independencia Los administradores necesitan saber si las diferencias que observan entre varias proporciones de la muestra son significativas o soacutelo se deben al azar 13 Prueba de la bondad del ajuste La prueba ji- cuadrada puede utilizarse tambieacuten para decidir si una distribucioacuten de probabilidad en particular como la binomial la de Poisson o la normal es la apropiada Esta es una habilidad importante porque como tomadores de decisiones que utilizamos la estadiacutestica necesitamos escoger cierta distribucioacuten de probabilidad para representar la distribucioacuten de los datos que tengamos que analizar La prueba ji- cuadrada nos permite hacernos la pregunta de cuaacutel distribucioacuten podemos utilizar y probar si existe una diferencia significativa entre una distribucioacuten de frecuencias observadas y una distribucioacuten de frecuencias teoacuterica Caacutelculo de frecuencias observadas y esperadas Ejemplo La compantildeiacutea ldquoxrdquo requiere que los estudiantes del uacuteltimo antildeo de la universidad que buscan trabajo sean entrevistados por tres ejecutivos diferentes Esto permite a la compantildeiacutea obtener una evaluacioacuten por consenso de candidatos Cada ejecutivo califica al candidato como positivo o negativo Con el propoacutesito de planear la contratacioacuten el director de seleccioacuten del personal de la compantildeiacutea piensa que el proceso de entrevistas puede ser aproximado por una distribucioacuten binomial con p= 040 es decir del 40 de de posibilidad de que cualquier candidato obtenga una calificacioacuten positiva en cualquiera de las entrevistas Si el director desea probar una hipoacutetesis a un nivel de significancia de 020 iquestCoacutemo debe proceder

Estadiacutestica Administrativa II 2

Ho una distribucioacuten binomial con p= 040 Es una buena descripcioacuten del proceso de entrevista Hi una distribucioacuten binomial con p= 040 No es una buena descripcioacuten del proceso de entrevista α= 020 nivel de significancia para probar la hipoacutetesis

Calificaciones positivas posibles en las tres

entrevistas

Nuacutemero de candidatos que obtienen cada

calificacioacuten Resultados de las entrevistas de 100 candidatos

0 18 1 47 2 24 3 11 100

Calificaciones positivas posibles en las tres

entrevistas

Probabilidades binomiales para esos resultados

Posibilidad binomial 0 2160 1 4320 2 2880 3 0640 10000

Calificaciones positivas

posibles en las tres entrevistas

Frecuencia observada de

candidatos que obtienen estas calificaciones

Probabilidades binomiales de

resultados posibles

Nuacutemero de candidatos

entrevistados

Frecuencia esperada de candidatos

que obtienen estas

calificaciones

Frecuencias observadas Probabilidades binomiales adecuadas y frecuencias esperada

0 18 2160 100 216 1 47 4320 100 432 2 24 2880 100 288 3 11 0640 100 64 100 10000 1000

Estadiacutestico ji- cuadrada

x2 = Σ(fo-fe)2

fe

fo= frecuencia observada fe= frecuencia esperada

Estadiacutestica Administrativa II 3

Frecuencia observada

fo

Frecuencia esperada

fe

fo-fe (fo-fe)2 (fo-fe)2

fe

Calculo del estadiacutestico x2

18 216 -36 1296 06000 47 432 38 1444 03343 24 288 -48 2304 08000 11 64 46 2116 33063

X2=50406

Determinacioacuten de los grados de libertad Antes de calcular el nuacutemero adecuado de grados de libertad para una prueba ji- cuadrada de bondad de ajuste es necesario contar el nuacutemero de clases (denotado por K) para las que se compararon las frecuencias observadas y esperadas

Grados de libertad = k-1

K= 0123 k= 4 gl= 4-1 gl= 3 Rechazamos la hipoacutetesis nula y llegamos a la conclusioacuten de que la distribucioacuten binomial con p=040 no proporciona una buena descripcioacuten de nuestras frecuencias observadas Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

11-16 466 11-17 466 11-18 466

Regioacuten de aceptacioacuten

50406

020 del aacuterea

Valor x2

Distribucioacuten x2

4642

Valor de tabla

Regioacuten de rechazo

Estadiacutestica Administrativa II 4

14 Tablas de contingencia Describimos las dimensiones de una tabla de contingencia estableciendo primero el nuacutemero de renglones y luego el nuacutemero de columnas La columna y el rengloacuten con el total no cuentan como parte de las dimensiones Los renglones corren de manera horizontal y las columnas de manera vertical Tabla de contingencia de 2 x 4( 2 renglones 4 columnas) 141 Meacutetodo para obtener el estadiacutestico x2 de una tabla de

contingencia con 2 renglones Ejemplo En cuatro regiones se muestrean las actitudes de los empleados respecto a la evaluacioacuten del desempentildeo en el trabajo Los trabajadores eligen entre el meacutetodo actual (dos evaluaciones al antildeo) y un meacutetodo propuesto (evaluaciones trimestrales) A continuacioacuten se presentan los datos Tabla de contingencia de 2x4 Noreste Sureste Central Costa

oeste Total

Respuesta de la muestra concerniente a los programas de evaluacioacuten de empleados

Nuacutemero de empleados que prefieren el meacutetodo actual

68 75 57 79 279

Nuacutemero de empleados que prefieren el meacutetodo nuevo

32 45 33 31 141

Total de empleados muestreados en cada regioacuten

100 56 90 110 420

Planteamiento del problema

Hipoacutetesis nula Ho PN=PS=PC=PW

Hipoacutetesis alternativa

Hi PN PS PC PW no son iguales PN= proporcioacuten de empleados en el noreste que prefieren el plan actual PS= proporcioacuten de empleados en el sureste que prefieren el plan actual PC= proporcioacuten de empleados en la regioacuten central que prefieren el plan actual PW= proporcioacuten de empleados de la regioacuten de la costa que prefieren el plan actual

Estadiacutestica Administrativa II 5

Frecuencias observadas y esperadas

Noreste Sureste Central Costa oeste

Proporcioacuten de empleados muestreados en cada regioacuten que se espera prefieren los dos meacutetodos de evaluacioacuten

Nuacutemero total muestreado 100 120 90 110 Proporcioacuten estimada que prefieren el meacutetodo actual

x 06643 x 06643 x 06643 x 06643

Nuacutemero que se espera prefiera el meacutetodo actual

6643 7972 5979 7307

Nuacutemero total muestreado 100 120 90 110 Proporcioacuten estimada que prefieren el meacutetodo nuevo

x 03357 x 03357 x 03357 x 03357

Nuacutemero que se espera prefiera el meacutetodo nuevo

3357 4028 3021 3693

Noreste Sureste Central Costa

oeste Comparacioacuten de las frecuencias observadas y esperadas de trabajadores muestreados

Frecuencia con que prefieren el meacutetodo actual

68 75 57 79

Frecuencia observada (real) Frecuencia esperada (teoacuterica)

6643 7972 5979 7307

Frecuencia con que prefieren el meacutetodo nuevo

32 45 33 31

Frecuencia observada (real) Frecuencia esperada (teoacuterica)

3357 4028 3021 3693

Estadiacutestico ji- cuadrada

119961120784 = 120622

(119943119952 minus 119943119942)120784119943119942

fo= frecuencia observada fe= frecuencia esperada

Paso 1 Paso 2 Paso 3 Calculo del estadiacutestico x2

fo fe fo-fe (fo-fe)2 (fo-fe)2

fe 68 6643 157 246 00370 75 7972 -472 2228 02795 57 5979 -279 778 01301 79 7307 593 3516 04812 32 3357 -157 246 00733

45 4028 472 2228 05531 33 3021 279 778 02575 31 3693 -593 3516 09521 X2= 27638

Estadiacutestica Administrativa II 6

Determinacioacuten de los grados de libertad

Nuacutemero de grados de libertad

Grados de libertad en una prueba ji- cuadrada

= (nuacutemero de renglones -1 )(nuacutemero de columnas -1)

Tabla de 2x4 (2-1)(4-1)= (1)(3) = 3 grados de libertad

Nivel de significancia de 10 Buscar en tablas x2 3 grados de libertad con un nivel de significancia de 10 y graficar

Interpretacioacuten de los resultados y la graacutefica 142 Meacutetodo para obtener el estadiacutestico x2 de una tabla de

contingencia con maacutes de 2 renglones Estadiacutestico ji- cuadrada

x2 = Σ(fo-fe)2

fe fo= frecuencia observada fe= frecuencia esperada Determinacioacuten de los grados de libertad de una tabla de contingencia de maacutes de tres renglones

Nuacutemero de grados de libertad de una tabla de maacutes de tres renglones

Grados de libertad en una prueba ji- cuadrada

= (nuacutemero de renglones -1 )(nuacutemero de columnas -1)

Regioacuten de aceptacioacuten

2764

010 del aacuterea

Valor x2

Distribucioacuten x2

con 3 grados de

libertad

6251

Valor de tabla

Regioacuten de rechazo

Estadiacutestica Administrativa II 7

Tabla de contingencia Nuacutemero de

renglones Nuacutemero de columnas

r-1 c-1 Grados de libertad (r-1)(c-1)

A 3 4 3-1=2 4-1=3 (2)(3)=6 B 5 7 5-1=4 7-1=6 (4)(6)=24 C 6 9 6-1=5 9-1=8 (5)(8)=40

El presidente de una compantildeiacutea de seguros de salud se opone al seguro nacional Argumenta que su implementacioacuten seriacutea muy costosa en particular debido a que la existencia de este sistema tenderiacutea a fomentar permanencias hospitalarias maacutes prolongadas ademaacutes de otros efectos El presidente piensa que el tiempo de hospitalizacioacuten depende del tipo de seguro de salud que tengan las personas Los siguientes datos se obtuvieron de una muestra aleatoria de 660 hospitalizaciones Diacuteas en el hospital lt5 5-10 gt10 Total Datos de hospitalizaciones Calificados seguacuten el tipo de cobertura del seguro y el tiempo de estancia

Fraccioacuten de costos cubiertos por el seguro

lt25 40 75 65 180 25 -50 30 45 75 150

gt50 40 100 190 330

Total 110 220 330 660

Planteamiento del problema

Hipoacutetesis nula Ho el tiempo de estancia y tipo de seguro son independientes

Hipoacutetesis alternativa

Hi el tiempo de estancia depende del tipo de seguro

α= 001 nivel de significancia para probar la hipoacutetesis Frecuencia esperada para cualquier celda

Calculo de la frecuencia esperada fe= RT X CT n

fe= frecuencia esperada en una celda dada RT= total por rengloacuten para el rengloacuten que contiene esa celda CT= total por columna para la columna que contiene esa celda n= nuacutemero total de observaciones

Estadiacutestica Administrativa II 8

Estadiacutestico ji- cuadrada

fo= frecuencia observada fe= frecuencia esperada

x2 = Σ(fo-fe)2

fe

Rengloacuten Columna fo fe = RT X CT n

fo-fe (fo-fe)2 (fo-fe)2

fe Calculo de las frecuencias esperadas y ji- cuadrada

1 1 40 30 180 X 110 660

10 100 3333

1 2 75 60 180 X 220 660

15 225 3750

1 3 65 90 180 X 330 660

-25 625 6944

2 1 30 25 150 X 110 660

5 25 1000

2 2 45 50 150 X 220 660

-5 25 0500

2 3 75 75 150 X 330 660

0 0 0000

3 1 40 55 330 X 110 660

-15 225 4091

3 2 100 110 330 X 220 660

-10 100 0909

3 3 190 165 330 X 330 660

25 625 3788

X2=24315

Buscar en tablas x2 4grados de libertad con un nivel de significancia de 10 y graficar Interpretacioacuten de resultados

Regioacuten de aceptacioacuten

x2= 24315

010 del aacuterea

Distribucioacuten x2

13277

Valor de tabla

Regioacuten de rechazo

Estadiacutestica Administrativa II 9

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

11-1 459 11-2 460 11-7 460 11-8 460 11-9 460

11-10 460 11-11 461 11-12 461 11-13 461

15 Anaacutelisis de varianza

El anaacutelisis de varianza nos permite probar si maacutes de dos medias de poblacioacuten pueden considerarse iguales A menudo se abrevia ANOVA analysis of variance ANOVA Es un meacutetodo de prueba de igualdad de tres o maacutes medias poblacionales1

Hipoacutetesis nula tiacutepica

HO= μ1= μ2= μ3

El meacutetodo ANOVA nos sirve para evitar el error tipo I (rechazar una hipoacutetesis nula verdadera) si utilizamos una prueba de igualdad de varias medias

151 Aplicaciones de ANOVA Se utiliza cuando Se asevera que los supermercados colocan los cereales con alto contenido de azuacutecar en estantes que estaacuten a la altura De los ojos de los nintildeos de manera que eso nos permite probar la aseveracioacuten de que los cereales en los estantes tienen el mismo contenido de azuacutecar

1 Mario F Triola Estadiacutestica Pearson Meacutexico2006

Estadiacutestica Administrativa II 10

Tambieacuten en casos como la comparacioacuten del kilometraje logrado por cinco clases diferentes de gasolina la prueba de cuaacutel de cuatro meacutetodos de capacitacioacuten produce el aprendizaje maacutes raacutepido etc Los meacutetodos de ANOVA requieren de la distribucioacuten F Propiedades de la distribucioacuten F

1 Es no simeacutetrica se sesga hacia la derecha 2 Los valores F son 0 o positivo pero no negativos 3 Hay una distribucioacuten F para cada par de grados de libertad para el

numerador y el denominador

Figura 1 Fuente (Triola 2006605) Ejemplo

Muestra 1 15 18 19 22 11

Muestra 2 22 27 18 21 17

Muestra 3 18 24 19 16 22 15

Planteamiento de la hipoacutetesis

Ho μ1= μ2= μ3

H1 μ1 μ2 y μ3 no son todas iguales

Estadiacutestica Administrativa II 11

Caacutelculo de la media

Meacutetodo 1 Meacutetodo 2 Meacutetodo 3 Produccioacuten diaria 15 22 18

18 27 24 19 18 19 22 21 16 11 17 22

15 85 105 114 Sumatoria divide5 divide5 divide6 Tamantildeo de

la muestra 17 21 19 Media

muestral n1=5 n2=5 n3=6

1= 17 2= 21 3= 19

Caacutelculo de la gran media

= 15 +18+ 19+ 22+ 11+22 +27+ 18+ 21+ 17+18 +24+ 19+ 16+ 22+ 15 = 19 16

Caacutelculo de la varianza entre columnas

σ2b = Σnj ( - )2 = k-1

n - ( - )2 n( - ) Caacutelculo de la varianza entre columnas

5 17 19 17-19=-2 (-2)2=4 5x4=20 5 21 19 21-19=2 (2)2=4 5x4=20 6 19 19 19-19=0 (0)2=0 6x0 = 0 Σnj( - )

2 =40

σ2b = Σnj ( - )2 = 40= 40 = 20 varianza entre columnas

k-1 3-1 2

Estadiacutestica Administrativa II 12

Estimacioacuten de la varianza dentro de columnas

Meacutetodo de capacitacioacuten 1 Media muestral =17

Estimacioacuten de la varianza dentro de columnas

- ( - )2 15-17=-2 (-2)2=4 18-17=1 (1)2=1 19-17=2 (2)2=4 22-17=5 (5)2=25 11-17=-6 (-6)2=36 Σ( - )2 =70

s21= Σ( - )2 = 70 = 175 varianza de la muestra

n-1 5-1

Meacutetodo de capacitacioacuten 2 Media muestral =21

Estimacioacuten de la varianza dentro de columnas

- ( - )2 22-21=1 (1)2=1 27-21=6 (6)2=36 18-21=-3 (-3)2=9 21-21=0 (0)2=0 17-21=-4 (-4)2=16 Σ( - )2 =62

s22= Σ( - )2 = 62 = 155 varianza de la muestra

n-1 5-1

Meacutetodo de capacitacioacuten 3 Media muestral =19

Estimacioacuten de la varianza dentro de columnas

- ( - )2 18-19=-1 (-1)2=1 24-19=5 (5)2=25 19-19=0 (0)2=0 16-19=-3 (-3)2=9 22-19=3 (-32=9 15-19=-4 (-4)2=16 Σ( - )2 =60

Estadiacutestica Administrativa II 13

s23= Σ( - )2 = 60 = 120 varianza de la muestra

n-1 6-1

σ2w = Σ nj - 1 s2

j = (413)(175) + (413)(155) + (513)(120) = 193 = 14769 nt - k 13

Estadiacutestico F

F = varianza entre columnas = σ2b

Varianza dentro de columnas σ2w

F= 20 = 1354 cociente F 14769

Determinacioacuten de los grados de libertad

Grados de libertad del numerador

Nuacutemero de grados de libertad en el numerador del cociente F

= (nuacutemero de muestras-1)

Grados de libertad del denominador

Nuacutemero de grados de libertad en el denominador del cociente F

= Σ (nj-1)= nt-k

Graacutefica

Se acepta la hipoacutetesis nula

Regioacuten de aceptacioacuten

F= 1354

005 del aacuterea

Distribucioacuten f

381

Valor de tabla

Regioacuten de rechazo

Estadiacutestica Administrativa II 14

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

11-5 479 11-6 479

11-26 480 11-27 480 11-28 480 11-29 480 11-30 480

152 Inferencia sobre una varianza de poblacioacuten (Anova)

Estadiacutestico ji- cuadrada para inferencias sobre una varianza

X2=(n-1)s2 σ2

Intervalo de confianza para σ2

Liacutemite inferior de confianza

σ2L=(n-1)s2 X2

U Liacutemite superior de confianza

σ2U=(n-1)s2 X2

L

Estadiacutestica Administrativa II 15

Ejercicio

Con los siguientes datos obtener el estadiacutestico ji- cuadrada Y el intervalo de

confianza del 95

Tiempo x

50 45 27 66 43 96 45 90 69

153 Inferencia sobre la varianza de dos poblaciones (Anova) Ademaacutes de comparar la varianza de dos poblaciones el principal objetivo de este tema es analizar el cociente que se obtiene al aplicar la foacutermula correspondiente

Coeficiente F para inferencias acerca de dos varianzas

F=S21

S22

Estadiacutestica Administrativa II 16

Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple

21 Estimacioacuten mediante la liacutenea de regresioacuten El anaacutelisis de regresioacuten y correlacioacuten permiten determinar tanto la naturaleza como la fuerza de una relacioacuten entre dos variables En el anaacutelisis de regresioacuten se desarrollaraacute una ecuacioacuten de estimacioacuten a traveacutes de una foacutermula matemaacutetica que relaciona las variables conocidas con la variable desconocida La variable conocida- variable independiente X La variable que tratamos de predecir se llama variable dependiente Y

Figura 2 Fuente (Levin 2004511) 211 Diagrama de dispersioacuten El primer paso para determinar si existe una relacioacuten entre dos variables es examinar la graacutefica de datos observados A esta graacutefica se le llama diagrama de dispersioacuten Un diagrama de dispersioacuten se puede identificar visualmente patrones que indique si las variables estaacuten relacionadas

X

Y

Gastos contra la contaminacioacuten

Emisor de

contaminacioacuten

Pendiente negativa

b) Relacioacuten directa

X

Y

Publicidad

Ventas

Pendiente positiva

a) Relacioacuten directa

Estadiacutestica Administrativa II 17

Figura 3 Fuente (Levin 2004503)

212 Meacutetodo de miacutenimos cuadrados

Liacutenea de estimacioacuten

Y= a+bx Y= variable dependiente a=variable ordenada y b=pendiente de la recta x=variable independiente

Pendiente de la recta de regresioacuten de mejor ajuste

b = Σ XY - n X Y Σ X2 - n X2

b=pendiente de la liacutenea de estimacioacuten de mejor ajuste X= valores de la variable independiente Y= variable valores de la variable dependiente X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente n= nuacutemero de puntos

Estadiacutestica Administrativa II 18

Liacutenea de estimacioacuten

a = Y - bX a= ordenada Y b= pendiente de la ecuacioacuten X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente

Error estaacutendar de la estimacioacuten

Se= Σ(Y-Y)2

n-2 Y= valores de la variable dependiente Y=valores estimados con la ecuacioacuten de estimacioacuten que corresponden a cada valor de Y n= nuacutemero de puntos utilizados para ajustar la liacutenea de regresioacuten Para medir la confiabilidad de la ecuacioacuten de estimacioacuten los especialistas en estadiacutestica han desarrollado el error estaacutendar de estimacioacuten Este error estaacutendar se simboliza por Se y es similar a la desviacioacuten estaacutendar en cuanto a que ambas son medidas de dispersioacuten El error estaacutendar de la estimacioacuten por otra parte mide la variabilidad o dispersioacuten de los valores observados alrededor de la recta de regresioacuten 213 Interpretacioacuten del error estaacutendar de la estimacioacuten Como ocurririacutea en el caso de la desviacioacuten estaacutendar mientras maacutes grande sea el error estaacutendar de la estimacioacuten mayor seraacute la dispersioacuten de los puntos alrededor de la liacutenea de regresioacuten De manera inversa si Se= 0 esperamos que la ecuacioacuten de estimacioacuten sea un estimador ldquoperfectordquo de la variable dependiente En este caso todos los puntos caeriacutean directamente sobre la liacutenea de regresioacuten y no habriacutea puntos dispersos alrededor Usaremos el error estaacutendar de la estimacioacuten como una herramienta de la misma forma que podemos usar la desviacioacuten estaacutendar Esto es suponiendo que los puntos observados siguen una distribucioacuten normal alrededor de la recta de regresioacuten podemos esperar encontrar el 68 de los puntos dentro de plusmn1Se el 955 de los puntos dentro de plusmn2Se y el 997 de los puntos dentro de plusmn3Se

Estadiacutestica Administrativa II 19

Figura 4 Fuente (Levin 2004529)

Debemos observar que el error estaacutendar de la estimacioacuten se mide a lo largo del eje Y y no perpendicularmente desde la recta de regresioacuten 214 Intervalos de prediccioacuten aproximados Podemos concebir al error estaacutendar de la estimacioacuten como una herramienta estadiacutestica que podemos usar para hacer afirmaciones de probabilidad acerca del intervalo alrededor del valor estimado de Y dentro del cual cae el valor real de Y Ejemplo

Y= 375 + 075 X Sustituyendo 4 en X

Y= 375 + 075 (4) = 375 + 300

= 675

Estadiacutestica Administrativa II 20

Intervalo 1 error 2 errores 3 errores

Y plusmn1 Se

Y plusmn2 Se

Y plusmn3 Se

En donde Se = 8660

Sustitucioacuten

Ejemplo A menudo quienes hacen la contabilidad de costos estiman los gastos generales con base en el nivel de produccioacuten Se ha reunido informacioacuten acerca de los gastos generales y las unidades producidas en diferentes plantas y ahora desean estimar una ecuacioacuten de regresioacuten para predecir los gastos generales futuros Gastos generales 191 170 272 155 280 173 234 116 153 178 Unidades 40 42 53 35 56 39 48 30 37 40

a) Determine la variable dependiente e independiente b) Desarrolle una ecuacioacuten de regresioacuten para contabilidad de costos c) Pronostique los gastos generales cuando se producen 50 unidades d) Calcule el error estaacutendar de estimacioacuten

Y +1 Se =

675 + (1) (8660) = 76140 Liacutemite superior del intervalo de prediccioacuten

Y +2 Se =

675 + (2) (8660) = 84820 Liacutemite superior del intervalo de prediccioacuten

Y -1 Se =

675 - (1) (8660) = 58840 Liacutemite inferior del intervalo de prediccioacuten

Y - 2 Se =

675 - (2) (8660) = 50180 Liacutemite inferior del intervalo de prediccioacuten

Estadiacutestica Administrativa II 21

X Y XY X2 Y2 40 191 7640 1600 36481 42 170 7140 1764 28900 53 272 14416 2809 73984 35 155 5425 1225 24025 56 280 15680 3136 78400 39 173 6747 1521 29929 48 234 11232 2304 54756 30 116 3480 900 13456 37 153 5661 1369 23409 40 178 7120 1600 31684 ΣX= 420 ΣY= 1922 ΣXY= 84541 ΣX2= 18228 ΣY2= 395024

b = Σ XY - n X Y = 84541 - 10(42)(1922) = 64915 Σ X2 - n X2 18228 - 10(42)2 a = Y ndash bX = 1922 ndash 64915 (42) = - 804430 Y= a+bx = -804430 + 64915 (50) = 2441320 Se= ΣY2 ndashaΣY ndash b ΣXY = n-2 Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

12-2 531 12-3 531

12-13 531 12-14 531 12-15 531

Estadiacutestica Administrativa II 22

215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten

Coeficiente de determinacioacuten de la muestra

r2= aΣY+bΣXY-nY2

ΣY2 ndash n Y2

Coeficiente de correlacioacuten de la muestra

r= r2

Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten

Estadiacutestica Administrativa II 23

Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables

Y= a + b1 X1 + b2 X2

Ecuacioacuten

na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2

1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2

2 = Σ X2Y

Ejemplo

a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10

Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784

Sumatoria

114 105 85 2463 1590 1435 2367 1571

Matriz

6 105 85 114 105 2367 1435 2463 85 1435 1571 1590

1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25

1 175 14167 19 0 1 -099 884 0 0 361608 21410

361608 b2 = 21410 b2 = 21410 361608 b2 = 059

Estadiacutestica Administrativa II 24

1 b1 -099 b2 = 884 1 b1 -099 (059) = 884

-006 884 1b1 = 884 +006 b1 = 890

1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a

= 2589

Y= a + b1 X1 + b2 X2

y=2589+890(28)+059(10)=28099

Estadiacutestica Administrativa II 25

218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)

Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad

La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos

Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir

donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria

Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados

Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante

Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo

Estadiacutestica Administrativa II 26

Figura 5 Distribucioacuten Homocedaacutestica

Figura 6 Distribucioacuten Heterocedaacutestica

Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten

lineal para hacer estimaciones futuras

Estadiacutestica Administrativa II 27

Unidad 3 Nuacutemeros iacutendice

Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se

calcula encontrando el cociente del valor actual entre el valor base luego se

multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje

Tipos de nuacutemeros iacutendice

Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de

cantidad e iacutendice de valor

Iacutendice de precios

Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida

Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo

Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable

El iacutendice de valor combina los cambios de precio y cantidad para presentar un

iacutendice con maacutes informacioacuten

Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos

como indicadores generales de la condicioacuten econoacutemica de un paiacutes

Factores que pueden distorsionar los nuacutemeros iacutendice

bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados

bull Falta de comparacioacuten de iacutendices

bull Ponderacioacuten no apropiada de los factores

bull Seleccioacuten de una base no apropiada

Estadiacutestica Administrativa II 28

31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores

Iacutendice de cantidad de agregados no ponderados

ΣQi x 100 ΣQo

Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea

1993 1994 1995

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200

Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado

1993 Qo

1994 Q1

1995 Q2

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308

Estadiacutestica Administrativa II 29

Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra

Iacutendice de precios de agregados ponderados

ΣPiQ x 100 ΣPoQ

Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100

Cambio de periodo base

I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base

Estadiacutestica Administrativa II 30

35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos

Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables

Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico

Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios

El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)

Estadiacutestica Administrativa II 31

Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica

37 Deflacioacuten de los valores de series de tiempo

Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios

En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea

La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores

Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero

Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes

Los valores expresados en unidades monetarias corrientes se conocen como valores nominales

Los valores expresados en unidades monetarias constantes se conocen como valores reales

Estadiacutestica Administrativa II 32

38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor

Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos

39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)

Estadiacutestica Administrativa II 33

Siacutembolo Nombre de la compantildeiacutea

AA Alcoa

ALD Allied Signal

AXP American Express

BA Boeing

CAT Caterpillar

CHV Chevron

C CitiGroup

DIS Disney

DD Dupont

EK Eastman Kodak

GE General Electric

GM General Motors

GT Goodyear Tire

HWP Hewlett-Packard

IBM International Business Machines

IP International Paper

JNJ Johnson amp Johnson

JPM JP Morgan Bank

KO Coca Cola

Figura 5 Compantildeiacuteas comprendidas en el Dow Jones

310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos

Praacutectica 2

992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico

elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado

de precios

Estadiacutestica Administrativa II 34

Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida

bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)

42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten

Las principales pruebas no parameacutetricas son las siguientes

bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher

Estadiacutestica Administrativa II 35

bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon

Caracteriacutesticas de algunas pruebas no parameacutetricas

1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos

2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten

3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal

4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados

5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc

6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica

Prueba Caracteriacutestica

Mann- Whitney 2 muestras independientes

Wilcoxon 2 muestras asociadas

Kruskal-Wallis + de 2 muestras independientes

Friedman + de 2 muestras asociadas

Tabla1 Caracteriacutesticas de pruebas no parameacutetricas

Estadiacutestica Administrativa II 36

Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media

Ventajas y desventajas de los meacutetodos parameacutetricos

Desventajas Ventajas bull Ignoran cierta cantidad de

informacioacuten bull No requieren la suposicioacuten de que

una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica

bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas

bull Generalmente es maacutes sencillo realizarlas y entenderlas

bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal

Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo

MHHHHM

1ra 2ra 3ra

Estadiacutestica Administrativa II 37

Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1

n2= nuacutemero de ocurrencias del tipo 2

r= nuacutemero de corridas

4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue

BABBBAAABBABBBBAAAABABAABBBAABAAAABBA

BBAAAABBABBBBAABBABAABB

Valores de la prueba

n1= 29

n2= 31

r= 29

4322 Distribucioacuten de muestreo del estadiacutestico r

El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba

Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente

Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1

n1+n2

Estadiacutestica Administrativa II 38

μr = 2(29)(31) +1

29+31

μr = 1798 +1 60

μr = 2997 +1

μr = 3097

Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)

(n1+n2)2(n1+n2-1)

σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)

σr= (1798) (1738)

(60)2(59)

σr= 1471

σr= 384

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-24 643 14-25 643 14-26 643 14-27 644 14-28 644

Estadiacutestica Administrativa II 39

44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica

Ejemplo

Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado

Miembro del panel Calificacioacuten para

conferencias grandes

Calificacioacuten para

sesiones pequentildeas

Signo de la calificacioacuten

Evaluacioacuten de los dos tipos de

clases

1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -

6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +

La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)

Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20

Estadiacutestica Administrativa II 40

Establecimiento de las hipoacutetesis

Ho p = 05

H1 p ne 05

Se consideran la posibilidades solamente de signos + y - (9+6 =15)

p Ho = 05

q H0 = 05

n= 15

p= 0600 (915)

q= 0400 (615)

Prueba de hipoacutetesis de que no hay diferencia

Error estaacutendar del la proporcioacuten

σp= pq n

σp= (05)(05) 15

σp= 0129

0025

0

0475 del aacuterea

Valor criacutetico Z=-196

Regioacuten de aceptacioacuten

0025

0475 del aacuterea

Valor criacutetico Z=196

Estadiacutestica Administrativa II 41

45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten

Procedimiento de la prueba de rangos con signo de Wilcoxon

Paso1 Para cada par de datos calcule la diferencia d restando el segundo

valor del primero Guarde los signos pero descarte cualquier par para el que

d=0

Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de

la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango

correspondiente Cuando las diferencias tengan el mismo valor numeacuterico

asiacutegneles la media de los rangos implicados en el empate

Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino

Esto es inserte aquellos signos que se ignoraron e el paso dos

Paso 4 Calcule la suma de los valores absolutos de los rangos negativos

Tambieacuten la suma de los rangos positivos

Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon

en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el

procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos

sumas

Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la

diferencia d no es 0

Estadiacutestica Administrativa II 42

Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el

tamantildeo muestral

Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos

muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica

esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico

Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente

2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha

Notacioacuten

T= la maacutes pequentildea de las siguientes dos sumas

1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0

La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T

Estadiacutestica Administrativa II 43

46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2

Rango Calificacioacuten Plantel

1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S

10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S

Estadiacutestica Administrativa II 44

30 1600 S

Estadiacutestica Administrativa II 45

Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500

n1= 15 n2= 15 R1= 247 R2= 218

Estadiacutestico U

U = n1n2 + n1(n1 +1) -R1 2

U= (15)(15) + (15)(16) -247 2

U= 225+120-247

U= 98

Media de la distribucioacuten muestral U

μu = n1n2

2

μu = (15)(15)

2

μu =1125

Estadiacutestica Administrativa II 46

Estadiacutestico U

σU = n1n2 + (n1n2 +1)

12

σU = (15)(15)(15+15+1)

12

σU = 6975 12

σU = 58125

σU = 241

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2

α= 015

Estandarizacioacuten del estadiacutestico U

z = U-μu

σU

z = 98 - 1125 241

z = -0602

144 -144 0 -0602

Valor estandarizado de

la muestra U

Regioacuten de aceptacioacuten

Estadiacutestica Administrativa II 47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras

Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular

Prueba de Wilcoxon de los rangos con signo

Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero

Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande

Prueba de Wilcoxon para contrastar datos pareados

El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 2: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

INDICE Unidad 1 Pruebas de la bondad del ajuste y anaacutelisis de varianza

11 Anaacutelisis Ji-Cuadrada 1 12 Prueba de independencia 1 13 Prueba de la bondad del ajuste 1 14 Tablas de contingencia 4 141 meacutetodo para obtener el estadiacutestico x2 de una tabla de contingencia con dos renglones 4 142 meacutetodo para obtener el estadiacutestico x2 de una tabla de contingencia con maacutes de dos renglones 6 15 Anaacutelisis de varianza 9 151 Aplicaciones de ANOVA 9 152 Inferencia sobre una varianza de poblacioacuten (Anova) 14 153 Inferencia sobre la varianza de dos poblaciones (Anova) 15

Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple 21 Estimacioacuten mediante la liacutenea de regresioacuten 16 211 Diagrama de dispersioacuten 16 212 Meacutetodo de miacutenimos cuadrados 17 213 Interpretacioacuten del error estaacutendar de la estimacioacuten 18 214 Intervalos de prediccioacuten aproximados 19 215 Anaacutelisis de correlacioacuten 22 216 Paquete computacional para la solucioacuten de problemas 22 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten 22 218 Usos de variables ficticias 25 219 Residuales y graacuteficas de residuales 25 Unidad 3 Nuacutemeros iacutendice

31 Elaboracioacuten de iacutendices simples 27 32 Iacutendices agregados de precio 27 33 Relativos eslabonados 28 34 Cambio de periodo base 28 35 Fusioacuten de dos series de nuacutemeros iacutendice 29 36 Iacutendice de precios al consumidor (IPC) 29 37 Deflacioacuten de los valores de series de tiempo 30 38 Iacutendice de precios al productor (IPP) 31 39 Promedios de precios bursaacutetiles de DowJones 31 310 Indice de produccioacuten insustrial 31

Unidad 4 Estadiacutestica no parameacutetrica

41 Escala de medicioacuten 33 42 Meacutetodos estadiacutesticos contra no parameacutetricos 33 43 Prueba de corridas para aleatoriedad 35 431 Concepto de aleatoriedad 35 432 Teoriacutea de corridas 35 4321 Prueba de corridas de una sola muestra 36 4322 Distribucioacuten de muestreo del estadiacutestico r 36 44 Una muestra prueba de signos 38 45 Una muestra prueba de Wilcoxon 40 46 Dos muestras prueba de Mann-Whitney 42 47 Observaciones apareadas prueba de Wilcoxon 45 48 Varias muestras independientes prueba de Krauskal-Wallis 46

INTRODUCCIOacuteN La estadiacutestica administrativa es una materia importante en contaduriacutea ya que permite recopilar organizar representar analizar datos y tomar decisiones asiacute mismo nos da las herramientas necesarias para utilizar el meacutetodo adecuado conforme a la situacioacuten que se estaacute analizando y aplicarlo en el aacuterea contable Este cuadernillo de apuntes tiene como finalidad servir de apoyo al estudiante durante el curso de la materia el cual consta de 4 unidades en donde se proponen algunas praacutecticas para la aplicacioacuten de los temas estudiados y estaacute desarrollado conforme al temario Sin embargo es importante que el alumno consulte maacutes fuentes de informacioacuten con el objetivo de retroalimentar A continuacioacuten se hace una breve semblanza de los temas que se tratan en las unidades Unidad 1 Pruebas de la bondad del ajuste y anaacutelisis de varianza En esta unidad se analizan los siguientes temas anaacutelisis ji-cuadrada pruebas de independencia bondad de ajuste tablas de contingencia y anaacutelisis de varianza para hacer inferencias a partir de una o dos poblaciones Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple En esta unidad realiza el diagrama de dispersioacuten se aplica el meacutetodo de miacutenimos cuadrados para interpretar el error estaacutendar y determinar los intervalos de prediccioacuten asiacute como la solucioacuten de ejercicios de anaacutelisis de correlacioacuten en Excel Asimismo se recaban datos de una empresa para aplicar la regresioacuten lineal y hacer estimaciones futuras

Unidad 3 Nuacutemeros iacutendice En esta unidad se realizan ejercicios para la elaboracioacuten de nuacutemeros iacutendice simple precio agregado y precio al consumidor Asimismo se elaboran iacutendices de precio y cantidad con datos recabados en revistas y otras fuentes Unidad 4 Estadiacutestica no parameacutetrica En esta unidad se contrasta la estadiacutestica parameacutetrica contra la no parameacutetrica asiacute mismo se analizan temas de prueba de corrida de aleatoriedad de una o dos muestras y observaciones apareadas Tambieacuten se recopilan datos para efectuar comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestica no parameacutetrica

Estadiacutestica Administrativa II 1

Unidad 1 Pruebas de la bondad del ajuste y anaacutelisis de varianza 11 Anaacutelisis Ji-Cuadrada Las pruebas Ji-Cuadrada nos permite probar si maacutes de dos proporciones de poblacioacuten pueden ser consideradas iguales Si clasificamos una poblacioacuten en diferentes categoriacuteas respecto a dos atributos (por ejemplo edad y desempentildeo en el trabajo) entonces podemos utilizar una prueba Ji-Cuadrada para los dos atributos son independientes entre siacute 12 Prueba de independencia Los administradores necesitan saber si las diferencias que observan entre varias proporciones de la muestra son significativas o soacutelo se deben al azar 13 Prueba de la bondad del ajuste La prueba ji- cuadrada puede utilizarse tambieacuten para decidir si una distribucioacuten de probabilidad en particular como la binomial la de Poisson o la normal es la apropiada Esta es una habilidad importante porque como tomadores de decisiones que utilizamos la estadiacutestica necesitamos escoger cierta distribucioacuten de probabilidad para representar la distribucioacuten de los datos que tengamos que analizar La prueba ji- cuadrada nos permite hacernos la pregunta de cuaacutel distribucioacuten podemos utilizar y probar si existe una diferencia significativa entre una distribucioacuten de frecuencias observadas y una distribucioacuten de frecuencias teoacuterica Caacutelculo de frecuencias observadas y esperadas Ejemplo La compantildeiacutea ldquoxrdquo requiere que los estudiantes del uacuteltimo antildeo de la universidad que buscan trabajo sean entrevistados por tres ejecutivos diferentes Esto permite a la compantildeiacutea obtener una evaluacioacuten por consenso de candidatos Cada ejecutivo califica al candidato como positivo o negativo Con el propoacutesito de planear la contratacioacuten el director de seleccioacuten del personal de la compantildeiacutea piensa que el proceso de entrevistas puede ser aproximado por una distribucioacuten binomial con p= 040 es decir del 40 de de posibilidad de que cualquier candidato obtenga una calificacioacuten positiva en cualquiera de las entrevistas Si el director desea probar una hipoacutetesis a un nivel de significancia de 020 iquestCoacutemo debe proceder

Estadiacutestica Administrativa II 2

Ho una distribucioacuten binomial con p= 040 Es una buena descripcioacuten del proceso de entrevista Hi una distribucioacuten binomial con p= 040 No es una buena descripcioacuten del proceso de entrevista α= 020 nivel de significancia para probar la hipoacutetesis

Calificaciones positivas posibles en las tres

entrevistas

Nuacutemero de candidatos que obtienen cada

calificacioacuten Resultados de las entrevistas de 100 candidatos

0 18 1 47 2 24 3 11 100

Calificaciones positivas posibles en las tres

entrevistas

Probabilidades binomiales para esos resultados

Posibilidad binomial 0 2160 1 4320 2 2880 3 0640 10000

Calificaciones positivas

posibles en las tres entrevistas

Frecuencia observada de

candidatos que obtienen estas calificaciones

Probabilidades binomiales de

resultados posibles

Nuacutemero de candidatos

entrevistados

Frecuencia esperada de candidatos

que obtienen estas

calificaciones

Frecuencias observadas Probabilidades binomiales adecuadas y frecuencias esperada

0 18 2160 100 216 1 47 4320 100 432 2 24 2880 100 288 3 11 0640 100 64 100 10000 1000

Estadiacutestico ji- cuadrada

x2 = Σ(fo-fe)2

fe

fo= frecuencia observada fe= frecuencia esperada

Estadiacutestica Administrativa II 3

Frecuencia observada

fo

Frecuencia esperada

fe

fo-fe (fo-fe)2 (fo-fe)2

fe

Calculo del estadiacutestico x2

18 216 -36 1296 06000 47 432 38 1444 03343 24 288 -48 2304 08000 11 64 46 2116 33063

X2=50406

Determinacioacuten de los grados de libertad Antes de calcular el nuacutemero adecuado de grados de libertad para una prueba ji- cuadrada de bondad de ajuste es necesario contar el nuacutemero de clases (denotado por K) para las que se compararon las frecuencias observadas y esperadas

Grados de libertad = k-1

K= 0123 k= 4 gl= 4-1 gl= 3 Rechazamos la hipoacutetesis nula y llegamos a la conclusioacuten de que la distribucioacuten binomial con p=040 no proporciona una buena descripcioacuten de nuestras frecuencias observadas Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

11-16 466 11-17 466 11-18 466

Regioacuten de aceptacioacuten

50406

020 del aacuterea

Valor x2

Distribucioacuten x2

4642

Valor de tabla

Regioacuten de rechazo

Estadiacutestica Administrativa II 4

14 Tablas de contingencia Describimos las dimensiones de una tabla de contingencia estableciendo primero el nuacutemero de renglones y luego el nuacutemero de columnas La columna y el rengloacuten con el total no cuentan como parte de las dimensiones Los renglones corren de manera horizontal y las columnas de manera vertical Tabla de contingencia de 2 x 4( 2 renglones 4 columnas) 141 Meacutetodo para obtener el estadiacutestico x2 de una tabla de

contingencia con 2 renglones Ejemplo En cuatro regiones se muestrean las actitudes de los empleados respecto a la evaluacioacuten del desempentildeo en el trabajo Los trabajadores eligen entre el meacutetodo actual (dos evaluaciones al antildeo) y un meacutetodo propuesto (evaluaciones trimestrales) A continuacioacuten se presentan los datos Tabla de contingencia de 2x4 Noreste Sureste Central Costa

oeste Total

Respuesta de la muestra concerniente a los programas de evaluacioacuten de empleados

Nuacutemero de empleados que prefieren el meacutetodo actual

68 75 57 79 279

Nuacutemero de empleados que prefieren el meacutetodo nuevo

32 45 33 31 141

Total de empleados muestreados en cada regioacuten

100 56 90 110 420

Planteamiento del problema

Hipoacutetesis nula Ho PN=PS=PC=PW

Hipoacutetesis alternativa

Hi PN PS PC PW no son iguales PN= proporcioacuten de empleados en el noreste que prefieren el plan actual PS= proporcioacuten de empleados en el sureste que prefieren el plan actual PC= proporcioacuten de empleados en la regioacuten central que prefieren el plan actual PW= proporcioacuten de empleados de la regioacuten de la costa que prefieren el plan actual

Estadiacutestica Administrativa II 5

Frecuencias observadas y esperadas

Noreste Sureste Central Costa oeste

Proporcioacuten de empleados muestreados en cada regioacuten que se espera prefieren los dos meacutetodos de evaluacioacuten

Nuacutemero total muestreado 100 120 90 110 Proporcioacuten estimada que prefieren el meacutetodo actual

x 06643 x 06643 x 06643 x 06643

Nuacutemero que se espera prefiera el meacutetodo actual

6643 7972 5979 7307

Nuacutemero total muestreado 100 120 90 110 Proporcioacuten estimada que prefieren el meacutetodo nuevo

x 03357 x 03357 x 03357 x 03357

Nuacutemero que se espera prefiera el meacutetodo nuevo

3357 4028 3021 3693

Noreste Sureste Central Costa

oeste Comparacioacuten de las frecuencias observadas y esperadas de trabajadores muestreados

Frecuencia con que prefieren el meacutetodo actual

68 75 57 79

Frecuencia observada (real) Frecuencia esperada (teoacuterica)

6643 7972 5979 7307

Frecuencia con que prefieren el meacutetodo nuevo

32 45 33 31

Frecuencia observada (real) Frecuencia esperada (teoacuterica)

3357 4028 3021 3693

Estadiacutestico ji- cuadrada

119961120784 = 120622

(119943119952 minus 119943119942)120784119943119942

fo= frecuencia observada fe= frecuencia esperada

Paso 1 Paso 2 Paso 3 Calculo del estadiacutestico x2

fo fe fo-fe (fo-fe)2 (fo-fe)2

fe 68 6643 157 246 00370 75 7972 -472 2228 02795 57 5979 -279 778 01301 79 7307 593 3516 04812 32 3357 -157 246 00733

45 4028 472 2228 05531 33 3021 279 778 02575 31 3693 -593 3516 09521 X2= 27638

Estadiacutestica Administrativa II 6

Determinacioacuten de los grados de libertad

Nuacutemero de grados de libertad

Grados de libertad en una prueba ji- cuadrada

= (nuacutemero de renglones -1 )(nuacutemero de columnas -1)

Tabla de 2x4 (2-1)(4-1)= (1)(3) = 3 grados de libertad

Nivel de significancia de 10 Buscar en tablas x2 3 grados de libertad con un nivel de significancia de 10 y graficar

Interpretacioacuten de los resultados y la graacutefica 142 Meacutetodo para obtener el estadiacutestico x2 de una tabla de

contingencia con maacutes de 2 renglones Estadiacutestico ji- cuadrada

x2 = Σ(fo-fe)2

fe fo= frecuencia observada fe= frecuencia esperada Determinacioacuten de los grados de libertad de una tabla de contingencia de maacutes de tres renglones

Nuacutemero de grados de libertad de una tabla de maacutes de tres renglones

Grados de libertad en una prueba ji- cuadrada

= (nuacutemero de renglones -1 )(nuacutemero de columnas -1)

Regioacuten de aceptacioacuten

2764

010 del aacuterea

Valor x2

Distribucioacuten x2

con 3 grados de

libertad

6251

Valor de tabla

Regioacuten de rechazo

Estadiacutestica Administrativa II 7

Tabla de contingencia Nuacutemero de

renglones Nuacutemero de columnas

r-1 c-1 Grados de libertad (r-1)(c-1)

A 3 4 3-1=2 4-1=3 (2)(3)=6 B 5 7 5-1=4 7-1=6 (4)(6)=24 C 6 9 6-1=5 9-1=8 (5)(8)=40

El presidente de una compantildeiacutea de seguros de salud se opone al seguro nacional Argumenta que su implementacioacuten seriacutea muy costosa en particular debido a que la existencia de este sistema tenderiacutea a fomentar permanencias hospitalarias maacutes prolongadas ademaacutes de otros efectos El presidente piensa que el tiempo de hospitalizacioacuten depende del tipo de seguro de salud que tengan las personas Los siguientes datos se obtuvieron de una muestra aleatoria de 660 hospitalizaciones Diacuteas en el hospital lt5 5-10 gt10 Total Datos de hospitalizaciones Calificados seguacuten el tipo de cobertura del seguro y el tiempo de estancia

Fraccioacuten de costos cubiertos por el seguro

lt25 40 75 65 180 25 -50 30 45 75 150

gt50 40 100 190 330

Total 110 220 330 660

Planteamiento del problema

Hipoacutetesis nula Ho el tiempo de estancia y tipo de seguro son independientes

Hipoacutetesis alternativa

Hi el tiempo de estancia depende del tipo de seguro

α= 001 nivel de significancia para probar la hipoacutetesis Frecuencia esperada para cualquier celda

Calculo de la frecuencia esperada fe= RT X CT n

fe= frecuencia esperada en una celda dada RT= total por rengloacuten para el rengloacuten que contiene esa celda CT= total por columna para la columna que contiene esa celda n= nuacutemero total de observaciones

Estadiacutestica Administrativa II 8

Estadiacutestico ji- cuadrada

fo= frecuencia observada fe= frecuencia esperada

x2 = Σ(fo-fe)2

fe

Rengloacuten Columna fo fe = RT X CT n

fo-fe (fo-fe)2 (fo-fe)2

fe Calculo de las frecuencias esperadas y ji- cuadrada

1 1 40 30 180 X 110 660

10 100 3333

1 2 75 60 180 X 220 660

15 225 3750

1 3 65 90 180 X 330 660

-25 625 6944

2 1 30 25 150 X 110 660

5 25 1000

2 2 45 50 150 X 220 660

-5 25 0500

2 3 75 75 150 X 330 660

0 0 0000

3 1 40 55 330 X 110 660

-15 225 4091

3 2 100 110 330 X 220 660

-10 100 0909

3 3 190 165 330 X 330 660

25 625 3788

X2=24315

Buscar en tablas x2 4grados de libertad con un nivel de significancia de 10 y graficar Interpretacioacuten de resultados

Regioacuten de aceptacioacuten

x2= 24315

010 del aacuterea

Distribucioacuten x2

13277

Valor de tabla

Regioacuten de rechazo

Estadiacutestica Administrativa II 9

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

11-1 459 11-2 460 11-7 460 11-8 460 11-9 460

11-10 460 11-11 461 11-12 461 11-13 461

15 Anaacutelisis de varianza

El anaacutelisis de varianza nos permite probar si maacutes de dos medias de poblacioacuten pueden considerarse iguales A menudo se abrevia ANOVA analysis of variance ANOVA Es un meacutetodo de prueba de igualdad de tres o maacutes medias poblacionales1

Hipoacutetesis nula tiacutepica

HO= μ1= μ2= μ3

El meacutetodo ANOVA nos sirve para evitar el error tipo I (rechazar una hipoacutetesis nula verdadera) si utilizamos una prueba de igualdad de varias medias

151 Aplicaciones de ANOVA Se utiliza cuando Se asevera que los supermercados colocan los cereales con alto contenido de azuacutecar en estantes que estaacuten a la altura De los ojos de los nintildeos de manera que eso nos permite probar la aseveracioacuten de que los cereales en los estantes tienen el mismo contenido de azuacutecar

1 Mario F Triola Estadiacutestica Pearson Meacutexico2006

Estadiacutestica Administrativa II 10

Tambieacuten en casos como la comparacioacuten del kilometraje logrado por cinco clases diferentes de gasolina la prueba de cuaacutel de cuatro meacutetodos de capacitacioacuten produce el aprendizaje maacutes raacutepido etc Los meacutetodos de ANOVA requieren de la distribucioacuten F Propiedades de la distribucioacuten F

1 Es no simeacutetrica se sesga hacia la derecha 2 Los valores F son 0 o positivo pero no negativos 3 Hay una distribucioacuten F para cada par de grados de libertad para el

numerador y el denominador

Figura 1 Fuente (Triola 2006605) Ejemplo

Muestra 1 15 18 19 22 11

Muestra 2 22 27 18 21 17

Muestra 3 18 24 19 16 22 15

Planteamiento de la hipoacutetesis

Ho μ1= μ2= μ3

H1 μ1 μ2 y μ3 no son todas iguales

Estadiacutestica Administrativa II 11

Caacutelculo de la media

Meacutetodo 1 Meacutetodo 2 Meacutetodo 3 Produccioacuten diaria 15 22 18

18 27 24 19 18 19 22 21 16 11 17 22

15 85 105 114 Sumatoria divide5 divide5 divide6 Tamantildeo de

la muestra 17 21 19 Media

muestral n1=5 n2=5 n3=6

1= 17 2= 21 3= 19

Caacutelculo de la gran media

= 15 +18+ 19+ 22+ 11+22 +27+ 18+ 21+ 17+18 +24+ 19+ 16+ 22+ 15 = 19 16

Caacutelculo de la varianza entre columnas

σ2b = Σnj ( - )2 = k-1

n - ( - )2 n( - ) Caacutelculo de la varianza entre columnas

5 17 19 17-19=-2 (-2)2=4 5x4=20 5 21 19 21-19=2 (2)2=4 5x4=20 6 19 19 19-19=0 (0)2=0 6x0 = 0 Σnj( - )

2 =40

σ2b = Σnj ( - )2 = 40= 40 = 20 varianza entre columnas

k-1 3-1 2

Estadiacutestica Administrativa II 12

Estimacioacuten de la varianza dentro de columnas

Meacutetodo de capacitacioacuten 1 Media muestral =17

Estimacioacuten de la varianza dentro de columnas

- ( - )2 15-17=-2 (-2)2=4 18-17=1 (1)2=1 19-17=2 (2)2=4 22-17=5 (5)2=25 11-17=-6 (-6)2=36 Σ( - )2 =70

s21= Σ( - )2 = 70 = 175 varianza de la muestra

n-1 5-1

Meacutetodo de capacitacioacuten 2 Media muestral =21

Estimacioacuten de la varianza dentro de columnas

- ( - )2 22-21=1 (1)2=1 27-21=6 (6)2=36 18-21=-3 (-3)2=9 21-21=0 (0)2=0 17-21=-4 (-4)2=16 Σ( - )2 =62

s22= Σ( - )2 = 62 = 155 varianza de la muestra

n-1 5-1

Meacutetodo de capacitacioacuten 3 Media muestral =19

Estimacioacuten de la varianza dentro de columnas

- ( - )2 18-19=-1 (-1)2=1 24-19=5 (5)2=25 19-19=0 (0)2=0 16-19=-3 (-3)2=9 22-19=3 (-32=9 15-19=-4 (-4)2=16 Σ( - )2 =60

Estadiacutestica Administrativa II 13

s23= Σ( - )2 = 60 = 120 varianza de la muestra

n-1 6-1

σ2w = Σ nj - 1 s2

j = (413)(175) + (413)(155) + (513)(120) = 193 = 14769 nt - k 13

Estadiacutestico F

F = varianza entre columnas = σ2b

Varianza dentro de columnas σ2w

F= 20 = 1354 cociente F 14769

Determinacioacuten de los grados de libertad

Grados de libertad del numerador

Nuacutemero de grados de libertad en el numerador del cociente F

= (nuacutemero de muestras-1)

Grados de libertad del denominador

Nuacutemero de grados de libertad en el denominador del cociente F

= Σ (nj-1)= nt-k

Graacutefica

Se acepta la hipoacutetesis nula

Regioacuten de aceptacioacuten

F= 1354

005 del aacuterea

Distribucioacuten f

381

Valor de tabla

Regioacuten de rechazo

Estadiacutestica Administrativa II 14

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

11-5 479 11-6 479

11-26 480 11-27 480 11-28 480 11-29 480 11-30 480

152 Inferencia sobre una varianza de poblacioacuten (Anova)

Estadiacutestico ji- cuadrada para inferencias sobre una varianza

X2=(n-1)s2 σ2

Intervalo de confianza para σ2

Liacutemite inferior de confianza

σ2L=(n-1)s2 X2

U Liacutemite superior de confianza

σ2U=(n-1)s2 X2

L

Estadiacutestica Administrativa II 15

Ejercicio

Con los siguientes datos obtener el estadiacutestico ji- cuadrada Y el intervalo de

confianza del 95

Tiempo x

50 45 27 66 43 96 45 90 69

153 Inferencia sobre la varianza de dos poblaciones (Anova) Ademaacutes de comparar la varianza de dos poblaciones el principal objetivo de este tema es analizar el cociente que se obtiene al aplicar la foacutermula correspondiente

Coeficiente F para inferencias acerca de dos varianzas

F=S21

S22

Estadiacutestica Administrativa II 16

Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple

21 Estimacioacuten mediante la liacutenea de regresioacuten El anaacutelisis de regresioacuten y correlacioacuten permiten determinar tanto la naturaleza como la fuerza de una relacioacuten entre dos variables En el anaacutelisis de regresioacuten se desarrollaraacute una ecuacioacuten de estimacioacuten a traveacutes de una foacutermula matemaacutetica que relaciona las variables conocidas con la variable desconocida La variable conocida- variable independiente X La variable que tratamos de predecir se llama variable dependiente Y

Figura 2 Fuente (Levin 2004511) 211 Diagrama de dispersioacuten El primer paso para determinar si existe una relacioacuten entre dos variables es examinar la graacutefica de datos observados A esta graacutefica se le llama diagrama de dispersioacuten Un diagrama de dispersioacuten se puede identificar visualmente patrones que indique si las variables estaacuten relacionadas

X

Y

Gastos contra la contaminacioacuten

Emisor de

contaminacioacuten

Pendiente negativa

b) Relacioacuten directa

X

Y

Publicidad

Ventas

Pendiente positiva

a) Relacioacuten directa

Estadiacutestica Administrativa II 17

Figura 3 Fuente (Levin 2004503)

212 Meacutetodo de miacutenimos cuadrados

Liacutenea de estimacioacuten

Y= a+bx Y= variable dependiente a=variable ordenada y b=pendiente de la recta x=variable independiente

Pendiente de la recta de regresioacuten de mejor ajuste

b = Σ XY - n X Y Σ X2 - n X2

b=pendiente de la liacutenea de estimacioacuten de mejor ajuste X= valores de la variable independiente Y= variable valores de la variable dependiente X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente n= nuacutemero de puntos

Estadiacutestica Administrativa II 18

Liacutenea de estimacioacuten

a = Y - bX a= ordenada Y b= pendiente de la ecuacioacuten X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente

Error estaacutendar de la estimacioacuten

Se= Σ(Y-Y)2

n-2 Y= valores de la variable dependiente Y=valores estimados con la ecuacioacuten de estimacioacuten que corresponden a cada valor de Y n= nuacutemero de puntos utilizados para ajustar la liacutenea de regresioacuten Para medir la confiabilidad de la ecuacioacuten de estimacioacuten los especialistas en estadiacutestica han desarrollado el error estaacutendar de estimacioacuten Este error estaacutendar se simboliza por Se y es similar a la desviacioacuten estaacutendar en cuanto a que ambas son medidas de dispersioacuten El error estaacutendar de la estimacioacuten por otra parte mide la variabilidad o dispersioacuten de los valores observados alrededor de la recta de regresioacuten 213 Interpretacioacuten del error estaacutendar de la estimacioacuten Como ocurririacutea en el caso de la desviacioacuten estaacutendar mientras maacutes grande sea el error estaacutendar de la estimacioacuten mayor seraacute la dispersioacuten de los puntos alrededor de la liacutenea de regresioacuten De manera inversa si Se= 0 esperamos que la ecuacioacuten de estimacioacuten sea un estimador ldquoperfectordquo de la variable dependiente En este caso todos los puntos caeriacutean directamente sobre la liacutenea de regresioacuten y no habriacutea puntos dispersos alrededor Usaremos el error estaacutendar de la estimacioacuten como una herramienta de la misma forma que podemos usar la desviacioacuten estaacutendar Esto es suponiendo que los puntos observados siguen una distribucioacuten normal alrededor de la recta de regresioacuten podemos esperar encontrar el 68 de los puntos dentro de plusmn1Se el 955 de los puntos dentro de plusmn2Se y el 997 de los puntos dentro de plusmn3Se

Estadiacutestica Administrativa II 19

Figura 4 Fuente (Levin 2004529)

Debemos observar que el error estaacutendar de la estimacioacuten se mide a lo largo del eje Y y no perpendicularmente desde la recta de regresioacuten 214 Intervalos de prediccioacuten aproximados Podemos concebir al error estaacutendar de la estimacioacuten como una herramienta estadiacutestica que podemos usar para hacer afirmaciones de probabilidad acerca del intervalo alrededor del valor estimado de Y dentro del cual cae el valor real de Y Ejemplo

Y= 375 + 075 X Sustituyendo 4 en X

Y= 375 + 075 (4) = 375 + 300

= 675

Estadiacutestica Administrativa II 20

Intervalo 1 error 2 errores 3 errores

Y plusmn1 Se

Y plusmn2 Se

Y plusmn3 Se

En donde Se = 8660

Sustitucioacuten

Ejemplo A menudo quienes hacen la contabilidad de costos estiman los gastos generales con base en el nivel de produccioacuten Se ha reunido informacioacuten acerca de los gastos generales y las unidades producidas en diferentes plantas y ahora desean estimar una ecuacioacuten de regresioacuten para predecir los gastos generales futuros Gastos generales 191 170 272 155 280 173 234 116 153 178 Unidades 40 42 53 35 56 39 48 30 37 40

a) Determine la variable dependiente e independiente b) Desarrolle una ecuacioacuten de regresioacuten para contabilidad de costos c) Pronostique los gastos generales cuando se producen 50 unidades d) Calcule el error estaacutendar de estimacioacuten

Y +1 Se =

675 + (1) (8660) = 76140 Liacutemite superior del intervalo de prediccioacuten

Y +2 Se =

675 + (2) (8660) = 84820 Liacutemite superior del intervalo de prediccioacuten

Y -1 Se =

675 - (1) (8660) = 58840 Liacutemite inferior del intervalo de prediccioacuten

Y - 2 Se =

675 - (2) (8660) = 50180 Liacutemite inferior del intervalo de prediccioacuten

Estadiacutestica Administrativa II 21

X Y XY X2 Y2 40 191 7640 1600 36481 42 170 7140 1764 28900 53 272 14416 2809 73984 35 155 5425 1225 24025 56 280 15680 3136 78400 39 173 6747 1521 29929 48 234 11232 2304 54756 30 116 3480 900 13456 37 153 5661 1369 23409 40 178 7120 1600 31684 ΣX= 420 ΣY= 1922 ΣXY= 84541 ΣX2= 18228 ΣY2= 395024

b = Σ XY - n X Y = 84541 - 10(42)(1922) = 64915 Σ X2 - n X2 18228 - 10(42)2 a = Y ndash bX = 1922 ndash 64915 (42) = - 804430 Y= a+bx = -804430 + 64915 (50) = 2441320 Se= ΣY2 ndashaΣY ndash b ΣXY = n-2 Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

12-2 531 12-3 531

12-13 531 12-14 531 12-15 531

Estadiacutestica Administrativa II 22

215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten

Coeficiente de determinacioacuten de la muestra

r2= aΣY+bΣXY-nY2

ΣY2 ndash n Y2

Coeficiente de correlacioacuten de la muestra

r= r2

Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten

Estadiacutestica Administrativa II 23

Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables

Y= a + b1 X1 + b2 X2

Ecuacioacuten

na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2

1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2

2 = Σ X2Y

Ejemplo

a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10

Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784

Sumatoria

114 105 85 2463 1590 1435 2367 1571

Matriz

6 105 85 114 105 2367 1435 2463 85 1435 1571 1590

1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25

1 175 14167 19 0 1 -099 884 0 0 361608 21410

361608 b2 = 21410 b2 = 21410 361608 b2 = 059

Estadiacutestica Administrativa II 24

1 b1 -099 b2 = 884 1 b1 -099 (059) = 884

-006 884 1b1 = 884 +006 b1 = 890

1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a

= 2589

Y= a + b1 X1 + b2 X2

y=2589+890(28)+059(10)=28099

Estadiacutestica Administrativa II 25

218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)

Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad

La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos

Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir

donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria

Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados

Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante

Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo

Estadiacutestica Administrativa II 26

Figura 5 Distribucioacuten Homocedaacutestica

Figura 6 Distribucioacuten Heterocedaacutestica

Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten

lineal para hacer estimaciones futuras

Estadiacutestica Administrativa II 27

Unidad 3 Nuacutemeros iacutendice

Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se

calcula encontrando el cociente del valor actual entre el valor base luego se

multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje

Tipos de nuacutemeros iacutendice

Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de

cantidad e iacutendice de valor

Iacutendice de precios

Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida

Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo

Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable

El iacutendice de valor combina los cambios de precio y cantidad para presentar un

iacutendice con maacutes informacioacuten

Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos

como indicadores generales de la condicioacuten econoacutemica de un paiacutes

Factores que pueden distorsionar los nuacutemeros iacutendice

bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados

bull Falta de comparacioacuten de iacutendices

bull Ponderacioacuten no apropiada de los factores

bull Seleccioacuten de una base no apropiada

Estadiacutestica Administrativa II 28

31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores

Iacutendice de cantidad de agregados no ponderados

ΣQi x 100 ΣQo

Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea

1993 1994 1995

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200

Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado

1993 Qo

1994 Q1

1995 Q2

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308

Estadiacutestica Administrativa II 29

Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra

Iacutendice de precios de agregados ponderados

ΣPiQ x 100 ΣPoQ

Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100

Cambio de periodo base

I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base

Estadiacutestica Administrativa II 30

35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos

Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables

Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico

Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios

El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)

Estadiacutestica Administrativa II 31

Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica

37 Deflacioacuten de los valores de series de tiempo

Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios

En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea

La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores

Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero

Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes

Los valores expresados en unidades monetarias corrientes se conocen como valores nominales

Los valores expresados en unidades monetarias constantes se conocen como valores reales

Estadiacutestica Administrativa II 32

38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor

Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos

39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)

Estadiacutestica Administrativa II 33

Siacutembolo Nombre de la compantildeiacutea

AA Alcoa

ALD Allied Signal

AXP American Express

BA Boeing

CAT Caterpillar

CHV Chevron

C CitiGroup

DIS Disney

DD Dupont

EK Eastman Kodak

GE General Electric

GM General Motors

GT Goodyear Tire

HWP Hewlett-Packard

IBM International Business Machines

IP International Paper

JNJ Johnson amp Johnson

JPM JP Morgan Bank

KO Coca Cola

Figura 5 Compantildeiacuteas comprendidas en el Dow Jones

310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos

Praacutectica 2

992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico

elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado

de precios

Estadiacutestica Administrativa II 34

Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida

bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)

42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten

Las principales pruebas no parameacutetricas son las siguientes

bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher

Estadiacutestica Administrativa II 35

bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon

Caracteriacutesticas de algunas pruebas no parameacutetricas

1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos

2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten

3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal

4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados

5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc

6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica

Prueba Caracteriacutestica

Mann- Whitney 2 muestras independientes

Wilcoxon 2 muestras asociadas

Kruskal-Wallis + de 2 muestras independientes

Friedman + de 2 muestras asociadas

Tabla1 Caracteriacutesticas de pruebas no parameacutetricas

Estadiacutestica Administrativa II 36

Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media

Ventajas y desventajas de los meacutetodos parameacutetricos

Desventajas Ventajas bull Ignoran cierta cantidad de

informacioacuten bull No requieren la suposicioacuten de que

una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica

bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas

bull Generalmente es maacutes sencillo realizarlas y entenderlas

bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal

Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo

MHHHHM

1ra 2ra 3ra

Estadiacutestica Administrativa II 37

Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1

n2= nuacutemero de ocurrencias del tipo 2

r= nuacutemero de corridas

4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue

BABBBAAABBABBBBAAAABABAABBBAABAAAABBA

BBAAAABBABBBBAABBABAABB

Valores de la prueba

n1= 29

n2= 31

r= 29

4322 Distribucioacuten de muestreo del estadiacutestico r

El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba

Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente

Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1

n1+n2

Estadiacutestica Administrativa II 38

μr = 2(29)(31) +1

29+31

μr = 1798 +1 60

μr = 2997 +1

μr = 3097

Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)

(n1+n2)2(n1+n2-1)

σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)

σr= (1798) (1738)

(60)2(59)

σr= 1471

σr= 384

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-24 643 14-25 643 14-26 643 14-27 644 14-28 644

Estadiacutestica Administrativa II 39

44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica

Ejemplo

Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado

Miembro del panel Calificacioacuten para

conferencias grandes

Calificacioacuten para

sesiones pequentildeas

Signo de la calificacioacuten

Evaluacioacuten de los dos tipos de

clases

1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -

6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +

La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)

Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20

Estadiacutestica Administrativa II 40

Establecimiento de las hipoacutetesis

Ho p = 05

H1 p ne 05

Se consideran la posibilidades solamente de signos + y - (9+6 =15)

p Ho = 05

q H0 = 05

n= 15

p= 0600 (915)

q= 0400 (615)

Prueba de hipoacutetesis de que no hay diferencia

Error estaacutendar del la proporcioacuten

σp= pq n

σp= (05)(05) 15

σp= 0129

0025

0

0475 del aacuterea

Valor criacutetico Z=-196

Regioacuten de aceptacioacuten

0025

0475 del aacuterea

Valor criacutetico Z=196

Estadiacutestica Administrativa II 41

45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten

Procedimiento de la prueba de rangos con signo de Wilcoxon

Paso1 Para cada par de datos calcule la diferencia d restando el segundo

valor del primero Guarde los signos pero descarte cualquier par para el que

d=0

Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de

la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango

correspondiente Cuando las diferencias tengan el mismo valor numeacuterico

asiacutegneles la media de los rangos implicados en el empate

Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino

Esto es inserte aquellos signos que se ignoraron e el paso dos

Paso 4 Calcule la suma de los valores absolutos de los rangos negativos

Tambieacuten la suma de los rangos positivos

Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon

en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el

procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos

sumas

Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la

diferencia d no es 0

Estadiacutestica Administrativa II 42

Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el

tamantildeo muestral

Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos

muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica

esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico

Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente

2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha

Notacioacuten

T= la maacutes pequentildea de las siguientes dos sumas

1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0

La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T

Estadiacutestica Administrativa II 43

46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2

Rango Calificacioacuten Plantel

1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S

10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S

Estadiacutestica Administrativa II 44

30 1600 S

Estadiacutestica Administrativa II 45

Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500

n1= 15 n2= 15 R1= 247 R2= 218

Estadiacutestico U

U = n1n2 + n1(n1 +1) -R1 2

U= (15)(15) + (15)(16) -247 2

U= 225+120-247

U= 98

Media de la distribucioacuten muestral U

μu = n1n2

2

μu = (15)(15)

2

μu =1125

Estadiacutestica Administrativa II 46

Estadiacutestico U

σU = n1n2 + (n1n2 +1)

12

σU = (15)(15)(15+15+1)

12

σU = 6975 12

σU = 58125

σU = 241

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2

α= 015

Estandarizacioacuten del estadiacutestico U

z = U-μu

σU

z = 98 - 1125 241

z = -0602

144 -144 0 -0602

Valor estandarizado de

la muestra U

Regioacuten de aceptacioacuten

Estadiacutestica Administrativa II 47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras

Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular

Prueba de Wilcoxon de los rangos con signo

Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero

Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande

Prueba de Wilcoxon para contrastar datos pareados

El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 3: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

Unidad 4 Estadiacutestica no parameacutetrica

41 Escala de medicioacuten 33 42 Meacutetodos estadiacutesticos contra no parameacutetricos 33 43 Prueba de corridas para aleatoriedad 35 431 Concepto de aleatoriedad 35 432 Teoriacutea de corridas 35 4321 Prueba de corridas de una sola muestra 36 4322 Distribucioacuten de muestreo del estadiacutestico r 36 44 Una muestra prueba de signos 38 45 Una muestra prueba de Wilcoxon 40 46 Dos muestras prueba de Mann-Whitney 42 47 Observaciones apareadas prueba de Wilcoxon 45 48 Varias muestras independientes prueba de Krauskal-Wallis 46

INTRODUCCIOacuteN La estadiacutestica administrativa es una materia importante en contaduriacutea ya que permite recopilar organizar representar analizar datos y tomar decisiones asiacute mismo nos da las herramientas necesarias para utilizar el meacutetodo adecuado conforme a la situacioacuten que se estaacute analizando y aplicarlo en el aacuterea contable Este cuadernillo de apuntes tiene como finalidad servir de apoyo al estudiante durante el curso de la materia el cual consta de 4 unidades en donde se proponen algunas praacutecticas para la aplicacioacuten de los temas estudiados y estaacute desarrollado conforme al temario Sin embargo es importante que el alumno consulte maacutes fuentes de informacioacuten con el objetivo de retroalimentar A continuacioacuten se hace una breve semblanza de los temas que se tratan en las unidades Unidad 1 Pruebas de la bondad del ajuste y anaacutelisis de varianza En esta unidad se analizan los siguientes temas anaacutelisis ji-cuadrada pruebas de independencia bondad de ajuste tablas de contingencia y anaacutelisis de varianza para hacer inferencias a partir de una o dos poblaciones Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple En esta unidad realiza el diagrama de dispersioacuten se aplica el meacutetodo de miacutenimos cuadrados para interpretar el error estaacutendar y determinar los intervalos de prediccioacuten asiacute como la solucioacuten de ejercicios de anaacutelisis de correlacioacuten en Excel Asimismo se recaban datos de una empresa para aplicar la regresioacuten lineal y hacer estimaciones futuras

Unidad 3 Nuacutemeros iacutendice En esta unidad se realizan ejercicios para la elaboracioacuten de nuacutemeros iacutendice simple precio agregado y precio al consumidor Asimismo se elaboran iacutendices de precio y cantidad con datos recabados en revistas y otras fuentes Unidad 4 Estadiacutestica no parameacutetrica En esta unidad se contrasta la estadiacutestica parameacutetrica contra la no parameacutetrica asiacute mismo se analizan temas de prueba de corrida de aleatoriedad de una o dos muestras y observaciones apareadas Tambieacuten se recopilan datos para efectuar comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestica no parameacutetrica

Estadiacutestica Administrativa II 1

Unidad 1 Pruebas de la bondad del ajuste y anaacutelisis de varianza 11 Anaacutelisis Ji-Cuadrada Las pruebas Ji-Cuadrada nos permite probar si maacutes de dos proporciones de poblacioacuten pueden ser consideradas iguales Si clasificamos una poblacioacuten en diferentes categoriacuteas respecto a dos atributos (por ejemplo edad y desempentildeo en el trabajo) entonces podemos utilizar una prueba Ji-Cuadrada para los dos atributos son independientes entre siacute 12 Prueba de independencia Los administradores necesitan saber si las diferencias que observan entre varias proporciones de la muestra son significativas o soacutelo se deben al azar 13 Prueba de la bondad del ajuste La prueba ji- cuadrada puede utilizarse tambieacuten para decidir si una distribucioacuten de probabilidad en particular como la binomial la de Poisson o la normal es la apropiada Esta es una habilidad importante porque como tomadores de decisiones que utilizamos la estadiacutestica necesitamos escoger cierta distribucioacuten de probabilidad para representar la distribucioacuten de los datos que tengamos que analizar La prueba ji- cuadrada nos permite hacernos la pregunta de cuaacutel distribucioacuten podemos utilizar y probar si existe una diferencia significativa entre una distribucioacuten de frecuencias observadas y una distribucioacuten de frecuencias teoacuterica Caacutelculo de frecuencias observadas y esperadas Ejemplo La compantildeiacutea ldquoxrdquo requiere que los estudiantes del uacuteltimo antildeo de la universidad que buscan trabajo sean entrevistados por tres ejecutivos diferentes Esto permite a la compantildeiacutea obtener una evaluacioacuten por consenso de candidatos Cada ejecutivo califica al candidato como positivo o negativo Con el propoacutesito de planear la contratacioacuten el director de seleccioacuten del personal de la compantildeiacutea piensa que el proceso de entrevistas puede ser aproximado por una distribucioacuten binomial con p= 040 es decir del 40 de de posibilidad de que cualquier candidato obtenga una calificacioacuten positiva en cualquiera de las entrevistas Si el director desea probar una hipoacutetesis a un nivel de significancia de 020 iquestCoacutemo debe proceder

Estadiacutestica Administrativa II 2

Ho una distribucioacuten binomial con p= 040 Es una buena descripcioacuten del proceso de entrevista Hi una distribucioacuten binomial con p= 040 No es una buena descripcioacuten del proceso de entrevista α= 020 nivel de significancia para probar la hipoacutetesis

Calificaciones positivas posibles en las tres

entrevistas

Nuacutemero de candidatos que obtienen cada

calificacioacuten Resultados de las entrevistas de 100 candidatos

0 18 1 47 2 24 3 11 100

Calificaciones positivas posibles en las tres

entrevistas

Probabilidades binomiales para esos resultados

Posibilidad binomial 0 2160 1 4320 2 2880 3 0640 10000

Calificaciones positivas

posibles en las tres entrevistas

Frecuencia observada de

candidatos que obtienen estas calificaciones

Probabilidades binomiales de

resultados posibles

Nuacutemero de candidatos

entrevistados

Frecuencia esperada de candidatos

que obtienen estas

calificaciones

Frecuencias observadas Probabilidades binomiales adecuadas y frecuencias esperada

0 18 2160 100 216 1 47 4320 100 432 2 24 2880 100 288 3 11 0640 100 64 100 10000 1000

Estadiacutestico ji- cuadrada

x2 = Σ(fo-fe)2

fe

fo= frecuencia observada fe= frecuencia esperada

Estadiacutestica Administrativa II 3

Frecuencia observada

fo

Frecuencia esperada

fe

fo-fe (fo-fe)2 (fo-fe)2

fe

Calculo del estadiacutestico x2

18 216 -36 1296 06000 47 432 38 1444 03343 24 288 -48 2304 08000 11 64 46 2116 33063

X2=50406

Determinacioacuten de los grados de libertad Antes de calcular el nuacutemero adecuado de grados de libertad para una prueba ji- cuadrada de bondad de ajuste es necesario contar el nuacutemero de clases (denotado por K) para las que se compararon las frecuencias observadas y esperadas

Grados de libertad = k-1

K= 0123 k= 4 gl= 4-1 gl= 3 Rechazamos la hipoacutetesis nula y llegamos a la conclusioacuten de que la distribucioacuten binomial con p=040 no proporciona una buena descripcioacuten de nuestras frecuencias observadas Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

11-16 466 11-17 466 11-18 466

Regioacuten de aceptacioacuten

50406

020 del aacuterea

Valor x2

Distribucioacuten x2

4642

Valor de tabla

Regioacuten de rechazo

Estadiacutestica Administrativa II 4

14 Tablas de contingencia Describimos las dimensiones de una tabla de contingencia estableciendo primero el nuacutemero de renglones y luego el nuacutemero de columnas La columna y el rengloacuten con el total no cuentan como parte de las dimensiones Los renglones corren de manera horizontal y las columnas de manera vertical Tabla de contingencia de 2 x 4( 2 renglones 4 columnas) 141 Meacutetodo para obtener el estadiacutestico x2 de una tabla de

contingencia con 2 renglones Ejemplo En cuatro regiones se muestrean las actitudes de los empleados respecto a la evaluacioacuten del desempentildeo en el trabajo Los trabajadores eligen entre el meacutetodo actual (dos evaluaciones al antildeo) y un meacutetodo propuesto (evaluaciones trimestrales) A continuacioacuten se presentan los datos Tabla de contingencia de 2x4 Noreste Sureste Central Costa

oeste Total

Respuesta de la muestra concerniente a los programas de evaluacioacuten de empleados

Nuacutemero de empleados que prefieren el meacutetodo actual

68 75 57 79 279

Nuacutemero de empleados que prefieren el meacutetodo nuevo

32 45 33 31 141

Total de empleados muestreados en cada regioacuten

100 56 90 110 420

Planteamiento del problema

Hipoacutetesis nula Ho PN=PS=PC=PW

Hipoacutetesis alternativa

Hi PN PS PC PW no son iguales PN= proporcioacuten de empleados en el noreste que prefieren el plan actual PS= proporcioacuten de empleados en el sureste que prefieren el plan actual PC= proporcioacuten de empleados en la regioacuten central que prefieren el plan actual PW= proporcioacuten de empleados de la regioacuten de la costa que prefieren el plan actual

Estadiacutestica Administrativa II 5

Frecuencias observadas y esperadas

Noreste Sureste Central Costa oeste

Proporcioacuten de empleados muestreados en cada regioacuten que se espera prefieren los dos meacutetodos de evaluacioacuten

Nuacutemero total muestreado 100 120 90 110 Proporcioacuten estimada que prefieren el meacutetodo actual

x 06643 x 06643 x 06643 x 06643

Nuacutemero que se espera prefiera el meacutetodo actual

6643 7972 5979 7307

Nuacutemero total muestreado 100 120 90 110 Proporcioacuten estimada que prefieren el meacutetodo nuevo

x 03357 x 03357 x 03357 x 03357

Nuacutemero que se espera prefiera el meacutetodo nuevo

3357 4028 3021 3693

Noreste Sureste Central Costa

oeste Comparacioacuten de las frecuencias observadas y esperadas de trabajadores muestreados

Frecuencia con que prefieren el meacutetodo actual

68 75 57 79

Frecuencia observada (real) Frecuencia esperada (teoacuterica)

6643 7972 5979 7307

Frecuencia con que prefieren el meacutetodo nuevo

32 45 33 31

Frecuencia observada (real) Frecuencia esperada (teoacuterica)

3357 4028 3021 3693

Estadiacutestico ji- cuadrada

119961120784 = 120622

(119943119952 minus 119943119942)120784119943119942

fo= frecuencia observada fe= frecuencia esperada

Paso 1 Paso 2 Paso 3 Calculo del estadiacutestico x2

fo fe fo-fe (fo-fe)2 (fo-fe)2

fe 68 6643 157 246 00370 75 7972 -472 2228 02795 57 5979 -279 778 01301 79 7307 593 3516 04812 32 3357 -157 246 00733

45 4028 472 2228 05531 33 3021 279 778 02575 31 3693 -593 3516 09521 X2= 27638

Estadiacutestica Administrativa II 6

Determinacioacuten de los grados de libertad

Nuacutemero de grados de libertad

Grados de libertad en una prueba ji- cuadrada

= (nuacutemero de renglones -1 )(nuacutemero de columnas -1)

Tabla de 2x4 (2-1)(4-1)= (1)(3) = 3 grados de libertad

Nivel de significancia de 10 Buscar en tablas x2 3 grados de libertad con un nivel de significancia de 10 y graficar

Interpretacioacuten de los resultados y la graacutefica 142 Meacutetodo para obtener el estadiacutestico x2 de una tabla de

contingencia con maacutes de 2 renglones Estadiacutestico ji- cuadrada

x2 = Σ(fo-fe)2

fe fo= frecuencia observada fe= frecuencia esperada Determinacioacuten de los grados de libertad de una tabla de contingencia de maacutes de tres renglones

Nuacutemero de grados de libertad de una tabla de maacutes de tres renglones

Grados de libertad en una prueba ji- cuadrada

= (nuacutemero de renglones -1 )(nuacutemero de columnas -1)

Regioacuten de aceptacioacuten

2764

010 del aacuterea

Valor x2

Distribucioacuten x2

con 3 grados de

libertad

6251

Valor de tabla

Regioacuten de rechazo

Estadiacutestica Administrativa II 7

Tabla de contingencia Nuacutemero de

renglones Nuacutemero de columnas

r-1 c-1 Grados de libertad (r-1)(c-1)

A 3 4 3-1=2 4-1=3 (2)(3)=6 B 5 7 5-1=4 7-1=6 (4)(6)=24 C 6 9 6-1=5 9-1=8 (5)(8)=40

El presidente de una compantildeiacutea de seguros de salud se opone al seguro nacional Argumenta que su implementacioacuten seriacutea muy costosa en particular debido a que la existencia de este sistema tenderiacutea a fomentar permanencias hospitalarias maacutes prolongadas ademaacutes de otros efectos El presidente piensa que el tiempo de hospitalizacioacuten depende del tipo de seguro de salud que tengan las personas Los siguientes datos se obtuvieron de una muestra aleatoria de 660 hospitalizaciones Diacuteas en el hospital lt5 5-10 gt10 Total Datos de hospitalizaciones Calificados seguacuten el tipo de cobertura del seguro y el tiempo de estancia

Fraccioacuten de costos cubiertos por el seguro

lt25 40 75 65 180 25 -50 30 45 75 150

gt50 40 100 190 330

Total 110 220 330 660

Planteamiento del problema

Hipoacutetesis nula Ho el tiempo de estancia y tipo de seguro son independientes

Hipoacutetesis alternativa

Hi el tiempo de estancia depende del tipo de seguro

α= 001 nivel de significancia para probar la hipoacutetesis Frecuencia esperada para cualquier celda

Calculo de la frecuencia esperada fe= RT X CT n

fe= frecuencia esperada en una celda dada RT= total por rengloacuten para el rengloacuten que contiene esa celda CT= total por columna para la columna que contiene esa celda n= nuacutemero total de observaciones

Estadiacutestica Administrativa II 8

Estadiacutestico ji- cuadrada

fo= frecuencia observada fe= frecuencia esperada

x2 = Σ(fo-fe)2

fe

Rengloacuten Columna fo fe = RT X CT n

fo-fe (fo-fe)2 (fo-fe)2

fe Calculo de las frecuencias esperadas y ji- cuadrada

1 1 40 30 180 X 110 660

10 100 3333

1 2 75 60 180 X 220 660

15 225 3750

1 3 65 90 180 X 330 660

-25 625 6944

2 1 30 25 150 X 110 660

5 25 1000

2 2 45 50 150 X 220 660

-5 25 0500

2 3 75 75 150 X 330 660

0 0 0000

3 1 40 55 330 X 110 660

-15 225 4091

3 2 100 110 330 X 220 660

-10 100 0909

3 3 190 165 330 X 330 660

25 625 3788

X2=24315

Buscar en tablas x2 4grados de libertad con un nivel de significancia de 10 y graficar Interpretacioacuten de resultados

Regioacuten de aceptacioacuten

x2= 24315

010 del aacuterea

Distribucioacuten x2

13277

Valor de tabla

Regioacuten de rechazo

Estadiacutestica Administrativa II 9

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

11-1 459 11-2 460 11-7 460 11-8 460 11-9 460

11-10 460 11-11 461 11-12 461 11-13 461

15 Anaacutelisis de varianza

El anaacutelisis de varianza nos permite probar si maacutes de dos medias de poblacioacuten pueden considerarse iguales A menudo se abrevia ANOVA analysis of variance ANOVA Es un meacutetodo de prueba de igualdad de tres o maacutes medias poblacionales1

Hipoacutetesis nula tiacutepica

HO= μ1= μ2= μ3

El meacutetodo ANOVA nos sirve para evitar el error tipo I (rechazar una hipoacutetesis nula verdadera) si utilizamos una prueba de igualdad de varias medias

151 Aplicaciones de ANOVA Se utiliza cuando Se asevera que los supermercados colocan los cereales con alto contenido de azuacutecar en estantes que estaacuten a la altura De los ojos de los nintildeos de manera que eso nos permite probar la aseveracioacuten de que los cereales en los estantes tienen el mismo contenido de azuacutecar

1 Mario F Triola Estadiacutestica Pearson Meacutexico2006

Estadiacutestica Administrativa II 10

Tambieacuten en casos como la comparacioacuten del kilometraje logrado por cinco clases diferentes de gasolina la prueba de cuaacutel de cuatro meacutetodos de capacitacioacuten produce el aprendizaje maacutes raacutepido etc Los meacutetodos de ANOVA requieren de la distribucioacuten F Propiedades de la distribucioacuten F

1 Es no simeacutetrica se sesga hacia la derecha 2 Los valores F son 0 o positivo pero no negativos 3 Hay una distribucioacuten F para cada par de grados de libertad para el

numerador y el denominador

Figura 1 Fuente (Triola 2006605) Ejemplo

Muestra 1 15 18 19 22 11

Muestra 2 22 27 18 21 17

Muestra 3 18 24 19 16 22 15

Planteamiento de la hipoacutetesis

Ho μ1= μ2= μ3

H1 μ1 μ2 y μ3 no son todas iguales

Estadiacutestica Administrativa II 11

Caacutelculo de la media

Meacutetodo 1 Meacutetodo 2 Meacutetodo 3 Produccioacuten diaria 15 22 18

18 27 24 19 18 19 22 21 16 11 17 22

15 85 105 114 Sumatoria divide5 divide5 divide6 Tamantildeo de

la muestra 17 21 19 Media

muestral n1=5 n2=5 n3=6

1= 17 2= 21 3= 19

Caacutelculo de la gran media

= 15 +18+ 19+ 22+ 11+22 +27+ 18+ 21+ 17+18 +24+ 19+ 16+ 22+ 15 = 19 16

Caacutelculo de la varianza entre columnas

σ2b = Σnj ( - )2 = k-1

n - ( - )2 n( - ) Caacutelculo de la varianza entre columnas

5 17 19 17-19=-2 (-2)2=4 5x4=20 5 21 19 21-19=2 (2)2=4 5x4=20 6 19 19 19-19=0 (0)2=0 6x0 = 0 Σnj( - )

2 =40

σ2b = Σnj ( - )2 = 40= 40 = 20 varianza entre columnas

k-1 3-1 2

Estadiacutestica Administrativa II 12

Estimacioacuten de la varianza dentro de columnas

Meacutetodo de capacitacioacuten 1 Media muestral =17

Estimacioacuten de la varianza dentro de columnas

- ( - )2 15-17=-2 (-2)2=4 18-17=1 (1)2=1 19-17=2 (2)2=4 22-17=5 (5)2=25 11-17=-6 (-6)2=36 Σ( - )2 =70

s21= Σ( - )2 = 70 = 175 varianza de la muestra

n-1 5-1

Meacutetodo de capacitacioacuten 2 Media muestral =21

Estimacioacuten de la varianza dentro de columnas

- ( - )2 22-21=1 (1)2=1 27-21=6 (6)2=36 18-21=-3 (-3)2=9 21-21=0 (0)2=0 17-21=-4 (-4)2=16 Σ( - )2 =62

s22= Σ( - )2 = 62 = 155 varianza de la muestra

n-1 5-1

Meacutetodo de capacitacioacuten 3 Media muestral =19

Estimacioacuten de la varianza dentro de columnas

- ( - )2 18-19=-1 (-1)2=1 24-19=5 (5)2=25 19-19=0 (0)2=0 16-19=-3 (-3)2=9 22-19=3 (-32=9 15-19=-4 (-4)2=16 Σ( - )2 =60

Estadiacutestica Administrativa II 13

s23= Σ( - )2 = 60 = 120 varianza de la muestra

n-1 6-1

σ2w = Σ nj - 1 s2

j = (413)(175) + (413)(155) + (513)(120) = 193 = 14769 nt - k 13

Estadiacutestico F

F = varianza entre columnas = σ2b

Varianza dentro de columnas σ2w

F= 20 = 1354 cociente F 14769

Determinacioacuten de los grados de libertad

Grados de libertad del numerador

Nuacutemero de grados de libertad en el numerador del cociente F

= (nuacutemero de muestras-1)

Grados de libertad del denominador

Nuacutemero de grados de libertad en el denominador del cociente F

= Σ (nj-1)= nt-k

Graacutefica

Se acepta la hipoacutetesis nula

Regioacuten de aceptacioacuten

F= 1354

005 del aacuterea

Distribucioacuten f

381

Valor de tabla

Regioacuten de rechazo

Estadiacutestica Administrativa II 14

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

11-5 479 11-6 479

11-26 480 11-27 480 11-28 480 11-29 480 11-30 480

152 Inferencia sobre una varianza de poblacioacuten (Anova)

Estadiacutestico ji- cuadrada para inferencias sobre una varianza

X2=(n-1)s2 σ2

Intervalo de confianza para σ2

Liacutemite inferior de confianza

σ2L=(n-1)s2 X2

U Liacutemite superior de confianza

σ2U=(n-1)s2 X2

L

Estadiacutestica Administrativa II 15

Ejercicio

Con los siguientes datos obtener el estadiacutestico ji- cuadrada Y el intervalo de

confianza del 95

Tiempo x

50 45 27 66 43 96 45 90 69

153 Inferencia sobre la varianza de dos poblaciones (Anova) Ademaacutes de comparar la varianza de dos poblaciones el principal objetivo de este tema es analizar el cociente que se obtiene al aplicar la foacutermula correspondiente

Coeficiente F para inferencias acerca de dos varianzas

F=S21

S22

Estadiacutestica Administrativa II 16

Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple

21 Estimacioacuten mediante la liacutenea de regresioacuten El anaacutelisis de regresioacuten y correlacioacuten permiten determinar tanto la naturaleza como la fuerza de una relacioacuten entre dos variables En el anaacutelisis de regresioacuten se desarrollaraacute una ecuacioacuten de estimacioacuten a traveacutes de una foacutermula matemaacutetica que relaciona las variables conocidas con la variable desconocida La variable conocida- variable independiente X La variable que tratamos de predecir se llama variable dependiente Y

Figura 2 Fuente (Levin 2004511) 211 Diagrama de dispersioacuten El primer paso para determinar si existe una relacioacuten entre dos variables es examinar la graacutefica de datos observados A esta graacutefica se le llama diagrama de dispersioacuten Un diagrama de dispersioacuten se puede identificar visualmente patrones que indique si las variables estaacuten relacionadas

X

Y

Gastos contra la contaminacioacuten

Emisor de

contaminacioacuten

Pendiente negativa

b) Relacioacuten directa

X

Y

Publicidad

Ventas

Pendiente positiva

a) Relacioacuten directa

Estadiacutestica Administrativa II 17

Figura 3 Fuente (Levin 2004503)

212 Meacutetodo de miacutenimos cuadrados

Liacutenea de estimacioacuten

Y= a+bx Y= variable dependiente a=variable ordenada y b=pendiente de la recta x=variable independiente

Pendiente de la recta de regresioacuten de mejor ajuste

b = Σ XY - n X Y Σ X2 - n X2

b=pendiente de la liacutenea de estimacioacuten de mejor ajuste X= valores de la variable independiente Y= variable valores de la variable dependiente X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente n= nuacutemero de puntos

Estadiacutestica Administrativa II 18

Liacutenea de estimacioacuten

a = Y - bX a= ordenada Y b= pendiente de la ecuacioacuten X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente

Error estaacutendar de la estimacioacuten

Se= Σ(Y-Y)2

n-2 Y= valores de la variable dependiente Y=valores estimados con la ecuacioacuten de estimacioacuten que corresponden a cada valor de Y n= nuacutemero de puntos utilizados para ajustar la liacutenea de regresioacuten Para medir la confiabilidad de la ecuacioacuten de estimacioacuten los especialistas en estadiacutestica han desarrollado el error estaacutendar de estimacioacuten Este error estaacutendar se simboliza por Se y es similar a la desviacioacuten estaacutendar en cuanto a que ambas son medidas de dispersioacuten El error estaacutendar de la estimacioacuten por otra parte mide la variabilidad o dispersioacuten de los valores observados alrededor de la recta de regresioacuten 213 Interpretacioacuten del error estaacutendar de la estimacioacuten Como ocurririacutea en el caso de la desviacioacuten estaacutendar mientras maacutes grande sea el error estaacutendar de la estimacioacuten mayor seraacute la dispersioacuten de los puntos alrededor de la liacutenea de regresioacuten De manera inversa si Se= 0 esperamos que la ecuacioacuten de estimacioacuten sea un estimador ldquoperfectordquo de la variable dependiente En este caso todos los puntos caeriacutean directamente sobre la liacutenea de regresioacuten y no habriacutea puntos dispersos alrededor Usaremos el error estaacutendar de la estimacioacuten como una herramienta de la misma forma que podemos usar la desviacioacuten estaacutendar Esto es suponiendo que los puntos observados siguen una distribucioacuten normal alrededor de la recta de regresioacuten podemos esperar encontrar el 68 de los puntos dentro de plusmn1Se el 955 de los puntos dentro de plusmn2Se y el 997 de los puntos dentro de plusmn3Se

Estadiacutestica Administrativa II 19

Figura 4 Fuente (Levin 2004529)

Debemos observar que el error estaacutendar de la estimacioacuten se mide a lo largo del eje Y y no perpendicularmente desde la recta de regresioacuten 214 Intervalos de prediccioacuten aproximados Podemos concebir al error estaacutendar de la estimacioacuten como una herramienta estadiacutestica que podemos usar para hacer afirmaciones de probabilidad acerca del intervalo alrededor del valor estimado de Y dentro del cual cae el valor real de Y Ejemplo

Y= 375 + 075 X Sustituyendo 4 en X

Y= 375 + 075 (4) = 375 + 300

= 675

Estadiacutestica Administrativa II 20

Intervalo 1 error 2 errores 3 errores

Y plusmn1 Se

Y plusmn2 Se

Y plusmn3 Se

En donde Se = 8660

Sustitucioacuten

Ejemplo A menudo quienes hacen la contabilidad de costos estiman los gastos generales con base en el nivel de produccioacuten Se ha reunido informacioacuten acerca de los gastos generales y las unidades producidas en diferentes plantas y ahora desean estimar una ecuacioacuten de regresioacuten para predecir los gastos generales futuros Gastos generales 191 170 272 155 280 173 234 116 153 178 Unidades 40 42 53 35 56 39 48 30 37 40

a) Determine la variable dependiente e independiente b) Desarrolle una ecuacioacuten de regresioacuten para contabilidad de costos c) Pronostique los gastos generales cuando se producen 50 unidades d) Calcule el error estaacutendar de estimacioacuten

Y +1 Se =

675 + (1) (8660) = 76140 Liacutemite superior del intervalo de prediccioacuten

Y +2 Se =

675 + (2) (8660) = 84820 Liacutemite superior del intervalo de prediccioacuten

Y -1 Se =

675 - (1) (8660) = 58840 Liacutemite inferior del intervalo de prediccioacuten

Y - 2 Se =

675 - (2) (8660) = 50180 Liacutemite inferior del intervalo de prediccioacuten

Estadiacutestica Administrativa II 21

X Y XY X2 Y2 40 191 7640 1600 36481 42 170 7140 1764 28900 53 272 14416 2809 73984 35 155 5425 1225 24025 56 280 15680 3136 78400 39 173 6747 1521 29929 48 234 11232 2304 54756 30 116 3480 900 13456 37 153 5661 1369 23409 40 178 7120 1600 31684 ΣX= 420 ΣY= 1922 ΣXY= 84541 ΣX2= 18228 ΣY2= 395024

b = Σ XY - n X Y = 84541 - 10(42)(1922) = 64915 Σ X2 - n X2 18228 - 10(42)2 a = Y ndash bX = 1922 ndash 64915 (42) = - 804430 Y= a+bx = -804430 + 64915 (50) = 2441320 Se= ΣY2 ndashaΣY ndash b ΣXY = n-2 Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

12-2 531 12-3 531

12-13 531 12-14 531 12-15 531

Estadiacutestica Administrativa II 22

215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten

Coeficiente de determinacioacuten de la muestra

r2= aΣY+bΣXY-nY2

ΣY2 ndash n Y2

Coeficiente de correlacioacuten de la muestra

r= r2

Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten

Estadiacutestica Administrativa II 23

Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables

Y= a + b1 X1 + b2 X2

Ecuacioacuten

na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2

1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2

2 = Σ X2Y

Ejemplo

a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10

Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784

Sumatoria

114 105 85 2463 1590 1435 2367 1571

Matriz

6 105 85 114 105 2367 1435 2463 85 1435 1571 1590

1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25

1 175 14167 19 0 1 -099 884 0 0 361608 21410

361608 b2 = 21410 b2 = 21410 361608 b2 = 059

Estadiacutestica Administrativa II 24

1 b1 -099 b2 = 884 1 b1 -099 (059) = 884

-006 884 1b1 = 884 +006 b1 = 890

1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a

= 2589

Y= a + b1 X1 + b2 X2

y=2589+890(28)+059(10)=28099

Estadiacutestica Administrativa II 25

218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)

Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad

La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos

Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir

donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria

Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados

Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante

Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo

Estadiacutestica Administrativa II 26

Figura 5 Distribucioacuten Homocedaacutestica

Figura 6 Distribucioacuten Heterocedaacutestica

Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten

lineal para hacer estimaciones futuras

Estadiacutestica Administrativa II 27

Unidad 3 Nuacutemeros iacutendice

Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se

calcula encontrando el cociente del valor actual entre el valor base luego se

multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje

Tipos de nuacutemeros iacutendice

Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de

cantidad e iacutendice de valor

Iacutendice de precios

Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida

Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo

Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable

El iacutendice de valor combina los cambios de precio y cantidad para presentar un

iacutendice con maacutes informacioacuten

Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos

como indicadores generales de la condicioacuten econoacutemica de un paiacutes

Factores que pueden distorsionar los nuacutemeros iacutendice

bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados

bull Falta de comparacioacuten de iacutendices

bull Ponderacioacuten no apropiada de los factores

bull Seleccioacuten de una base no apropiada

Estadiacutestica Administrativa II 28

31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores

Iacutendice de cantidad de agregados no ponderados

ΣQi x 100 ΣQo

Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea

1993 1994 1995

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200

Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado

1993 Qo

1994 Q1

1995 Q2

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308

Estadiacutestica Administrativa II 29

Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra

Iacutendice de precios de agregados ponderados

ΣPiQ x 100 ΣPoQ

Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100

Cambio de periodo base

I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base

Estadiacutestica Administrativa II 30

35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos

Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables

Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico

Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios

El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)

Estadiacutestica Administrativa II 31

Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica

37 Deflacioacuten de los valores de series de tiempo

Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios

En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea

La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores

Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero

Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes

Los valores expresados en unidades monetarias corrientes se conocen como valores nominales

Los valores expresados en unidades monetarias constantes se conocen como valores reales

Estadiacutestica Administrativa II 32

38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor

Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos

39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)

Estadiacutestica Administrativa II 33

Siacutembolo Nombre de la compantildeiacutea

AA Alcoa

ALD Allied Signal

AXP American Express

BA Boeing

CAT Caterpillar

CHV Chevron

C CitiGroup

DIS Disney

DD Dupont

EK Eastman Kodak

GE General Electric

GM General Motors

GT Goodyear Tire

HWP Hewlett-Packard

IBM International Business Machines

IP International Paper

JNJ Johnson amp Johnson

JPM JP Morgan Bank

KO Coca Cola

Figura 5 Compantildeiacuteas comprendidas en el Dow Jones

310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos

Praacutectica 2

992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico

elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado

de precios

Estadiacutestica Administrativa II 34

Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida

bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)

42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten

Las principales pruebas no parameacutetricas son las siguientes

bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher

Estadiacutestica Administrativa II 35

bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon

Caracteriacutesticas de algunas pruebas no parameacutetricas

1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos

2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten

3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal

4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados

5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc

6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica

Prueba Caracteriacutestica

Mann- Whitney 2 muestras independientes

Wilcoxon 2 muestras asociadas

Kruskal-Wallis + de 2 muestras independientes

Friedman + de 2 muestras asociadas

Tabla1 Caracteriacutesticas de pruebas no parameacutetricas

Estadiacutestica Administrativa II 36

Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media

Ventajas y desventajas de los meacutetodos parameacutetricos

Desventajas Ventajas bull Ignoran cierta cantidad de

informacioacuten bull No requieren la suposicioacuten de que

una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica

bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas

bull Generalmente es maacutes sencillo realizarlas y entenderlas

bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal

Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo

MHHHHM

1ra 2ra 3ra

Estadiacutestica Administrativa II 37

Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1

n2= nuacutemero de ocurrencias del tipo 2

r= nuacutemero de corridas

4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue

BABBBAAABBABBBBAAAABABAABBBAABAAAABBA

BBAAAABBABBBBAABBABAABB

Valores de la prueba

n1= 29

n2= 31

r= 29

4322 Distribucioacuten de muestreo del estadiacutestico r

El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba

Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente

Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1

n1+n2

Estadiacutestica Administrativa II 38

μr = 2(29)(31) +1

29+31

μr = 1798 +1 60

μr = 2997 +1

μr = 3097

Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)

(n1+n2)2(n1+n2-1)

σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)

σr= (1798) (1738)

(60)2(59)

σr= 1471

σr= 384

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-24 643 14-25 643 14-26 643 14-27 644 14-28 644

Estadiacutestica Administrativa II 39

44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica

Ejemplo

Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado

Miembro del panel Calificacioacuten para

conferencias grandes

Calificacioacuten para

sesiones pequentildeas

Signo de la calificacioacuten

Evaluacioacuten de los dos tipos de

clases

1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -

6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +

La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)

Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20

Estadiacutestica Administrativa II 40

Establecimiento de las hipoacutetesis

Ho p = 05

H1 p ne 05

Se consideran la posibilidades solamente de signos + y - (9+6 =15)

p Ho = 05

q H0 = 05

n= 15

p= 0600 (915)

q= 0400 (615)

Prueba de hipoacutetesis de que no hay diferencia

Error estaacutendar del la proporcioacuten

σp= pq n

σp= (05)(05) 15

σp= 0129

0025

0

0475 del aacuterea

Valor criacutetico Z=-196

Regioacuten de aceptacioacuten

0025

0475 del aacuterea

Valor criacutetico Z=196

Estadiacutestica Administrativa II 41

45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten

Procedimiento de la prueba de rangos con signo de Wilcoxon

Paso1 Para cada par de datos calcule la diferencia d restando el segundo

valor del primero Guarde los signos pero descarte cualquier par para el que

d=0

Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de

la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango

correspondiente Cuando las diferencias tengan el mismo valor numeacuterico

asiacutegneles la media de los rangos implicados en el empate

Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino

Esto es inserte aquellos signos que se ignoraron e el paso dos

Paso 4 Calcule la suma de los valores absolutos de los rangos negativos

Tambieacuten la suma de los rangos positivos

Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon

en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el

procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos

sumas

Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la

diferencia d no es 0

Estadiacutestica Administrativa II 42

Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el

tamantildeo muestral

Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos

muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica

esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico

Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente

2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha

Notacioacuten

T= la maacutes pequentildea de las siguientes dos sumas

1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0

La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T

Estadiacutestica Administrativa II 43

46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2

Rango Calificacioacuten Plantel

1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S

10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S

Estadiacutestica Administrativa II 44

30 1600 S

Estadiacutestica Administrativa II 45

Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500

n1= 15 n2= 15 R1= 247 R2= 218

Estadiacutestico U

U = n1n2 + n1(n1 +1) -R1 2

U= (15)(15) + (15)(16) -247 2

U= 225+120-247

U= 98

Media de la distribucioacuten muestral U

μu = n1n2

2

μu = (15)(15)

2

μu =1125

Estadiacutestica Administrativa II 46

Estadiacutestico U

σU = n1n2 + (n1n2 +1)

12

σU = (15)(15)(15+15+1)

12

σU = 6975 12

σU = 58125

σU = 241

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2

α= 015

Estandarizacioacuten del estadiacutestico U

z = U-μu

σU

z = 98 - 1125 241

z = -0602

144 -144 0 -0602

Valor estandarizado de

la muestra U

Regioacuten de aceptacioacuten

Estadiacutestica Administrativa II 47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras

Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular

Prueba de Wilcoxon de los rangos con signo

Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero

Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande

Prueba de Wilcoxon para contrastar datos pareados

El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 4: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

INTRODUCCIOacuteN La estadiacutestica administrativa es una materia importante en contaduriacutea ya que permite recopilar organizar representar analizar datos y tomar decisiones asiacute mismo nos da las herramientas necesarias para utilizar el meacutetodo adecuado conforme a la situacioacuten que se estaacute analizando y aplicarlo en el aacuterea contable Este cuadernillo de apuntes tiene como finalidad servir de apoyo al estudiante durante el curso de la materia el cual consta de 4 unidades en donde se proponen algunas praacutecticas para la aplicacioacuten de los temas estudiados y estaacute desarrollado conforme al temario Sin embargo es importante que el alumno consulte maacutes fuentes de informacioacuten con el objetivo de retroalimentar A continuacioacuten se hace una breve semblanza de los temas que se tratan en las unidades Unidad 1 Pruebas de la bondad del ajuste y anaacutelisis de varianza En esta unidad se analizan los siguientes temas anaacutelisis ji-cuadrada pruebas de independencia bondad de ajuste tablas de contingencia y anaacutelisis de varianza para hacer inferencias a partir de una o dos poblaciones Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple En esta unidad realiza el diagrama de dispersioacuten se aplica el meacutetodo de miacutenimos cuadrados para interpretar el error estaacutendar y determinar los intervalos de prediccioacuten asiacute como la solucioacuten de ejercicios de anaacutelisis de correlacioacuten en Excel Asimismo se recaban datos de una empresa para aplicar la regresioacuten lineal y hacer estimaciones futuras

Unidad 3 Nuacutemeros iacutendice En esta unidad se realizan ejercicios para la elaboracioacuten de nuacutemeros iacutendice simple precio agregado y precio al consumidor Asimismo se elaboran iacutendices de precio y cantidad con datos recabados en revistas y otras fuentes Unidad 4 Estadiacutestica no parameacutetrica En esta unidad se contrasta la estadiacutestica parameacutetrica contra la no parameacutetrica asiacute mismo se analizan temas de prueba de corrida de aleatoriedad de una o dos muestras y observaciones apareadas Tambieacuten se recopilan datos para efectuar comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestica no parameacutetrica

Estadiacutestica Administrativa II 1

Unidad 1 Pruebas de la bondad del ajuste y anaacutelisis de varianza 11 Anaacutelisis Ji-Cuadrada Las pruebas Ji-Cuadrada nos permite probar si maacutes de dos proporciones de poblacioacuten pueden ser consideradas iguales Si clasificamos una poblacioacuten en diferentes categoriacuteas respecto a dos atributos (por ejemplo edad y desempentildeo en el trabajo) entonces podemos utilizar una prueba Ji-Cuadrada para los dos atributos son independientes entre siacute 12 Prueba de independencia Los administradores necesitan saber si las diferencias que observan entre varias proporciones de la muestra son significativas o soacutelo se deben al azar 13 Prueba de la bondad del ajuste La prueba ji- cuadrada puede utilizarse tambieacuten para decidir si una distribucioacuten de probabilidad en particular como la binomial la de Poisson o la normal es la apropiada Esta es una habilidad importante porque como tomadores de decisiones que utilizamos la estadiacutestica necesitamos escoger cierta distribucioacuten de probabilidad para representar la distribucioacuten de los datos que tengamos que analizar La prueba ji- cuadrada nos permite hacernos la pregunta de cuaacutel distribucioacuten podemos utilizar y probar si existe una diferencia significativa entre una distribucioacuten de frecuencias observadas y una distribucioacuten de frecuencias teoacuterica Caacutelculo de frecuencias observadas y esperadas Ejemplo La compantildeiacutea ldquoxrdquo requiere que los estudiantes del uacuteltimo antildeo de la universidad que buscan trabajo sean entrevistados por tres ejecutivos diferentes Esto permite a la compantildeiacutea obtener una evaluacioacuten por consenso de candidatos Cada ejecutivo califica al candidato como positivo o negativo Con el propoacutesito de planear la contratacioacuten el director de seleccioacuten del personal de la compantildeiacutea piensa que el proceso de entrevistas puede ser aproximado por una distribucioacuten binomial con p= 040 es decir del 40 de de posibilidad de que cualquier candidato obtenga una calificacioacuten positiva en cualquiera de las entrevistas Si el director desea probar una hipoacutetesis a un nivel de significancia de 020 iquestCoacutemo debe proceder

Estadiacutestica Administrativa II 2

Ho una distribucioacuten binomial con p= 040 Es una buena descripcioacuten del proceso de entrevista Hi una distribucioacuten binomial con p= 040 No es una buena descripcioacuten del proceso de entrevista α= 020 nivel de significancia para probar la hipoacutetesis

Calificaciones positivas posibles en las tres

entrevistas

Nuacutemero de candidatos que obtienen cada

calificacioacuten Resultados de las entrevistas de 100 candidatos

0 18 1 47 2 24 3 11 100

Calificaciones positivas posibles en las tres

entrevistas

Probabilidades binomiales para esos resultados

Posibilidad binomial 0 2160 1 4320 2 2880 3 0640 10000

Calificaciones positivas

posibles en las tres entrevistas

Frecuencia observada de

candidatos que obtienen estas calificaciones

Probabilidades binomiales de

resultados posibles

Nuacutemero de candidatos

entrevistados

Frecuencia esperada de candidatos

que obtienen estas

calificaciones

Frecuencias observadas Probabilidades binomiales adecuadas y frecuencias esperada

0 18 2160 100 216 1 47 4320 100 432 2 24 2880 100 288 3 11 0640 100 64 100 10000 1000

Estadiacutestico ji- cuadrada

x2 = Σ(fo-fe)2

fe

fo= frecuencia observada fe= frecuencia esperada

Estadiacutestica Administrativa II 3

Frecuencia observada

fo

Frecuencia esperada

fe

fo-fe (fo-fe)2 (fo-fe)2

fe

Calculo del estadiacutestico x2

18 216 -36 1296 06000 47 432 38 1444 03343 24 288 -48 2304 08000 11 64 46 2116 33063

X2=50406

Determinacioacuten de los grados de libertad Antes de calcular el nuacutemero adecuado de grados de libertad para una prueba ji- cuadrada de bondad de ajuste es necesario contar el nuacutemero de clases (denotado por K) para las que se compararon las frecuencias observadas y esperadas

Grados de libertad = k-1

K= 0123 k= 4 gl= 4-1 gl= 3 Rechazamos la hipoacutetesis nula y llegamos a la conclusioacuten de que la distribucioacuten binomial con p=040 no proporciona una buena descripcioacuten de nuestras frecuencias observadas Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

11-16 466 11-17 466 11-18 466

Regioacuten de aceptacioacuten

50406

020 del aacuterea

Valor x2

Distribucioacuten x2

4642

Valor de tabla

Regioacuten de rechazo

Estadiacutestica Administrativa II 4

14 Tablas de contingencia Describimos las dimensiones de una tabla de contingencia estableciendo primero el nuacutemero de renglones y luego el nuacutemero de columnas La columna y el rengloacuten con el total no cuentan como parte de las dimensiones Los renglones corren de manera horizontal y las columnas de manera vertical Tabla de contingencia de 2 x 4( 2 renglones 4 columnas) 141 Meacutetodo para obtener el estadiacutestico x2 de una tabla de

contingencia con 2 renglones Ejemplo En cuatro regiones se muestrean las actitudes de los empleados respecto a la evaluacioacuten del desempentildeo en el trabajo Los trabajadores eligen entre el meacutetodo actual (dos evaluaciones al antildeo) y un meacutetodo propuesto (evaluaciones trimestrales) A continuacioacuten se presentan los datos Tabla de contingencia de 2x4 Noreste Sureste Central Costa

oeste Total

Respuesta de la muestra concerniente a los programas de evaluacioacuten de empleados

Nuacutemero de empleados que prefieren el meacutetodo actual

68 75 57 79 279

Nuacutemero de empleados que prefieren el meacutetodo nuevo

32 45 33 31 141

Total de empleados muestreados en cada regioacuten

100 56 90 110 420

Planteamiento del problema

Hipoacutetesis nula Ho PN=PS=PC=PW

Hipoacutetesis alternativa

Hi PN PS PC PW no son iguales PN= proporcioacuten de empleados en el noreste que prefieren el plan actual PS= proporcioacuten de empleados en el sureste que prefieren el plan actual PC= proporcioacuten de empleados en la regioacuten central que prefieren el plan actual PW= proporcioacuten de empleados de la regioacuten de la costa que prefieren el plan actual

Estadiacutestica Administrativa II 5

Frecuencias observadas y esperadas

Noreste Sureste Central Costa oeste

Proporcioacuten de empleados muestreados en cada regioacuten que se espera prefieren los dos meacutetodos de evaluacioacuten

Nuacutemero total muestreado 100 120 90 110 Proporcioacuten estimada que prefieren el meacutetodo actual

x 06643 x 06643 x 06643 x 06643

Nuacutemero que se espera prefiera el meacutetodo actual

6643 7972 5979 7307

Nuacutemero total muestreado 100 120 90 110 Proporcioacuten estimada que prefieren el meacutetodo nuevo

x 03357 x 03357 x 03357 x 03357

Nuacutemero que se espera prefiera el meacutetodo nuevo

3357 4028 3021 3693

Noreste Sureste Central Costa

oeste Comparacioacuten de las frecuencias observadas y esperadas de trabajadores muestreados

Frecuencia con que prefieren el meacutetodo actual

68 75 57 79

Frecuencia observada (real) Frecuencia esperada (teoacuterica)

6643 7972 5979 7307

Frecuencia con que prefieren el meacutetodo nuevo

32 45 33 31

Frecuencia observada (real) Frecuencia esperada (teoacuterica)

3357 4028 3021 3693

Estadiacutestico ji- cuadrada

119961120784 = 120622

(119943119952 minus 119943119942)120784119943119942

fo= frecuencia observada fe= frecuencia esperada

Paso 1 Paso 2 Paso 3 Calculo del estadiacutestico x2

fo fe fo-fe (fo-fe)2 (fo-fe)2

fe 68 6643 157 246 00370 75 7972 -472 2228 02795 57 5979 -279 778 01301 79 7307 593 3516 04812 32 3357 -157 246 00733

45 4028 472 2228 05531 33 3021 279 778 02575 31 3693 -593 3516 09521 X2= 27638

Estadiacutestica Administrativa II 6

Determinacioacuten de los grados de libertad

Nuacutemero de grados de libertad

Grados de libertad en una prueba ji- cuadrada

= (nuacutemero de renglones -1 )(nuacutemero de columnas -1)

Tabla de 2x4 (2-1)(4-1)= (1)(3) = 3 grados de libertad

Nivel de significancia de 10 Buscar en tablas x2 3 grados de libertad con un nivel de significancia de 10 y graficar

Interpretacioacuten de los resultados y la graacutefica 142 Meacutetodo para obtener el estadiacutestico x2 de una tabla de

contingencia con maacutes de 2 renglones Estadiacutestico ji- cuadrada

x2 = Σ(fo-fe)2

fe fo= frecuencia observada fe= frecuencia esperada Determinacioacuten de los grados de libertad de una tabla de contingencia de maacutes de tres renglones

Nuacutemero de grados de libertad de una tabla de maacutes de tres renglones

Grados de libertad en una prueba ji- cuadrada

= (nuacutemero de renglones -1 )(nuacutemero de columnas -1)

Regioacuten de aceptacioacuten

2764

010 del aacuterea

Valor x2

Distribucioacuten x2

con 3 grados de

libertad

6251

Valor de tabla

Regioacuten de rechazo

Estadiacutestica Administrativa II 7

Tabla de contingencia Nuacutemero de

renglones Nuacutemero de columnas

r-1 c-1 Grados de libertad (r-1)(c-1)

A 3 4 3-1=2 4-1=3 (2)(3)=6 B 5 7 5-1=4 7-1=6 (4)(6)=24 C 6 9 6-1=5 9-1=8 (5)(8)=40

El presidente de una compantildeiacutea de seguros de salud se opone al seguro nacional Argumenta que su implementacioacuten seriacutea muy costosa en particular debido a que la existencia de este sistema tenderiacutea a fomentar permanencias hospitalarias maacutes prolongadas ademaacutes de otros efectos El presidente piensa que el tiempo de hospitalizacioacuten depende del tipo de seguro de salud que tengan las personas Los siguientes datos se obtuvieron de una muestra aleatoria de 660 hospitalizaciones Diacuteas en el hospital lt5 5-10 gt10 Total Datos de hospitalizaciones Calificados seguacuten el tipo de cobertura del seguro y el tiempo de estancia

Fraccioacuten de costos cubiertos por el seguro

lt25 40 75 65 180 25 -50 30 45 75 150

gt50 40 100 190 330

Total 110 220 330 660

Planteamiento del problema

Hipoacutetesis nula Ho el tiempo de estancia y tipo de seguro son independientes

Hipoacutetesis alternativa

Hi el tiempo de estancia depende del tipo de seguro

α= 001 nivel de significancia para probar la hipoacutetesis Frecuencia esperada para cualquier celda

Calculo de la frecuencia esperada fe= RT X CT n

fe= frecuencia esperada en una celda dada RT= total por rengloacuten para el rengloacuten que contiene esa celda CT= total por columna para la columna que contiene esa celda n= nuacutemero total de observaciones

Estadiacutestica Administrativa II 8

Estadiacutestico ji- cuadrada

fo= frecuencia observada fe= frecuencia esperada

x2 = Σ(fo-fe)2

fe

Rengloacuten Columna fo fe = RT X CT n

fo-fe (fo-fe)2 (fo-fe)2

fe Calculo de las frecuencias esperadas y ji- cuadrada

1 1 40 30 180 X 110 660

10 100 3333

1 2 75 60 180 X 220 660

15 225 3750

1 3 65 90 180 X 330 660

-25 625 6944

2 1 30 25 150 X 110 660

5 25 1000

2 2 45 50 150 X 220 660

-5 25 0500

2 3 75 75 150 X 330 660

0 0 0000

3 1 40 55 330 X 110 660

-15 225 4091

3 2 100 110 330 X 220 660

-10 100 0909

3 3 190 165 330 X 330 660

25 625 3788

X2=24315

Buscar en tablas x2 4grados de libertad con un nivel de significancia de 10 y graficar Interpretacioacuten de resultados

Regioacuten de aceptacioacuten

x2= 24315

010 del aacuterea

Distribucioacuten x2

13277

Valor de tabla

Regioacuten de rechazo

Estadiacutestica Administrativa II 9

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

11-1 459 11-2 460 11-7 460 11-8 460 11-9 460

11-10 460 11-11 461 11-12 461 11-13 461

15 Anaacutelisis de varianza

El anaacutelisis de varianza nos permite probar si maacutes de dos medias de poblacioacuten pueden considerarse iguales A menudo se abrevia ANOVA analysis of variance ANOVA Es un meacutetodo de prueba de igualdad de tres o maacutes medias poblacionales1

Hipoacutetesis nula tiacutepica

HO= μ1= μ2= μ3

El meacutetodo ANOVA nos sirve para evitar el error tipo I (rechazar una hipoacutetesis nula verdadera) si utilizamos una prueba de igualdad de varias medias

151 Aplicaciones de ANOVA Se utiliza cuando Se asevera que los supermercados colocan los cereales con alto contenido de azuacutecar en estantes que estaacuten a la altura De los ojos de los nintildeos de manera que eso nos permite probar la aseveracioacuten de que los cereales en los estantes tienen el mismo contenido de azuacutecar

1 Mario F Triola Estadiacutestica Pearson Meacutexico2006

Estadiacutestica Administrativa II 10

Tambieacuten en casos como la comparacioacuten del kilometraje logrado por cinco clases diferentes de gasolina la prueba de cuaacutel de cuatro meacutetodos de capacitacioacuten produce el aprendizaje maacutes raacutepido etc Los meacutetodos de ANOVA requieren de la distribucioacuten F Propiedades de la distribucioacuten F

1 Es no simeacutetrica se sesga hacia la derecha 2 Los valores F son 0 o positivo pero no negativos 3 Hay una distribucioacuten F para cada par de grados de libertad para el

numerador y el denominador

Figura 1 Fuente (Triola 2006605) Ejemplo

Muestra 1 15 18 19 22 11

Muestra 2 22 27 18 21 17

Muestra 3 18 24 19 16 22 15

Planteamiento de la hipoacutetesis

Ho μ1= μ2= μ3

H1 μ1 μ2 y μ3 no son todas iguales

Estadiacutestica Administrativa II 11

Caacutelculo de la media

Meacutetodo 1 Meacutetodo 2 Meacutetodo 3 Produccioacuten diaria 15 22 18

18 27 24 19 18 19 22 21 16 11 17 22

15 85 105 114 Sumatoria divide5 divide5 divide6 Tamantildeo de

la muestra 17 21 19 Media

muestral n1=5 n2=5 n3=6

1= 17 2= 21 3= 19

Caacutelculo de la gran media

= 15 +18+ 19+ 22+ 11+22 +27+ 18+ 21+ 17+18 +24+ 19+ 16+ 22+ 15 = 19 16

Caacutelculo de la varianza entre columnas

σ2b = Σnj ( - )2 = k-1

n - ( - )2 n( - ) Caacutelculo de la varianza entre columnas

5 17 19 17-19=-2 (-2)2=4 5x4=20 5 21 19 21-19=2 (2)2=4 5x4=20 6 19 19 19-19=0 (0)2=0 6x0 = 0 Σnj( - )

2 =40

σ2b = Σnj ( - )2 = 40= 40 = 20 varianza entre columnas

k-1 3-1 2

Estadiacutestica Administrativa II 12

Estimacioacuten de la varianza dentro de columnas

Meacutetodo de capacitacioacuten 1 Media muestral =17

Estimacioacuten de la varianza dentro de columnas

- ( - )2 15-17=-2 (-2)2=4 18-17=1 (1)2=1 19-17=2 (2)2=4 22-17=5 (5)2=25 11-17=-6 (-6)2=36 Σ( - )2 =70

s21= Σ( - )2 = 70 = 175 varianza de la muestra

n-1 5-1

Meacutetodo de capacitacioacuten 2 Media muestral =21

Estimacioacuten de la varianza dentro de columnas

- ( - )2 22-21=1 (1)2=1 27-21=6 (6)2=36 18-21=-3 (-3)2=9 21-21=0 (0)2=0 17-21=-4 (-4)2=16 Σ( - )2 =62

s22= Σ( - )2 = 62 = 155 varianza de la muestra

n-1 5-1

Meacutetodo de capacitacioacuten 3 Media muestral =19

Estimacioacuten de la varianza dentro de columnas

- ( - )2 18-19=-1 (-1)2=1 24-19=5 (5)2=25 19-19=0 (0)2=0 16-19=-3 (-3)2=9 22-19=3 (-32=9 15-19=-4 (-4)2=16 Σ( - )2 =60

Estadiacutestica Administrativa II 13

s23= Σ( - )2 = 60 = 120 varianza de la muestra

n-1 6-1

σ2w = Σ nj - 1 s2

j = (413)(175) + (413)(155) + (513)(120) = 193 = 14769 nt - k 13

Estadiacutestico F

F = varianza entre columnas = σ2b

Varianza dentro de columnas σ2w

F= 20 = 1354 cociente F 14769

Determinacioacuten de los grados de libertad

Grados de libertad del numerador

Nuacutemero de grados de libertad en el numerador del cociente F

= (nuacutemero de muestras-1)

Grados de libertad del denominador

Nuacutemero de grados de libertad en el denominador del cociente F

= Σ (nj-1)= nt-k

Graacutefica

Se acepta la hipoacutetesis nula

Regioacuten de aceptacioacuten

F= 1354

005 del aacuterea

Distribucioacuten f

381

Valor de tabla

Regioacuten de rechazo

Estadiacutestica Administrativa II 14

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

11-5 479 11-6 479

11-26 480 11-27 480 11-28 480 11-29 480 11-30 480

152 Inferencia sobre una varianza de poblacioacuten (Anova)

Estadiacutestico ji- cuadrada para inferencias sobre una varianza

X2=(n-1)s2 σ2

Intervalo de confianza para σ2

Liacutemite inferior de confianza

σ2L=(n-1)s2 X2

U Liacutemite superior de confianza

σ2U=(n-1)s2 X2

L

Estadiacutestica Administrativa II 15

Ejercicio

Con los siguientes datos obtener el estadiacutestico ji- cuadrada Y el intervalo de

confianza del 95

Tiempo x

50 45 27 66 43 96 45 90 69

153 Inferencia sobre la varianza de dos poblaciones (Anova) Ademaacutes de comparar la varianza de dos poblaciones el principal objetivo de este tema es analizar el cociente que se obtiene al aplicar la foacutermula correspondiente

Coeficiente F para inferencias acerca de dos varianzas

F=S21

S22

Estadiacutestica Administrativa II 16

Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple

21 Estimacioacuten mediante la liacutenea de regresioacuten El anaacutelisis de regresioacuten y correlacioacuten permiten determinar tanto la naturaleza como la fuerza de una relacioacuten entre dos variables En el anaacutelisis de regresioacuten se desarrollaraacute una ecuacioacuten de estimacioacuten a traveacutes de una foacutermula matemaacutetica que relaciona las variables conocidas con la variable desconocida La variable conocida- variable independiente X La variable que tratamos de predecir se llama variable dependiente Y

Figura 2 Fuente (Levin 2004511) 211 Diagrama de dispersioacuten El primer paso para determinar si existe una relacioacuten entre dos variables es examinar la graacutefica de datos observados A esta graacutefica se le llama diagrama de dispersioacuten Un diagrama de dispersioacuten se puede identificar visualmente patrones que indique si las variables estaacuten relacionadas

X

Y

Gastos contra la contaminacioacuten

Emisor de

contaminacioacuten

Pendiente negativa

b) Relacioacuten directa

X

Y

Publicidad

Ventas

Pendiente positiva

a) Relacioacuten directa

Estadiacutestica Administrativa II 17

Figura 3 Fuente (Levin 2004503)

212 Meacutetodo de miacutenimos cuadrados

Liacutenea de estimacioacuten

Y= a+bx Y= variable dependiente a=variable ordenada y b=pendiente de la recta x=variable independiente

Pendiente de la recta de regresioacuten de mejor ajuste

b = Σ XY - n X Y Σ X2 - n X2

b=pendiente de la liacutenea de estimacioacuten de mejor ajuste X= valores de la variable independiente Y= variable valores de la variable dependiente X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente n= nuacutemero de puntos

Estadiacutestica Administrativa II 18

Liacutenea de estimacioacuten

a = Y - bX a= ordenada Y b= pendiente de la ecuacioacuten X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente

Error estaacutendar de la estimacioacuten

Se= Σ(Y-Y)2

n-2 Y= valores de la variable dependiente Y=valores estimados con la ecuacioacuten de estimacioacuten que corresponden a cada valor de Y n= nuacutemero de puntos utilizados para ajustar la liacutenea de regresioacuten Para medir la confiabilidad de la ecuacioacuten de estimacioacuten los especialistas en estadiacutestica han desarrollado el error estaacutendar de estimacioacuten Este error estaacutendar se simboliza por Se y es similar a la desviacioacuten estaacutendar en cuanto a que ambas son medidas de dispersioacuten El error estaacutendar de la estimacioacuten por otra parte mide la variabilidad o dispersioacuten de los valores observados alrededor de la recta de regresioacuten 213 Interpretacioacuten del error estaacutendar de la estimacioacuten Como ocurririacutea en el caso de la desviacioacuten estaacutendar mientras maacutes grande sea el error estaacutendar de la estimacioacuten mayor seraacute la dispersioacuten de los puntos alrededor de la liacutenea de regresioacuten De manera inversa si Se= 0 esperamos que la ecuacioacuten de estimacioacuten sea un estimador ldquoperfectordquo de la variable dependiente En este caso todos los puntos caeriacutean directamente sobre la liacutenea de regresioacuten y no habriacutea puntos dispersos alrededor Usaremos el error estaacutendar de la estimacioacuten como una herramienta de la misma forma que podemos usar la desviacioacuten estaacutendar Esto es suponiendo que los puntos observados siguen una distribucioacuten normal alrededor de la recta de regresioacuten podemos esperar encontrar el 68 de los puntos dentro de plusmn1Se el 955 de los puntos dentro de plusmn2Se y el 997 de los puntos dentro de plusmn3Se

Estadiacutestica Administrativa II 19

Figura 4 Fuente (Levin 2004529)

Debemos observar que el error estaacutendar de la estimacioacuten se mide a lo largo del eje Y y no perpendicularmente desde la recta de regresioacuten 214 Intervalos de prediccioacuten aproximados Podemos concebir al error estaacutendar de la estimacioacuten como una herramienta estadiacutestica que podemos usar para hacer afirmaciones de probabilidad acerca del intervalo alrededor del valor estimado de Y dentro del cual cae el valor real de Y Ejemplo

Y= 375 + 075 X Sustituyendo 4 en X

Y= 375 + 075 (4) = 375 + 300

= 675

Estadiacutestica Administrativa II 20

Intervalo 1 error 2 errores 3 errores

Y plusmn1 Se

Y plusmn2 Se

Y plusmn3 Se

En donde Se = 8660

Sustitucioacuten

Ejemplo A menudo quienes hacen la contabilidad de costos estiman los gastos generales con base en el nivel de produccioacuten Se ha reunido informacioacuten acerca de los gastos generales y las unidades producidas en diferentes plantas y ahora desean estimar una ecuacioacuten de regresioacuten para predecir los gastos generales futuros Gastos generales 191 170 272 155 280 173 234 116 153 178 Unidades 40 42 53 35 56 39 48 30 37 40

a) Determine la variable dependiente e independiente b) Desarrolle una ecuacioacuten de regresioacuten para contabilidad de costos c) Pronostique los gastos generales cuando se producen 50 unidades d) Calcule el error estaacutendar de estimacioacuten

Y +1 Se =

675 + (1) (8660) = 76140 Liacutemite superior del intervalo de prediccioacuten

Y +2 Se =

675 + (2) (8660) = 84820 Liacutemite superior del intervalo de prediccioacuten

Y -1 Se =

675 - (1) (8660) = 58840 Liacutemite inferior del intervalo de prediccioacuten

Y - 2 Se =

675 - (2) (8660) = 50180 Liacutemite inferior del intervalo de prediccioacuten

Estadiacutestica Administrativa II 21

X Y XY X2 Y2 40 191 7640 1600 36481 42 170 7140 1764 28900 53 272 14416 2809 73984 35 155 5425 1225 24025 56 280 15680 3136 78400 39 173 6747 1521 29929 48 234 11232 2304 54756 30 116 3480 900 13456 37 153 5661 1369 23409 40 178 7120 1600 31684 ΣX= 420 ΣY= 1922 ΣXY= 84541 ΣX2= 18228 ΣY2= 395024

b = Σ XY - n X Y = 84541 - 10(42)(1922) = 64915 Σ X2 - n X2 18228 - 10(42)2 a = Y ndash bX = 1922 ndash 64915 (42) = - 804430 Y= a+bx = -804430 + 64915 (50) = 2441320 Se= ΣY2 ndashaΣY ndash b ΣXY = n-2 Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

12-2 531 12-3 531

12-13 531 12-14 531 12-15 531

Estadiacutestica Administrativa II 22

215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten

Coeficiente de determinacioacuten de la muestra

r2= aΣY+bΣXY-nY2

ΣY2 ndash n Y2

Coeficiente de correlacioacuten de la muestra

r= r2

Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten

Estadiacutestica Administrativa II 23

Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables

Y= a + b1 X1 + b2 X2

Ecuacioacuten

na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2

1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2

2 = Σ X2Y

Ejemplo

a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10

Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784

Sumatoria

114 105 85 2463 1590 1435 2367 1571

Matriz

6 105 85 114 105 2367 1435 2463 85 1435 1571 1590

1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25

1 175 14167 19 0 1 -099 884 0 0 361608 21410

361608 b2 = 21410 b2 = 21410 361608 b2 = 059

Estadiacutestica Administrativa II 24

1 b1 -099 b2 = 884 1 b1 -099 (059) = 884

-006 884 1b1 = 884 +006 b1 = 890

1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a

= 2589

Y= a + b1 X1 + b2 X2

y=2589+890(28)+059(10)=28099

Estadiacutestica Administrativa II 25

218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)

Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad

La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos

Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir

donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria

Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados

Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante

Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo

Estadiacutestica Administrativa II 26

Figura 5 Distribucioacuten Homocedaacutestica

Figura 6 Distribucioacuten Heterocedaacutestica

Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten

lineal para hacer estimaciones futuras

Estadiacutestica Administrativa II 27

Unidad 3 Nuacutemeros iacutendice

Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se

calcula encontrando el cociente del valor actual entre el valor base luego se

multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje

Tipos de nuacutemeros iacutendice

Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de

cantidad e iacutendice de valor

Iacutendice de precios

Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida

Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo

Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable

El iacutendice de valor combina los cambios de precio y cantidad para presentar un

iacutendice con maacutes informacioacuten

Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos

como indicadores generales de la condicioacuten econoacutemica de un paiacutes

Factores que pueden distorsionar los nuacutemeros iacutendice

bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados

bull Falta de comparacioacuten de iacutendices

bull Ponderacioacuten no apropiada de los factores

bull Seleccioacuten de una base no apropiada

Estadiacutestica Administrativa II 28

31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores

Iacutendice de cantidad de agregados no ponderados

ΣQi x 100 ΣQo

Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea

1993 1994 1995

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200

Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado

1993 Qo

1994 Q1

1995 Q2

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308

Estadiacutestica Administrativa II 29

Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra

Iacutendice de precios de agregados ponderados

ΣPiQ x 100 ΣPoQ

Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100

Cambio de periodo base

I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base

Estadiacutestica Administrativa II 30

35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos

Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables

Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico

Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios

El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)

Estadiacutestica Administrativa II 31

Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica

37 Deflacioacuten de los valores de series de tiempo

Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios

En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea

La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores

Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero

Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes

Los valores expresados en unidades monetarias corrientes se conocen como valores nominales

Los valores expresados en unidades monetarias constantes se conocen como valores reales

Estadiacutestica Administrativa II 32

38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor

Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos

39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)

Estadiacutestica Administrativa II 33

Siacutembolo Nombre de la compantildeiacutea

AA Alcoa

ALD Allied Signal

AXP American Express

BA Boeing

CAT Caterpillar

CHV Chevron

C CitiGroup

DIS Disney

DD Dupont

EK Eastman Kodak

GE General Electric

GM General Motors

GT Goodyear Tire

HWP Hewlett-Packard

IBM International Business Machines

IP International Paper

JNJ Johnson amp Johnson

JPM JP Morgan Bank

KO Coca Cola

Figura 5 Compantildeiacuteas comprendidas en el Dow Jones

310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos

Praacutectica 2

992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico

elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado

de precios

Estadiacutestica Administrativa II 34

Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida

bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)

42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten

Las principales pruebas no parameacutetricas son las siguientes

bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher

Estadiacutestica Administrativa II 35

bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon

Caracteriacutesticas de algunas pruebas no parameacutetricas

1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos

2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten

3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal

4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados

5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc

6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica

Prueba Caracteriacutestica

Mann- Whitney 2 muestras independientes

Wilcoxon 2 muestras asociadas

Kruskal-Wallis + de 2 muestras independientes

Friedman + de 2 muestras asociadas

Tabla1 Caracteriacutesticas de pruebas no parameacutetricas

Estadiacutestica Administrativa II 36

Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media

Ventajas y desventajas de los meacutetodos parameacutetricos

Desventajas Ventajas bull Ignoran cierta cantidad de

informacioacuten bull No requieren la suposicioacuten de que

una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica

bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas

bull Generalmente es maacutes sencillo realizarlas y entenderlas

bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal

Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo

MHHHHM

1ra 2ra 3ra

Estadiacutestica Administrativa II 37

Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1

n2= nuacutemero de ocurrencias del tipo 2

r= nuacutemero de corridas

4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue

BABBBAAABBABBBBAAAABABAABBBAABAAAABBA

BBAAAABBABBBBAABBABAABB

Valores de la prueba

n1= 29

n2= 31

r= 29

4322 Distribucioacuten de muestreo del estadiacutestico r

El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba

Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente

Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1

n1+n2

Estadiacutestica Administrativa II 38

μr = 2(29)(31) +1

29+31

μr = 1798 +1 60

μr = 2997 +1

μr = 3097

Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)

(n1+n2)2(n1+n2-1)

σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)

σr= (1798) (1738)

(60)2(59)

σr= 1471

σr= 384

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-24 643 14-25 643 14-26 643 14-27 644 14-28 644

Estadiacutestica Administrativa II 39

44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica

Ejemplo

Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado

Miembro del panel Calificacioacuten para

conferencias grandes

Calificacioacuten para

sesiones pequentildeas

Signo de la calificacioacuten

Evaluacioacuten de los dos tipos de

clases

1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -

6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +

La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)

Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20

Estadiacutestica Administrativa II 40

Establecimiento de las hipoacutetesis

Ho p = 05

H1 p ne 05

Se consideran la posibilidades solamente de signos + y - (9+6 =15)

p Ho = 05

q H0 = 05

n= 15

p= 0600 (915)

q= 0400 (615)

Prueba de hipoacutetesis de que no hay diferencia

Error estaacutendar del la proporcioacuten

σp= pq n

σp= (05)(05) 15

σp= 0129

0025

0

0475 del aacuterea

Valor criacutetico Z=-196

Regioacuten de aceptacioacuten

0025

0475 del aacuterea

Valor criacutetico Z=196

Estadiacutestica Administrativa II 41

45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten

Procedimiento de la prueba de rangos con signo de Wilcoxon

Paso1 Para cada par de datos calcule la diferencia d restando el segundo

valor del primero Guarde los signos pero descarte cualquier par para el que

d=0

Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de

la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango

correspondiente Cuando las diferencias tengan el mismo valor numeacuterico

asiacutegneles la media de los rangos implicados en el empate

Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino

Esto es inserte aquellos signos que se ignoraron e el paso dos

Paso 4 Calcule la suma de los valores absolutos de los rangos negativos

Tambieacuten la suma de los rangos positivos

Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon

en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el

procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos

sumas

Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la

diferencia d no es 0

Estadiacutestica Administrativa II 42

Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el

tamantildeo muestral

Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos

muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica

esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico

Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente

2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha

Notacioacuten

T= la maacutes pequentildea de las siguientes dos sumas

1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0

La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T

Estadiacutestica Administrativa II 43

46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2

Rango Calificacioacuten Plantel

1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S

10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S

Estadiacutestica Administrativa II 44

30 1600 S

Estadiacutestica Administrativa II 45

Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500

n1= 15 n2= 15 R1= 247 R2= 218

Estadiacutestico U

U = n1n2 + n1(n1 +1) -R1 2

U= (15)(15) + (15)(16) -247 2

U= 225+120-247

U= 98

Media de la distribucioacuten muestral U

μu = n1n2

2

μu = (15)(15)

2

μu =1125

Estadiacutestica Administrativa II 46

Estadiacutestico U

σU = n1n2 + (n1n2 +1)

12

σU = (15)(15)(15+15+1)

12

σU = 6975 12

σU = 58125

σU = 241

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2

α= 015

Estandarizacioacuten del estadiacutestico U

z = U-μu

σU

z = 98 - 1125 241

z = -0602

144 -144 0 -0602

Valor estandarizado de

la muestra U

Regioacuten de aceptacioacuten

Estadiacutestica Administrativa II 47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras

Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular

Prueba de Wilcoxon de los rangos con signo

Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero

Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande

Prueba de Wilcoxon para contrastar datos pareados

El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 5: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

Estadiacutestica Administrativa II 1

Unidad 1 Pruebas de la bondad del ajuste y anaacutelisis de varianza 11 Anaacutelisis Ji-Cuadrada Las pruebas Ji-Cuadrada nos permite probar si maacutes de dos proporciones de poblacioacuten pueden ser consideradas iguales Si clasificamos una poblacioacuten en diferentes categoriacuteas respecto a dos atributos (por ejemplo edad y desempentildeo en el trabajo) entonces podemos utilizar una prueba Ji-Cuadrada para los dos atributos son independientes entre siacute 12 Prueba de independencia Los administradores necesitan saber si las diferencias que observan entre varias proporciones de la muestra son significativas o soacutelo se deben al azar 13 Prueba de la bondad del ajuste La prueba ji- cuadrada puede utilizarse tambieacuten para decidir si una distribucioacuten de probabilidad en particular como la binomial la de Poisson o la normal es la apropiada Esta es una habilidad importante porque como tomadores de decisiones que utilizamos la estadiacutestica necesitamos escoger cierta distribucioacuten de probabilidad para representar la distribucioacuten de los datos que tengamos que analizar La prueba ji- cuadrada nos permite hacernos la pregunta de cuaacutel distribucioacuten podemos utilizar y probar si existe una diferencia significativa entre una distribucioacuten de frecuencias observadas y una distribucioacuten de frecuencias teoacuterica Caacutelculo de frecuencias observadas y esperadas Ejemplo La compantildeiacutea ldquoxrdquo requiere que los estudiantes del uacuteltimo antildeo de la universidad que buscan trabajo sean entrevistados por tres ejecutivos diferentes Esto permite a la compantildeiacutea obtener una evaluacioacuten por consenso de candidatos Cada ejecutivo califica al candidato como positivo o negativo Con el propoacutesito de planear la contratacioacuten el director de seleccioacuten del personal de la compantildeiacutea piensa que el proceso de entrevistas puede ser aproximado por una distribucioacuten binomial con p= 040 es decir del 40 de de posibilidad de que cualquier candidato obtenga una calificacioacuten positiva en cualquiera de las entrevistas Si el director desea probar una hipoacutetesis a un nivel de significancia de 020 iquestCoacutemo debe proceder

Estadiacutestica Administrativa II 2

Ho una distribucioacuten binomial con p= 040 Es una buena descripcioacuten del proceso de entrevista Hi una distribucioacuten binomial con p= 040 No es una buena descripcioacuten del proceso de entrevista α= 020 nivel de significancia para probar la hipoacutetesis

Calificaciones positivas posibles en las tres

entrevistas

Nuacutemero de candidatos que obtienen cada

calificacioacuten Resultados de las entrevistas de 100 candidatos

0 18 1 47 2 24 3 11 100

Calificaciones positivas posibles en las tres

entrevistas

Probabilidades binomiales para esos resultados

Posibilidad binomial 0 2160 1 4320 2 2880 3 0640 10000

Calificaciones positivas

posibles en las tres entrevistas

Frecuencia observada de

candidatos que obtienen estas calificaciones

Probabilidades binomiales de

resultados posibles

Nuacutemero de candidatos

entrevistados

Frecuencia esperada de candidatos

que obtienen estas

calificaciones

Frecuencias observadas Probabilidades binomiales adecuadas y frecuencias esperada

0 18 2160 100 216 1 47 4320 100 432 2 24 2880 100 288 3 11 0640 100 64 100 10000 1000

Estadiacutestico ji- cuadrada

x2 = Σ(fo-fe)2

fe

fo= frecuencia observada fe= frecuencia esperada

Estadiacutestica Administrativa II 3

Frecuencia observada

fo

Frecuencia esperada

fe

fo-fe (fo-fe)2 (fo-fe)2

fe

Calculo del estadiacutestico x2

18 216 -36 1296 06000 47 432 38 1444 03343 24 288 -48 2304 08000 11 64 46 2116 33063

X2=50406

Determinacioacuten de los grados de libertad Antes de calcular el nuacutemero adecuado de grados de libertad para una prueba ji- cuadrada de bondad de ajuste es necesario contar el nuacutemero de clases (denotado por K) para las que se compararon las frecuencias observadas y esperadas

Grados de libertad = k-1

K= 0123 k= 4 gl= 4-1 gl= 3 Rechazamos la hipoacutetesis nula y llegamos a la conclusioacuten de que la distribucioacuten binomial con p=040 no proporciona una buena descripcioacuten de nuestras frecuencias observadas Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

11-16 466 11-17 466 11-18 466

Regioacuten de aceptacioacuten

50406

020 del aacuterea

Valor x2

Distribucioacuten x2

4642

Valor de tabla

Regioacuten de rechazo

Estadiacutestica Administrativa II 4

14 Tablas de contingencia Describimos las dimensiones de una tabla de contingencia estableciendo primero el nuacutemero de renglones y luego el nuacutemero de columnas La columna y el rengloacuten con el total no cuentan como parte de las dimensiones Los renglones corren de manera horizontal y las columnas de manera vertical Tabla de contingencia de 2 x 4( 2 renglones 4 columnas) 141 Meacutetodo para obtener el estadiacutestico x2 de una tabla de

contingencia con 2 renglones Ejemplo En cuatro regiones se muestrean las actitudes de los empleados respecto a la evaluacioacuten del desempentildeo en el trabajo Los trabajadores eligen entre el meacutetodo actual (dos evaluaciones al antildeo) y un meacutetodo propuesto (evaluaciones trimestrales) A continuacioacuten se presentan los datos Tabla de contingencia de 2x4 Noreste Sureste Central Costa

oeste Total

Respuesta de la muestra concerniente a los programas de evaluacioacuten de empleados

Nuacutemero de empleados que prefieren el meacutetodo actual

68 75 57 79 279

Nuacutemero de empleados que prefieren el meacutetodo nuevo

32 45 33 31 141

Total de empleados muestreados en cada regioacuten

100 56 90 110 420

Planteamiento del problema

Hipoacutetesis nula Ho PN=PS=PC=PW

Hipoacutetesis alternativa

Hi PN PS PC PW no son iguales PN= proporcioacuten de empleados en el noreste que prefieren el plan actual PS= proporcioacuten de empleados en el sureste que prefieren el plan actual PC= proporcioacuten de empleados en la regioacuten central que prefieren el plan actual PW= proporcioacuten de empleados de la regioacuten de la costa que prefieren el plan actual

Estadiacutestica Administrativa II 5

Frecuencias observadas y esperadas

Noreste Sureste Central Costa oeste

Proporcioacuten de empleados muestreados en cada regioacuten que se espera prefieren los dos meacutetodos de evaluacioacuten

Nuacutemero total muestreado 100 120 90 110 Proporcioacuten estimada que prefieren el meacutetodo actual

x 06643 x 06643 x 06643 x 06643

Nuacutemero que se espera prefiera el meacutetodo actual

6643 7972 5979 7307

Nuacutemero total muestreado 100 120 90 110 Proporcioacuten estimada que prefieren el meacutetodo nuevo

x 03357 x 03357 x 03357 x 03357

Nuacutemero que se espera prefiera el meacutetodo nuevo

3357 4028 3021 3693

Noreste Sureste Central Costa

oeste Comparacioacuten de las frecuencias observadas y esperadas de trabajadores muestreados

Frecuencia con que prefieren el meacutetodo actual

68 75 57 79

Frecuencia observada (real) Frecuencia esperada (teoacuterica)

6643 7972 5979 7307

Frecuencia con que prefieren el meacutetodo nuevo

32 45 33 31

Frecuencia observada (real) Frecuencia esperada (teoacuterica)

3357 4028 3021 3693

Estadiacutestico ji- cuadrada

119961120784 = 120622

(119943119952 minus 119943119942)120784119943119942

fo= frecuencia observada fe= frecuencia esperada

Paso 1 Paso 2 Paso 3 Calculo del estadiacutestico x2

fo fe fo-fe (fo-fe)2 (fo-fe)2

fe 68 6643 157 246 00370 75 7972 -472 2228 02795 57 5979 -279 778 01301 79 7307 593 3516 04812 32 3357 -157 246 00733

45 4028 472 2228 05531 33 3021 279 778 02575 31 3693 -593 3516 09521 X2= 27638

Estadiacutestica Administrativa II 6

Determinacioacuten de los grados de libertad

Nuacutemero de grados de libertad

Grados de libertad en una prueba ji- cuadrada

= (nuacutemero de renglones -1 )(nuacutemero de columnas -1)

Tabla de 2x4 (2-1)(4-1)= (1)(3) = 3 grados de libertad

Nivel de significancia de 10 Buscar en tablas x2 3 grados de libertad con un nivel de significancia de 10 y graficar

Interpretacioacuten de los resultados y la graacutefica 142 Meacutetodo para obtener el estadiacutestico x2 de una tabla de

contingencia con maacutes de 2 renglones Estadiacutestico ji- cuadrada

x2 = Σ(fo-fe)2

fe fo= frecuencia observada fe= frecuencia esperada Determinacioacuten de los grados de libertad de una tabla de contingencia de maacutes de tres renglones

Nuacutemero de grados de libertad de una tabla de maacutes de tres renglones

Grados de libertad en una prueba ji- cuadrada

= (nuacutemero de renglones -1 )(nuacutemero de columnas -1)

Regioacuten de aceptacioacuten

2764

010 del aacuterea

Valor x2

Distribucioacuten x2

con 3 grados de

libertad

6251

Valor de tabla

Regioacuten de rechazo

Estadiacutestica Administrativa II 7

Tabla de contingencia Nuacutemero de

renglones Nuacutemero de columnas

r-1 c-1 Grados de libertad (r-1)(c-1)

A 3 4 3-1=2 4-1=3 (2)(3)=6 B 5 7 5-1=4 7-1=6 (4)(6)=24 C 6 9 6-1=5 9-1=8 (5)(8)=40

El presidente de una compantildeiacutea de seguros de salud se opone al seguro nacional Argumenta que su implementacioacuten seriacutea muy costosa en particular debido a que la existencia de este sistema tenderiacutea a fomentar permanencias hospitalarias maacutes prolongadas ademaacutes de otros efectos El presidente piensa que el tiempo de hospitalizacioacuten depende del tipo de seguro de salud que tengan las personas Los siguientes datos se obtuvieron de una muestra aleatoria de 660 hospitalizaciones Diacuteas en el hospital lt5 5-10 gt10 Total Datos de hospitalizaciones Calificados seguacuten el tipo de cobertura del seguro y el tiempo de estancia

Fraccioacuten de costos cubiertos por el seguro

lt25 40 75 65 180 25 -50 30 45 75 150

gt50 40 100 190 330

Total 110 220 330 660

Planteamiento del problema

Hipoacutetesis nula Ho el tiempo de estancia y tipo de seguro son independientes

Hipoacutetesis alternativa

Hi el tiempo de estancia depende del tipo de seguro

α= 001 nivel de significancia para probar la hipoacutetesis Frecuencia esperada para cualquier celda

Calculo de la frecuencia esperada fe= RT X CT n

fe= frecuencia esperada en una celda dada RT= total por rengloacuten para el rengloacuten que contiene esa celda CT= total por columna para la columna que contiene esa celda n= nuacutemero total de observaciones

Estadiacutestica Administrativa II 8

Estadiacutestico ji- cuadrada

fo= frecuencia observada fe= frecuencia esperada

x2 = Σ(fo-fe)2

fe

Rengloacuten Columna fo fe = RT X CT n

fo-fe (fo-fe)2 (fo-fe)2

fe Calculo de las frecuencias esperadas y ji- cuadrada

1 1 40 30 180 X 110 660

10 100 3333

1 2 75 60 180 X 220 660

15 225 3750

1 3 65 90 180 X 330 660

-25 625 6944

2 1 30 25 150 X 110 660

5 25 1000

2 2 45 50 150 X 220 660

-5 25 0500

2 3 75 75 150 X 330 660

0 0 0000

3 1 40 55 330 X 110 660

-15 225 4091

3 2 100 110 330 X 220 660

-10 100 0909

3 3 190 165 330 X 330 660

25 625 3788

X2=24315

Buscar en tablas x2 4grados de libertad con un nivel de significancia de 10 y graficar Interpretacioacuten de resultados

Regioacuten de aceptacioacuten

x2= 24315

010 del aacuterea

Distribucioacuten x2

13277

Valor de tabla

Regioacuten de rechazo

Estadiacutestica Administrativa II 9

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

11-1 459 11-2 460 11-7 460 11-8 460 11-9 460

11-10 460 11-11 461 11-12 461 11-13 461

15 Anaacutelisis de varianza

El anaacutelisis de varianza nos permite probar si maacutes de dos medias de poblacioacuten pueden considerarse iguales A menudo se abrevia ANOVA analysis of variance ANOVA Es un meacutetodo de prueba de igualdad de tres o maacutes medias poblacionales1

Hipoacutetesis nula tiacutepica

HO= μ1= μ2= μ3

El meacutetodo ANOVA nos sirve para evitar el error tipo I (rechazar una hipoacutetesis nula verdadera) si utilizamos una prueba de igualdad de varias medias

151 Aplicaciones de ANOVA Se utiliza cuando Se asevera que los supermercados colocan los cereales con alto contenido de azuacutecar en estantes que estaacuten a la altura De los ojos de los nintildeos de manera que eso nos permite probar la aseveracioacuten de que los cereales en los estantes tienen el mismo contenido de azuacutecar

1 Mario F Triola Estadiacutestica Pearson Meacutexico2006

Estadiacutestica Administrativa II 10

Tambieacuten en casos como la comparacioacuten del kilometraje logrado por cinco clases diferentes de gasolina la prueba de cuaacutel de cuatro meacutetodos de capacitacioacuten produce el aprendizaje maacutes raacutepido etc Los meacutetodos de ANOVA requieren de la distribucioacuten F Propiedades de la distribucioacuten F

1 Es no simeacutetrica se sesga hacia la derecha 2 Los valores F son 0 o positivo pero no negativos 3 Hay una distribucioacuten F para cada par de grados de libertad para el

numerador y el denominador

Figura 1 Fuente (Triola 2006605) Ejemplo

Muestra 1 15 18 19 22 11

Muestra 2 22 27 18 21 17

Muestra 3 18 24 19 16 22 15

Planteamiento de la hipoacutetesis

Ho μ1= μ2= μ3

H1 μ1 μ2 y μ3 no son todas iguales

Estadiacutestica Administrativa II 11

Caacutelculo de la media

Meacutetodo 1 Meacutetodo 2 Meacutetodo 3 Produccioacuten diaria 15 22 18

18 27 24 19 18 19 22 21 16 11 17 22

15 85 105 114 Sumatoria divide5 divide5 divide6 Tamantildeo de

la muestra 17 21 19 Media

muestral n1=5 n2=5 n3=6

1= 17 2= 21 3= 19

Caacutelculo de la gran media

= 15 +18+ 19+ 22+ 11+22 +27+ 18+ 21+ 17+18 +24+ 19+ 16+ 22+ 15 = 19 16

Caacutelculo de la varianza entre columnas

σ2b = Σnj ( - )2 = k-1

n - ( - )2 n( - ) Caacutelculo de la varianza entre columnas

5 17 19 17-19=-2 (-2)2=4 5x4=20 5 21 19 21-19=2 (2)2=4 5x4=20 6 19 19 19-19=0 (0)2=0 6x0 = 0 Σnj( - )

2 =40

σ2b = Σnj ( - )2 = 40= 40 = 20 varianza entre columnas

k-1 3-1 2

Estadiacutestica Administrativa II 12

Estimacioacuten de la varianza dentro de columnas

Meacutetodo de capacitacioacuten 1 Media muestral =17

Estimacioacuten de la varianza dentro de columnas

- ( - )2 15-17=-2 (-2)2=4 18-17=1 (1)2=1 19-17=2 (2)2=4 22-17=5 (5)2=25 11-17=-6 (-6)2=36 Σ( - )2 =70

s21= Σ( - )2 = 70 = 175 varianza de la muestra

n-1 5-1

Meacutetodo de capacitacioacuten 2 Media muestral =21

Estimacioacuten de la varianza dentro de columnas

- ( - )2 22-21=1 (1)2=1 27-21=6 (6)2=36 18-21=-3 (-3)2=9 21-21=0 (0)2=0 17-21=-4 (-4)2=16 Σ( - )2 =62

s22= Σ( - )2 = 62 = 155 varianza de la muestra

n-1 5-1

Meacutetodo de capacitacioacuten 3 Media muestral =19

Estimacioacuten de la varianza dentro de columnas

- ( - )2 18-19=-1 (-1)2=1 24-19=5 (5)2=25 19-19=0 (0)2=0 16-19=-3 (-3)2=9 22-19=3 (-32=9 15-19=-4 (-4)2=16 Σ( - )2 =60

Estadiacutestica Administrativa II 13

s23= Σ( - )2 = 60 = 120 varianza de la muestra

n-1 6-1

σ2w = Σ nj - 1 s2

j = (413)(175) + (413)(155) + (513)(120) = 193 = 14769 nt - k 13

Estadiacutestico F

F = varianza entre columnas = σ2b

Varianza dentro de columnas σ2w

F= 20 = 1354 cociente F 14769

Determinacioacuten de los grados de libertad

Grados de libertad del numerador

Nuacutemero de grados de libertad en el numerador del cociente F

= (nuacutemero de muestras-1)

Grados de libertad del denominador

Nuacutemero de grados de libertad en el denominador del cociente F

= Σ (nj-1)= nt-k

Graacutefica

Se acepta la hipoacutetesis nula

Regioacuten de aceptacioacuten

F= 1354

005 del aacuterea

Distribucioacuten f

381

Valor de tabla

Regioacuten de rechazo

Estadiacutestica Administrativa II 14

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

11-5 479 11-6 479

11-26 480 11-27 480 11-28 480 11-29 480 11-30 480

152 Inferencia sobre una varianza de poblacioacuten (Anova)

Estadiacutestico ji- cuadrada para inferencias sobre una varianza

X2=(n-1)s2 σ2

Intervalo de confianza para σ2

Liacutemite inferior de confianza

σ2L=(n-1)s2 X2

U Liacutemite superior de confianza

σ2U=(n-1)s2 X2

L

Estadiacutestica Administrativa II 15

Ejercicio

Con los siguientes datos obtener el estadiacutestico ji- cuadrada Y el intervalo de

confianza del 95

Tiempo x

50 45 27 66 43 96 45 90 69

153 Inferencia sobre la varianza de dos poblaciones (Anova) Ademaacutes de comparar la varianza de dos poblaciones el principal objetivo de este tema es analizar el cociente que se obtiene al aplicar la foacutermula correspondiente

Coeficiente F para inferencias acerca de dos varianzas

F=S21

S22

Estadiacutestica Administrativa II 16

Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple

21 Estimacioacuten mediante la liacutenea de regresioacuten El anaacutelisis de regresioacuten y correlacioacuten permiten determinar tanto la naturaleza como la fuerza de una relacioacuten entre dos variables En el anaacutelisis de regresioacuten se desarrollaraacute una ecuacioacuten de estimacioacuten a traveacutes de una foacutermula matemaacutetica que relaciona las variables conocidas con la variable desconocida La variable conocida- variable independiente X La variable que tratamos de predecir se llama variable dependiente Y

Figura 2 Fuente (Levin 2004511) 211 Diagrama de dispersioacuten El primer paso para determinar si existe una relacioacuten entre dos variables es examinar la graacutefica de datos observados A esta graacutefica se le llama diagrama de dispersioacuten Un diagrama de dispersioacuten se puede identificar visualmente patrones que indique si las variables estaacuten relacionadas

X

Y

Gastos contra la contaminacioacuten

Emisor de

contaminacioacuten

Pendiente negativa

b) Relacioacuten directa

X

Y

Publicidad

Ventas

Pendiente positiva

a) Relacioacuten directa

Estadiacutestica Administrativa II 17

Figura 3 Fuente (Levin 2004503)

212 Meacutetodo de miacutenimos cuadrados

Liacutenea de estimacioacuten

Y= a+bx Y= variable dependiente a=variable ordenada y b=pendiente de la recta x=variable independiente

Pendiente de la recta de regresioacuten de mejor ajuste

b = Σ XY - n X Y Σ X2 - n X2

b=pendiente de la liacutenea de estimacioacuten de mejor ajuste X= valores de la variable independiente Y= variable valores de la variable dependiente X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente n= nuacutemero de puntos

Estadiacutestica Administrativa II 18

Liacutenea de estimacioacuten

a = Y - bX a= ordenada Y b= pendiente de la ecuacioacuten X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente

Error estaacutendar de la estimacioacuten

Se= Σ(Y-Y)2

n-2 Y= valores de la variable dependiente Y=valores estimados con la ecuacioacuten de estimacioacuten que corresponden a cada valor de Y n= nuacutemero de puntos utilizados para ajustar la liacutenea de regresioacuten Para medir la confiabilidad de la ecuacioacuten de estimacioacuten los especialistas en estadiacutestica han desarrollado el error estaacutendar de estimacioacuten Este error estaacutendar se simboliza por Se y es similar a la desviacioacuten estaacutendar en cuanto a que ambas son medidas de dispersioacuten El error estaacutendar de la estimacioacuten por otra parte mide la variabilidad o dispersioacuten de los valores observados alrededor de la recta de regresioacuten 213 Interpretacioacuten del error estaacutendar de la estimacioacuten Como ocurririacutea en el caso de la desviacioacuten estaacutendar mientras maacutes grande sea el error estaacutendar de la estimacioacuten mayor seraacute la dispersioacuten de los puntos alrededor de la liacutenea de regresioacuten De manera inversa si Se= 0 esperamos que la ecuacioacuten de estimacioacuten sea un estimador ldquoperfectordquo de la variable dependiente En este caso todos los puntos caeriacutean directamente sobre la liacutenea de regresioacuten y no habriacutea puntos dispersos alrededor Usaremos el error estaacutendar de la estimacioacuten como una herramienta de la misma forma que podemos usar la desviacioacuten estaacutendar Esto es suponiendo que los puntos observados siguen una distribucioacuten normal alrededor de la recta de regresioacuten podemos esperar encontrar el 68 de los puntos dentro de plusmn1Se el 955 de los puntos dentro de plusmn2Se y el 997 de los puntos dentro de plusmn3Se

Estadiacutestica Administrativa II 19

Figura 4 Fuente (Levin 2004529)

Debemos observar que el error estaacutendar de la estimacioacuten se mide a lo largo del eje Y y no perpendicularmente desde la recta de regresioacuten 214 Intervalos de prediccioacuten aproximados Podemos concebir al error estaacutendar de la estimacioacuten como una herramienta estadiacutestica que podemos usar para hacer afirmaciones de probabilidad acerca del intervalo alrededor del valor estimado de Y dentro del cual cae el valor real de Y Ejemplo

Y= 375 + 075 X Sustituyendo 4 en X

Y= 375 + 075 (4) = 375 + 300

= 675

Estadiacutestica Administrativa II 20

Intervalo 1 error 2 errores 3 errores

Y plusmn1 Se

Y plusmn2 Se

Y plusmn3 Se

En donde Se = 8660

Sustitucioacuten

Ejemplo A menudo quienes hacen la contabilidad de costos estiman los gastos generales con base en el nivel de produccioacuten Se ha reunido informacioacuten acerca de los gastos generales y las unidades producidas en diferentes plantas y ahora desean estimar una ecuacioacuten de regresioacuten para predecir los gastos generales futuros Gastos generales 191 170 272 155 280 173 234 116 153 178 Unidades 40 42 53 35 56 39 48 30 37 40

a) Determine la variable dependiente e independiente b) Desarrolle una ecuacioacuten de regresioacuten para contabilidad de costos c) Pronostique los gastos generales cuando se producen 50 unidades d) Calcule el error estaacutendar de estimacioacuten

Y +1 Se =

675 + (1) (8660) = 76140 Liacutemite superior del intervalo de prediccioacuten

Y +2 Se =

675 + (2) (8660) = 84820 Liacutemite superior del intervalo de prediccioacuten

Y -1 Se =

675 - (1) (8660) = 58840 Liacutemite inferior del intervalo de prediccioacuten

Y - 2 Se =

675 - (2) (8660) = 50180 Liacutemite inferior del intervalo de prediccioacuten

Estadiacutestica Administrativa II 21

X Y XY X2 Y2 40 191 7640 1600 36481 42 170 7140 1764 28900 53 272 14416 2809 73984 35 155 5425 1225 24025 56 280 15680 3136 78400 39 173 6747 1521 29929 48 234 11232 2304 54756 30 116 3480 900 13456 37 153 5661 1369 23409 40 178 7120 1600 31684 ΣX= 420 ΣY= 1922 ΣXY= 84541 ΣX2= 18228 ΣY2= 395024

b = Σ XY - n X Y = 84541 - 10(42)(1922) = 64915 Σ X2 - n X2 18228 - 10(42)2 a = Y ndash bX = 1922 ndash 64915 (42) = - 804430 Y= a+bx = -804430 + 64915 (50) = 2441320 Se= ΣY2 ndashaΣY ndash b ΣXY = n-2 Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

12-2 531 12-3 531

12-13 531 12-14 531 12-15 531

Estadiacutestica Administrativa II 22

215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten

Coeficiente de determinacioacuten de la muestra

r2= aΣY+bΣXY-nY2

ΣY2 ndash n Y2

Coeficiente de correlacioacuten de la muestra

r= r2

Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten

Estadiacutestica Administrativa II 23

Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables

Y= a + b1 X1 + b2 X2

Ecuacioacuten

na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2

1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2

2 = Σ X2Y

Ejemplo

a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10

Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784

Sumatoria

114 105 85 2463 1590 1435 2367 1571

Matriz

6 105 85 114 105 2367 1435 2463 85 1435 1571 1590

1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25

1 175 14167 19 0 1 -099 884 0 0 361608 21410

361608 b2 = 21410 b2 = 21410 361608 b2 = 059

Estadiacutestica Administrativa II 24

1 b1 -099 b2 = 884 1 b1 -099 (059) = 884

-006 884 1b1 = 884 +006 b1 = 890

1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a

= 2589

Y= a + b1 X1 + b2 X2

y=2589+890(28)+059(10)=28099

Estadiacutestica Administrativa II 25

218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)

Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad

La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos

Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir

donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria

Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados

Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante

Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo

Estadiacutestica Administrativa II 26

Figura 5 Distribucioacuten Homocedaacutestica

Figura 6 Distribucioacuten Heterocedaacutestica

Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten

lineal para hacer estimaciones futuras

Estadiacutestica Administrativa II 27

Unidad 3 Nuacutemeros iacutendice

Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se

calcula encontrando el cociente del valor actual entre el valor base luego se

multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje

Tipos de nuacutemeros iacutendice

Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de

cantidad e iacutendice de valor

Iacutendice de precios

Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida

Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo

Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable

El iacutendice de valor combina los cambios de precio y cantidad para presentar un

iacutendice con maacutes informacioacuten

Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos

como indicadores generales de la condicioacuten econoacutemica de un paiacutes

Factores que pueden distorsionar los nuacutemeros iacutendice

bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados

bull Falta de comparacioacuten de iacutendices

bull Ponderacioacuten no apropiada de los factores

bull Seleccioacuten de una base no apropiada

Estadiacutestica Administrativa II 28

31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores

Iacutendice de cantidad de agregados no ponderados

ΣQi x 100 ΣQo

Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea

1993 1994 1995

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200

Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado

1993 Qo

1994 Q1

1995 Q2

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308

Estadiacutestica Administrativa II 29

Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra

Iacutendice de precios de agregados ponderados

ΣPiQ x 100 ΣPoQ

Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100

Cambio de periodo base

I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base

Estadiacutestica Administrativa II 30

35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos

Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables

Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico

Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios

El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)

Estadiacutestica Administrativa II 31

Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica

37 Deflacioacuten de los valores de series de tiempo

Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios

En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea

La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores

Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero

Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes

Los valores expresados en unidades monetarias corrientes se conocen como valores nominales

Los valores expresados en unidades monetarias constantes se conocen como valores reales

Estadiacutestica Administrativa II 32

38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor

Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos

39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)

Estadiacutestica Administrativa II 33

Siacutembolo Nombre de la compantildeiacutea

AA Alcoa

ALD Allied Signal

AXP American Express

BA Boeing

CAT Caterpillar

CHV Chevron

C CitiGroup

DIS Disney

DD Dupont

EK Eastman Kodak

GE General Electric

GM General Motors

GT Goodyear Tire

HWP Hewlett-Packard

IBM International Business Machines

IP International Paper

JNJ Johnson amp Johnson

JPM JP Morgan Bank

KO Coca Cola

Figura 5 Compantildeiacuteas comprendidas en el Dow Jones

310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos

Praacutectica 2

992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico

elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado

de precios

Estadiacutestica Administrativa II 34

Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida

bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)

42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten

Las principales pruebas no parameacutetricas son las siguientes

bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher

Estadiacutestica Administrativa II 35

bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon

Caracteriacutesticas de algunas pruebas no parameacutetricas

1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos

2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten

3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal

4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados

5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc

6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica

Prueba Caracteriacutestica

Mann- Whitney 2 muestras independientes

Wilcoxon 2 muestras asociadas

Kruskal-Wallis + de 2 muestras independientes

Friedman + de 2 muestras asociadas

Tabla1 Caracteriacutesticas de pruebas no parameacutetricas

Estadiacutestica Administrativa II 36

Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media

Ventajas y desventajas de los meacutetodos parameacutetricos

Desventajas Ventajas bull Ignoran cierta cantidad de

informacioacuten bull No requieren la suposicioacuten de que

una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica

bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas

bull Generalmente es maacutes sencillo realizarlas y entenderlas

bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal

Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo

MHHHHM

1ra 2ra 3ra

Estadiacutestica Administrativa II 37

Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1

n2= nuacutemero de ocurrencias del tipo 2

r= nuacutemero de corridas

4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue

BABBBAAABBABBBBAAAABABAABBBAABAAAABBA

BBAAAABBABBBBAABBABAABB

Valores de la prueba

n1= 29

n2= 31

r= 29

4322 Distribucioacuten de muestreo del estadiacutestico r

El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba

Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente

Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1

n1+n2

Estadiacutestica Administrativa II 38

μr = 2(29)(31) +1

29+31

μr = 1798 +1 60

μr = 2997 +1

μr = 3097

Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)

(n1+n2)2(n1+n2-1)

σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)

σr= (1798) (1738)

(60)2(59)

σr= 1471

σr= 384

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-24 643 14-25 643 14-26 643 14-27 644 14-28 644

Estadiacutestica Administrativa II 39

44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica

Ejemplo

Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado

Miembro del panel Calificacioacuten para

conferencias grandes

Calificacioacuten para

sesiones pequentildeas

Signo de la calificacioacuten

Evaluacioacuten de los dos tipos de

clases

1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -

6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +

La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)

Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20

Estadiacutestica Administrativa II 40

Establecimiento de las hipoacutetesis

Ho p = 05

H1 p ne 05

Se consideran la posibilidades solamente de signos + y - (9+6 =15)

p Ho = 05

q H0 = 05

n= 15

p= 0600 (915)

q= 0400 (615)

Prueba de hipoacutetesis de que no hay diferencia

Error estaacutendar del la proporcioacuten

σp= pq n

σp= (05)(05) 15

σp= 0129

0025

0

0475 del aacuterea

Valor criacutetico Z=-196

Regioacuten de aceptacioacuten

0025

0475 del aacuterea

Valor criacutetico Z=196

Estadiacutestica Administrativa II 41

45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten

Procedimiento de la prueba de rangos con signo de Wilcoxon

Paso1 Para cada par de datos calcule la diferencia d restando el segundo

valor del primero Guarde los signos pero descarte cualquier par para el que

d=0

Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de

la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango

correspondiente Cuando las diferencias tengan el mismo valor numeacuterico

asiacutegneles la media de los rangos implicados en el empate

Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino

Esto es inserte aquellos signos que se ignoraron e el paso dos

Paso 4 Calcule la suma de los valores absolutos de los rangos negativos

Tambieacuten la suma de los rangos positivos

Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon

en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el

procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos

sumas

Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la

diferencia d no es 0

Estadiacutestica Administrativa II 42

Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el

tamantildeo muestral

Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos

muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica

esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico

Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente

2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha

Notacioacuten

T= la maacutes pequentildea de las siguientes dos sumas

1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0

La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T

Estadiacutestica Administrativa II 43

46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2

Rango Calificacioacuten Plantel

1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S

10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S

Estadiacutestica Administrativa II 44

30 1600 S

Estadiacutestica Administrativa II 45

Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500

n1= 15 n2= 15 R1= 247 R2= 218

Estadiacutestico U

U = n1n2 + n1(n1 +1) -R1 2

U= (15)(15) + (15)(16) -247 2

U= 225+120-247

U= 98

Media de la distribucioacuten muestral U

μu = n1n2

2

μu = (15)(15)

2

μu =1125

Estadiacutestica Administrativa II 46

Estadiacutestico U

σU = n1n2 + (n1n2 +1)

12

σU = (15)(15)(15+15+1)

12

σU = 6975 12

σU = 58125

σU = 241

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2

α= 015

Estandarizacioacuten del estadiacutestico U

z = U-μu

σU

z = 98 - 1125 241

z = -0602

144 -144 0 -0602

Valor estandarizado de

la muestra U

Regioacuten de aceptacioacuten

Estadiacutestica Administrativa II 47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras

Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular

Prueba de Wilcoxon de los rangos con signo

Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero

Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande

Prueba de Wilcoxon para contrastar datos pareados

El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 6: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

Estadiacutestica Administrativa II 2

Ho una distribucioacuten binomial con p= 040 Es una buena descripcioacuten del proceso de entrevista Hi una distribucioacuten binomial con p= 040 No es una buena descripcioacuten del proceso de entrevista α= 020 nivel de significancia para probar la hipoacutetesis

Calificaciones positivas posibles en las tres

entrevistas

Nuacutemero de candidatos que obtienen cada

calificacioacuten Resultados de las entrevistas de 100 candidatos

0 18 1 47 2 24 3 11 100

Calificaciones positivas posibles en las tres

entrevistas

Probabilidades binomiales para esos resultados

Posibilidad binomial 0 2160 1 4320 2 2880 3 0640 10000

Calificaciones positivas

posibles en las tres entrevistas

Frecuencia observada de

candidatos que obtienen estas calificaciones

Probabilidades binomiales de

resultados posibles

Nuacutemero de candidatos

entrevistados

Frecuencia esperada de candidatos

que obtienen estas

calificaciones

Frecuencias observadas Probabilidades binomiales adecuadas y frecuencias esperada

0 18 2160 100 216 1 47 4320 100 432 2 24 2880 100 288 3 11 0640 100 64 100 10000 1000

Estadiacutestico ji- cuadrada

x2 = Σ(fo-fe)2

fe

fo= frecuencia observada fe= frecuencia esperada

Estadiacutestica Administrativa II 3

Frecuencia observada

fo

Frecuencia esperada

fe

fo-fe (fo-fe)2 (fo-fe)2

fe

Calculo del estadiacutestico x2

18 216 -36 1296 06000 47 432 38 1444 03343 24 288 -48 2304 08000 11 64 46 2116 33063

X2=50406

Determinacioacuten de los grados de libertad Antes de calcular el nuacutemero adecuado de grados de libertad para una prueba ji- cuadrada de bondad de ajuste es necesario contar el nuacutemero de clases (denotado por K) para las que se compararon las frecuencias observadas y esperadas

Grados de libertad = k-1

K= 0123 k= 4 gl= 4-1 gl= 3 Rechazamos la hipoacutetesis nula y llegamos a la conclusioacuten de que la distribucioacuten binomial con p=040 no proporciona una buena descripcioacuten de nuestras frecuencias observadas Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

11-16 466 11-17 466 11-18 466

Regioacuten de aceptacioacuten

50406

020 del aacuterea

Valor x2

Distribucioacuten x2

4642

Valor de tabla

Regioacuten de rechazo

Estadiacutestica Administrativa II 4

14 Tablas de contingencia Describimos las dimensiones de una tabla de contingencia estableciendo primero el nuacutemero de renglones y luego el nuacutemero de columnas La columna y el rengloacuten con el total no cuentan como parte de las dimensiones Los renglones corren de manera horizontal y las columnas de manera vertical Tabla de contingencia de 2 x 4( 2 renglones 4 columnas) 141 Meacutetodo para obtener el estadiacutestico x2 de una tabla de

contingencia con 2 renglones Ejemplo En cuatro regiones se muestrean las actitudes de los empleados respecto a la evaluacioacuten del desempentildeo en el trabajo Los trabajadores eligen entre el meacutetodo actual (dos evaluaciones al antildeo) y un meacutetodo propuesto (evaluaciones trimestrales) A continuacioacuten se presentan los datos Tabla de contingencia de 2x4 Noreste Sureste Central Costa

oeste Total

Respuesta de la muestra concerniente a los programas de evaluacioacuten de empleados

Nuacutemero de empleados que prefieren el meacutetodo actual

68 75 57 79 279

Nuacutemero de empleados que prefieren el meacutetodo nuevo

32 45 33 31 141

Total de empleados muestreados en cada regioacuten

100 56 90 110 420

Planteamiento del problema

Hipoacutetesis nula Ho PN=PS=PC=PW

Hipoacutetesis alternativa

Hi PN PS PC PW no son iguales PN= proporcioacuten de empleados en el noreste que prefieren el plan actual PS= proporcioacuten de empleados en el sureste que prefieren el plan actual PC= proporcioacuten de empleados en la regioacuten central que prefieren el plan actual PW= proporcioacuten de empleados de la regioacuten de la costa que prefieren el plan actual

Estadiacutestica Administrativa II 5

Frecuencias observadas y esperadas

Noreste Sureste Central Costa oeste

Proporcioacuten de empleados muestreados en cada regioacuten que se espera prefieren los dos meacutetodos de evaluacioacuten

Nuacutemero total muestreado 100 120 90 110 Proporcioacuten estimada que prefieren el meacutetodo actual

x 06643 x 06643 x 06643 x 06643

Nuacutemero que se espera prefiera el meacutetodo actual

6643 7972 5979 7307

Nuacutemero total muestreado 100 120 90 110 Proporcioacuten estimada que prefieren el meacutetodo nuevo

x 03357 x 03357 x 03357 x 03357

Nuacutemero que se espera prefiera el meacutetodo nuevo

3357 4028 3021 3693

Noreste Sureste Central Costa

oeste Comparacioacuten de las frecuencias observadas y esperadas de trabajadores muestreados

Frecuencia con que prefieren el meacutetodo actual

68 75 57 79

Frecuencia observada (real) Frecuencia esperada (teoacuterica)

6643 7972 5979 7307

Frecuencia con que prefieren el meacutetodo nuevo

32 45 33 31

Frecuencia observada (real) Frecuencia esperada (teoacuterica)

3357 4028 3021 3693

Estadiacutestico ji- cuadrada

119961120784 = 120622

(119943119952 minus 119943119942)120784119943119942

fo= frecuencia observada fe= frecuencia esperada

Paso 1 Paso 2 Paso 3 Calculo del estadiacutestico x2

fo fe fo-fe (fo-fe)2 (fo-fe)2

fe 68 6643 157 246 00370 75 7972 -472 2228 02795 57 5979 -279 778 01301 79 7307 593 3516 04812 32 3357 -157 246 00733

45 4028 472 2228 05531 33 3021 279 778 02575 31 3693 -593 3516 09521 X2= 27638

Estadiacutestica Administrativa II 6

Determinacioacuten de los grados de libertad

Nuacutemero de grados de libertad

Grados de libertad en una prueba ji- cuadrada

= (nuacutemero de renglones -1 )(nuacutemero de columnas -1)

Tabla de 2x4 (2-1)(4-1)= (1)(3) = 3 grados de libertad

Nivel de significancia de 10 Buscar en tablas x2 3 grados de libertad con un nivel de significancia de 10 y graficar

Interpretacioacuten de los resultados y la graacutefica 142 Meacutetodo para obtener el estadiacutestico x2 de una tabla de

contingencia con maacutes de 2 renglones Estadiacutestico ji- cuadrada

x2 = Σ(fo-fe)2

fe fo= frecuencia observada fe= frecuencia esperada Determinacioacuten de los grados de libertad de una tabla de contingencia de maacutes de tres renglones

Nuacutemero de grados de libertad de una tabla de maacutes de tres renglones

Grados de libertad en una prueba ji- cuadrada

= (nuacutemero de renglones -1 )(nuacutemero de columnas -1)

Regioacuten de aceptacioacuten

2764

010 del aacuterea

Valor x2

Distribucioacuten x2

con 3 grados de

libertad

6251

Valor de tabla

Regioacuten de rechazo

Estadiacutestica Administrativa II 7

Tabla de contingencia Nuacutemero de

renglones Nuacutemero de columnas

r-1 c-1 Grados de libertad (r-1)(c-1)

A 3 4 3-1=2 4-1=3 (2)(3)=6 B 5 7 5-1=4 7-1=6 (4)(6)=24 C 6 9 6-1=5 9-1=8 (5)(8)=40

El presidente de una compantildeiacutea de seguros de salud se opone al seguro nacional Argumenta que su implementacioacuten seriacutea muy costosa en particular debido a que la existencia de este sistema tenderiacutea a fomentar permanencias hospitalarias maacutes prolongadas ademaacutes de otros efectos El presidente piensa que el tiempo de hospitalizacioacuten depende del tipo de seguro de salud que tengan las personas Los siguientes datos se obtuvieron de una muestra aleatoria de 660 hospitalizaciones Diacuteas en el hospital lt5 5-10 gt10 Total Datos de hospitalizaciones Calificados seguacuten el tipo de cobertura del seguro y el tiempo de estancia

Fraccioacuten de costos cubiertos por el seguro

lt25 40 75 65 180 25 -50 30 45 75 150

gt50 40 100 190 330

Total 110 220 330 660

Planteamiento del problema

Hipoacutetesis nula Ho el tiempo de estancia y tipo de seguro son independientes

Hipoacutetesis alternativa

Hi el tiempo de estancia depende del tipo de seguro

α= 001 nivel de significancia para probar la hipoacutetesis Frecuencia esperada para cualquier celda

Calculo de la frecuencia esperada fe= RT X CT n

fe= frecuencia esperada en una celda dada RT= total por rengloacuten para el rengloacuten que contiene esa celda CT= total por columna para la columna que contiene esa celda n= nuacutemero total de observaciones

Estadiacutestica Administrativa II 8

Estadiacutestico ji- cuadrada

fo= frecuencia observada fe= frecuencia esperada

x2 = Σ(fo-fe)2

fe

Rengloacuten Columna fo fe = RT X CT n

fo-fe (fo-fe)2 (fo-fe)2

fe Calculo de las frecuencias esperadas y ji- cuadrada

1 1 40 30 180 X 110 660

10 100 3333

1 2 75 60 180 X 220 660

15 225 3750

1 3 65 90 180 X 330 660

-25 625 6944

2 1 30 25 150 X 110 660

5 25 1000

2 2 45 50 150 X 220 660

-5 25 0500

2 3 75 75 150 X 330 660

0 0 0000

3 1 40 55 330 X 110 660

-15 225 4091

3 2 100 110 330 X 220 660

-10 100 0909

3 3 190 165 330 X 330 660

25 625 3788

X2=24315

Buscar en tablas x2 4grados de libertad con un nivel de significancia de 10 y graficar Interpretacioacuten de resultados

Regioacuten de aceptacioacuten

x2= 24315

010 del aacuterea

Distribucioacuten x2

13277

Valor de tabla

Regioacuten de rechazo

Estadiacutestica Administrativa II 9

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

11-1 459 11-2 460 11-7 460 11-8 460 11-9 460

11-10 460 11-11 461 11-12 461 11-13 461

15 Anaacutelisis de varianza

El anaacutelisis de varianza nos permite probar si maacutes de dos medias de poblacioacuten pueden considerarse iguales A menudo se abrevia ANOVA analysis of variance ANOVA Es un meacutetodo de prueba de igualdad de tres o maacutes medias poblacionales1

Hipoacutetesis nula tiacutepica

HO= μ1= μ2= μ3

El meacutetodo ANOVA nos sirve para evitar el error tipo I (rechazar una hipoacutetesis nula verdadera) si utilizamos una prueba de igualdad de varias medias

151 Aplicaciones de ANOVA Se utiliza cuando Se asevera que los supermercados colocan los cereales con alto contenido de azuacutecar en estantes que estaacuten a la altura De los ojos de los nintildeos de manera que eso nos permite probar la aseveracioacuten de que los cereales en los estantes tienen el mismo contenido de azuacutecar

1 Mario F Triola Estadiacutestica Pearson Meacutexico2006

Estadiacutestica Administrativa II 10

Tambieacuten en casos como la comparacioacuten del kilometraje logrado por cinco clases diferentes de gasolina la prueba de cuaacutel de cuatro meacutetodos de capacitacioacuten produce el aprendizaje maacutes raacutepido etc Los meacutetodos de ANOVA requieren de la distribucioacuten F Propiedades de la distribucioacuten F

1 Es no simeacutetrica se sesga hacia la derecha 2 Los valores F son 0 o positivo pero no negativos 3 Hay una distribucioacuten F para cada par de grados de libertad para el

numerador y el denominador

Figura 1 Fuente (Triola 2006605) Ejemplo

Muestra 1 15 18 19 22 11

Muestra 2 22 27 18 21 17

Muestra 3 18 24 19 16 22 15

Planteamiento de la hipoacutetesis

Ho μ1= μ2= μ3

H1 μ1 μ2 y μ3 no son todas iguales

Estadiacutestica Administrativa II 11

Caacutelculo de la media

Meacutetodo 1 Meacutetodo 2 Meacutetodo 3 Produccioacuten diaria 15 22 18

18 27 24 19 18 19 22 21 16 11 17 22

15 85 105 114 Sumatoria divide5 divide5 divide6 Tamantildeo de

la muestra 17 21 19 Media

muestral n1=5 n2=5 n3=6

1= 17 2= 21 3= 19

Caacutelculo de la gran media

= 15 +18+ 19+ 22+ 11+22 +27+ 18+ 21+ 17+18 +24+ 19+ 16+ 22+ 15 = 19 16

Caacutelculo de la varianza entre columnas

σ2b = Σnj ( - )2 = k-1

n - ( - )2 n( - ) Caacutelculo de la varianza entre columnas

5 17 19 17-19=-2 (-2)2=4 5x4=20 5 21 19 21-19=2 (2)2=4 5x4=20 6 19 19 19-19=0 (0)2=0 6x0 = 0 Σnj( - )

2 =40

σ2b = Σnj ( - )2 = 40= 40 = 20 varianza entre columnas

k-1 3-1 2

Estadiacutestica Administrativa II 12

Estimacioacuten de la varianza dentro de columnas

Meacutetodo de capacitacioacuten 1 Media muestral =17

Estimacioacuten de la varianza dentro de columnas

- ( - )2 15-17=-2 (-2)2=4 18-17=1 (1)2=1 19-17=2 (2)2=4 22-17=5 (5)2=25 11-17=-6 (-6)2=36 Σ( - )2 =70

s21= Σ( - )2 = 70 = 175 varianza de la muestra

n-1 5-1

Meacutetodo de capacitacioacuten 2 Media muestral =21

Estimacioacuten de la varianza dentro de columnas

- ( - )2 22-21=1 (1)2=1 27-21=6 (6)2=36 18-21=-3 (-3)2=9 21-21=0 (0)2=0 17-21=-4 (-4)2=16 Σ( - )2 =62

s22= Σ( - )2 = 62 = 155 varianza de la muestra

n-1 5-1

Meacutetodo de capacitacioacuten 3 Media muestral =19

Estimacioacuten de la varianza dentro de columnas

- ( - )2 18-19=-1 (-1)2=1 24-19=5 (5)2=25 19-19=0 (0)2=0 16-19=-3 (-3)2=9 22-19=3 (-32=9 15-19=-4 (-4)2=16 Σ( - )2 =60

Estadiacutestica Administrativa II 13

s23= Σ( - )2 = 60 = 120 varianza de la muestra

n-1 6-1

σ2w = Σ nj - 1 s2

j = (413)(175) + (413)(155) + (513)(120) = 193 = 14769 nt - k 13

Estadiacutestico F

F = varianza entre columnas = σ2b

Varianza dentro de columnas σ2w

F= 20 = 1354 cociente F 14769

Determinacioacuten de los grados de libertad

Grados de libertad del numerador

Nuacutemero de grados de libertad en el numerador del cociente F

= (nuacutemero de muestras-1)

Grados de libertad del denominador

Nuacutemero de grados de libertad en el denominador del cociente F

= Σ (nj-1)= nt-k

Graacutefica

Se acepta la hipoacutetesis nula

Regioacuten de aceptacioacuten

F= 1354

005 del aacuterea

Distribucioacuten f

381

Valor de tabla

Regioacuten de rechazo

Estadiacutestica Administrativa II 14

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

11-5 479 11-6 479

11-26 480 11-27 480 11-28 480 11-29 480 11-30 480

152 Inferencia sobre una varianza de poblacioacuten (Anova)

Estadiacutestico ji- cuadrada para inferencias sobre una varianza

X2=(n-1)s2 σ2

Intervalo de confianza para σ2

Liacutemite inferior de confianza

σ2L=(n-1)s2 X2

U Liacutemite superior de confianza

σ2U=(n-1)s2 X2

L

Estadiacutestica Administrativa II 15

Ejercicio

Con los siguientes datos obtener el estadiacutestico ji- cuadrada Y el intervalo de

confianza del 95

Tiempo x

50 45 27 66 43 96 45 90 69

153 Inferencia sobre la varianza de dos poblaciones (Anova) Ademaacutes de comparar la varianza de dos poblaciones el principal objetivo de este tema es analizar el cociente que se obtiene al aplicar la foacutermula correspondiente

Coeficiente F para inferencias acerca de dos varianzas

F=S21

S22

Estadiacutestica Administrativa II 16

Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple

21 Estimacioacuten mediante la liacutenea de regresioacuten El anaacutelisis de regresioacuten y correlacioacuten permiten determinar tanto la naturaleza como la fuerza de una relacioacuten entre dos variables En el anaacutelisis de regresioacuten se desarrollaraacute una ecuacioacuten de estimacioacuten a traveacutes de una foacutermula matemaacutetica que relaciona las variables conocidas con la variable desconocida La variable conocida- variable independiente X La variable que tratamos de predecir se llama variable dependiente Y

Figura 2 Fuente (Levin 2004511) 211 Diagrama de dispersioacuten El primer paso para determinar si existe una relacioacuten entre dos variables es examinar la graacutefica de datos observados A esta graacutefica se le llama diagrama de dispersioacuten Un diagrama de dispersioacuten se puede identificar visualmente patrones que indique si las variables estaacuten relacionadas

X

Y

Gastos contra la contaminacioacuten

Emisor de

contaminacioacuten

Pendiente negativa

b) Relacioacuten directa

X

Y

Publicidad

Ventas

Pendiente positiva

a) Relacioacuten directa

Estadiacutestica Administrativa II 17

Figura 3 Fuente (Levin 2004503)

212 Meacutetodo de miacutenimos cuadrados

Liacutenea de estimacioacuten

Y= a+bx Y= variable dependiente a=variable ordenada y b=pendiente de la recta x=variable independiente

Pendiente de la recta de regresioacuten de mejor ajuste

b = Σ XY - n X Y Σ X2 - n X2

b=pendiente de la liacutenea de estimacioacuten de mejor ajuste X= valores de la variable independiente Y= variable valores de la variable dependiente X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente n= nuacutemero de puntos

Estadiacutestica Administrativa II 18

Liacutenea de estimacioacuten

a = Y - bX a= ordenada Y b= pendiente de la ecuacioacuten X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente

Error estaacutendar de la estimacioacuten

Se= Σ(Y-Y)2

n-2 Y= valores de la variable dependiente Y=valores estimados con la ecuacioacuten de estimacioacuten que corresponden a cada valor de Y n= nuacutemero de puntos utilizados para ajustar la liacutenea de regresioacuten Para medir la confiabilidad de la ecuacioacuten de estimacioacuten los especialistas en estadiacutestica han desarrollado el error estaacutendar de estimacioacuten Este error estaacutendar se simboliza por Se y es similar a la desviacioacuten estaacutendar en cuanto a que ambas son medidas de dispersioacuten El error estaacutendar de la estimacioacuten por otra parte mide la variabilidad o dispersioacuten de los valores observados alrededor de la recta de regresioacuten 213 Interpretacioacuten del error estaacutendar de la estimacioacuten Como ocurririacutea en el caso de la desviacioacuten estaacutendar mientras maacutes grande sea el error estaacutendar de la estimacioacuten mayor seraacute la dispersioacuten de los puntos alrededor de la liacutenea de regresioacuten De manera inversa si Se= 0 esperamos que la ecuacioacuten de estimacioacuten sea un estimador ldquoperfectordquo de la variable dependiente En este caso todos los puntos caeriacutean directamente sobre la liacutenea de regresioacuten y no habriacutea puntos dispersos alrededor Usaremos el error estaacutendar de la estimacioacuten como una herramienta de la misma forma que podemos usar la desviacioacuten estaacutendar Esto es suponiendo que los puntos observados siguen una distribucioacuten normal alrededor de la recta de regresioacuten podemos esperar encontrar el 68 de los puntos dentro de plusmn1Se el 955 de los puntos dentro de plusmn2Se y el 997 de los puntos dentro de plusmn3Se

Estadiacutestica Administrativa II 19

Figura 4 Fuente (Levin 2004529)

Debemos observar que el error estaacutendar de la estimacioacuten se mide a lo largo del eje Y y no perpendicularmente desde la recta de regresioacuten 214 Intervalos de prediccioacuten aproximados Podemos concebir al error estaacutendar de la estimacioacuten como una herramienta estadiacutestica que podemos usar para hacer afirmaciones de probabilidad acerca del intervalo alrededor del valor estimado de Y dentro del cual cae el valor real de Y Ejemplo

Y= 375 + 075 X Sustituyendo 4 en X

Y= 375 + 075 (4) = 375 + 300

= 675

Estadiacutestica Administrativa II 20

Intervalo 1 error 2 errores 3 errores

Y plusmn1 Se

Y plusmn2 Se

Y plusmn3 Se

En donde Se = 8660

Sustitucioacuten

Ejemplo A menudo quienes hacen la contabilidad de costos estiman los gastos generales con base en el nivel de produccioacuten Se ha reunido informacioacuten acerca de los gastos generales y las unidades producidas en diferentes plantas y ahora desean estimar una ecuacioacuten de regresioacuten para predecir los gastos generales futuros Gastos generales 191 170 272 155 280 173 234 116 153 178 Unidades 40 42 53 35 56 39 48 30 37 40

a) Determine la variable dependiente e independiente b) Desarrolle una ecuacioacuten de regresioacuten para contabilidad de costos c) Pronostique los gastos generales cuando se producen 50 unidades d) Calcule el error estaacutendar de estimacioacuten

Y +1 Se =

675 + (1) (8660) = 76140 Liacutemite superior del intervalo de prediccioacuten

Y +2 Se =

675 + (2) (8660) = 84820 Liacutemite superior del intervalo de prediccioacuten

Y -1 Se =

675 - (1) (8660) = 58840 Liacutemite inferior del intervalo de prediccioacuten

Y - 2 Se =

675 - (2) (8660) = 50180 Liacutemite inferior del intervalo de prediccioacuten

Estadiacutestica Administrativa II 21

X Y XY X2 Y2 40 191 7640 1600 36481 42 170 7140 1764 28900 53 272 14416 2809 73984 35 155 5425 1225 24025 56 280 15680 3136 78400 39 173 6747 1521 29929 48 234 11232 2304 54756 30 116 3480 900 13456 37 153 5661 1369 23409 40 178 7120 1600 31684 ΣX= 420 ΣY= 1922 ΣXY= 84541 ΣX2= 18228 ΣY2= 395024

b = Σ XY - n X Y = 84541 - 10(42)(1922) = 64915 Σ X2 - n X2 18228 - 10(42)2 a = Y ndash bX = 1922 ndash 64915 (42) = - 804430 Y= a+bx = -804430 + 64915 (50) = 2441320 Se= ΣY2 ndashaΣY ndash b ΣXY = n-2 Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

12-2 531 12-3 531

12-13 531 12-14 531 12-15 531

Estadiacutestica Administrativa II 22

215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten

Coeficiente de determinacioacuten de la muestra

r2= aΣY+bΣXY-nY2

ΣY2 ndash n Y2

Coeficiente de correlacioacuten de la muestra

r= r2

Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten

Estadiacutestica Administrativa II 23

Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables

Y= a + b1 X1 + b2 X2

Ecuacioacuten

na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2

1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2

2 = Σ X2Y

Ejemplo

a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10

Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784

Sumatoria

114 105 85 2463 1590 1435 2367 1571

Matriz

6 105 85 114 105 2367 1435 2463 85 1435 1571 1590

1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25

1 175 14167 19 0 1 -099 884 0 0 361608 21410

361608 b2 = 21410 b2 = 21410 361608 b2 = 059

Estadiacutestica Administrativa II 24

1 b1 -099 b2 = 884 1 b1 -099 (059) = 884

-006 884 1b1 = 884 +006 b1 = 890

1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a

= 2589

Y= a + b1 X1 + b2 X2

y=2589+890(28)+059(10)=28099

Estadiacutestica Administrativa II 25

218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)

Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad

La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos

Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir

donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria

Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados

Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante

Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo

Estadiacutestica Administrativa II 26

Figura 5 Distribucioacuten Homocedaacutestica

Figura 6 Distribucioacuten Heterocedaacutestica

Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten

lineal para hacer estimaciones futuras

Estadiacutestica Administrativa II 27

Unidad 3 Nuacutemeros iacutendice

Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se

calcula encontrando el cociente del valor actual entre el valor base luego se

multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje

Tipos de nuacutemeros iacutendice

Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de

cantidad e iacutendice de valor

Iacutendice de precios

Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida

Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo

Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable

El iacutendice de valor combina los cambios de precio y cantidad para presentar un

iacutendice con maacutes informacioacuten

Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos

como indicadores generales de la condicioacuten econoacutemica de un paiacutes

Factores que pueden distorsionar los nuacutemeros iacutendice

bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados

bull Falta de comparacioacuten de iacutendices

bull Ponderacioacuten no apropiada de los factores

bull Seleccioacuten de una base no apropiada

Estadiacutestica Administrativa II 28

31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores

Iacutendice de cantidad de agregados no ponderados

ΣQi x 100 ΣQo

Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea

1993 1994 1995

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200

Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado

1993 Qo

1994 Q1

1995 Q2

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308

Estadiacutestica Administrativa II 29

Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra

Iacutendice de precios de agregados ponderados

ΣPiQ x 100 ΣPoQ

Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100

Cambio de periodo base

I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base

Estadiacutestica Administrativa II 30

35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos

Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables

Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico

Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios

El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)

Estadiacutestica Administrativa II 31

Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica

37 Deflacioacuten de los valores de series de tiempo

Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios

En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea

La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores

Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero

Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes

Los valores expresados en unidades monetarias corrientes se conocen como valores nominales

Los valores expresados en unidades monetarias constantes se conocen como valores reales

Estadiacutestica Administrativa II 32

38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor

Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos

39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)

Estadiacutestica Administrativa II 33

Siacutembolo Nombre de la compantildeiacutea

AA Alcoa

ALD Allied Signal

AXP American Express

BA Boeing

CAT Caterpillar

CHV Chevron

C CitiGroup

DIS Disney

DD Dupont

EK Eastman Kodak

GE General Electric

GM General Motors

GT Goodyear Tire

HWP Hewlett-Packard

IBM International Business Machines

IP International Paper

JNJ Johnson amp Johnson

JPM JP Morgan Bank

KO Coca Cola

Figura 5 Compantildeiacuteas comprendidas en el Dow Jones

310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos

Praacutectica 2

992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico

elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado

de precios

Estadiacutestica Administrativa II 34

Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida

bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)

42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten

Las principales pruebas no parameacutetricas son las siguientes

bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher

Estadiacutestica Administrativa II 35

bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon

Caracteriacutesticas de algunas pruebas no parameacutetricas

1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos

2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten

3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal

4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados

5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc

6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica

Prueba Caracteriacutestica

Mann- Whitney 2 muestras independientes

Wilcoxon 2 muestras asociadas

Kruskal-Wallis + de 2 muestras independientes

Friedman + de 2 muestras asociadas

Tabla1 Caracteriacutesticas de pruebas no parameacutetricas

Estadiacutestica Administrativa II 36

Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media

Ventajas y desventajas de los meacutetodos parameacutetricos

Desventajas Ventajas bull Ignoran cierta cantidad de

informacioacuten bull No requieren la suposicioacuten de que

una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica

bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas

bull Generalmente es maacutes sencillo realizarlas y entenderlas

bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal

Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo

MHHHHM

1ra 2ra 3ra

Estadiacutestica Administrativa II 37

Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1

n2= nuacutemero de ocurrencias del tipo 2

r= nuacutemero de corridas

4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue

BABBBAAABBABBBBAAAABABAABBBAABAAAABBA

BBAAAABBABBBBAABBABAABB

Valores de la prueba

n1= 29

n2= 31

r= 29

4322 Distribucioacuten de muestreo del estadiacutestico r

El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba

Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente

Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1

n1+n2

Estadiacutestica Administrativa II 38

μr = 2(29)(31) +1

29+31

μr = 1798 +1 60

μr = 2997 +1

μr = 3097

Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)

(n1+n2)2(n1+n2-1)

σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)

σr= (1798) (1738)

(60)2(59)

σr= 1471

σr= 384

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-24 643 14-25 643 14-26 643 14-27 644 14-28 644

Estadiacutestica Administrativa II 39

44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica

Ejemplo

Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado

Miembro del panel Calificacioacuten para

conferencias grandes

Calificacioacuten para

sesiones pequentildeas

Signo de la calificacioacuten

Evaluacioacuten de los dos tipos de

clases

1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -

6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +

La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)

Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20

Estadiacutestica Administrativa II 40

Establecimiento de las hipoacutetesis

Ho p = 05

H1 p ne 05

Se consideran la posibilidades solamente de signos + y - (9+6 =15)

p Ho = 05

q H0 = 05

n= 15

p= 0600 (915)

q= 0400 (615)

Prueba de hipoacutetesis de que no hay diferencia

Error estaacutendar del la proporcioacuten

σp= pq n

σp= (05)(05) 15

σp= 0129

0025

0

0475 del aacuterea

Valor criacutetico Z=-196

Regioacuten de aceptacioacuten

0025

0475 del aacuterea

Valor criacutetico Z=196

Estadiacutestica Administrativa II 41

45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten

Procedimiento de la prueba de rangos con signo de Wilcoxon

Paso1 Para cada par de datos calcule la diferencia d restando el segundo

valor del primero Guarde los signos pero descarte cualquier par para el que

d=0

Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de

la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango

correspondiente Cuando las diferencias tengan el mismo valor numeacuterico

asiacutegneles la media de los rangos implicados en el empate

Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino

Esto es inserte aquellos signos que se ignoraron e el paso dos

Paso 4 Calcule la suma de los valores absolutos de los rangos negativos

Tambieacuten la suma de los rangos positivos

Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon

en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el

procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos

sumas

Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la

diferencia d no es 0

Estadiacutestica Administrativa II 42

Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el

tamantildeo muestral

Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos

muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica

esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico

Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente

2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha

Notacioacuten

T= la maacutes pequentildea de las siguientes dos sumas

1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0

La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T

Estadiacutestica Administrativa II 43

46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2

Rango Calificacioacuten Plantel

1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S

10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S

Estadiacutestica Administrativa II 44

30 1600 S

Estadiacutestica Administrativa II 45

Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500

n1= 15 n2= 15 R1= 247 R2= 218

Estadiacutestico U

U = n1n2 + n1(n1 +1) -R1 2

U= (15)(15) + (15)(16) -247 2

U= 225+120-247

U= 98

Media de la distribucioacuten muestral U

μu = n1n2

2

μu = (15)(15)

2

μu =1125

Estadiacutestica Administrativa II 46

Estadiacutestico U

σU = n1n2 + (n1n2 +1)

12

σU = (15)(15)(15+15+1)

12

σU = 6975 12

σU = 58125

σU = 241

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2

α= 015

Estandarizacioacuten del estadiacutestico U

z = U-μu

σU

z = 98 - 1125 241

z = -0602

144 -144 0 -0602

Valor estandarizado de

la muestra U

Regioacuten de aceptacioacuten

Estadiacutestica Administrativa II 47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras

Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular

Prueba de Wilcoxon de los rangos con signo

Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero

Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande

Prueba de Wilcoxon para contrastar datos pareados

El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 7: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

Estadiacutestica Administrativa II 3

Frecuencia observada

fo

Frecuencia esperada

fe

fo-fe (fo-fe)2 (fo-fe)2

fe

Calculo del estadiacutestico x2

18 216 -36 1296 06000 47 432 38 1444 03343 24 288 -48 2304 08000 11 64 46 2116 33063

X2=50406

Determinacioacuten de los grados de libertad Antes de calcular el nuacutemero adecuado de grados de libertad para una prueba ji- cuadrada de bondad de ajuste es necesario contar el nuacutemero de clases (denotado por K) para las que se compararon las frecuencias observadas y esperadas

Grados de libertad = k-1

K= 0123 k= 4 gl= 4-1 gl= 3 Rechazamos la hipoacutetesis nula y llegamos a la conclusioacuten de que la distribucioacuten binomial con p=040 no proporciona una buena descripcioacuten de nuestras frecuencias observadas Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

11-16 466 11-17 466 11-18 466

Regioacuten de aceptacioacuten

50406

020 del aacuterea

Valor x2

Distribucioacuten x2

4642

Valor de tabla

Regioacuten de rechazo

Estadiacutestica Administrativa II 4

14 Tablas de contingencia Describimos las dimensiones de una tabla de contingencia estableciendo primero el nuacutemero de renglones y luego el nuacutemero de columnas La columna y el rengloacuten con el total no cuentan como parte de las dimensiones Los renglones corren de manera horizontal y las columnas de manera vertical Tabla de contingencia de 2 x 4( 2 renglones 4 columnas) 141 Meacutetodo para obtener el estadiacutestico x2 de una tabla de

contingencia con 2 renglones Ejemplo En cuatro regiones se muestrean las actitudes de los empleados respecto a la evaluacioacuten del desempentildeo en el trabajo Los trabajadores eligen entre el meacutetodo actual (dos evaluaciones al antildeo) y un meacutetodo propuesto (evaluaciones trimestrales) A continuacioacuten se presentan los datos Tabla de contingencia de 2x4 Noreste Sureste Central Costa

oeste Total

Respuesta de la muestra concerniente a los programas de evaluacioacuten de empleados

Nuacutemero de empleados que prefieren el meacutetodo actual

68 75 57 79 279

Nuacutemero de empleados que prefieren el meacutetodo nuevo

32 45 33 31 141

Total de empleados muestreados en cada regioacuten

100 56 90 110 420

Planteamiento del problema

Hipoacutetesis nula Ho PN=PS=PC=PW

Hipoacutetesis alternativa

Hi PN PS PC PW no son iguales PN= proporcioacuten de empleados en el noreste que prefieren el plan actual PS= proporcioacuten de empleados en el sureste que prefieren el plan actual PC= proporcioacuten de empleados en la regioacuten central que prefieren el plan actual PW= proporcioacuten de empleados de la regioacuten de la costa que prefieren el plan actual

Estadiacutestica Administrativa II 5

Frecuencias observadas y esperadas

Noreste Sureste Central Costa oeste

Proporcioacuten de empleados muestreados en cada regioacuten que se espera prefieren los dos meacutetodos de evaluacioacuten

Nuacutemero total muestreado 100 120 90 110 Proporcioacuten estimada que prefieren el meacutetodo actual

x 06643 x 06643 x 06643 x 06643

Nuacutemero que se espera prefiera el meacutetodo actual

6643 7972 5979 7307

Nuacutemero total muestreado 100 120 90 110 Proporcioacuten estimada que prefieren el meacutetodo nuevo

x 03357 x 03357 x 03357 x 03357

Nuacutemero que se espera prefiera el meacutetodo nuevo

3357 4028 3021 3693

Noreste Sureste Central Costa

oeste Comparacioacuten de las frecuencias observadas y esperadas de trabajadores muestreados

Frecuencia con que prefieren el meacutetodo actual

68 75 57 79

Frecuencia observada (real) Frecuencia esperada (teoacuterica)

6643 7972 5979 7307

Frecuencia con que prefieren el meacutetodo nuevo

32 45 33 31

Frecuencia observada (real) Frecuencia esperada (teoacuterica)

3357 4028 3021 3693

Estadiacutestico ji- cuadrada

119961120784 = 120622

(119943119952 minus 119943119942)120784119943119942

fo= frecuencia observada fe= frecuencia esperada

Paso 1 Paso 2 Paso 3 Calculo del estadiacutestico x2

fo fe fo-fe (fo-fe)2 (fo-fe)2

fe 68 6643 157 246 00370 75 7972 -472 2228 02795 57 5979 -279 778 01301 79 7307 593 3516 04812 32 3357 -157 246 00733

45 4028 472 2228 05531 33 3021 279 778 02575 31 3693 -593 3516 09521 X2= 27638

Estadiacutestica Administrativa II 6

Determinacioacuten de los grados de libertad

Nuacutemero de grados de libertad

Grados de libertad en una prueba ji- cuadrada

= (nuacutemero de renglones -1 )(nuacutemero de columnas -1)

Tabla de 2x4 (2-1)(4-1)= (1)(3) = 3 grados de libertad

Nivel de significancia de 10 Buscar en tablas x2 3 grados de libertad con un nivel de significancia de 10 y graficar

Interpretacioacuten de los resultados y la graacutefica 142 Meacutetodo para obtener el estadiacutestico x2 de una tabla de

contingencia con maacutes de 2 renglones Estadiacutestico ji- cuadrada

x2 = Σ(fo-fe)2

fe fo= frecuencia observada fe= frecuencia esperada Determinacioacuten de los grados de libertad de una tabla de contingencia de maacutes de tres renglones

Nuacutemero de grados de libertad de una tabla de maacutes de tres renglones

Grados de libertad en una prueba ji- cuadrada

= (nuacutemero de renglones -1 )(nuacutemero de columnas -1)

Regioacuten de aceptacioacuten

2764

010 del aacuterea

Valor x2

Distribucioacuten x2

con 3 grados de

libertad

6251

Valor de tabla

Regioacuten de rechazo

Estadiacutestica Administrativa II 7

Tabla de contingencia Nuacutemero de

renglones Nuacutemero de columnas

r-1 c-1 Grados de libertad (r-1)(c-1)

A 3 4 3-1=2 4-1=3 (2)(3)=6 B 5 7 5-1=4 7-1=6 (4)(6)=24 C 6 9 6-1=5 9-1=8 (5)(8)=40

El presidente de una compantildeiacutea de seguros de salud se opone al seguro nacional Argumenta que su implementacioacuten seriacutea muy costosa en particular debido a que la existencia de este sistema tenderiacutea a fomentar permanencias hospitalarias maacutes prolongadas ademaacutes de otros efectos El presidente piensa que el tiempo de hospitalizacioacuten depende del tipo de seguro de salud que tengan las personas Los siguientes datos se obtuvieron de una muestra aleatoria de 660 hospitalizaciones Diacuteas en el hospital lt5 5-10 gt10 Total Datos de hospitalizaciones Calificados seguacuten el tipo de cobertura del seguro y el tiempo de estancia

Fraccioacuten de costos cubiertos por el seguro

lt25 40 75 65 180 25 -50 30 45 75 150

gt50 40 100 190 330

Total 110 220 330 660

Planteamiento del problema

Hipoacutetesis nula Ho el tiempo de estancia y tipo de seguro son independientes

Hipoacutetesis alternativa

Hi el tiempo de estancia depende del tipo de seguro

α= 001 nivel de significancia para probar la hipoacutetesis Frecuencia esperada para cualquier celda

Calculo de la frecuencia esperada fe= RT X CT n

fe= frecuencia esperada en una celda dada RT= total por rengloacuten para el rengloacuten que contiene esa celda CT= total por columna para la columna que contiene esa celda n= nuacutemero total de observaciones

Estadiacutestica Administrativa II 8

Estadiacutestico ji- cuadrada

fo= frecuencia observada fe= frecuencia esperada

x2 = Σ(fo-fe)2

fe

Rengloacuten Columna fo fe = RT X CT n

fo-fe (fo-fe)2 (fo-fe)2

fe Calculo de las frecuencias esperadas y ji- cuadrada

1 1 40 30 180 X 110 660

10 100 3333

1 2 75 60 180 X 220 660

15 225 3750

1 3 65 90 180 X 330 660

-25 625 6944

2 1 30 25 150 X 110 660

5 25 1000

2 2 45 50 150 X 220 660

-5 25 0500

2 3 75 75 150 X 330 660

0 0 0000

3 1 40 55 330 X 110 660

-15 225 4091

3 2 100 110 330 X 220 660

-10 100 0909

3 3 190 165 330 X 330 660

25 625 3788

X2=24315

Buscar en tablas x2 4grados de libertad con un nivel de significancia de 10 y graficar Interpretacioacuten de resultados

Regioacuten de aceptacioacuten

x2= 24315

010 del aacuterea

Distribucioacuten x2

13277

Valor de tabla

Regioacuten de rechazo

Estadiacutestica Administrativa II 9

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

11-1 459 11-2 460 11-7 460 11-8 460 11-9 460

11-10 460 11-11 461 11-12 461 11-13 461

15 Anaacutelisis de varianza

El anaacutelisis de varianza nos permite probar si maacutes de dos medias de poblacioacuten pueden considerarse iguales A menudo se abrevia ANOVA analysis of variance ANOVA Es un meacutetodo de prueba de igualdad de tres o maacutes medias poblacionales1

Hipoacutetesis nula tiacutepica

HO= μ1= μ2= μ3

El meacutetodo ANOVA nos sirve para evitar el error tipo I (rechazar una hipoacutetesis nula verdadera) si utilizamos una prueba de igualdad de varias medias

151 Aplicaciones de ANOVA Se utiliza cuando Se asevera que los supermercados colocan los cereales con alto contenido de azuacutecar en estantes que estaacuten a la altura De los ojos de los nintildeos de manera que eso nos permite probar la aseveracioacuten de que los cereales en los estantes tienen el mismo contenido de azuacutecar

1 Mario F Triola Estadiacutestica Pearson Meacutexico2006

Estadiacutestica Administrativa II 10

Tambieacuten en casos como la comparacioacuten del kilometraje logrado por cinco clases diferentes de gasolina la prueba de cuaacutel de cuatro meacutetodos de capacitacioacuten produce el aprendizaje maacutes raacutepido etc Los meacutetodos de ANOVA requieren de la distribucioacuten F Propiedades de la distribucioacuten F

1 Es no simeacutetrica se sesga hacia la derecha 2 Los valores F son 0 o positivo pero no negativos 3 Hay una distribucioacuten F para cada par de grados de libertad para el

numerador y el denominador

Figura 1 Fuente (Triola 2006605) Ejemplo

Muestra 1 15 18 19 22 11

Muestra 2 22 27 18 21 17

Muestra 3 18 24 19 16 22 15

Planteamiento de la hipoacutetesis

Ho μ1= μ2= μ3

H1 μ1 μ2 y μ3 no son todas iguales

Estadiacutestica Administrativa II 11

Caacutelculo de la media

Meacutetodo 1 Meacutetodo 2 Meacutetodo 3 Produccioacuten diaria 15 22 18

18 27 24 19 18 19 22 21 16 11 17 22

15 85 105 114 Sumatoria divide5 divide5 divide6 Tamantildeo de

la muestra 17 21 19 Media

muestral n1=5 n2=5 n3=6

1= 17 2= 21 3= 19

Caacutelculo de la gran media

= 15 +18+ 19+ 22+ 11+22 +27+ 18+ 21+ 17+18 +24+ 19+ 16+ 22+ 15 = 19 16

Caacutelculo de la varianza entre columnas

σ2b = Σnj ( - )2 = k-1

n - ( - )2 n( - ) Caacutelculo de la varianza entre columnas

5 17 19 17-19=-2 (-2)2=4 5x4=20 5 21 19 21-19=2 (2)2=4 5x4=20 6 19 19 19-19=0 (0)2=0 6x0 = 0 Σnj( - )

2 =40

σ2b = Σnj ( - )2 = 40= 40 = 20 varianza entre columnas

k-1 3-1 2

Estadiacutestica Administrativa II 12

Estimacioacuten de la varianza dentro de columnas

Meacutetodo de capacitacioacuten 1 Media muestral =17

Estimacioacuten de la varianza dentro de columnas

- ( - )2 15-17=-2 (-2)2=4 18-17=1 (1)2=1 19-17=2 (2)2=4 22-17=5 (5)2=25 11-17=-6 (-6)2=36 Σ( - )2 =70

s21= Σ( - )2 = 70 = 175 varianza de la muestra

n-1 5-1

Meacutetodo de capacitacioacuten 2 Media muestral =21

Estimacioacuten de la varianza dentro de columnas

- ( - )2 22-21=1 (1)2=1 27-21=6 (6)2=36 18-21=-3 (-3)2=9 21-21=0 (0)2=0 17-21=-4 (-4)2=16 Σ( - )2 =62

s22= Σ( - )2 = 62 = 155 varianza de la muestra

n-1 5-1

Meacutetodo de capacitacioacuten 3 Media muestral =19

Estimacioacuten de la varianza dentro de columnas

- ( - )2 18-19=-1 (-1)2=1 24-19=5 (5)2=25 19-19=0 (0)2=0 16-19=-3 (-3)2=9 22-19=3 (-32=9 15-19=-4 (-4)2=16 Σ( - )2 =60

Estadiacutestica Administrativa II 13

s23= Σ( - )2 = 60 = 120 varianza de la muestra

n-1 6-1

σ2w = Σ nj - 1 s2

j = (413)(175) + (413)(155) + (513)(120) = 193 = 14769 nt - k 13

Estadiacutestico F

F = varianza entre columnas = σ2b

Varianza dentro de columnas σ2w

F= 20 = 1354 cociente F 14769

Determinacioacuten de los grados de libertad

Grados de libertad del numerador

Nuacutemero de grados de libertad en el numerador del cociente F

= (nuacutemero de muestras-1)

Grados de libertad del denominador

Nuacutemero de grados de libertad en el denominador del cociente F

= Σ (nj-1)= nt-k

Graacutefica

Se acepta la hipoacutetesis nula

Regioacuten de aceptacioacuten

F= 1354

005 del aacuterea

Distribucioacuten f

381

Valor de tabla

Regioacuten de rechazo

Estadiacutestica Administrativa II 14

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

11-5 479 11-6 479

11-26 480 11-27 480 11-28 480 11-29 480 11-30 480

152 Inferencia sobre una varianza de poblacioacuten (Anova)

Estadiacutestico ji- cuadrada para inferencias sobre una varianza

X2=(n-1)s2 σ2

Intervalo de confianza para σ2

Liacutemite inferior de confianza

σ2L=(n-1)s2 X2

U Liacutemite superior de confianza

σ2U=(n-1)s2 X2

L

Estadiacutestica Administrativa II 15

Ejercicio

Con los siguientes datos obtener el estadiacutestico ji- cuadrada Y el intervalo de

confianza del 95

Tiempo x

50 45 27 66 43 96 45 90 69

153 Inferencia sobre la varianza de dos poblaciones (Anova) Ademaacutes de comparar la varianza de dos poblaciones el principal objetivo de este tema es analizar el cociente que se obtiene al aplicar la foacutermula correspondiente

Coeficiente F para inferencias acerca de dos varianzas

F=S21

S22

Estadiacutestica Administrativa II 16

Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple

21 Estimacioacuten mediante la liacutenea de regresioacuten El anaacutelisis de regresioacuten y correlacioacuten permiten determinar tanto la naturaleza como la fuerza de una relacioacuten entre dos variables En el anaacutelisis de regresioacuten se desarrollaraacute una ecuacioacuten de estimacioacuten a traveacutes de una foacutermula matemaacutetica que relaciona las variables conocidas con la variable desconocida La variable conocida- variable independiente X La variable que tratamos de predecir se llama variable dependiente Y

Figura 2 Fuente (Levin 2004511) 211 Diagrama de dispersioacuten El primer paso para determinar si existe una relacioacuten entre dos variables es examinar la graacutefica de datos observados A esta graacutefica se le llama diagrama de dispersioacuten Un diagrama de dispersioacuten se puede identificar visualmente patrones que indique si las variables estaacuten relacionadas

X

Y

Gastos contra la contaminacioacuten

Emisor de

contaminacioacuten

Pendiente negativa

b) Relacioacuten directa

X

Y

Publicidad

Ventas

Pendiente positiva

a) Relacioacuten directa

Estadiacutestica Administrativa II 17

Figura 3 Fuente (Levin 2004503)

212 Meacutetodo de miacutenimos cuadrados

Liacutenea de estimacioacuten

Y= a+bx Y= variable dependiente a=variable ordenada y b=pendiente de la recta x=variable independiente

Pendiente de la recta de regresioacuten de mejor ajuste

b = Σ XY - n X Y Σ X2 - n X2

b=pendiente de la liacutenea de estimacioacuten de mejor ajuste X= valores de la variable independiente Y= variable valores de la variable dependiente X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente n= nuacutemero de puntos

Estadiacutestica Administrativa II 18

Liacutenea de estimacioacuten

a = Y - bX a= ordenada Y b= pendiente de la ecuacioacuten X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente

Error estaacutendar de la estimacioacuten

Se= Σ(Y-Y)2

n-2 Y= valores de la variable dependiente Y=valores estimados con la ecuacioacuten de estimacioacuten que corresponden a cada valor de Y n= nuacutemero de puntos utilizados para ajustar la liacutenea de regresioacuten Para medir la confiabilidad de la ecuacioacuten de estimacioacuten los especialistas en estadiacutestica han desarrollado el error estaacutendar de estimacioacuten Este error estaacutendar se simboliza por Se y es similar a la desviacioacuten estaacutendar en cuanto a que ambas son medidas de dispersioacuten El error estaacutendar de la estimacioacuten por otra parte mide la variabilidad o dispersioacuten de los valores observados alrededor de la recta de regresioacuten 213 Interpretacioacuten del error estaacutendar de la estimacioacuten Como ocurririacutea en el caso de la desviacioacuten estaacutendar mientras maacutes grande sea el error estaacutendar de la estimacioacuten mayor seraacute la dispersioacuten de los puntos alrededor de la liacutenea de regresioacuten De manera inversa si Se= 0 esperamos que la ecuacioacuten de estimacioacuten sea un estimador ldquoperfectordquo de la variable dependiente En este caso todos los puntos caeriacutean directamente sobre la liacutenea de regresioacuten y no habriacutea puntos dispersos alrededor Usaremos el error estaacutendar de la estimacioacuten como una herramienta de la misma forma que podemos usar la desviacioacuten estaacutendar Esto es suponiendo que los puntos observados siguen una distribucioacuten normal alrededor de la recta de regresioacuten podemos esperar encontrar el 68 de los puntos dentro de plusmn1Se el 955 de los puntos dentro de plusmn2Se y el 997 de los puntos dentro de plusmn3Se

Estadiacutestica Administrativa II 19

Figura 4 Fuente (Levin 2004529)

Debemos observar que el error estaacutendar de la estimacioacuten se mide a lo largo del eje Y y no perpendicularmente desde la recta de regresioacuten 214 Intervalos de prediccioacuten aproximados Podemos concebir al error estaacutendar de la estimacioacuten como una herramienta estadiacutestica que podemos usar para hacer afirmaciones de probabilidad acerca del intervalo alrededor del valor estimado de Y dentro del cual cae el valor real de Y Ejemplo

Y= 375 + 075 X Sustituyendo 4 en X

Y= 375 + 075 (4) = 375 + 300

= 675

Estadiacutestica Administrativa II 20

Intervalo 1 error 2 errores 3 errores

Y plusmn1 Se

Y plusmn2 Se

Y plusmn3 Se

En donde Se = 8660

Sustitucioacuten

Ejemplo A menudo quienes hacen la contabilidad de costos estiman los gastos generales con base en el nivel de produccioacuten Se ha reunido informacioacuten acerca de los gastos generales y las unidades producidas en diferentes plantas y ahora desean estimar una ecuacioacuten de regresioacuten para predecir los gastos generales futuros Gastos generales 191 170 272 155 280 173 234 116 153 178 Unidades 40 42 53 35 56 39 48 30 37 40

a) Determine la variable dependiente e independiente b) Desarrolle una ecuacioacuten de regresioacuten para contabilidad de costos c) Pronostique los gastos generales cuando se producen 50 unidades d) Calcule el error estaacutendar de estimacioacuten

Y +1 Se =

675 + (1) (8660) = 76140 Liacutemite superior del intervalo de prediccioacuten

Y +2 Se =

675 + (2) (8660) = 84820 Liacutemite superior del intervalo de prediccioacuten

Y -1 Se =

675 - (1) (8660) = 58840 Liacutemite inferior del intervalo de prediccioacuten

Y - 2 Se =

675 - (2) (8660) = 50180 Liacutemite inferior del intervalo de prediccioacuten

Estadiacutestica Administrativa II 21

X Y XY X2 Y2 40 191 7640 1600 36481 42 170 7140 1764 28900 53 272 14416 2809 73984 35 155 5425 1225 24025 56 280 15680 3136 78400 39 173 6747 1521 29929 48 234 11232 2304 54756 30 116 3480 900 13456 37 153 5661 1369 23409 40 178 7120 1600 31684 ΣX= 420 ΣY= 1922 ΣXY= 84541 ΣX2= 18228 ΣY2= 395024

b = Σ XY - n X Y = 84541 - 10(42)(1922) = 64915 Σ X2 - n X2 18228 - 10(42)2 a = Y ndash bX = 1922 ndash 64915 (42) = - 804430 Y= a+bx = -804430 + 64915 (50) = 2441320 Se= ΣY2 ndashaΣY ndash b ΣXY = n-2 Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

12-2 531 12-3 531

12-13 531 12-14 531 12-15 531

Estadiacutestica Administrativa II 22

215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten

Coeficiente de determinacioacuten de la muestra

r2= aΣY+bΣXY-nY2

ΣY2 ndash n Y2

Coeficiente de correlacioacuten de la muestra

r= r2

Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten

Estadiacutestica Administrativa II 23

Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables

Y= a + b1 X1 + b2 X2

Ecuacioacuten

na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2

1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2

2 = Σ X2Y

Ejemplo

a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10

Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784

Sumatoria

114 105 85 2463 1590 1435 2367 1571

Matriz

6 105 85 114 105 2367 1435 2463 85 1435 1571 1590

1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25

1 175 14167 19 0 1 -099 884 0 0 361608 21410

361608 b2 = 21410 b2 = 21410 361608 b2 = 059

Estadiacutestica Administrativa II 24

1 b1 -099 b2 = 884 1 b1 -099 (059) = 884

-006 884 1b1 = 884 +006 b1 = 890

1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a

= 2589

Y= a + b1 X1 + b2 X2

y=2589+890(28)+059(10)=28099

Estadiacutestica Administrativa II 25

218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)

Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad

La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos

Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir

donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria

Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados

Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante

Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo

Estadiacutestica Administrativa II 26

Figura 5 Distribucioacuten Homocedaacutestica

Figura 6 Distribucioacuten Heterocedaacutestica

Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten

lineal para hacer estimaciones futuras

Estadiacutestica Administrativa II 27

Unidad 3 Nuacutemeros iacutendice

Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se

calcula encontrando el cociente del valor actual entre el valor base luego se

multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje

Tipos de nuacutemeros iacutendice

Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de

cantidad e iacutendice de valor

Iacutendice de precios

Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida

Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo

Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable

El iacutendice de valor combina los cambios de precio y cantidad para presentar un

iacutendice con maacutes informacioacuten

Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos

como indicadores generales de la condicioacuten econoacutemica de un paiacutes

Factores que pueden distorsionar los nuacutemeros iacutendice

bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados

bull Falta de comparacioacuten de iacutendices

bull Ponderacioacuten no apropiada de los factores

bull Seleccioacuten de una base no apropiada

Estadiacutestica Administrativa II 28

31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores

Iacutendice de cantidad de agregados no ponderados

ΣQi x 100 ΣQo

Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea

1993 1994 1995

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200

Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado

1993 Qo

1994 Q1

1995 Q2

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308

Estadiacutestica Administrativa II 29

Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra

Iacutendice de precios de agregados ponderados

ΣPiQ x 100 ΣPoQ

Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100

Cambio de periodo base

I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base

Estadiacutestica Administrativa II 30

35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos

Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables

Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico

Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios

El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)

Estadiacutestica Administrativa II 31

Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica

37 Deflacioacuten de los valores de series de tiempo

Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios

En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea

La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores

Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero

Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes

Los valores expresados en unidades monetarias corrientes se conocen como valores nominales

Los valores expresados en unidades monetarias constantes se conocen como valores reales

Estadiacutestica Administrativa II 32

38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor

Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos

39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)

Estadiacutestica Administrativa II 33

Siacutembolo Nombre de la compantildeiacutea

AA Alcoa

ALD Allied Signal

AXP American Express

BA Boeing

CAT Caterpillar

CHV Chevron

C CitiGroup

DIS Disney

DD Dupont

EK Eastman Kodak

GE General Electric

GM General Motors

GT Goodyear Tire

HWP Hewlett-Packard

IBM International Business Machines

IP International Paper

JNJ Johnson amp Johnson

JPM JP Morgan Bank

KO Coca Cola

Figura 5 Compantildeiacuteas comprendidas en el Dow Jones

310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos

Praacutectica 2

992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico

elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado

de precios

Estadiacutestica Administrativa II 34

Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida

bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)

42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten

Las principales pruebas no parameacutetricas son las siguientes

bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher

Estadiacutestica Administrativa II 35

bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon

Caracteriacutesticas de algunas pruebas no parameacutetricas

1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos

2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten

3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal

4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados

5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc

6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica

Prueba Caracteriacutestica

Mann- Whitney 2 muestras independientes

Wilcoxon 2 muestras asociadas

Kruskal-Wallis + de 2 muestras independientes

Friedman + de 2 muestras asociadas

Tabla1 Caracteriacutesticas de pruebas no parameacutetricas

Estadiacutestica Administrativa II 36

Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media

Ventajas y desventajas de los meacutetodos parameacutetricos

Desventajas Ventajas bull Ignoran cierta cantidad de

informacioacuten bull No requieren la suposicioacuten de que

una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica

bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas

bull Generalmente es maacutes sencillo realizarlas y entenderlas

bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal

Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo

MHHHHM

1ra 2ra 3ra

Estadiacutestica Administrativa II 37

Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1

n2= nuacutemero de ocurrencias del tipo 2

r= nuacutemero de corridas

4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue

BABBBAAABBABBBBAAAABABAABBBAABAAAABBA

BBAAAABBABBBBAABBABAABB

Valores de la prueba

n1= 29

n2= 31

r= 29

4322 Distribucioacuten de muestreo del estadiacutestico r

El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba

Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente

Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1

n1+n2

Estadiacutestica Administrativa II 38

μr = 2(29)(31) +1

29+31

μr = 1798 +1 60

μr = 2997 +1

μr = 3097

Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)

(n1+n2)2(n1+n2-1)

σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)

σr= (1798) (1738)

(60)2(59)

σr= 1471

σr= 384

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-24 643 14-25 643 14-26 643 14-27 644 14-28 644

Estadiacutestica Administrativa II 39

44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica

Ejemplo

Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado

Miembro del panel Calificacioacuten para

conferencias grandes

Calificacioacuten para

sesiones pequentildeas

Signo de la calificacioacuten

Evaluacioacuten de los dos tipos de

clases

1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -

6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +

La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)

Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20

Estadiacutestica Administrativa II 40

Establecimiento de las hipoacutetesis

Ho p = 05

H1 p ne 05

Se consideran la posibilidades solamente de signos + y - (9+6 =15)

p Ho = 05

q H0 = 05

n= 15

p= 0600 (915)

q= 0400 (615)

Prueba de hipoacutetesis de que no hay diferencia

Error estaacutendar del la proporcioacuten

σp= pq n

σp= (05)(05) 15

σp= 0129

0025

0

0475 del aacuterea

Valor criacutetico Z=-196

Regioacuten de aceptacioacuten

0025

0475 del aacuterea

Valor criacutetico Z=196

Estadiacutestica Administrativa II 41

45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten

Procedimiento de la prueba de rangos con signo de Wilcoxon

Paso1 Para cada par de datos calcule la diferencia d restando el segundo

valor del primero Guarde los signos pero descarte cualquier par para el que

d=0

Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de

la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango

correspondiente Cuando las diferencias tengan el mismo valor numeacuterico

asiacutegneles la media de los rangos implicados en el empate

Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino

Esto es inserte aquellos signos que se ignoraron e el paso dos

Paso 4 Calcule la suma de los valores absolutos de los rangos negativos

Tambieacuten la suma de los rangos positivos

Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon

en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el

procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos

sumas

Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la

diferencia d no es 0

Estadiacutestica Administrativa II 42

Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el

tamantildeo muestral

Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos

muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica

esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico

Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente

2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha

Notacioacuten

T= la maacutes pequentildea de las siguientes dos sumas

1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0

La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T

Estadiacutestica Administrativa II 43

46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2

Rango Calificacioacuten Plantel

1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S

10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S

Estadiacutestica Administrativa II 44

30 1600 S

Estadiacutestica Administrativa II 45

Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500

n1= 15 n2= 15 R1= 247 R2= 218

Estadiacutestico U

U = n1n2 + n1(n1 +1) -R1 2

U= (15)(15) + (15)(16) -247 2

U= 225+120-247

U= 98

Media de la distribucioacuten muestral U

μu = n1n2

2

μu = (15)(15)

2

μu =1125

Estadiacutestica Administrativa II 46

Estadiacutestico U

σU = n1n2 + (n1n2 +1)

12

σU = (15)(15)(15+15+1)

12

σU = 6975 12

σU = 58125

σU = 241

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2

α= 015

Estandarizacioacuten del estadiacutestico U

z = U-μu

σU

z = 98 - 1125 241

z = -0602

144 -144 0 -0602

Valor estandarizado de

la muestra U

Regioacuten de aceptacioacuten

Estadiacutestica Administrativa II 47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras

Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular

Prueba de Wilcoxon de los rangos con signo

Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero

Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande

Prueba de Wilcoxon para contrastar datos pareados

El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 8: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

Estadiacutestica Administrativa II 4

14 Tablas de contingencia Describimos las dimensiones de una tabla de contingencia estableciendo primero el nuacutemero de renglones y luego el nuacutemero de columnas La columna y el rengloacuten con el total no cuentan como parte de las dimensiones Los renglones corren de manera horizontal y las columnas de manera vertical Tabla de contingencia de 2 x 4( 2 renglones 4 columnas) 141 Meacutetodo para obtener el estadiacutestico x2 de una tabla de

contingencia con 2 renglones Ejemplo En cuatro regiones se muestrean las actitudes de los empleados respecto a la evaluacioacuten del desempentildeo en el trabajo Los trabajadores eligen entre el meacutetodo actual (dos evaluaciones al antildeo) y un meacutetodo propuesto (evaluaciones trimestrales) A continuacioacuten se presentan los datos Tabla de contingencia de 2x4 Noreste Sureste Central Costa

oeste Total

Respuesta de la muestra concerniente a los programas de evaluacioacuten de empleados

Nuacutemero de empleados que prefieren el meacutetodo actual

68 75 57 79 279

Nuacutemero de empleados que prefieren el meacutetodo nuevo

32 45 33 31 141

Total de empleados muestreados en cada regioacuten

100 56 90 110 420

Planteamiento del problema

Hipoacutetesis nula Ho PN=PS=PC=PW

Hipoacutetesis alternativa

Hi PN PS PC PW no son iguales PN= proporcioacuten de empleados en el noreste que prefieren el plan actual PS= proporcioacuten de empleados en el sureste que prefieren el plan actual PC= proporcioacuten de empleados en la regioacuten central que prefieren el plan actual PW= proporcioacuten de empleados de la regioacuten de la costa que prefieren el plan actual

Estadiacutestica Administrativa II 5

Frecuencias observadas y esperadas

Noreste Sureste Central Costa oeste

Proporcioacuten de empleados muestreados en cada regioacuten que se espera prefieren los dos meacutetodos de evaluacioacuten

Nuacutemero total muestreado 100 120 90 110 Proporcioacuten estimada que prefieren el meacutetodo actual

x 06643 x 06643 x 06643 x 06643

Nuacutemero que se espera prefiera el meacutetodo actual

6643 7972 5979 7307

Nuacutemero total muestreado 100 120 90 110 Proporcioacuten estimada que prefieren el meacutetodo nuevo

x 03357 x 03357 x 03357 x 03357

Nuacutemero que se espera prefiera el meacutetodo nuevo

3357 4028 3021 3693

Noreste Sureste Central Costa

oeste Comparacioacuten de las frecuencias observadas y esperadas de trabajadores muestreados

Frecuencia con que prefieren el meacutetodo actual

68 75 57 79

Frecuencia observada (real) Frecuencia esperada (teoacuterica)

6643 7972 5979 7307

Frecuencia con que prefieren el meacutetodo nuevo

32 45 33 31

Frecuencia observada (real) Frecuencia esperada (teoacuterica)

3357 4028 3021 3693

Estadiacutestico ji- cuadrada

119961120784 = 120622

(119943119952 minus 119943119942)120784119943119942

fo= frecuencia observada fe= frecuencia esperada

Paso 1 Paso 2 Paso 3 Calculo del estadiacutestico x2

fo fe fo-fe (fo-fe)2 (fo-fe)2

fe 68 6643 157 246 00370 75 7972 -472 2228 02795 57 5979 -279 778 01301 79 7307 593 3516 04812 32 3357 -157 246 00733

45 4028 472 2228 05531 33 3021 279 778 02575 31 3693 -593 3516 09521 X2= 27638

Estadiacutestica Administrativa II 6

Determinacioacuten de los grados de libertad

Nuacutemero de grados de libertad

Grados de libertad en una prueba ji- cuadrada

= (nuacutemero de renglones -1 )(nuacutemero de columnas -1)

Tabla de 2x4 (2-1)(4-1)= (1)(3) = 3 grados de libertad

Nivel de significancia de 10 Buscar en tablas x2 3 grados de libertad con un nivel de significancia de 10 y graficar

Interpretacioacuten de los resultados y la graacutefica 142 Meacutetodo para obtener el estadiacutestico x2 de una tabla de

contingencia con maacutes de 2 renglones Estadiacutestico ji- cuadrada

x2 = Σ(fo-fe)2

fe fo= frecuencia observada fe= frecuencia esperada Determinacioacuten de los grados de libertad de una tabla de contingencia de maacutes de tres renglones

Nuacutemero de grados de libertad de una tabla de maacutes de tres renglones

Grados de libertad en una prueba ji- cuadrada

= (nuacutemero de renglones -1 )(nuacutemero de columnas -1)

Regioacuten de aceptacioacuten

2764

010 del aacuterea

Valor x2

Distribucioacuten x2

con 3 grados de

libertad

6251

Valor de tabla

Regioacuten de rechazo

Estadiacutestica Administrativa II 7

Tabla de contingencia Nuacutemero de

renglones Nuacutemero de columnas

r-1 c-1 Grados de libertad (r-1)(c-1)

A 3 4 3-1=2 4-1=3 (2)(3)=6 B 5 7 5-1=4 7-1=6 (4)(6)=24 C 6 9 6-1=5 9-1=8 (5)(8)=40

El presidente de una compantildeiacutea de seguros de salud se opone al seguro nacional Argumenta que su implementacioacuten seriacutea muy costosa en particular debido a que la existencia de este sistema tenderiacutea a fomentar permanencias hospitalarias maacutes prolongadas ademaacutes de otros efectos El presidente piensa que el tiempo de hospitalizacioacuten depende del tipo de seguro de salud que tengan las personas Los siguientes datos se obtuvieron de una muestra aleatoria de 660 hospitalizaciones Diacuteas en el hospital lt5 5-10 gt10 Total Datos de hospitalizaciones Calificados seguacuten el tipo de cobertura del seguro y el tiempo de estancia

Fraccioacuten de costos cubiertos por el seguro

lt25 40 75 65 180 25 -50 30 45 75 150

gt50 40 100 190 330

Total 110 220 330 660

Planteamiento del problema

Hipoacutetesis nula Ho el tiempo de estancia y tipo de seguro son independientes

Hipoacutetesis alternativa

Hi el tiempo de estancia depende del tipo de seguro

α= 001 nivel de significancia para probar la hipoacutetesis Frecuencia esperada para cualquier celda

Calculo de la frecuencia esperada fe= RT X CT n

fe= frecuencia esperada en una celda dada RT= total por rengloacuten para el rengloacuten que contiene esa celda CT= total por columna para la columna que contiene esa celda n= nuacutemero total de observaciones

Estadiacutestica Administrativa II 8

Estadiacutestico ji- cuadrada

fo= frecuencia observada fe= frecuencia esperada

x2 = Σ(fo-fe)2

fe

Rengloacuten Columna fo fe = RT X CT n

fo-fe (fo-fe)2 (fo-fe)2

fe Calculo de las frecuencias esperadas y ji- cuadrada

1 1 40 30 180 X 110 660

10 100 3333

1 2 75 60 180 X 220 660

15 225 3750

1 3 65 90 180 X 330 660

-25 625 6944

2 1 30 25 150 X 110 660

5 25 1000

2 2 45 50 150 X 220 660

-5 25 0500

2 3 75 75 150 X 330 660

0 0 0000

3 1 40 55 330 X 110 660

-15 225 4091

3 2 100 110 330 X 220 660

-10 100 0909

3 3 190 165 330 X 330 660

25 625 3788

X2=24315

Buscar en tablas x2 4grados de libertad con un nivel de significancia de 10 y graficar Interpretacioacuten de resultados

Regioacuten de aceptacioacuten

x2= 24315

010 del aacuterea

Distribucioacuten x2

13277

Valor de tabla

Regioacuten de rechazo

Estadiacutestica Administrativa II 9

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

11-1 459 11-2 460 11-7 460 11-8 460 11-9 460

11-10 460 11-11 461 11-12 461 11-13 461

15 Anaacutelisis de varianza

El anaacutelisis de varianza nos permite probar si maacutes de dos medias de poblacioacuten pueden considerarse iguales A menudo se abrevia ANOVA analysis of variance ANOVA Es un meacutetodo de prueba de igualdad de tres o maacutes medias poblacionales1

Hipoacutetesis nula tiacutepica

HO= μ1= μ2= μ3

El meacutetodo ANOVA nos sirve para evitar el error tipo I (rechazar una hipoacutetesis nula verdadera) si utilizamos una prueba de igualdad de varias medias

151 Aplicaciones de ANOVA Se utiliza cuando Se asevera que los supermercados colocan los cereales con alto contenido de azuacutecar en estantes que estaacuten a la altura De los ojos de los nintildeos de manera que eso nos permite probar la aseveracioacuten de que los cereales en los estantes tienen el mismo contenido de azuacutecar

1 Mario F Triola Estadiacutestica Pearson Meacutexico2006

Estadiacutestica Administrativa II 10

Tambieacuten en casos como la comparacioacuten del kilometraje logrado por cinco clases diferentes de gasolina la prueba de cuaacutel de cuatro meacutetodos de capacitacioacuten produce el aprendizaje maacutes raacutepido etc Los meacutetodos de ANOVA requieren de la distribucioacuten F Propiedades de la distribucioacuten F

1 Es no simeacutetrica se sesga hacia la derecha 2 Los valores F son 0 o positivo pero no negativos 3 Hay una distribucioacuten F para cada par de grados de libertad para el

numerador y el denominador

Figura 1 Fuente (Triola 2006605) Ejemplo

Muestra 1 15 18 19 22 11

Muestra 2 22 27 18 21 17

Muestra 3 18 24 19 16 22 15

Planteamiento de la hipoacutetesis

Ho μ1= μ2= μ3

H1 μ1 μ2 y μ3 no son todas iguales

Estadiacutestica Administrativa II 11

Caacutelculo de la media

Meacutetodo 1 Meacutetodo 2 Meacutetodo 3 Produccioacuten diaria 15 22 18

18 27 24 19 18 19 22 21 16 11 17 22

15 85 105 114 Sumatoria divide5 divide5 divide6 Tamantildeo de

la muestra 17 21 19 Media

muestral n1=5 n2=5 n3=6

1= 17 2= 21 3= 19

Caacutelculo de la gran media

= 15 +18+ 19+ 22+ 11+22 +27+ 18+ 21+ 17+18 +24+ 19+ 16+ 22+ 15 = 19 16

Caacutelculo de la varianza entre columnas

σ2b = Σnj ( - )2 = k-1

n - ( - )2 n( - ) Caacutelculo de la varianza entre columnas

5 17 19 17-19=-2 (-2)2=4 5x4=20 5 21 19 21-19=2 (2)2=4 5x4=20 6 19 19 19-19=0 (0)2=0 6x0 = 0 Σnj( - )

2 =40

σ2b = Σnj ( - )2 = 40= 40 = 20 varianza entre columnas

k-1 3-1 2

Estadiacutestica Administrativa II 12

Estimacioacuten de la varianza dentro de columnas

Meacutetodo de capacitacioacuten 1 Media muestral =17

Estimacioacuten de la varianza dentro de columnas

- ( - )2 15-17=-2 (-2)2=4 18-17=1 (1)2=1 19-17=2 (2)2=4 22-17=5 (5)2=25 11-17=-6 (-6)2=36 Σ( - )2 =70

s21= Σ( - )2 = 70 = 175 varianza de la muestra

n-1 5-1

Meacutetodo de capacitacioacuten 2 Media muestral =21

Estimacioacuten de la varianza dentro de columnas

- ( - )2 22-21=1 (1)2=1 27-21=6 (6)2=36 18-21=-3 (-3)2=9 21-21=0 (0)2=0 17-21=-4 (-4)2=16 Σ( - )2 =62

s22= Σ( - )2 = 62 = 155 varianza de la muestra

n-1 5-1

Meacutetodo de capacitacioacuten 3 Media muestral =19

Estimacioacuten de la varianza dentro de columnas

- ( - )2 18-19=-1 (-1)2=1 24-19=5 (5)2=25 19-19=0 (0)2=0 16-19=-3 (-3)2=9 22-19=3 (-32=9 15-19=-4 (-4)2=16 Σ( - )2 =60

Estadiacutestica Administrativa II 13

s23= Σ( - )2 = 60 = 120 varianza de la muestra

n-1 6-1

σ2w = Σ nj - 1 s2

j = (413)(175) + (413)(155) + (513)(120) = 193 = 14769 nt - k 13

Estadiacutestico F

F = varianza entre columnas = σ2b

Varianza dentro de columnas σ2w

F= 20 = 1354 cociente F 14769

Determinacioacuten de los grados de libertad

Grados de libertad del numerador

Nuacutemero de grados de libertad en el numerador del cociente F

= (nuacutemero de muestras-1)

Grados de libertad del denominador

Nuacutemero de grados de libertad en el denominador del cociente F

= Σ (nj-1)= nt-k

Graacutefica

Se acepta la hipoacutetesis nula

Regioacuten de aceptacioacuten

F= 1354

005 del aacuterea

Distribucioacuten f

381

Valor de tabla

Regioacuten de rechazo

Estadiacutestica Administrativa II 14

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

11-5 479 11-6 479

11-26 480 11-27 480 11-28 480 11-29 480 11-30 480

152 Inferencia sobre una varianza de poblacioacuten (Anova)

Estadiacutestico ji- cuadrada para inferencias sobre una varianza

X2=(n-1)s2 σ2

Intervalo de confianza para σ2

Liacutemite inferior de confianza

σ2L=(n-1)s2 X2

U Liacutemite superior de confianza

σ2U=(n-1)s2 X2

L

Estadiacutestica Administrativa II 15

Ejercicio

Con los siguientes datos obtener el estadiacutestico ji- cuadrada Y el intervalo de

confianza del 95

Tiempo x

50 45 27 66 43 96 45 90 69

153 Inferencia sobre la varianza de dos poblaciones (Anova) Ademaacutes de comparar la varianza de dos poblaciones el principal objetivo de este tema es analizar el cociente que se obtiene al aplicar la foacutermula correspondiente

Coeficiente F para inferencias acerca de dos varianzas

F=S21

S22

Estadiacutestica Administrativa II 16

Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple

21 Estimacioacuten mediante la liacutenea de regresioacuten El anaacutelisis de regresioacuten y correlacioacuten permiten determinar tanto la naturaleza como la fuerza de una relacioacuten entre dos variables En el anaacutelisis de regresioacuten se desarrollaraacute una ecuacioacuten de estimacioacuten a traveacutes de una foacutermula matemaacutetica que relaciona las variables conocidas con la variable desconocida La variable conocida- variable independiente X La variable que tratamos de predecir se llama variable dependiente Y

Figura 2 Fuente (Levin 2004511) 211 Diagrama de dispersioacuten El primer paso para determinar si existe una relacioacuten entre dos variables es examinar la graacutefica de datos observados A esta graacutefica se le llama diagrama de dispersioacuten Un diagrama de dispersioacuten se puede identificar visualmente patrones que indique si las variables estaacuten relacionadas

X

Y

Gastos contra la contaminacioacuten

Emisor de

contaminacioacuten

Pendiente negativa

b) Relacioacuten directa

X

Y

Publicidad

Ventas

Pendiente positiva

a) Relacioacuten directa

Estadiacutestica Administrativa II 17

Figura 3 Fuente (Levin 2004503)

212 Meacutetodo de miacutenimos cuadrados

Liacutenea de estimacioacuten

Y= a+bx Y= variable dependiente a=variable ordenada y b=pendiente de la recta x=variable independiente

Pendiente de la recta de regresioacuten de mejor ajuste

b = Σ XY - n X Y Σ X2 - n X2

b=pendiente de la liacutenea de estimacioacuten de mejor ajuste X= valores de la variable independiente Y= variable valores de la variable dependiente X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente n= nuacutemero de puntos

Estadiacutestica Administrativa II 18

Liacutenea de estimacioacuten

a = Y - bX a= ordenada Y b= pendiente de la ecuacioacuten X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente

Error estaacutendar de la estimacioacuten

Se= Σ(Y-Y)2

n-2 Y= valores de la variable dependiente Y=valores estimados con la ecuacioacuten de estimacioacuten que corresponden a cada valor de Y n= nuacutemero de puntos utilizados para ajustar la liacutenea de regresioacuten Para medir la confiabilidad de la ecuacioacuten de estimacioacuten los especialistas en estadiacutestica han desarrollado el error estaacutendar de estimacioacuten Este error estaacutendar se simboliza por Se y es similar a la desviacioacuten estaacutendar en cuanto a que ambas son medidas de dispersioacuten El error estaacutendar de la estimacioacuten por otra parte mide la variabilidad o dispersioacuten de los valores observados alrededor de la recta de regresioacuten 213 Interpretacioacuten del error estaacutendar de la estimacioacuten Como ocurririacutea en el caso de la desviacioacuten estaacutendar mientras maacutes grande sea el error estaacutendar de la estimacioacuten mayor seraacute la dispersioacuten de los puntos alrededor de la liacutenea de regresioacuten De manera inversa si Se= 0 esperamos que la ecuacioacuten de estimacioacuten sea un estimador ldquoperfectordquo de la variable dependiente En este caso todos los puntos caeriacutean directamente sobre la liacutenea de regresioacuten y no habriacutea puntos dispersos alrededor Usaremos el error estaacutendar de la estimacioacuten como una herramienta de la misma forma que podemos usar la desviacioacuten estaacutendar Esto es suponiendo que los puntos observados siguen una distribucioacuten normal alrededor de la recta de regresioacuten podemos esperar encontrar el 68 de los puntos dentro de plusmn1Se el 955 de los puntos dentro de plusmn2Se y el 997 de los puntos dentro de plusmn3Se

Estadiacutestica Administrativa II 19

Figura 4 Fuente (Levin 2004529)

Debemos observar que el error estaacutendar de la estimacioacuten se mide a lo largo del eje Y y no perpendicularmente desde la recta de regresioacuten 214 Intervalos de prediccioacuten aproximados Podemos concebir al error estaacutendar de la estimacioacuten como una herramienta estadiacutestica que podemos usar para hacer afirmaciones de probabilidad acerca del intervalo alrededor del valor estimado de Y dentro del cual cae el valor real de Y Ejemplo

Y= 375 + 075 X Sustituyendo 4 en X

Y= 375 + 075 (4) = 375 + 300

= 675

Estadiacutestica Administrativa II 20

Intervalo 1 error 2 errores 3 errores

Y plusmn1 Se

Y plusmn2 Se

Y plusmn3 Se

En donde Se = 8660

Sustitucioacuten

Ejemplo A menudo quienes hacen la contabilidad de costos estiman los gastos generales con base en el nivel de produccioacuten Se ha reunido informacioacuten acerca de los gastos generales y las unidades producidas en diferentes plantas y ahora desean estimar una ecuacioacuten de regresioacuten para predecir los gastos generales futuros Gastos generales 191 170 272 155 280 173 234 116 153 178 Unidades 40 42 53 35 56 39 48 30 37 40

a) Determine la variable dependiente e independiente b) Desarrolle una ecuacioacuten de regresioacuten para contabilidad de costos c) Pronostique los gastos generales cuando se producen 50 unidades d) Calcule el error estaacutendar de estimacioacuten

Y +1 Se =

675 + (1) (8660) = 76140 Liacutemite superior del intervalo de prediccioacuten

Y +2 Se =

675 + (2) (8660) = 84820 Liacutemite superior del intervalo de prediccioacuten

Y -1 Se =

675 - (1) (8660) = 58840 Liacutemite inferior del intervalo de prediccioacuten

Y - 2 Se =

675 - (2) (8660) = 50180 Liacutemite inferior del intervalo de prediccioacuten

Estadiacutestica Administrativa II 21

X Y XY X2 Y2 40 191 7640 1600 36481 42 170 7140 1764 28900 53 272 14416 2809 73984 35 155 5425 1225 24025 56 280 15680 3136 78400 39 173 6747 1521 29929 48 234 11232 2304 54756 30 116 3480 900 13456 37 153 5661 1369 23409 40 178 7120 1600 31684 ΣX= 420 ΣY= 1922 ΣXY= 84541 ΣX2= 18228 ΣY2= 395024

b = Σ XY - n X Y = 84541 - 10(42)(1922) = 64915 Σ X2 - n X2 18228 - 10(42)2 a = Y ndash bX = 1922 ndash 64915 (42) = - 804430 Y= a+bx = -804430 + 64915 (50) = 2441320 Se= ΣY2 ndashaΣY ndash b ΣXY = n-2 Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

12-2 531 12-3 531

12-13 531 12-14 531 12-15 531

Estadiacutestica Administrativa II 22

215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten

Coeficiente de determinacioacuten de la muestra

r2= aΣY+bΣXY-nY2

ΣY2 ndash n Y2

Coeficiente de correlacioacuten de la muestra

r= r2

Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten

Estadiacutestica Administrativa II 23

Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables

Y= a + b1 X1 + b2 X2

Ecuacioacuten

na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2

1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2

2 = Σ X2Y

Ejemplo

a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10

Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784

Sumatoria

114 105 85 2463 1590 1435 2367 1571

Matriz

6 105 85 114 105 2367 1435 2463 85 1435 1571 1590

1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25

1 175 14167 19 0 1 -099 884 0 0 361608 21410

361608 b2 = 21410 b2 = 21410 361608 b2 = 059

Estadiacutestica Administrativa II 24

1 b1 -099 b2 = 884 1 b1 -099 (059) = 884

-006 884 1b1 = 884 +006 b1 = 890

1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a

= 2589

Y= a + b1 X1 + b2 X2

y=2589+890(28)+059(10)=28099

Estadiacutestica Administrativa II 25

218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)

Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad

La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos

Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir

donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria

Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados

Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante

Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo

Estadiacutestica Administrativa II 26

Figura 5 Distribucioacuten Homocedaacutestica

Figura 6 Distribucioacuten Heterocedaacutestica

Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten

lineal para hacer estimaciones futuras

Estadiacutestica Administrativa II 27

Unidad 3 Nuacutemeros iacutendice

Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se

calcula encontrando el cociente del valor actual entre el valor base luego se

multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje

Tipos de nuacutemeros iacutendice

Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de

cantidad e iacutendice de valor

Iacutendice de precios

Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida

Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo

Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable

El iacutendice de valor combina los cambios de precio y cantidad para presentar un

iacutendice con maacutes informacioacuten

Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos

como indicadores generales de la condicioacuten econoacutemica de un paiacutes

Factores que pueden distorsionar los nuacutemeros iacutendice

bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados

bull Falta de comparacioacuten de iacutendices

bull Ponderacioacuten no apropiada de los factores

bull Seleccioacuten de una base no apropiada

Estadiacutestica Administrativa II 28

31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores

Iacutendice de cantidad de agregados no ponderados

ΣQi x 100 ΣQo

Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea

1993 1994 1995

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200

Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado

1993 Qo

1994 Q1

1995 Q2

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308

Estadiacutestica Administrativa II 29

Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra

Iacutendice de precios de agregados ponderados

ΣPiQ x 100 ΣPoQ

Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100

Cambio de periodo base

I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base

Estadiacutestica Administrativa II 30

35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos

Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables

Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico

Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios

El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)

Estadiacutestica Administrativa II 31

Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica

37 Deflacioacuten de los valores de series de tiempo

Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios

En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea

La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores

Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero

Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes

Los valores expresados en unidades monetarias corrientes se conocen como valores nominales

Los valores expresados en unidades monetarias constantes se conocen como valores reales

Estadiacutestica Administrativa II 32

38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor

Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos

39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)

Estadiacutestica Administrativa II 33

Siacutembolo Nombre de la compantildeiacutea

AA Alcoa

ALD Allied Signal

AXP American Express

BA Boeing

CAT Caterpillar

CHV Chevron

C CitiGroup

DIS Disney

DD Dupont

EK Eastman Kodak

GE General Electric

GM General Motors

GT Goodyear Tire

HWP Hewlett-Packard

IBM International Business Machines

IP International Paper

JNJ Johnson amp Johnson

JPM JP Morgan Bank

KO Coca Cola

Figura 5 Compantildeiacuteas comprendidas en el Dow Jones

310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos

Praacutectica 2

992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico

elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado

de precios

Estadiacutestica Administrativa II 34

Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida

bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)

42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten

Las principales pruebas no parameacutetricas son las siguientes

bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher

Estadiacutestica Administrativa II 35

bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon

Caracteriacutesticas de algunas pruebas no parameacutetricas

1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos

2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten

3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal

4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados

5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc

6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica

Prueba Caracteriacutestica

Mann- Whitney 2 muestras independientes

Wilcoxon 2 muestras asociadas

Kruskal-Wallis + de 2 muestras independientes

Friedman + de 2 muestras asociadas

Tabla1 Caracteriacutesticas de pruebas no parameacutetricas

Estadiacutestica Administrativa II 36

Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media

Ventajas y desventajas de los meacutetodos parameacutetricos

Desventajas Ventajas bull Ignoran cierta cantidad de

informacioacuten bull No requieren la suposicioacuten de que

una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica

bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas

bull Generalmente es maacutes sencillo realizarlas y entenderlas

bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal

Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo

MHHHHM

1ra 2ra 3ra

Estadiacutestica Administrativa II 37

Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1

n2= nuacutemero de ocurrencias del tipo 2

r= nuacutemero de corridas

4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue

BABBBAAABBABBBBAAAABABAABBBAABAAAABBA

BBAAAABBABBBBAABBABAABB

Valores de la prueba

n1= 29

n2= 31

r= 29

4322 Distribucioacuten de muestreo del estadiacutestico r

El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba

Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente

Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1

n1+n2

Estadiacutestica Administrativa II 38

μr = 2(29)(31) +1

29+31

μr = 1798 +1 60

μr = 2997 +1

μr = 3097

Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)

(n1+n2)2(n1+n2-1)

σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)

σr= (1798) (1738)

(60)2(59)

σr= 1471

σr= 384

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-24 643 14-25 643 14-26 643 14-27 644 14-28 644

Estadiacutestica Administrativa II 39

44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica

Ejemplo

Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado

Miembro del panel Calificacioacuten para

conferencias grandes

Calificacioacuten para

sesiones pequentildeas

Signo de la calificacioacuten

Evaluacioacuten de los dos tipos de

clases

1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -

6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +

La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)

Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20

Estadiacutestica Administrativa II 40

Establecimiento de las hipoacutetesis

Ho p = 05

H1 p ne 05

Se consideran la posibilidades solamente de signos + y - (9+6 =15)

p Ho = 05

q H0 = 05

n= 15

p= 0600 (915)

q= 0400 (615)

Prueba de hipoacutetesis de que no hay diferencia

Error estaacutendar del la proporcioacuten

σp= pq n

σp= (05)(05) 15

σp= 0129

0025

0

0475 del aacuterea

Valor criacutetico Z=-196

Regioacuten de aceptacioacuten

0025

0475 del aacuterea

Valor criacutetico Z=196

Estadiacutestica Administrativa II 41

45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten

Procedimiento de la prueba de rangos con signo de Wilcoxon

Paso1 Para cada par de datos calcule la diferencia d restando el segundo

valor del primero Guarde los signos pero descarte cualquier par para el que

d=0

Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de

la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango

correspondiente Cuando las diferencias tengan el mismo valor numeacuterico

asiacutegneles la media de los rangos implicados en el empate

Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino

Esto es inserte aquellos signos que se ignoraron e el paso dos

Paso 4 Calcule la suma de los valores absolutos de los rangos negativos

Tambieacuten la suma de los rangos positivos

Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon

en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el

procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos

sumas

Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la

diferencia d no es 0

Estadiacutestica Administrativa II 42

Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el

tamantildeo muestral

Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos

muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica

esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico

Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente

2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha

Notacioacuten

T= la maacutes pequentildea de las siguientes dos sumas

1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0

La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T

Estadiacutestica Administrativa II 43

46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2

Rango Calificacioacuten Plantel

1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S

10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S

Estadiacutestica Administrativa II 44

30 1600 S

Estadiacutestica Administrativa II 45

Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500

n1= 15 n2= 15 R1= 247 R2= 218

Estadiacutestico U

U = n1n2 + n1(n1 +1) -R1 2

U= (15)(15) + (15)(16) -247 2

U= 225+120-247

U= 98

Media de la distribucioacuten muestral U

μu = n1n2

2

μu = (15)(15)

2

μu =1125

Estadiacutestica Administrativa II 46

Estadiacutestico U

σU = n1n2 + (n1n2 +1)

12

σU = (15)(15)(15+15+1)

12

σU = 6975 12

σU = 58125

σU = 241

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2

α= 015

Estandarizacioacuten del estadiacutestico U

z = U-μu

σU

z = 98 - 1125 241

z = -0602

144 -144 0 -0602

Valor estandarizado de

la muestra U

Regioacuten de aceptacioacuten

Estadiacutestica Administrativa II 47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras

Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular

Prueba de Wilcoxon de los rangos con signo

Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero

Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande

Prueba de Wilcoxon para contrastar datos pareados

El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 9: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

Estadiacutestica Administrativa II 5

Frecuencias observadas y esperadas

Noreste Sureste Central Costa oeste

Proporcioacuten de empleados muestreados en cada regioacuten que se espera prefieren los dos meacutetodos de evaluacioacuten

Nuacutemero total muestreado 100 120 90 110 Proporcioacuten estimada que prefieren el meacutetodo actual

x 06643 x 06643 x 06643 x 06643

Nuacutemero que se espera prefiera el meacutetodo actual

6643 7972 5979 7307

Nuacutemero total muestreado 100 120 90 110 Proporcioacuten estimada que prefieren el meacutetodo nuevo

x 03357 x 03357 x 03357 x 03357

Nuacutemero que se espera prefiera el meacutetodo nuevo

3357 4028 3021 3693

Noreste Sureste Central Costa

oeste Comparacioacuten de las frecuencias observadas y esperadas de trabajadores muestreados

Frecuencia con que prefieren el meacutetodo actual

68 75 57 79

Frecuencia observada (real) Frecuencia esperada (teoacuterica)

6643 7972 5979 7307

Frecuencia con que prefieren el meacutetodo nuevo

32 45 33 31

Frecuencia observada (real) Frecuencia esperada (teoacuterica)

3357 4028 3021 3693

Estadiacutestico ji- cuadrada

119961120784 = 120622

(119943119952 minus 119943119942)120784119943119942

fo= frecuencia observada fe= frecuencia esperada

Paso 1 Paso 2 Paso 3 Calculo del estadiacutestico x2

fo fe fo-fe (fo-fe)2 (fo-fe)2

fe 68 6643 157 246 00370 75 7972 -472 2228 02795 57 5979 -279 778 01301 79 7307 593 3516 04812 32 3357 -157 246 00733

45 4028 472 2228 05531 33 3021 279 778 02575 31 3693 -593 3516 09521 X2= 27638

Estadiacutestica Administrativa II 6

Determinacioacuten de los grados de libertad

Nuacutemero de grados de libertad

Grados de libertad en una prueba ji- cuadrada

= (nuacutemero de renglones -1 )(nuacutemero de columnas -1)

Tabla de 2x4 (2-1)(4-1)= (1)(3) = 3 grados de libertad

Nivel de significancia de 10 Buscar en tablas x2 3 grados de libertad con un nivel de significancia de 10 y graficar

Interpretacioacuten de los resultados y la graacutefica 142 Meacutetodo para obtener el estadiacutestico x2 de una tabla de

contingencia con maacutes de 2 renglones Estadiacutestico ji- cuadrada

x2 = Σ(fo-fe)2

fe fo= frecuencia observada fe= frecuencia esperada Determinacioacuten de los grados de libertad de una tabla de contingencia de maacutes de tres renglones

Nuacutemero de grados de libertad de una tabla de maacutes de tres renglones

Grados de libertad en una prueba ji- cuadrada

= (nuacutemero de renglones -1 )(nuacutemero de columnas -1)

Regioacuten de aceptacioacuten

2764

010 del aacuterea

Valor x2

Distribucioacuten x2

con 3 grados de

libertad

6251

Valor de tabla

Regioacuten de rechazo

Estadiacutestica Administrativa II 7

Tabla de contingencia Nuacutemero de

renglones Nuacutemero de columnas

r-1 c-1 Grados de libertad (r-1)(c-1)

A 3 4 3-1=2 4-1=3 (2)(3)=6 B 5 7 5-1=4 7-1=6 (4)(6)=24 C 6 9 6-1=5 9-1=8 (5)(8)=40

El presidente de una compantildeiacutea de seguros de salud se opone al seguro nacional Argumenta que su implementacioacuten seriacutea muy costosa en particular debido a que la existencia de este sistema tenderiacutea a fomentar permanencias hospitalarias maacutes prolongadas ademaacutes de otros efectos El presidente piensa que el tiempo de hospitalizacioacuten depende del tipo de seguro de salud que tengan las personas Los siguientes datos se obtuvieron de una muestra aleatoria de 660 hospitalizaciones Diacuteas en el hospital lt5 5-10 gt10 Total Datos de hospitalizaciones Calificados seguacuten el tipo de cobertura del seguro y el tiempo de estancia

Fraccioacuten de costos cubiertos por el seguro

lt25 40 75 65 180 25 -50 30 45 75 150

gt50 40 100 190 330

Total 110 220 330 660

Planteamiento del problema

Hipoacutetesis nula Ho el tiempo de estancia y tipo de seguro son independientes

Hipoacutetesis alternativa

Hi el tiempo de estancia depende del tipo de seguro

α= 001 nivel de significancia para probar la hipoacutetesis Frecuencia esperada para cualquier celda

Calculo de la frecuencia esperada fe= RT X CT n

fe= frecuencia esperada en una celda dada RT= total por rengloacuten para el rengloacuten que contiene esa celda CT= total por columna para la columna que contiene esa celda n= nuacutemero total de observaciones

Estadiacutestica Administrativa II 8

Estadiacutestico ji- cuadrada

fo= frecuencia observada fe= frecuencia esperada

x2 = Σ(fo-fe)2

fe

Rengloacuten Columna fo fe = RT X CT n

fo-fe (fo-fe)2 (fo-fe)2

fe Calculo de las frecuencias esperadas y ji- cuadrada

1 1 40 30 180 X 110 660

10 100 3333

1 2 75 60 180 X 220 660

15 225 3750

1 3 65 90 180 X 330 660

-25 625 6944

2 1 30 25 150 X 110 660

5 25 1000

2 2 45 50 150 X 220 660

-5 25 0500

2 3 75 75 150 X 330 660

0 0 0000

3 1 40 55 330 X 110 660

-15 225 4091

3 2 100 110 330 X 220 660

-10 100 0909

3 3 190 165 330 X 330 660

25 625 3788

X2=24315

Buscar en tablas x2 4grados de libertad con un nivel de significancia de 10 y graficar Interpretacioacuten de resultados

Regioacuten de aceptacioacuten

x2= 24315

010 del aacuterea

Distribucioacuten x2

13277

Valor de tabla

Regioacuten de rechazo

Estadiacutestica Administrativa II 9

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

11-1 459 11-2 460 11-7 460 11-8 460 11-9 460

11-10 460 11-11 461 11-12 461 11-13 461

15 Anaacutelisis de varianza

El anaacutelisis de varianza nos permite probar si maacutes de dos medias de poblacioacuten pueden considerarse iguales A menudo se abrevia ANOVA analysis of variance ANOVA Es un meacutetodo de prueba de igualdad de tres o maacutes medias poblacionales1

Hipoacutetesis nula tiacutepica

HO= μ1= μ2= μ3

El meacutetodo ANOVA nos sirve para evitar el error tipo I (rechazar una hipoacutetesis nula verdadera) si utilizamos una prueba de igualdad de varias medias

151 Aplicaciones de ANOVA Se utiliza cuando Se asevera que los supermercados colocan los cereales con alto contenido de azuacutecar en estantes que estaacuten a la altura De los ojos de los nintildeos de manera que eso nos permite probar la aseveracioacuten de que los cereales en los estantes tienen el mismo contenido de azuacutecar

1 Mario F Triola Estadiacutestica Pearson Meacutexico2006

Estadiacutestica Administrativa II 10

Tambieacuten en casos como la comparacioacuten del kilometraje logrado por cinco clases diferentes de gasolina la prueba de cuaacutel de cuatro meacutetodos de capacitacioacuten produce el aprendizaje maacutes raacutepido etc Los meacutetodos de ANOVA requieren de la distribucioacuten F Propiedades de la distribucioacuten F

1 Es no simeacutetrica se sesga hacia la derecha 2 Los valores F son 0 o positivo pero no negativos 3 Hay una distribucioacuten F para cada par de grados de libertad para el

numerador y el denominador

Figura 1 Fuente (Triola 2006605) Ejemplo

Muestra 1 15 18 19 22 11

Muestra 2 22 27 18 21 17

Muestra 3 18 24 19 16 22 15

Planteamiento de la hipoacutetesis

Ho μ1= μ2= μ3

H1 μ1 μ2 y μ3 no son todas iguales

Estadiacutestica Administrativa II 11

Caacutelculo de la media

Meacutetodo 1 Meacutetodo 2 Meacutetodo 3 Produccioacuten diaria 15 22 18

18 27 24 19 18 19 22 21 16 11 17 22

15 85 105 114 Sumatoria divide5 divide5 divide6 Tamantildeo de

la muestra 17 21 19 Media

muestral n1=5 n2=5 n3=6

1= 17 2= 21 3= 19

Caacutelculo de la gran media

= 15 +18+ 19+ 22+ 11+22 +27+ 18+ 21+ 17+18 +24+ 19+ 16+ 22+ 15 = 19 16

Caacutelculo de la varianza entre columnas

σ2b = Σnj ( - )2 = k-1

n - ( - )2 n( - ) Caacutelculo de la varianza entre columnas

5 17 19 17-19=-2 (-2)2=4 5x4=20 5 21 19 21-19=2 (2)2=4 5x4=20 6 19 19 19-19=0 (0)2=0 6x0 = 0 Σnj( - )

2 =40

σ2b = Σnj ( - )2 = 40= 40 = 20 varianza entre columnas

k-1 3-1 2

Estadiacutestica Administrativa II 12

Estimacioacuten de la varianza dentro de columnas

Meacutetodo de capacitacioacuten 1 Media muestral =17

Estimacioacuten de la varianza dentro de columnas

- ( - )2 15-17=-2 (-2)2=4 18-17=1 (1)2=1 19-17=2 (2)2=4 22-17=5 (5)2=25 11-17=-6 (-6)2=36 Σ( - )2 =70

s21= Σ( - )2 = 70 = 175 varianza de la muestra

n-1 5-1

Meacutetodo de capacitacioacuten 2 Media muestral =21

Estimacioacuten de la varianza dentro de columnas

- ( - )2 22-21=1 (1)2=1 27-21=6 (6)2=36 18-21=-3 (-3)2=9 21-21=0 (0)2=0 17-21=-4 (-4)2=16 Σ( - )2 =62

s22= Σ( - )2 = 62 = 155 varianza de la muestra

n-1 5-1

Meacutetodo de capacitacioacuten 3 Media muestral =19

Estimacioacuten de la varianza dentro de columnas

- ( - )2 18-19=-1 (-1)2=1 24-19=5 (5)2=25 19-19=0 (0)2=0 16-19=-3 (-3)2=9 22-19=3 (-32=9 15-19=-4 (-4)2=16 Σ( - )2 =60

Estadiacutestica Administrativa II 13

s23= Σ( - )2 = 60 = 120 varianza de la muestra

n-1 6-1

σ2w = Σ nj - 1 s2

j = (413)(175) + (413)(155) + (513)(120) = 193 = 14769 nt - k 13

Estadiacutestico F

F = varianza entre columnas = σ2b

Varianza dentro de columnas σ2w

F= 20 = 1354 cociente F 14769

Determinacioacuten de los grados de libertad

Grados de libertad del numerador

Nuacutemero de grados de libertad en el numerador del cociente F

= (nuacutemero de muestras-1)

Grados de libertad del denominador

Nuacutemero de grados de libertad en el denominador del cociente F

= Σ (nj-1)= nt-k

Graacutefica

Se acepta la hipoacutetesis nula

Regioacuten de aceptacioacuten

F= 1354

005 del aacuterea

Distribucioacuten f

381

Valor de tabla

Regioacuten de rechazo

Estadiacutestica Administrativa II 14

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

11-5 479 11-6 479

11-26 480 11-27 480 11-28 480 11-29 480 11-30 480

152 Inferencia sobre una varianza de poblacioacuten (Anova)

Estadiacutestico ji- cuadrada para inferencias sobre una varianza

X2=(n-1)s2 σ2

Intervalo de confianza para σ2

Liacutemite inferior de confianza

σ2L=(n-1)s2 X2

U Liacutemite superior de confianza

σ2U=(n-1)s2 X2

L

Estadiacutestica Administrativa II 15

Ejercicio

Con los siguientes datos obtener el estadiacutestico ji- cuadrada Y el intervalo de

confianza del 95

Tiempo x

50 45 27 66 43 96 45 90 69

153 Inferencia sobre la varianza de dos poblaciones (Anova) Ademaacutes de comparar la varianza de dos poblaciones el principal objetivo de este tema es analizar el cociente que se obtiene al aplicar la foacutermula correspondiente

Coeficiente F para inferencias acerca de dos varianzas

F=S21

S22

Estadiacutestica Administrativa II 16

Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple

21 Estimacioacuten mediante la liacutenea de regresioacuten El anaacutelisis de regresioacuten y correlacioacuten permiten determinar tanto la naturaleza como la fuerza de una relacioacuten entre dos variables En el anaacutelisis de regresioacuten se desarrollaraacute una ecuacioacuten de estimacioacuten a traveacutes de una foacutermula matemaacutetica que relaciona las variables conocidas con la variable desconocida La variable conocida- variable independiente X La variable que tratamos de predecir se llama variable dependiente Y

Figura 2 Fuente (Levin 2004511) 211 Diagrama de dispersioacuten El primer paso para determinar si existe una relacioacuten entre dos variables es examinar la graacutefica de datos observados A esta graacutefica se le llama diagrama de dispersioacuten Un diagrama de dispersioacuten se puede identificar visualmente patrones que indique si las variables estaacuten relacionadas

X

Y

Gastos contra la contaminacioacuten

Emisor de

contaminacioacuten

Pendiente negativa

b) Relacioacuten directa

X

Y

Publicidad

Ventas

Pendiente positiva

a) Relacioacuten directa

Estadiacutestica Administrativa II 17

Figura 3 Fuente (Levin 2004503)

212 Meacutetodo de miacutenimos cuadrados

Liacutenea de estimacioacuten

Y= a+bx Y= variable dependiente a=variable ordenada y b=pendiente de la recta x=variable independiente

Pendiente de la recta de regresioacuten de mejor ajuste

b = Σ XY - n X Y Σ X2 - n X2

b=pendiente de la liacutenea de estimacioacuten de mejor ajuste X= valores de la variable independiente Y= variable valores de la variable dependiente X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente n= nuacutemero de puntos

Estadiacutestica Administrativa II 18

Liacutenea de estimacioacuten

a = Y - bX a= ordenada Y b= pendiente de la ecuacioacuten X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente

Error estaacutendar de la estimacioacuten

Se= Σ(Y-Y)2

n-2 Y= valores de la variable dependiente Y=valores estimados con la ecuacioacuten de estimacioacuten que corresponden a cada valor de Y n= nuacutemero de puntos utilizados para ajustar la liacutenea de regresioacuten Para medir la confiabilidad de la ecuacioacuten de estimacioacuten los especialistas en estadiacutestica han desarrollado el error estaacutendar de estimacioacuten Este error estaacutendar se simboliza por Se y es similar a la desviacioacuten estaacutendar en cuanto a que ambas son medidas de dispersioacuten El error estaacutendar de la estimacioacuten por otra parte mide la variabilidad o dispersioacuten de los valores observados alrededor de la recta de regresioacuten 213 Interpretacioacuten del error estaacutendar de la estimacioacuten Como ocurririacutea en el caso de la desviacioacuten estaacutendar mientras maacutes grande sea el error estaacutendar de la estimacioacuten mayor seraacute la dispersioacuten de los puntos alrededor de la liacutenea de regresioacuten De manera inversa si Se= 0 esperamos que la ecuacioacuten de estimacioacuten sea un estimador ldquoperfectordquo de la variable dependiente En este caso todos los puntos caeriacutean directamente sobre la liacutenea de regresioacuten y no habriacutea puntos dispersos alrededor Usaremos el error estaacutendar de la estimacioacuten como una herramienta de la misma forma que podemos usar la desviacioacuten estaacutendar Esto es suponiendo que los puntos observados siguen una distribucioacuten normal alrededor de la recta de regresioacuten podemos esperar encontrar el 68 de los puntos dentro de plusmn1Se el 955 de los puntos dentro de plusmn2Se y el 997 de los puntos dentro de plusmn3Se

Estadiacutestica Administrativa II 19

Figura 4 Fuente (Levin 2004529)

Debemos observar que el error estaacutendar de la estimacioacuten se mide a lo largo del eje Y y no perpendicularmente desde la recta de regresioacuten 214 Intervalos de prediccioacuten aproximados Podemos concebir al error estaacutendar de la estimacioacuten como una herramienta estadiacutestica que podemos usar para hacer afirmaciones de probabilidad acerca del intervalo alrededor del valor estimado de Y dentro del cual cae el valor real de Y Ejemplo

Y= 375 + 075 X Sustituyendo 4 en X

Y= 375 + 075 (4) = 375 + 300

= 675

Estadiacutestica Administrativa II 20

Intervalo 1 error 2 errores 3 errores

Y plusmn1 Se

Y plusmn2 Se

Y plusmn3 Se

En donde Se = 8660

Sustitucioacuten

Ejemplo A menudo quienes hacen la contabilidad de costos estiman los gastos generales con base en el nivel de produccioacuten Se ha reunido informacioacuten acerca de los gastos generales y las unidades producidas en diferentes plantas y ahora desean estimar una ecuacioacuten de regresioacuten para predecir los gastos generales futuros Gastos generales 191 170 272 155 280 173 234 116 153 178 Unidades 40 42 53 35 56 39 48 30 37 40

a) Determine la variable dependiente e independiente b) Desarrolle una ecuacioacuten de regresioacuten para contabilidad de costos c) Pronostique los gastos generales cuando se producen 50 unidades d) Calcule el error estaacutendar de estimacioacuten

Y +1 Se =

675 + (1) (8660) = 76140 Liacutemite superior del intervalo de prediccioacuten

Y +2 Se =

675 + (2) (8660) = 84820 Liacutemite superior del intervalo de prediccioacuten

Y -1 Se =

675 - (1) (8660) = 58840 Liacutemite inferior del intervalo de prediccioacuten

Y - 2 Se =

675 - (2) (8660) = 50180 Liacutemite inferior del intervalo de prediccioacuten

Estadiacutestica Administrativa II 21

X Y XY X2 Y2 40 191 7640 1600 36481 42 170 7140 1764 28900 53 272 14416 2809 73984 35 155 5425 1225 24025 56 280 15680 3136 78400 39 173 6747 1521 29929 48 234 11232 2304 54756 30 116 3480 900 13456 37 153 5661 1369 23409 40 178 7120 1600 31684 ΣX= 420 ΣY= 1922 ΣXY= 84541 ΣX2= 18228 ΣY2= 395024

b = Σ XY - n X Y = 84541 - 10(42)(1922) = 64915 Σ X2 - n X2 18228 - 10(42)2 a = Y ndash bX = 1922 ndash 64915 (42) = - 804430 Y= a+bx = -804430 + 64915 (50) = 2441320 Se= ΣY2 ndashaΣY ndash b ΣXY = n-2 Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

12-2 531 12-3 531

12-13 531 12-14 531 12-15 531

Estadiacutestica Administrativa II 22

215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten

Coeficiente de determinacioacuten de la muestra

r2= aΣY+bΣXY-nY2

ΣY2 ndash n Y2

Coeficiente de correlacioacuten de la muestra

r= r2

Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten

Estadiacutestica Administrativa II 23

Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables

Y= a + b1 X1 + b2 X2

Ecuacioacuten

na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2

1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2

2 = Σ X2Y

Ejemplo

a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10

Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784

Sumatoria

114 105 85 2463 1590 1435 2367 1571

Matriz

6 105 85 114 105 2367 1435 2463 85 1435 1571 1590

1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25

1 175 14167 19 0 1 -099 884 0 0 361608 21410

361608 b2 = 21410 b2 = 21410 361608 b2 = 059

Estadiacutestica Administrativa II 24

1 b1 -099 b2 = 884 1 b1 -099 (059) = 884

-006 884 1b1 = 884 +006 b1 = 890

1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a

= 2589

Y= a + b1 X1 + b2 X2

y=2589+890(28)+059(10)=28099

Estadiacutestica Administrativa II 25

218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)

Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad

La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos

Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir

donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria

Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados

Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante

Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo

Estadiacutestica Administrativa II 26

Figura 5 Distribucioacuten Homocedaacutestica

Figura 6 Distribucioacuten Heterocedaacutestica

Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten

lineal para hacer estimaciones futuras

Estadiacutestica Administrativa II 27

Unidad 3 Nuacutemeros iacutendice

Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se

calcula encontrando el cociente del valor actual entre el valor base luego se

multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje

Tipos de nuacutemeros iacutendice

Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de

cantidad e iacutendice de valor

Iacutendice de precios

Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida

Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo

Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable

El iacutendice de valor combina los cambios de precio y cantidad para presentar un

iacutendice con maacutes informacioacuten

Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos

como indicadores generales de la condicioacuten econoacutemica de un paiacutes

Factores que pueden distorsionar los nuacutemeros iacutendice

bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados

bull Falta de comparacioacuten de iacutendices

bull Ponderacioacuten no apropiada de los factores

bull Seleccioacuten de una base no apropiada

Estadiacutestica Administrativa II 28

31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores

Iacutendice de cantidad de agregados no ponderados

ΣQi x 100 ΣQo

Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea

1993 1994 1995

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200

Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado

1993 Qo

1994 Q1

1995 Q2

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308

Estadiacutestica Administrativa II 29

Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra

Iacutendice de precios de agregados ponderados

ΣPiQ x 100 ΣPoQ

Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100

Cambio de periodo base

I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base

Estadiacutestica Administrativa II 30

35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos

Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables

Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico

Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios

El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)

Estadiacutestica Administrativa II 31

Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica

37 Deflacioacuten de los valores de series de tiempo

Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios

En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea

La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores

Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero

Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes

Los valores expresados en unidades monetarias corrientes se conocen como valores nominales

Los valores expresados en unidades monetarias constantes se conocen como valores reales

Estadiacutestica Administrativa II 32

38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor

Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos

39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)

Estadiacutestica Administrativa II 33

Siacutembolo Nombre de la compantildeiacutea

AA Alcoa

ALD Allied Signal

AXP American Express

BA Boeing

CAT Caterpillar

CHV Chevron

C CitiGroup

DIS Disney

DD Dupont

EK Eastman Kodak

GE General Electric

GM General Motors

GT Goodyear Tire

HWP Hewlett-Packard

IBM International Business Machines

IP International Paper

JNJ Johnson amp Johnson

JPM JP Morgan Bank

KO Coca Cola

Figura 5 Compantildeiacuteas comprendidas en el Dow Jones

310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos

Praacutectica 2

992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico

elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado

de precios

Estadiacutestica Administrativa II 34

Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida

bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)

42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten

Las principales pruebas no parameacutetricas son las siguientes

bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher

Estadiacutestica Administrativa II 35

bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon

Caracteriacutesticas de algunas pruebas no parameacutetricas

1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos

2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten

3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal

4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados

5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc

6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica

Prueba Caracteriacutestica

Mann- Whitney 2 muestras independientes

Wilcoxon 2 muestras asociadas

Kruskal-Wallis + de 2 muestras independientes

Friedman + de 2 muestras asociadas

Tabla1 Caracteriacutesticas de pruebas no parameacutetricas

Estadiacutestica Administrativa II 36

Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media

Ventajas y desventajas de los meacutetodos parameacutetricos

Desventajas Ventajas bull Ignoran cierta cantidad de

informacioacuten bull No requieren la suposicioacuten de que

una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica

bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas

bull Generalmente es maacutes sencillo realizarlas y entenderlas

bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal

Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo

MHHHHM

1ra 2ra 3ra

Estadiacutestica Administrativa II 37

Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1

n2= nuacutemero de ocurrencias del tipo 2

r= nuacutemero de corridas

4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue

BABBBAAABBABBBBAAAABABAABBBAABAAAABBA

BBAAAABBABBBBAABBABAABB

Valores de la prueba

n1= 29

n2= 31

r= 29

4322 Distribucioacuten de muestreo del estadiacutestico r

El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba

Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente

Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1

n1+n2

Estadiacutestica Administrativa II 38

μr = 2(29)(31) +1

29+31

μr = 1798 +1 60

μr = 2997 +1

μr = 3097

Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)

(n1+n2)2(n1+n2-1)

σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)

σr= (1798) (1738)

(60)2(59)

σr= 1471

σr= 384

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-24 643 14-25 643 14-26 643 14-27 644 14-28 644

Estadiacutestica Administrativa II 39

44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica

Ejemplo

Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado

Miembro del panel Calificacioacuten para

conferencias grandes

Calificacioacuten para

sesiones pequentildeas

Signo de la calificacioacuten

Evaluacioacuten de los dos tipos de

clases

1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -

6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +

La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)

Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20

Estadiacutestica Administrativa II 40

Establecimiento de las hipoacutetesis

Ho p = 05

H1 p ne 05

Se consideran la posibilidades solamente de signos + y - (9+6 =15)

p Ho = 05

q H0 = 05

n= 15

p= 0600 (915)

q= 0400 (615)

Prueba de hipoacutetesis de que no hay diferencia

Error estaacutendar del la proporcioacuten

σp= pq n

σp= (05)(05) 15

σp= 0129

0025

0

0475 del aacuterea

Valor criacutetico Z=-196

Regioacuten de aceptacioacuten

0025

0475 del aacuterea

Valor criacutetico Z=196

Estadiacutestica Administrativa II 41

45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten

Procedimiento de la prueba de rangos con signo de Wilcoxon

Paso1 Para cada par de datos calcule la diferencia d restando el segundo

valor del primero Guarde los signos pero descarte cualquier par para el que

d=0

Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de

la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango

correspondiente Cuando las diferencias tengan el mismo valor numeacuterico

asiacutegneles la media de los rangos implicados en el empate

Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino

Esto es inserte aquellos signos que se ignoraron e el paso dos

Paso 4 Calcule la suma de los valores absolutos de los rangos negativos

Tambieacuten la suma de los rangos positivos

Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon

en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el

procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos

sumas

Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la

diferencia d no es 0

Estadiacutestica Administrativa II 42

Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el

tamantildeo muestral

Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos

muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica

esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico

Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente

2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha

Notacioacuten

T= la maacutes pequentildea de las siguientes dos sumas

1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0

La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T

Estadiacutestica Administrativa II 43

46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2

Rango Calificacioacuten Plantel

1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S

10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S

Estadiacutestica Administrativa II 44

30 1600 S

Estadiacutestica Administrativa II 45

Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500

n1= 15 n2= 15 R1= 247 R2= 218

Estadiacutestico U

U = n1n2 + n1(n1 +1) -R1 2

U= (15)(15) + (15)(16) -247 2

U= 225+120-247

U= 98

Media de la distribucioacuten muestral U

μu = n1n2

2

μu = (15)(15)

2

μu =1125

Estadiacutestica Administrativa II 46

Estadiacutestico U

σU = n1n2 + (n1n2 +1)

12

σU = (15)(15)(15+15+1)

12

σU = 6975 12

σU = 58125

σU = 241

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2

α= 015

Estandarizacioacuten del estadiacutestico U

z = U-μu

σU

z = 98 - 1125 241

z = -0602

144 -144 0 -0602

Valor estandarizado de

la muestra U

Regioacuten de aceptacioacuten

Estadiacutestica Administrativa II 47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras

Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular

Prueba de Wilcoxon de los rangos con signo

Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero

Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande

Prueba de Wilcoxon para contrastar datos pareados

El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 10: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

Estadiacutestica Administrativa II 6

Determinacioacuten de los grados de libertad

Nuacutemero de grados de libertad

Grados de libertad en una prueba ji- cuadrada

= (nuacutemero de renglones -1 )(nuacutemero de columnas -1)

Tabla de 2x4 (2-1)(4-1)= (1)(3) = 3 grados de libertad

Nivel de significancia de 10 Buscar en tablas x2 3 grados de libertad con un nivel de significancia de 10 y graficar

Interpretacioacuten de los resultados y la graacutefica 142 Meacutetodo para obtener el estadiacutestico x2 de una tabla de

contingencia con maacutes de 2 renglones Estadiacutestico ji- cuadrada

x2 = Σ(fo-fe)2

fe fo= frecuencia observada fe= frecuencia esperada Determinacioacuten de los grados de libertad de una tabla de contingencia de maacutes de tres renglones

Nuacutemero de grados de libertad de una tabla de maacutes de tres renglones

Grados de libertad en una prueba ji- cuadrada

= (nuacutemero de renglones -1 )(nuacutemero de columnas -1)

Regioacuten de aceptacioacuten

2764

010 del aacuterea

Valor x2

Distribucioacuten x2

con 3 grados de

libertad

6251

Valor de tabla

Regioacuten de rechazo

Estadiacutestica Administrativa II 7

Tabla de contingencia Nuacutemero de

renglones Nuacutemero de columnas

r-1 c-1 Grados de libertad (r-1)(c-1)

A 3 4 3-1=2 4-1=3 (2)(3)=6 B 5 7 5-1=4 7-1=6 (4)(6)=24 C 6 9 6-1=5 9-1=8 (5)(8)=40

El presidente de una compantildeiacutea de seguros de salud se opone al seguro nacional Argumenta que su implementacioacuten seriacutea muy costosa en particular debido a que la existencia de este sistema tenderiacutea a fomentar permanencias hospitalarias maacutes prolongadas ademaacutes de otros efectos El presidente piensa que el tiempo de hospitalizacioacuten depende del tipo de seguro de salud que tengan las personas Los siguientes datos se obtuvieron de una muestra aleatoria de 660 hospitalizaciones Diacuteas en el hospital lt5 5-10 gt10 Total Datos de hospitalizaciones Calificados seguacuten el tipo de cobertura del seguro y el tiempo de estancia

Fraccioacuten de costos cubiertos por el seguro

lt25 40 75 65 180 25 -50 30 45 75 150

gt50 40 100 190 330

Total 110 220 330 660

Planteamiento del problema

Hipoacutetesis nula Ho el tiempo de estancia y tipo de seguro son independientes

Hipoacutetesis alternativa

Hi el tiempo de estancia depende del tipo de seguro

α= 001 nivel de significancia para probar la hipoacutetesis Frecuencia esperada para cualquier celda

Calculo de la frecuencia esperada fe= RT X CT n

fe= frecuencia esperada en una celda dada RT= total por rengloacuten para el rengloacuten que contiene esa celda CT= total por columna para la columna que contiene esa celda n= nuacutemero total de observaciones

Estadiacutestica Administrativa II 8

Estadiacutestico ji- cuadrada

fo= frecuencia observada fe= frecuencia esperada

x2 = Σ(fo-fe)2

fe

Rengloacuten Columna fo fe = RT X CT n

fo-fe (fo-fe)2 (fo-fe)2

fe Calculo de las frecuencias esperadas y ji- cuadrada

1 1 40 30 180 X 110 660

10 100 3333

1 2 75 60 180 X 220 660

15 225 3750

1 3 65 90 180 X 330 660

-25 625 6944

2 1 30 25 150 X 110 660

5 25 1000

2 2 45 50 150 X 220 660

-5 25 0500

2 3 75 75 150 X 330 660

0 0 0000

3 1 40 55 330 X 110 660

-15 225 4091

3 2 100 110 330 X 220 660

-10 100 0909

3 3 190 165 330 X 330 660

25 625 3788

X2=24315

Buscar en tablas x2 4grados de libertad con un nivel de significancia de 10 y graficar Interpretacioacuten de resultados

Regioacuten de aceptacioacuten

x2= 24315

010 del aacuterea

Distribucioacuten x2

13277

Valor de tabla

Regioacuten de rechazo

Estadiacutestica Administrativa II 9

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

11-1 459 11-2 460 11-7 460 11-8 460 11-9 460

11-10 460 11-11 461 11-12 461 11-13 461

15 Anaacutelisis de varianza

El anaacutelisis de varianza nos permite probar si maacutes de dos medias de poblacioacuten pueden considerarse iguales A menudo se abrevia ANOVA analysis of variance ANOVA Es un meacutetodo de prueba de igualdad de tres o maacutes medias poblacionales1

Hipoacutetesis nula tiacutepica

HO= μ1= μ2= μ3

El meacutetodo ANOVA nos sirve para evitar el error tipo I (rechazar una hipoacutetesis nula verdadera) si utilizamos una prueba de igualdad de varias medias

151 Aplicaciones de ANOVA Se utiliza cuando Se asevera que los supermercados colocan los cereales con alto contenido de azuacutecar en estantes que estaacuten a la altura De los ojos de los nintildeos de manera que eso nos permite probar la aseveracioacuten de que los cereales en los estantes tienen el mismo contenido de azuacutecar

1 Mario F Triola Estadiacutestica Pearson Meacutexico2006

Estadiacutestica Administrativa II 10

Tambieacuten en casos como la comparacioacuten del kilometraje logrado por cinco clases diferentes de gasolina la prueba de cuaacutel de cuatro meacutetodos de capacitacioacuten produce el aprendizaje maacutes raacutepido etc Los meacutetodos de ANOVA requieren de la distribucioacuten F Propiedades de la distribucioacuten F

1 Es no simeacutetrica se sesga hacia la derecha 2 Los valores F son 0 o positivo pero no negativos 3 Hay una distribucioacuten F para cada par de grados de libertad para el

numerador y el denominador

Figura 1 Fuente (Triola 2006605) Ejemplo

Muestra 1 15 18 19 22 11

Muestra 2 22 27 18 21 17

Muestra 3 18 24 19 16 22 15

Planteamiento de la hipoacutetesis

Ho μ1= μ2= μ3

H1 μ1 μ2 y μ3 no son todas iguales

Estadiacutestica Administrativa II 11

Caacutelculo de la media

Meacutetodo 1 Meacutetodo 2 Meacutetodo 3 Produccioacuten diaria 15 22 18

18 27 24 19 18 19 22 21 16 11 17 22

15 85 105 114 Sumatoria divide5 divide5 divide6 Tamantildeo de

la muestra 17 21 19 Media

muestral n1=5 n2=5 n3=6

1= 17 2= 21 3= 19

Caacutelculo de la gran media

= 15 +18+ 19+ 22+ 11+22 +27+ 18+ 21+ 17+18 +24+ 19+ 16+ 22+ 15 = 19 16

Caacutelculo de la varianza entre columnas

σ2b = Σnj ( - )2 = k-1

n - ( - )2 n( - ) Caacutelculo de la varianza entre columnas

5 17 19 17-19=-2 (-2)2=4 5x4=20 5 21 19 21-19=2 (2)2=4 5x4=20 6 19 19 19-19=0 (0)2=0 6x0 = 0 Σnj( - )

2 =40

σ2b = Σnj ( - )2 = 40= 40 = 20 varianza entre columnas

k-1 3-1 2

Estadiacutestica Administrativa II 12

Estimacioacuten de la varianza dentro de columnas

Meacutetodo de capacitacioacuten 1 Media muestral =17

Estimacioacuten de la varianza dentro de columnas

- ( - )2 15-17=-2 (-2)2=4 18-17=1 (1)2=1 19-17=2 (2)2=4 22-17=5 (5)2=25 11-17=-6 (-6)2=36 Σ( - )2 =70

s21= Σ( - )2 = 70 = 175 varianza de la muestra

n-1 5-1

Meacutetodo de capacitacioacuten 2 Media muestral =21

Estimacioacuten de la varianza dentro de columnas

- ( - )2 22-21=1 (1)2=1 27-21=6 (6)2=36 18-21=-3 (-3)2=9 21-21=0 (0)2=0 17-21=-4 (-4)2=16 Σ( - )2 =62

s22= Σ( - )2 = 62 = 155 varianza de la muestra

n-1 5-1

Meacutetodo de capacitacioacuten 3 Media muestral =19

Estimacioacuten de la varianza dentro de columnas

- ( - )2 18-19=-1 (-1)2=1 24-19=5 (5)2=25 19-19=0 (0)2=0 16-19=-3 (-3)2=9 22-19=3 (-32=9 15-19=-4 (-4)2=16 Σ( - )2 =60

Estadiacutestica Administrativa II 13

s23= Σ( - )2 = 60 = 120 varianza de la muestra

n-1 6-1

σ2w = Σ nj - 1 s2

j = (413)(175) + (413)(155) + (513)(120) = 193 = 14769 nt - k 13

Estadiacutestico F

F = varianza entre columnas = σ2b

Varianza dentro de columnas σ2w

F= 20 = 1354 cociente F 14769

Determinacioacuten de los grados de libertad

Grados de libertad del numerador

Nuacutemero de grados de libertad en el numerador del cociente F

= (nuacutemero de muestras-1)

Grados de libertad del denominador

Nuacutemero de grados de libertad en el denominador del cociente F

= Σ (nj-1)= nt-k

Graacutefica

Se acepta la hipoacutetesis nula

Regioacuten de aceptacioacuten

F= 1354

005 del aacuterea

Distribucioacuten f

381

Valor de tabla

Regioacuten de rechazo

Estadiacutestica Administrativa II 14

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

11-5 479 11-6 479

11-26 480 11-27 480 11-28 480 11-29 480 11-30 480

152 Inferencia sobre una varianza de poblacioacuten (Anova)

Estadiacutestico ji- cuadrada para inferencias sobre una varianza

X2=(n-1)s2 σ2

Intervalo de confianza para σ2

Liacutemite inferior de confianza

σ2L=(n-1)s2 X2

U Liacutemite superior de confianza

σ2U=(n-1)s2 X2

L

Estadiacutestica Administrativa II 15

Ejercicio

Con los siguientes datos obtener el estadiacutestico ji- cuadrada Y el intervalo de

confianza del 95

Tiempo x

50 45 27 66 43 96 45 90 69

153 Inferencia sobre la varianza de dos poblaciones (Anova) Ademaacutes de comparar la varianza de dos poblaciones el principal objetivo de este tema es analizar el cociente que se obtiene al aplicar la foacutermula correspondiente

Coeficiente F para inferencias acerca de dos varianzas

F=S21

S22

Estadiacutestica Administrativa II 16

Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple

21 Estimacioacuten mediante la liacutenea de regresioacuten El anaacutelisis de regresioacuten y correlacioacuten permiten determinar tanto la naturaleza como la fuerza de una relacioacuten entre dos variables En el anaacutelisis de regresioacuten se desarrollaraacute una ecuacioacuten de estimacioacuten a traveacutes de una foacutermula matemaacutetica que relaciona las variables conocidas con la variable desconocida La variable conocida- variable independiente X La variable que tratamos de predecir se llama variable dependiente Y

Figura 2 Fuente (Levin 2004511) 211 Diagrama de dispersioacuten El primer paso para determinar si existe una relacioacuten entre dos variables es examinar la graacutefica de datos observados A esta graacutefica se le llama diagrama de dispersioacuten Un diagrama de dispersioacuten se puede identificar visualmente patrones que indique si las variables estaacuten relacionadas

X

Y

Gastos contra la contaminacioacuten

Emisor de

contaminacioacuten

Pendiente negativa

b) Relacioacuten directa

X

Y

Publicidad

Ventas

Pendiente positiva

a) Relacioacuten directa

Estadiacutestica Administrativa II 17

Figura 3 Fuente (Levin 2004503)

212 Meacutetodo de miacutenimos cuadrados

Liacutenea de estimacioacuten

Y= a+bx Y= variable dependiente a=variable ordenada y b=pendiente de la recta x=variable independiente

Pendiente de la recta de regresioacuten de mejor ajuste

b = Σ XY - n X Y Σ X2 - n X2

b=pendiente de la liacutenea de estimacioacuten de mejor ajuste X= valores de la variable independiente Y= variable valores de la variable dependiente X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente n= nuacutemero de puntos

Estadiacutestica Administrativa II 18

Liacutenea de estimacioacuten

a = Y - bX a= ordenada Y b= pendiente de la ecuacioacuten X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente

Error estaacutendar de la estimacioacuten

Se= Σ(Y-Y)2

n-2 Y= valores de la variable dependiente Y=valores estimados con la ecuacioacuten de estimacioacuten que corresponden a cada valor de Y n= nuacutemero de puntos utilizados para ajustar la liacutenea de regresioacuten Para medir la confiabilidad de la ecuacioacuten de estimacioacuten los especialistas en estadiacutestica han desarrollado el error estaacutendar de estimacioacuten Este error estaacutendar se simboliza por Se y es similar a la desviacioacuten estaacutendar en cuanto a que ambas son medidas de dispersioacuten El error estaacutendar de la estimacioacuten por otra parte mide la variabilidad o dispersioacuten de los valores observados alrededor de la recta de regresioacuten 213 Interpretacioacuten del error estaacutendar de la estimacioacuten Como ocurririacutea en el caso de la desviacioacuten estaacutendar mientras maacutes grande sea el error estaacutendar de la estimacioacuten mayor seraacute la dispersioacuten de los puntos alrededor de la liacutenea de regresioacuten De manera inversa si Se= 0 esperamos que la ecuacioacuten de estimacioacuten sea un estimador ldquoperfectordquo de la variable dependiente En este caso todos los puntos caeriacutean directamente sobre la liacutenea de regresioacuten y no habriacutea puntos dispersos alrededor Usaremos el error estaacutendar de la estimacioacuten como una herramienta de la misma forma que podemos usar la desviacioacuten estaacutendar Esto es suponiendo que los puntos observados siguen una distribucioacuten normal alrededor de la recta de regresioacuten podemos esperar encontrar el 68 de los puntos dentro de plusmn1Se el 955 de los puntos dentro de plusmn2Se y el 997 de los puntos dentro de plusmn3Se

Estadiacutestica Administrativa II 19

Figura 4 Fuente (Levin 2004529)

Debemos observar que el error estaacutendar de la estimacioacuten se mide a lo largo del eje Y y no perpendicularmente desde la recta de regresioacuten 214 Intervalos de prediccioacuten aproximados Podemos concebir al error estaacutendar de la estimacioacuten como una herramienta estadiacutestica que podemos usar para hacer afirmaciones de probabilidad acerca del intervalo alrededor del valor estimado de Y dentro del cual cae el valor real de Y Ejemplo

Y= 375 + 075 X Sustituyendo 4 en X

Y= 375 + 075 (4) = 375 + 300

= 675

Estadiacutestica Administrativa II 20

Intervalo 1 error 2 errores 3 errores

Y plusmn1 Se

Y plusmn2 Se

Y plusmn3 Se

En donde Se = 8660

Sustitucioacuten

Ejemplo A menudo quienes hacen la contabilidad de costos estiman los gastos generales con base en el nivel de produccioacuten Se ha reunido informacioacuten acerca de los gastos generales y las unidades producidas en diferentes plantas y ahora desean estimar una ecuacioacuten de regresioacuten para predecir los gastos generales futuros Gastos generales 191 170 272 155 280 173 234 116 153 178 Unidades 40 42 53 35 56 39 48 30 37 40

a) Determine la variable dependiente e independiente b) Desarrolle una ecuacioacuten de regresioacuten para contabilidad de costos c) Pronostique los gastos generales cuando se producen 50 unidades d) Calcule el error estaacutendar de estimacioacuten

Y +1 Se =

675 + (1) (8660) = 76140 Liacutemite superior del intervalo de prediccioacuten

Y +2 Se =

675 + (2) (8660) = 84820 Liacutemite superior del intervalo de prediccioacuten

Y -1 Se =

675 - (1) (8660) = 58840 Liacutemite inferior del intervalo de prediccioacuten

Y - 2 Se =

675 - (2) (8660) = 50180 Liacutemite inferior del intervalo de prediccioacuten

Estadiacutestica Administrativa II 21

X Y XY X2 Y2 40 191 7640 1600 36481 42 170 7140 1764 28900 53 272 14416 2809 73984 35 155 5425 1225 24025 56 280 15680 3136 78400 39 173 6747 1521 29929 48 234 11232 2304 54756 30 116 3480 900 13456 37 153 5661 1369 23409 40 178 7120 1600 31684 ΣX= 420 ΣY= 1922 ΣXY= 84541 ΣX2= 18228 ΣY2= 395024

b = Σ XY - n X Y = 84541 - 10(42)(1922) = 64915 Σ X2 - n X2 18228 - 10(42)2 a = Y ndash bX = 1922 ndash 64915 (42) = - 804430 Y= a+bx = -804430 + 64915 (50) = 2441320 Se= ΣY2 ndashaΣY ndash b ΣXY = n-2 Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

12-2 531 12-3 531

12-13 531 12-14 531 12-15 531

Estadiacutestica Administrativa II 22

215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten

Coeficiente de determinacioacuten de la muestra

r2= aΣY+bΣXY-nY2

ΣY2 ndash n Y2

Coeficiente de correlacioacuten de la muestra

r= r2

Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten

Estadiacutestica Administrativa II 23

Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables

Y= a + b1 X1 + b2 X2

Ecuacioacuten

na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2

1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2

2 = Σ X2Y

Ejemplo

a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10

Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784

Sumatoria

114 105 85 2463 1590 1435 2367 1571

Matriz

6 105 85 114 105 2367 1435 2463 85 1435 1571 1590

1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25

1 175 14167 19 0 1 -099 884 0 0 361608 21410

361608 b2 = 21410 b2 = 21410 361608 b2 = 059

Estadiacutestica Administrativa II 24

1 b1 -099 b2 = 884 1 b1 -099 (059) = 884

-006 884 1b1 = 884 +006 b1 = 890

1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a

= 2589

Y= a + b1 X1 + b2 X2

y=2589+890(28)+059(10)=28099

Estadiacutestica Administrativa II 25

218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)

Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad

La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos

Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir

donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria

Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados

Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante

Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo

Estadiacutestica Administrativa II 26

Figura 5 Distribucioacuten Homocedaacutestica

Figura 6 Distribucioacuten Heterocedaacutestica

Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten

lineal para hacer estimaciones futuras

Estadiacutestica Administrativa II 27

Unidad 3 Nuacutemeros iacutendice

Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se

calcula encontrando el cociente del valor actual entre el valor base luego se

multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje

Tipos de nuacutemeros iacutendice

Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de

cantidad e iacutendice de valor

Iacutendice de precios

Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida

Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo

Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable

El iacutendice de valor combina los cambios de precio y cantidad para presentar un

iacutendice con maacutes informacioacuten

Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos

como indicadores generales de la condicioacuten econoacutemica de un paiacutes

Factores que pueden distorsionar los nuacutemeros iacutendice

bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados

bull Falta de comparacioacuten de iacutendices

bull Ponderacioacuten no apropiada de los factores

bull Seleccioacuten de una base no apropiada

Estadiacutestica Administrativa II 28

31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores

Iacutendice de cantidad de agregados no ponderados

ΣQi x 100 ΣQo

Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea

1993 1994 1995

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200

Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado

1993 Qo

1994 Q1

1995 Q2

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308

Estadiacutestica Administrativa II 29

Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra

Iacutendice de precios de agregados ponderados

ΣPiQ x 100 ΣPoQ

Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100

Cambio de periodo base

I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base

Estadiacutestica Administrativa II 30

35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos

Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables

Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico

Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios

El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)

Estadiacutestica Administrativa II 31

Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica

37 Deflacioacuten de los valores de series de tiempo

Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios

En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea

La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores

Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero

Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes

Los valores expresados en unidades monetarias corrientes se conocen como valores nominales

Los valores expresados en unidades monetarias constantes se conocen como valores reales

Estadiacutestica Administrativa II 32

38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor

Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos

39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)

Estadiacutestica Administrativa II 33

Siacutembolo Nombre de la compantildeiacutea

AA Alcoa

ALD Allied Signal

AXP American Express

BA Boeing

CAT Caterpillar

CHV Chevron

C CitiGroup

DIS Disney

DD Dupont

EK Eastman Kodak

GE General Electric

GM General Motors

GT Goodyear Tire

HWP Hewlett-Packard

IBM International Business Machines

IP International Paper

JNJ Johnson amp Johnson

JPM JP Morgan Bank

KO Coca Cola

Figura 5 Compantildeiacuteas comprendidas en el Dow Jones

310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos

Praacutectica 2

992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico

elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado

de precios

Estadiacutestica Administrativa II 34

Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida

bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)

42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten

Las principales pruebas no parameacutetricas son las siguientes

bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher

Estadiacutestica Administrativa II 35

bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon

Caracteriacutesticas de algunas pruebas no parameacutetricas

1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos

2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten

3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal

4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados

5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc

6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica

Prueba Caracteriacutestica

Mann- Whitney 2 muestras independientes

Wilcoxon 2 muestras asociadas

Kruskal-Wallis + de 2 muestras independientes

Friedman + de 2 muestras asociadas

Tabla1 Caracteriacutesticas de pruebas no parameacutetricas

Estadiacutestica Administrativa II 36

Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media

Ventajas y desventajas de los meacutetodos parameacutetricos

Desventajas Ventajas bull Ignoran cierta cantidad de

informacioacuten bull No requieren la suposicioacuten de que

una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica

bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas

bull Generalmente es maacutes sencillo realizarlas y entenderlas

bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal

Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo

MHHHHM

1ra 2ra 3ra

Estadiacutestica Administrativa II 37

Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1

n2= nuacutemero de ocurrencias del tipo 2

r= nuacutemero de corridas

4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue

BABBBAAABBABBBBAAAABABAABBBAABAAAABBA

BBAAAABBABBBBAABBABAABB

Valores de la prueba

n1= 29

n2= 31

r= 29

4322 Distribucioacuten de muestreo del estadiacutestico r

El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba

Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente

Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1

n1+n2

Estadiacutestica Administrativa II 38

μr = 2(29)(31) +1

29+31

μr = 1798 +1 60

μr = 2997 +1

μr = 3097

Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)

(n1+n2)2(n1+n2-1)

σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)

σr= (1798) (1738)

(60)2(59)

σr= 1471

σr= 384

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-24 643 14-25 643 14-26 643 14-27 644 14-28 644

Estadiacutestica Administrativa II 39

44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica

Ejemplo

Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado

Miembro del panel Calificacioacuten para

conferencias grandes

Calificacioacuten para

sesiones pequentildeas

Signo de la calificacioacuten

Evaluacioacuten de los dos tipos de

clases

1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -

6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +

La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)

Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20

Estadiacutestica Administrativa II 40

Establecimiento de las hipoacutetesis

Ho p = 05

H1 p ne 05

Se consideran la posibilidades solamente de signos + y - (9+6 =15)

p Ho = 05

q H0 = 05

n= 15

p= 0600 (915)

q= 0400 (615)

Prueba de hipoacutetesis de que no hay diferencia

Error estaacutendar del la proporcioacuten

σp= pq n

σp= (05)(05) 15

σp= 0129

0025

0

0475 del aacuterea

Valor criacutetico Z=-196

Regioacuten de aceptacioacuten

0025

0475 del aacuterea

Valor criacutetico Z=196

Estadiacutestica Administrativa II 41

45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten

Procedimiento de la prueba de rangos con signo de Wilcoxon

Paso1 Para cada par de datos calcule la diferencia d restando el segundo

valor del primero Guarde los signos pero descarte cualquier par para el que

d=0

Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de

la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango

correspondiente Cuando las diferencias tengan el mismo valor numeacuterico

asiacutegneles la media de los rangos implicados en el empate

Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino

Esto es inserte aquellos signos que se ignoraron e el paso dos

Paso 4 Calcule la suma de los valores absolutos de los rangos negativos

Tambieacuten la suma de los rangos positivos

Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon

en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el

procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos

sumas

Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la

diferencia d no es 0

Estadiacutestica Administrativa II 42

Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el

tamantildeo muestral

Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos

muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica

esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico

Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente

2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha

Notacioacuten

T= la maacutes pequentildea de las siguientes dos sumas

1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0

La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T

Estadiacutestica Administrativa II 43

46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2

Rango Calificacioacuten Plantel

1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S

10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S

Estadiacutestica Administrativa II 44

30 1600 S

Estadiacutestica Administrativa II 45

Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500

n1= 15 n2= 15 R1= 247 R2= 218

Estadiacutestico U

U = n1n2 + n1(n1 +1) -R1 2

U= (15)(15) + (15)(16) -247 2

U= 225+120-247

U= 98

Media de la distribucioacuten muestral U

μu = n1n2

2

μu = (15)(15)

2

μu =1125

Estadiacutestica Administrativa II 46

Estadiacutestico U

σU = n1n2 + (n1n2 +1)

12

σU = (15)(15)(15+15+1)

12

σU = 6975 12

σU = 58125

σU = 241

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2

α= 015

Estandarizacioacuten del estadiacutestico U

z = U-μu

σU

z = 98 - 1125 241

z = -0602

144 -144 0 -0602

Valor estandarizado de

la muestra U

Regioacuten de aceptacioacuten

Estadiacutestica Administrativa II 47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras

Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular

Prueba de Wilcoxon de los rangos con signo

Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero

Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande

Prueba de Wilcoxon para contrastar datos pareados

El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 11: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

Estadiacutestica Administrativa II 7

Tabla de contingencia Nuacutemero de

renglones Nuacutemero de columnas

r-1 c-1 Grados de libertad (r-1)(c-1)

A 3 4 3-1=2 4-1=3 (2)(3)=6 B 5 7 5-1=4 7-1=6 (4)(6)=24 C 6 9 6-1=5 9-1=8 (5)(8)=40

El presidente de una compantildeiacutea de seguros de salud se opone al seguro nacional Argumenta que su implementacioacuten seriacutea muy costosa en particular debido a que la existencia de este sistema tenderiacutea a fomentar permanencias hospitalarias maacutes prolongadas ademaacutes de otros efectos El presidente piensa que el tiempo de hospitalizacioacuten depende del tipo de seguro de salud que tengan las personas Los siguientes datos se obtuvieron de una muestra aleatoria de 660 hospitalizaciones Diacuteas en el hospital lt5 5-10 gt10 Total Datos de hospitalizaciones Calificados seguacuten el tipo de cobertura del seguro y el tiempo de estancia

Fraccioacuten de costos cubiertos por el seguro

lt25 40 75 65 180 25 -50 30 45 75 150

gt50 40 100 190 330

Total 110 220 330 660

Planteamiento del problema

Hipoacutetesis nula Ho el tiempo de estancia y tipo de seguro son independientes

Hipoacutetesis alternativa

Hi el tiempo de estancia depende del tipo de seguro

α= 001 nivel de significancia para probar la hipoacutetesis Frecuencia esperada para cualquier celda

Calculo de la frecuencia esperada fe= RT X CT n

fe= frecuencia esperada en una celda dada RT= total por rengloacuten para el rengloacuten que contiene esa celda CT= total por columna para la columna que contiene esa celda n= nuacutemero total de observaciones

Estadiacutestica Administrativa II 8

Estadiacutestico ji- cuadrada

fo= frecuencia observada fe= frecuencia esperada

x2 = Σ(fo-fe)2

fe

Rengloacuten Columna fo fe = RT X CT n

fo-fe (fo-fe)2 (fo-fe)2

fe Calculo de las frecuencias esperadas y ji- cuadrada

1 1 40 30 180 X 110 660

10 100 3333

1 2 75 60 180 X 220 660

15 225 3750

1 3 65 90 180 X 330 660

-25 625 6944

2 1 30 25 150 X 110 660

5 25 1000

2 2 45 50 150 X 220 660

-5 25 0500

2 3 75 75 150 X 330 660

0 0 0000

3 1 40 55 330 X 110 660

-15 225 4091

3 2 100 110 330 X 220 660

-10 100 0909

3 3 190 165 330 X 330 660

25 625 3788

X2=24315

Buscar en tablas x2 4grados de libertad con un nivel de significancia de 10 y graficar Interpretacioacuten de resultados

Regioacuten de aceptacioacuten

x2= 24315

010 del aacuterea

Distribucioacuten x2

13277

Valor de tabla

Regioacuten de rechazo

Estadiacutestica Administrativa II 9

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

11-1 459 11-2 460 11-7 460 11-8 460 11-9 460

11-10 460 11-11 461 11-12 461 11-13 461

15 Anaacutelisis de varianza

El anaacutelisis de varianza nos permite probar si maacutes de dos medias de poblacioacuten pueden considerarse iguales A menudo se abrevia ANOVA analysis of variance ANOVA Es un meacutetodo de prueba de igualdad de tres o maacutes medias poblacionales1

Hipoacutetesis nula tiacutepica

HO= μ1= μ2= μ3

El meacutetodo ANOVA nos sirve para evitar el error tipo I (rechazar una hipoacutetesis nula verdadera) si utilizamos una prueba de igualdad de varias medias

151 Aplicaciones de ANOVA Se utiliza cuando Se asevera que los supermercados colocan los cereales con alto contenido de azuacutecar en estantes que estaacuten a la altura De los ojos de los nintildeos de manera que eso nos permite probar la aseveracioacuten de que los cereales en los estantes tienen el mismo contenido de azuacutecar

1 Mario F Triola Estadiacutestica Pearson Meacutexico2006

Estadiacutestica Administrativa II 10

Tambieacuten en casos como la comparacioacuten del kilometraje logrado por cinco clases diferentes de gasolina la prueba de cuaacutel de cuatro meacutetodos de capacitacioacuten produce el aprendizaje maacutes raacutepido etc Los meacutetodos de ANOVA requieren de la distribucioacuten F Propiedades de la distribucioacuten F

1 Es no simeacutetrica se sesga hacia la derecha 2 Los valores F son 0 o positivo pero no negativos 3 Hay una distribucioacuten F para cada par de grados de libertad para el

numerador y el denominador

Figura 1 Fuente (Triola 2006605) Ejemplo

Muestra 1 15 18 19 22 11

Muestra 2 22 27 18 21 17

Muestra 3 18 24 19 16 22 15

Planteamiento de la hipoacutetesis

Ho μ1= μ2= μ3

H1 μ1 μ2 y μ3 no son todas iguales

Estadiacutestica Administrativa II 11

Caacutelculo de la media

Meacutetodo 1 Meacutetodo 2 Meacutetodo 3 Produccioacuten diaria 15 22 18

18 27 24 19 18 19 22 21 16 11 17 22

15 85 105 114 Sumatoria divide5 divide5 divide6 Tamantildeo de

la muestra 17 21 19 Media

muestral n1=5 n2=5 n3=6

1= 17 2= 21 3= 19

Caacutelculo de la gran media

= 15 +18+ 19+ 22+ 11+22 +27+ 18+ 21+ 17+18 +24+ 19+ 16+ 22+ 15 = 19 16

Caacutelculo de la varianza entre columnas

σ2b = Σnj ( - )2 = k-1

n - ( - )2 n( - ) Caacutelculo de la varianza entre columnas

5 17 19 17-19=-2 (-2)2=4 5x4=20 5 21 19 21-19=2 (2)2=4 5x4=20 6 19 19 19-19=0 (0)2=0 6x0 = 0 Σnj( - )

2 =40

σ2b = Σnj ( - )2 = 40= 40 = 20 varianza entre columnas

k-1 3-1 2

Estadiacutestica Administrativa II 12

Estimacioacuten de la varianza dentro de columnas

Meacutetodo de capacitacioacuten 1 Media muestral =17

Estimacioacuten de la varianza dentro de columnas

- ( - )2 15-17=-2 (-2)2=4 18-17=1 (1)2=1 19-17=2 (2)2=4 22-17=5 (5)2=25 11-17=-6 (-6)2=36 Σ( - )2 =70

s21= Σ( - )2 = 70 = 175 varianza de la muestra

n-1 5-1

Meacutetodo de capacitacioacuten 2 Media muestral =21

Estimacioacuten de la varianza dentro de columnas

- ( - )2 22-21=1 (1)2=1 27-21=6 (6)2=36 18-21=-3 (-3)2=9 21-21=0 (0)2=0 17-21=-4 (-4)2=16 Σ( - )2 =62

s22= Σ( - )2 = 62 = 155 varianza de la muestra

n-1 5-1

Meacutetodo de capacitacioacuten 3 Media muestral =19

Estimacioacuten de la varianza dentro de columnas

- ( - )2 18-19=-1 (-1)2=1 24-19=5 (5)2=25 19-19=0 (0)2=0 16-19=-3 (-3)2=9 22-19=3 (-32=9 15-19=-4 (-4)2=16 Σ( - )2 =60

Estadiacutestica Administrativa II 13

s23= Σ( - )2 = 60 = 120 varianza de la muestra

n-1 6-1

σ2w = Σ nj - 1 s2

j = (413)(175) + (413)(155) + (513)(120) = 193 = 14769 nt - k 13

Estadiacutestico F

F = varianza entre columnas = σ2b

Varianza dentro de columnas σ2w

F= 20 = 1354 cociente F 14769

Determinacioacuten de los grados de libertad

Grados de libertad del numerador

Nuacutemero de grados de libertad en el numerador del cociente F

= (nuacutemero de muestras-1)

Grados de libertad del denominador

Nuacutemero de grados de libertad en el denominador del cociente F

= Σ (nj-1)= nt-k

Graacutefica

Se acepta la hipoacutetesis nula

Regioacuten de aceptacioacuten

F= 1354

005 del aacuterea

Distribucioacuten f

381

Valor de tabla

Regioacuten de rechazo

Estadiacutestica Administrativa II 14

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

11-5 479 11-6 479

11-26 480 11-27 480 11-28 480 11-29 480 11-30 480

152 Inferencia sobre una varianza de poblacioacuten (Anova)

Estadiacutestico ji- cuadrada para inferencias sobre una varianza

X2=(n-1)s2 σ2

Intervalo de confianza para σ2

Liacutemite inferior de confianza

σ2L=(n-1)s2 X2

U Liacutemite superior de confianza

σ2U=(n-1)s2 X2

L

Estadiacutestica Administrativa II 15

Ejercicio

Con los siguientes datos obtener el estadiacutestico ji- cuadrada Y el intervalo de

confianza del 95

Tiempo x

50 45 27 66 43 96 45 90 69

153 Inferencia sobre la varianza de dos poblaciones (Anova) Ademaacutes de comparar la varianza de dos poblaciones el principal objetivo de este tema es analizar el cociente que se obtiene al aplicar la foacutermula correspondiente

Coeficiente F para inferencias acerca de dos varianzas

F=S21

S22

Estadiacutestica Administrativa II 16

Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple

21 Estimacioacuten mediante la liacutenea de regresioacuten El anaacutelisis de regresioacuten y correlacioacuten permiten determinar tanto la naturaleza como la fuerza de una relacioacuten entre dos variables En el anaacutelisis de regresioacuten se desarrollaraacute una ecuacioacuten de estimacioacuten a traveacutes de una foacutermula matemaacutetica que relaciona las variables conocidas con la variable desconocida La variable conocida- variable independiente X La variable que tratamos de predecir se llama variable dependiente Y

Figura 2 Fuente (Levin 2004511) 211 Diagrama de dispersioacuten El primer paso para determinar si existe una relacioacuten entre dos variables es examinar la graacutefica de datos observados A esta graacutefica se le llama diagrama de dispersioacuten Un diagrama de dispersioacuten se puede identificar visualmente patrones que indique si las variables estaacuten relacionadas

X

Y

Gastos contra la contaminacioacuten

Emisor de

contaminacioacuten

Pendiente negativa

b) Relacioacuten directa

X

Y

Publicidad

Ventas

Pendiente positiva

a) Relacioacuten directa

Estadiacutestica Administrativa II 17

Figura 3 Fuente (Levin 2004503)

212 Meacutetodo de miacutenimos cuadrados

Liacutenea de estimacioacuten

Y= a+bx Y= variable dependiente a=variable ordenada y b=pendiente de la recta x=variable independiente

Pendiente de la recta de regresioacuten de mejor ajuste

b = Σ XY - n X Y Σ X2 - n X2

b=pendiente de la liacutenea de estimacioacuten de mejor ajuste X= valores de la variable independiente Y= variable valores de la variable dependiente X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente n= nuacutemero de puntos

Estadiacutestica Administrativa II 18

Liacutenea de estimacioacuten

a = Y - bX a= ordenada Y b= pendiente de la ecuacioacuten X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente

Error estaacutendar de la estimacioacuten

Se= Σ(Y-Y)2

n-2 Y= valores de la variable dependiente Y=valores estimados con la ecuacioacuten de estimacioacuten que corresponden a cada valor de Y n= nuacutemero de puntos utilizados para ajustar la liacutenea de regresioacuten Para medir la confiabilidad de la ecuacioacuten de estimacioacuten los especialistas en estadiacutestica han desarrollado el error estaacutendar de estimacioacuten Este error estaacutendar se simboliza por Se y es similar a la desviacioacuten estaacutendar en cuanto a que ambas son medidas de dispersioacuten El error estaacutendar de la estimacioacuten por otra parte mide la variabilidad o dispersioacuten de los valores observados alrededor de la recta de regresioacuten 213 Interpretacioacuten del error estaacutendar de la estimacioacuten Como ocurririacutea en el caso de la desviacioacuten estaacutendar mientras maacutes grande sea el error estaacutendar de la estimacioacuten mayor seraacute la dispersioacuten de los puntos alrededor de la liacutenea de regresioacuten De manera inversa si Se= 0 esperamos que la ecuacioacuten de estimacioacuten sea un estimador ldquoperfectordquo de la variable dependiente En este caso todos los puntos caeriacutean directamente sobre la liacutenea de regresioacuten y no habriacutea puntos dispersos alrededor Usaremos el error estaacutendar de la estimacioacuten como una herramienta de la misma forma que podemos usar la desviacioacuten estaacutendar Esto es suponiendo que los puntos observados siguen una distribucioacuten normal alrededor de la recta de regresioacuten podemos esperar encontrar el 68 de los puntos dentro de plusmn1Se el 955 de los puntos dentro de plusmn2Se y el 997 de los puntos dentro de plusmn3Se

Estadiacutestica Administrativa II 19

Figura 4 Fuente (Levin 2004529)

Debemos observar que el error estaacutendar de la estimacioacuten se mide a lo largo del eje Y y no perpendicularmente desde la recta de regresioacuten 214 Intervalos de prediccioacuten aproximados Podemos concebir al error estaacutendar de la estimacioacuten como una herramienta estadiacutestica que podemos usar para hacer afirmaciones de probabilidad acerca del intervalo alrededor del valor estimado de Y dentro del cual cae el valor real de Y Ejemplo

Y= 375 + 075 X Sustituyendo 4 en X

Y= 375 + 075 (4) = 375 + 300

= 675

Estadiacutestica Administrativa II 20

Intervalo 1 error 2 errores 3 errores

Y plusmn1 Se

Y plusmn2 Se

Y plusmn3 Se

En donde Se = 8660

Sustitucioacuten

Ejemplo A menudo quienes hacen la contabilidad de costos estiman los gastos generales con base en el nivel de produccioacuten Se ha reunido informacioacuten acerca de los gastos generales y las unidades producidas en diferentes plantas y ahora desean estimar una ecuacioacuten de regresioacuten para predecir los gastos generales futuros Gastos generales 191 170 272 155 280 173 234 116 153 178 Unidades 40 42 53 35 56 39 48 30 37 40

a) Determine la variable dependiente e independiente b) Desarrolle una ecuacioacuten de regresioacuten para contabilidad de costos c) Pronostique los gastos generales cuando se producen 50 unidades d) Calcule el error estaacutendar de estimacioacuten

Y +1 Se =

675 + (1) (8660) = 76140 Liacutemite superior del intervalo de prediccioacuten

Y +2 Se =

675 + (2) (8660) = 84820 Liacutemite superior del intervalo de prediccioacuten

Y -1 Se =

675 - (1) (8660) = 58840 Liacutemite inferior del intervalo de prediccioacuten

Y - 2 Se =

675 - (2) (8660) = 50180 Liacutemite inferior del intervalo de prediccioacuten

Estadiacutestica Administrativa II 21

X Y XY X2 Y2 40 191 7640 1600 36481 42 170 7140 1764 28900 53 272 14416 2809 73984 35 155 5425 1225 24025 56 280 15680 3136 78400 39 173 6747 1521 29929 48 234 11232 2304 54756 30 116 3480 900 13456 37 153 5661 1369 23409 40 178 7120 1600 31684 ΣX= 420 ΣY= 1922 ΣXY= 84541 ΣX2= 18228 ΣY2= 395024

b = Σ XY - n X Y = 84541 - 10(42)(1922) = 64915 Σ X2 - n X2 18228 - 10(42)2 a = Y ndash bX = 1922 ndash 64915 (42) = - 804430 Y= a+bx = -804430 + 64915 (50) = 2441320 Se= ΣY2 ndashaΣY ndash b ΣXY = n-2 Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

12-2 531 12-3 531

12-13 531 12-14 531 12-15 531

Estadiacutestica Administrativa II 22

215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten

Coeficiente de determinacioacuten de la muestra

r2= aΣY+bΣXY-nY2

ΣY2 ndash n Y2

Coeficiente de correlacioacuten de la muestra

r= r2

Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten

Estadiacutestica Administrativa II 23

Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables

Y= a + b1 X1 + b2 X2

Ecuacioacuten

na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2

1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2

2 = Σ X2Y

Ejemplo

a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10

Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784

Sumatoria

114 105 85 2463 1590 1435 2367 1571

Matriz

6 105 85 114 105 2367 1435 2463 85 1435 1571 1590

1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25

1 175 14167 19 0 1 -099 884 0 0 361608 21410

361608 b2 = 21410 b2 = 21410 361608 b2 = 059

Estadiacutestica Administrativa II 24

1 b1 -099 b2 = 884 1 b1 -099 (059) = 884

-006 884 1b1 = 884 +006 b1 = 890

1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a

= 2589

Y= a + b1 X1 + b2 X2

y=2589+890(28)+059(10)=28099

Estadiacutestica Administrativa II 25

218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)

Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad

La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos

Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir

donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria

Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados

Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante

Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo

Estadiacutestica Administrativa II 26

Figura 5 Distribucioacuten Homocedaacutestica

Figura 6 Distribucioacuten Heterocedaacutestica

Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten

lineal para hacer estimaciones futuras

Estadiacutestica Administrativa II 27

Unidad 3 Nuacutemeros iacutendice

Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se

calcula encontrando el cociente del valor actual entre el valor base luego se

multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje

Tipos de nuacutemeros iacutendice

Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de

cantidad e iacutendice de valor

Iacutendice de precios

Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida

Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo

Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable

El iacutendice de valor combina los cambios de precio y cantidad para presentar un

iacutendice con maacutes informacioacuten

Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos

como indicadores generales de la condicioacuten econoacutemica de un paiacutes

Factores que pueden distorsionar los nuacutemeros iacutendice

bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados

bull Falta de comparacioacuten de iacutendices

bull Ponderacioacuten no apropiada de los factores

bull Seleccioacuten de una base no apropiada

Estadiacutestica Administrativa II 28

31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores

Iacutendice de cantidad de agregados no ponderados

ΣQi x 100 ΣQo

Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea

1993 1994 1995

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200

Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado

1993 Qo

1994 Q1

1995 Q2

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308

Estadiacutestica Administrativa II 29

Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra

Iacutendice de precios de agregados ponderados

ΣPiQ x 100 ΣPoQ

Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100

Cambio de periodo base

I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base

Estadiacutestica Administrativa II 30

35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos

Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables

Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico

Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios

El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)

Estadiacutestica Administrativa II 31

Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica

37 Deflacioacuten de los valores de series de tiempo

Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios

En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea

La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores

Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero

Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes

Los valores expresados en unidades monetarias corrientes se conocen como valores nominales

Los valores expresados en unidades monetarias constantes se conocen como valores reales

Estadiacutestica Administrativa II 32

38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor

Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos

39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)

Estadiacutestica Administrativa II 33

Siacutembolo Nombre de la compantildeiacutea

AA Alcoa

ALD Allied Signal

AXP American Express

BA Boeing

CAT Caterpillar

CHV Chevron

C CitiGroup

DIS Disney

DD Dupont

EK Eastman Kodak

GE General Electric

GM General Motors

GT Goodyear Tire

HWP Hewlett-Packard

IBM International Business Machines

IP International Paper

JNJ Johnson amp Johnson

JPM JP Morgan Bank

KO Coca Cola

Figura 5 Compantildeiacuteas comprendidas en el Dow Jones

310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos

Praacutectica 2

992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico

elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado

de precios

Estadiacutestica Administrativa II 34

Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida

bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)

42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten

Las principales pruebas no parameacutetricas son las siguientes

bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher

Estadiacutestica Administrativa II 35

bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon

Caracteriacutesticas de algunas pruebas no parameacutetricas

1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos

2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten

3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal

4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados

5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc

6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica

Prueba Caracteriacutestica

Mann- Whitney 2 muestras independientes

Wilcoxon 2 muestras asociadas

Kruskal-Wallis + de 2 muestras independientes

Friedman + de 2 muestras asociadas

Tabla1 Caracteriacutesticas de pruebas no parameacutetricas

Estadiacutestica Administrativa II 36

Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media

Ventajas y desventajas de los meacutetodos parameacutetricos

Desventajas Ventajas bull Ignoran cierta cantidad de

informacioacuten bull No requieren la suposicioacuten de que

una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica

bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas

bull Generalmente es maacutes sencillo realizarlas y entenderlas

bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal

Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo

MHHHHM

1ra 2ra 3ra

Estadiacutestica Administrativa II 37

Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1

n2= nuacutemero de ocurrencias del tipo 2

r= nuacutemero de corridas

4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue

BABBBAAABBABBBBAAAABABAABBBAABAAAABBA

BBAAAABBABBBBAABBABAABB

Valores de la prueba

n1= 29

n2= 31

r= 29

4322 Distribucioacuten de muestreo del estadiacutestico r

El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba

Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente

Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1

n1+n2

Estadiacutestica Administrativa II 38

μr = 2(29)(31) +1

29+31

μr = 1798 +1 60

μr = 2997 +1

μr = 3097

Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)

(n1+n2)2(n1+n2-1)

σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)

σr= (1798) (1738)

(60)2(59)

σr= 1471

σr= 384

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-24 643 14-25 643 14-26 643 14-27 644 14-28 644

Estadiacutestica Administrativa II 39

44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica

Ejemplo

Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado

Miembro del panel Calificacioacuten para

conferencias grandes

Calificacioacuten para

sesiones pequentildeas

Signo de la calificacioacuten

Evaluacioacuten de los dos tipos de

clases

1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -

6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +

La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)

Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20

Estadiacutestica Administrativa II 40

Establecimiento de las hipoacutetesis

Ho p = 05

H1 p ne 05

Se consideran la posibilidades solamente de signos + y - (9+6 =15)

p Ho = 05

q H0 = 05

n= 15

p= 0600 (915)

q= 0400 (615)

Prueba de hipoacutetesis de que no hay diferencia

Error estaacutendar del la proporcioacuten

σp= pq n

σp= (05)(05) 15

σp= 0129

0025

0

0475 del aacuterea

Valor criacutetico Z=-196

Regioacuten de aceptacioacuten

0025

0475 del aacuterea

Valor criacutetico Z=196

Estadiacutestica Administrativa II 41

45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten

Procedimiento de la prueba de rangos con signo de Wilcoxon

Paso1 Para cada par de datos calcule la diferencia d restando el segundo

valor del primero Guarde los signos pero descarte cualquier par para el que

d=0

Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de

la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango

correspondiente Cuando las diferencias tengan el mismo valor numeacuterico

asiacutegneles la media de los rangos implicados en el empate

Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino

Esto es inserte aquellos signos que se ignoraron e el paso dos

Paso 4 Calcule la suma de los valores absolutos de los rangos negativos

Tambieacuten la suma de los rangos positivos

Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon

en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el

procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos

sumas

Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la

diferencia d no es 0

Estadiacutestica Administrativa II 42

Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el

tamantildeo muestral

Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos

muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica

esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico

Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente

2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha

Notacioacuten

T= la maacutes pequentildea de las siguientes dos sumas

1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0

La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T

Estadiacutestica Administrativa II 43

46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2

Rango Calificacioacuten Plantel

1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S

10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S

Estadiacutestica Administrativa II 44

30 1600 S

Estadiacutestica Administrativa II 45

Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500

n1= 15 n2= 15 R1= 247 R2= 218

Estadiacutestico U

U = n1n2 + n1(n1 +1) -R1 2

U= (15)(15) + (15)(16) -247 2

U= 225+120-247

U= 98

Media de la distribucioacuten muestral U

μu = n1n2

2

μu = (15)(15)

2

μu =1125

Estadiacutestica Administrativa II 46

Estadiacutestico U

σU = n1n2 + (n1n2 +1)

12

σU = (15)(15)(15+15+1)

12

σU = 6975 12

σU = 58125

σU = 241

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2

α= 015

Estandarizacioacuten del estadiacutestico U

z = U-μu

σU

z = 98 - 1125 241

z = -0602

144 -144 0 -0602

Valor estandarizado de

la muestra U

Regioacuten de aceptacioacuten

Estadiacutestica Administrativa II 47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras

Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular

Prueba de Wilcoxon de los rangos con signo

Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero

Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande

Prueba de Wilcoxon para contrastar datos pareados

El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 12: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

Estadiacutestica Administrativa II 8

Estadiacutestico ji- cuadrada

fo= frecuencia observada fe= frecuencia esperada

x2 = Σ(fo-fe)2

fe

Rengloacuten Columna fo fe = RT X CT n

fo-fe (fo-fe)2 (fo-fe)2

fe Calculo de las frecuencias esperadas y ji- cuadrada

1 1 40 30 180 X 110 660

10 100 3333

1 2 75 60 180 X 220 660

15 225 3750

1 3 65 90 180 X 330 660

-25 625 6944

2 1 30 25 150 X 110 660

5 25 1000

2 2 45 50 150 X 220 660

-5 25 0500

2 3 75 75 150 X 330 660

0 0 0000

3 1 40 55 330 X 110 660

-15 225 4091

3 2 100 110 330 X 220 660

-10 100 0909

3 3 190 165 330 X 330 660

25 625 3788

X2=24315

Buscar en tablas x2 4grados de libertad con un nivel de significancia de 10 y graficar Interpretacioacuten de resultados

Regioacuten de aceptacioacuten

x2= 24315

010 del aacuterea

Distribucioacuten x2

13277

Valor de tabla

Regioacuten de rechazo

Estadiacutestica Administrativa II 9

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

11-1 459 11-2 460 11-7 460 11-8 460 11-9 460

11-10 460 11-11 461 11-12 461 11-13 461

15 Anaacutelisis de varianza

El anaacutelisis de varianza nos permite probar si maacutes de dos medias de poblacioacuten pueden considerarse iguales A menudo se abrevia ANOVA analysis of variance ANOVA Es un meacutetodo de prueba de igualdad de tres o maacutes medias poblacionales1

Hipoacutetesis nula tiacutepica

HO= μ1= μ2= μ3

El meacutetodo ANOVA nos sirve para evitar el error tipo I (rechazar una hipoacutetesis nula verdadera) si utilizamos una prueba de igualdad de varias medias

151 Aplicaciones de ANOVA Se utiliza cuando Se asevera que los supermercados colocan los cereales con alto contenido de azuacutecar en estantes que estaacuten a la altura De los ojos de los nintildeos de manera que eso nos permite probar la aseveracioacuten de que los cereales en los estantes tienen el mismo contenido de azuacutecar

1 Mario F Triola Estadiacutestica Pearson Meacutexico2006

Estadiacutestica Administrativa II 10

Tambieacuten en casos como la comparacioacuten del kilometraje logrado por cinco clases diferentes de gasolina la prueba de cuaacutel de cuatro meacutetodos de capacitacioacuten produce el aprendizaje maacutes raacutepido etc Los meacutetodos de ANOVA requieren de la distribucioacuten F Propiedades de la distribucioacuten F

1 Es no simeacutetrica se sesga hacia la derecha 2 Los valores F son 0 o positivo pero no negativos 3 Hay una distribucioacuten F para cada par de grados de libertad para el

numerador y el denominador

Figura 1 Fuente (Triola 2006605) Ejemplo

Muestra 1 15 18 19 22 11

Muestra 2 22 27 18 21 17

Muestra 3 18 24 19 16 22 15

Planteamiento de la hipoacutetesis

Ho μ1= μ2= μ3

H1 μ1 μ2 y μ3 no son todas iguales

Estadiacutestica Administrativa II 11

Caacutelculo de la media

Meacutetodo 1 Meacutetodo 2 Meacutetodo 3 Produccioacuten diaria 15 22 18

18 27 24 19 18 19 22 21 16 11 17 22

15 85 105 114 Sumatoria divide5 divide5 divide6 Tamantildeo de

la muestra 17 21 19 Media

muestral n1=5 n2=5 n3=6

1= 17 2= 21 3= 19

Caacutelculo de la gran media

= 15 +18+ 19+ 22+ 11+22 +27+ 18+ 21+ 17+18 +24+ 19+ 16+ 22+ 15 = 19 16

Caacutelculo de la varianza entre columnas

σ2b = Σnj ( - )2 = k-1

n - ( - )2 n( - ) Caacutelculo de la varianza entre columnas

5 17 19 17-19=-2 (-2)2=4 5x4=20 5 21 19 21-19=2 (2)2=4 5x4=20 6 19 19 19-19=0 (0)2=0 6x0 = 0 Σnj( - )

2 =40

σ2b = Σnj ( - )2 = 40= 40 = 20 varianza entre columnas

k-1 3-1 2

Estadiacutestica Administrativa II 12

Estimacioacuten de la varianza dentro de columnas

Meacutetodo de capacitacioacuten 1 Media muestral =17

Estimacioacuten de la varianza dentro de columnas

- ( - )2 15-17=-2 (-2)2=4 18-17=1 (1)2=1 19-17=2 (2)2=4 22-17=5 (5)2=25 11-17=-6 (-6)2=36 Σ( - )2 =70

s21= Σ( - )2 = 70 = 175 varianza de la muestra

n-1 5-1

Meacutetodo de capacitacioacuten 2 Media muestral =21

Estimacioacuten de la varianza dentro de columnas

- ( - )2 22-21=1 (1)2=1 27-21=6 (6)2=36 18-21=-3 (-3)2=9 21-21=0 (0)2=0 17-21=-4 (-4)2=16 Σ( - )2 =62

s22= Σ( - )2 = 62 = 155 varianza de la muestra

n-1 5-1

Meacutetodo de capacitacioacuten 3 Media muestral =19

Estimacioacuten de la varianza dentro de columnas

- ( - )2 18-19=-1 (-1)2=1 24-19=5 (5)2=25 19-19=0 (0)2=0 16-19=-3 (-3)2=9 22-19=3 (-32=9 15-19=-4 (-4)2=16 Σ( - )2 =60

Estadiacutestica Administrativa II 13

s23= Σ( - )2 = 60 = 120 varianza de la muestra

n-1 6-1

σ2w = Σ nj - 1 s2

j = (413)(175) + (413)(155) + (513)(120) = 193 = 14769 nt - k 13

Estadiacutestico F

F = varianza entre columnas = σ2b

Varianza dentro de columnas σ2w

F= 20 = 1354 cociente F 14769

Determinacioacuten de los grados de libertad

Grados de libertad del numerador

Nuacutemero de grados de libertad en el numerador del cociente F

= (nuacutemero de muestras-1)

Grados de libertad del denominador

Nuacutemero de grados de libertad en el denominador del cociente F

= Σ (nj-1)= nt-k

Graacutefica

Se acepta la hipoacutetesis nula

Regioacuten de aceptacioacuten

F= 1354

005 del aacuterea

Distribucioacuten f

381

Valor de tabla

Regioacuten de rechazo

Estadiacutestica Administrativa II 14

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

11-5 479 11-6 479

11-26 480 11-27 480 11-28 480 11-29 480 11-30 480

152 Inferencia sobre una varianza de poblacioacuten (Anova)

Estadiacutestico ji- cuadrada para inferencias sobre una varianza

X2=(n-1)s2 σ2

Intervalo de confianza para σ2

Liacutemite inferior de confianza

σ2L=(n-1)s2 X2

U Liacutemite superior de confianza

σ2U=(n-1)s2 X2

L

Estadiacutestica Administrativa II 15

Ejercicio

Con los siguientes datos obtener el estadiacutestico ji- cuadrada Y el intervalo de

confianza del 95

Tiempo x

50 45 27 66 43 96 45 90 69

153 Inferencia sobre la varianza de dos poblaciones (Anova) Ademaacutes de comparar la varianza de dos poblaciones el principal objetivo de este tema es analizar el cociente que se obtiene al aplicar la foacutermula correspondiente

Coeficiente F para inferencias acerca de dos varianzas

F=S21

S22

Estadiacutestica Administrativa II 16

Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple

21 Estimacioacuten mediante la liacutenea de regresioacuten El anaacutelisis de regresioacuten y correlacioacuten permiten determinar tanto la naturaleza como la fuerza de una relacioacuten entre dos variables En el anaacutelisis de regresioacuten se desarrollaraacute una ecuacioacuten de estimacioacuten a traveacutes de una foacutermula matemaacutetica que relaciona las variables conocidas con la variable desconocida La variable conocida- variable independiente X La variable que tratamos de predecir se llama variable dependiente Y

Figura 2 Fuente (Levin 2004511) 211 Diagrama de dispersioacuten El primer paso para determinar si existe una relacioacuten entre dos variables es examinar la graacutefica de datos observados A esta graacutefica se le llama diagrama de dispersioacuten Un diagrama de dispersioacuten se puede identificar visualmente patrones que indique si las variables estaacuten relacionadas

X

Y

Gastos contra la contaminacioacuten

Emisor de

contaminacioacuten

Pendiente negativa

b) Relacioacuten directa

X

Y

Publicidad

Ventas

Pendiente positiva

a) Relacioacuten directa

Estadiacutestica Administrativa II 17

Figura 3 Fuente (Levin 2004503)

212 Meacutetodo de miacutenimos cuadrados

Liacutenea de estimacioacuten

Y= a+bx Y= variable dependiente a=variable ordenada y b=pendiente de la recta x=variable independiente

Pendiente de la recta de regresioacuten de mejor ajuste

b = Σ XY - n X Y Σ X2 - n X2

b=pendiente de la liacutenea de estimacioacuten de mejor ajuste X= valores de la variable independiente Y= variable valores de la variable dependiente X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente n= nuacutemero de puntos

Estadiacutestica Administrativa II 18

Liacutenea de estimacioacuten

a = Y - bX a= ordenada Y b= pendiente de la ecuacioacuten X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente

Error estaacutendar de la estimacioacuten

Se= Σ(Y-Y)2

n-2 Y= valores de la variable dependiente Y=valores estimados con la ecuacioacuten de estimacioacuten que corresponden a cada valor de Y n= nuacutemero de puntos utilizados para ajustar la liacutenea de regresioacuten Para medir la confiabilidad de la ecuacioacuten de estimacioacuten los especialistas en estadiacutestica han desarrollado el error estaacutendar de estimacioacuten Este error estaacutendar se simboliza por Se y es similar a la desviacioacuten estaacutendar en cuanto a que ambas son medidas de dispersioacuten El error estaacutendar de la estimacioacuten por otra parte mide la variabilidad o dispersioacuten de los valores observados alrededor de la recta de regresioacuten 213 Interpretacioacuten del error estaacutendar de la estimacioacuten Como ocurririacutea en el caso de la desviacioacuten estaacutendar mientras maacutes grande sea el error estaacutendar de la estimacioacuten mayor seraacute la dispersioacuten de los puntos alrededor de la liacutenea de regresioacuten De manera inversa si Se= 0 esperamos que la ecuacioacuten de estimacioacuten sea un estimador ldquoperfectordquo de la variable dependiente En este caso todos los puntos caeriacutean directamente sobre la liacutenea de regresioacuten y no habriacutea puntos dispersos alrededor Usaremos el error estaacutendar de la estimacioacuten como una herramienta de la misma forma que podemos usar la desviacioacuten estaacutendar Esto es suponiendo que los puntos observados siguen una distribucioacuten normal alrededor de la recta de regresioacuten podemos esperar encontrar el 68 de los puntos dentro de plusmn1Se el 955 de los puntos dentro de plusmn2Se y el 997 de los puntos dentro de plusmn3Se

Estadiacutestica Administrativa II 19

Figura 4 Fuente (Levin 2004529)

Debemos observar que el error estaacutendar de la estimacioacuten se mide a lo largo del eje Y y no perpendicularmente desde la recta de regresioacuten 214 Intervalos de prediccioacuten aproximados Podemos concebir al error estaacutendar de la estimacioacuten como una herramienta estadiacutestica que podemos usar para hacer afirmaciones de probabilidad acerca del intervalo alrededor del valor estimado de Y dentro del cual cae el valor real de Y Ejemplo

Y= 375 + 075 X Sustituyendo 4 en X

Y= 375 + 075 (4) = 375 + 300

= 675

Estadiacutestica Administrativa II 20

Intervalo 1 error 2 errores 3 errores

Y plusmn1 Se

Y plusmn2 Se

Y plusmn3 Se

En donde Se = 8660

Sustitucioacuten

Ejemplo A menudo quienes hacen la contabilidad de costos estiman los gastos generales con base en el nivel de produccioacuten Se ha reunido informacioacuten acerca de los gastos generales y las unidades producidas en diferentes plantas y ahora desean estimar una ecuacioacuten de regresioacuten para predecir los gastos generales futuros Gastos generales 191 170 272 155 280 173 234 116 153 178 Unidades 40 42 53 35 56 39 48 30 37 40

a) Determine la variable dependiente e independiente b) Desarrolle una ecuacioacuten de regresioacuten para contabilidad de costos c) Pronostique los gastos generales cuando se producen 50 unidades d) Calcule el error estaacutendar de estimacioacuten

Y +1 Se =

675 + (1) (8660) = 76140 Liacutemite superior del intervalo de prediccioacuten

Y +2 Se =

675 + (2) (8660) = 84820 Liacutemite superior del intervalo de prediccioacuten

Y -1 Se =

675 - (1) (8660) = 58840 Liacutemite inferior del intervalo de prediccioacuten

Y - 2 Se =

675 - (2) (8660) = 50180 Liacutemite inferior del intervalo de prediccioacuten

Estadiacutestica Administrativa II 21

X Y XY X2 Y2 40 191 7640 1600 36481 42 170 7140 1764 28900 53 272 14416 2809 73984 35 155 5425 1225 24025 56 280 15680 3136 78400 39 173 6747 1521 29929 48 234 11232 2304 54756 30 116 3480 900 13456 37 153 5661 1369 23409 40 178 7120 1600 31684 ΣX= 420 ΣY= 1922 ΣXY= 84541 ΣX2= 18228 ΣY2= 395024

b = Σ XY - n X Y = 84541 - 10(42)(1922) = 64915 Σ X2 - n X2 18228 - 10(42)2 a = Y ndash bX = 1922 ndash 64915 (42) = - 804430 Y= a+bx = -804430 + 64915 (50) = 2441320 Se= ΣY2 ndashaΣY ndash b ΣXY = n-2 Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

12-2 531 12-3 531

12-13 531 12-14 531 12-15 531

Estadiacutestica Administrativa II 22

215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten

Coeficiente de determinacioacuten de la muestra

r2= aΣY+bΣXY-nY2

ΣY2 ndash n Y2

Coeficiente de correlacioacuten de la muestra

r= r2

Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten

Estadiacutestica Administrativa II 23

Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables

Y= a + b1 X1 + b2 X2

Ecuacioacuten

na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2

1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2

2 = Σ X2Y

Ejemplo

a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10

Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784

Sumatoria

114 105 85 2463 1590 1435 2367 1571

Matriz

6 105 85 114 105 2367 1435 2463 85 1435 1571 1590

1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25

1 175 14167 19 0 1 -099 884 0 0 361608 21410

361608 b2 = 21410 b2 = 21410 361608 b2 = 059

Estadiacutestica Administrativa II 24

1 b1 -099 b2 = 884 1 b1 -099 (059) = 884

-006 884 1b1 = 884 +006 b1 = 890

1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a

= 2589

Y= a + b1 X1 + b2 X2

y=2589+890(28)+059(10)=28099

Estadiacutestica Administrativa II 25

218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)

Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad

La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos

Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir

donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria

Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados

Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante

Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo

Estadiacutestica Administrativa II 26

Figura 5 Distribucioacuten Homocedaacutestica

Figura 6 Distribucioacuten Heterocedaacutestica

Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten

lineal para hacer estimaciones futuras

Estadiacutestica Administrativa II 27

Unidad 3 Nuacutemeros iacutendice

Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se

calcula encontrando el cociente del valor actual entre el valor base luego se

multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje

Tipos de nuacutemeros iacutendice

Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de

cantidad e iacutendice de valor

Iacutendice de precios

Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida

Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo

Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable

El iacutendice de valor combina los cambios de precio y cantidad para presentar un

iacutendice con maacutes informacioacuten

Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos

como indicadores generales de la condicioacuten econoacutemica de un paiacutes

Factores que pueden distorsionar los nuacutemeros iacutendice

bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados

bull Falta de comparacioacuten de iacutendices

bull Ponderacioacuten no apropiada de los factores

bull Seleccioacuten de una base no apropiada

Estadiacutestica Administrativa II 28

31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores

Iacutendice de cantidad de agregados no ponderados

ΣQi x 100 ΣQo

Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea

1993 1994 1995

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200

Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado

1993 Qo

1994 Q1

1995 Q2

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308

Estadiacutestica Administrativa II 29

Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra

Iacutendice de precios de agregados ponderados

ΣPiQ x 100 ΣPoQ

Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100

Cambio de periodo base

I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base

Estadiacutestica Administrativa II 30

35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos

Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables

Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico

Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios

El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)

Estadiacutestica Administrativa II 31

Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica

37 Deflacioacuten de los valores de series de tiempo

Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios

En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea

La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores

Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero

Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes

Los valores expresados en unidades monetarias corrientes se conocen como valores nominales

Los valores expresados en unidades monetarias constantes se conocen como valores reales

Estadiacutestica Administrativa II 32

38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor

Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos

39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)

Estadiacutestica Administrativa II 33

Siacutembolo Nombre de la compantildeiacutea

AA Alcoa

ALD Allied Signal

AXP American Express

BA Boeing

CAT Caterpillar

CHV Chevron

C CitiGroup

DIS Disney

DD Dupont

EK Eastman Kodak

GE General Electric

GM General Motors

GT Goodyear Tire

HWP Hewlett-Packard

IBM International Business Machines

IP International Paper

JNJ Johnson amp Johnson

JPM JP Morgan Bank

KO Coca Cola

Figura 5 Compantildeiacuteas comprendidas en el Dow Jones

310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos

Praacutectica 2

992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico

elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado

de precios

Estadiacutestica Administrativa II 34

Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida

bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)

42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten

Las principales pruebas no parameacutetricas son las siguientes

bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher

Estadiacutestica Administrativa II 35

bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon

Caracteriacutesticas de algunas pruebas no parameacutetricas

1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos

2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten

3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal

4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados

5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc

6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica

Prueba Caracteriacutestica

Mann- Whitney 2 muestras independientes

Wilcoxon 2 muestras asociadas

Kruskal-Wallis + de 2 muestras independientes

Friedman + de 2 muestras asociadas

Tabla1 Caracteriacutesticas de pruebas no parameacutetricas

Estadiacutestica Administrativa II 36

Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media

Ventajas y desventajas de los meacutetodos parameacutetricos

Desventajas Ventajas bull Ignoran cierta cantidad de

informacioacuten bull No requieren la suposicioacuten de que

una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica

bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas

bull Generalmente es maacutes sencillo realizarlas y entenderlas

bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal

Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo

MHHHHM

1ra 2ra 3ra

Estadiacutestica Administrativa II 37

Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1

n2= nuacutemero de ocurrencias del tipo 2

r= nuacutemero de corridas

4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue

BABBBAAABBABBBBAAAABABAABBBAABAAAABBA

BBAAAABBABBBBAABBABAABB

Valores de la prueba

n1= 29

n2= 31

r= 29

4322 Distribucioacuten de muestreo del estadiacutestico r

El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba

Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente

Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1

n1+n2

Estadiacutestica Administrativa II 38

μr = 2(29)(31) +1

29+31

μr = 1798 +1 60

μr = 2997 +1

μr = 3097

Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)

(n1+n2)2(n1+n2-1)

σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)

σr= (1798) (1738)

(60)2(59)

σr= 1471

σr= 384

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-24 643 14-25 643 14-26 643 14-27 644 14-28 644

Estadiacutestica Administrativa II 39

44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica

Ejemplo

Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado

Miembro del panel Calificacioacuten para

conferencias grandes

Calificacioacuten para

sesiones pequentildeas

Signo de la calificacioacuten

Evaluacioacuten de los dos tipos de

clases

1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -

6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +

La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)

Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20

Estadiacutestica Administrativa II 40

Establecimiento de las hipoacutetesis

Ho p = 05

H1 p ne 05

Se consideran la posibilidades solamente de signos + y - (9+6 =15)

p Ho = 05

q H0 = 05

n= 15

p= 0600 (915)

q= 0400 (615)

Prueba de hipoacutetesis de que no hay diferencia

Error estaacutendar del la proporcioacuten

σp= pq n

σp= (05)(05) 15

σp= 0129

0025

0

0475 del aacuterea

Valor criacutetico Z=-196

Regioacuten de aceptacioacuten

0025

0475 del aacuterea

Valor criacutetico Z=196

Estadiacutestica Administrativa II 41

45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten

Procedimiento de la prueba de rangos con signo de Wilcoxon

Paso1 Para cada par de datos calcule la diferencia d restando el segundo

valor del primero Guarde los signos pero descarte cualquier par para el que

d=0

Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de

la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango

correspondiente Cuando las diferencias tengan el mismo valor numeacuterico

asiacutegneles la media de los rangos implicados en el empate

Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino

Esto es inserte aquellos signos que se ignoraron e el paso dos

Paso 4 Calcule la suma de los valores absolutos de los rangos negativos

Tambieacuten la suma de los rangos positivos

Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon

en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el

procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos

sumas

Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la

diferencia d no es 0

Estadiacutestica Administrativa II 42

Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el

tamantildeo muestral

Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos

muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica

esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico

Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente

2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha

Notacioacuten

T= la maacutes pequentildea de las siguientes dos sumas

1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0

La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T

Estadiacutestica Administrativa II 43

46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2

Rango Calificacioacuten Plantel

1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S

10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S

Estadiacutestica Administrativa II 44

30 1600 S

Estadiacutestica Administrativa II 45

Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500

n1= 15 n2= 15 R1= 247 R2= 218

Estadiacutestico U

U = n1n2 + n1(n1 +1) -R1 2

U= (15)(15) + (15)(16) -247 2

U= 225+120-247

U= 98

Media de la distribucioacuten muestral U

μu = n1n2

2

μu = (15)(15)

2

μu =1125

Estadiacutestica Administrativa II 46

Estadiacutestico U

σU = n1n2 + (n1n2 +1)

12

σU = (15)(15)(15+15+1)

12

σU = 6975 12

σU = 58125

σU = 241

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2

α= 015

Estandarizacioacuten del estadiacutestico U

z = U-μu

σU

z = 98 - 1125 241

z = -0602

144 -144 0 -0602

Valor estandarizado de

la muestra U

Regioacuten de aceptacioacuten

Estadiacutestica Administrativa II 47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras

Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular

Prueba de Wilcoxon de los rangos con signo

Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero

Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande

Prueba de Wilcoxon para contrastar datos pareados

El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 13: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

Estadiacutestica Administrativa II 9

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

11-1 459 11-2 460 11-7 460 11-8 460 11-9 460

11-10 460 11-11 461 11-12 461 11-13 461

15 Anaacutelisis de varianza

El anaacutelisis de varianza nos permite probar si maacutes de dos medias de poblacioacuten pueden considerarse iguales A menudo se abrevia ANOVA analysis of variance ANOVA Es un meacutetodo de prueba de igualdad de tres o maacutes medias poblacionales1

Hipoacutetesis nula tiacutepica

HO= μ1= μ2= μ3

El meacutetodo ANOVA nos sirve para evitar el error tipo I (rechazar una hipoacutetesis nula verdadera) si utilizamos una prueba de igualdad de varias medias

151 Aplicaciones de ANOVA Se utiliza cuando Se asevera que los supermercados colocan los cereales con alto contenido de azuacutecar en estantes que estaacuten a la altura De los ojos de los nintildeos de manera que eso nos permite probar la aseveracioacuten de que los cereales en los estantes tienen el mismo contenido de azuacutecar

1 Mario F Triola Estadiacutestica Pearson Meacutexico2006

Estadiacutestica Administrativa II 10

Tambieacuten en casos como la comparacioacuten del kilometraje logrado por cinco clases diferentes de gasolina la prueba de cuaacutel de cuatro meacutetodos de capacitacioacuten produce el aprendizaje maacutes raacutepido etc Los meacutetodos de ANOVA requieren de la distribucioacuten F Propiedades de la distribucioacuten F

1 Es no simeacutetrica se sesga hacia la derecha 2 Los valores F son 0 o positivo pero no negativos 3 Hay una distribucioacuten F para cada par de grados de libertad para el

numerador y el denominador

Figura 1 Fuente (Triola 2006605) Ejemplo

Muestra 1 15 18 19 22 11

Muestra 2 22 27 18 21 17

Muestra 3 18 24 19 16 22 15

Planteamiento de la hipoacutetesis

Ho μ1= μ2= μ3

H1 μ1 μ2 y μ3 no son todas iguales

Estadiacutestica Administrativa II 11

Caacutelculo de la media

Meacutetodo 1 Meacutetodo 2 Meacutetodo 3 Produccioacuten diaria 15 22 18

18 27 24 19 18 19 22 21 16 11 17 22

15 85 105 114 Sumatoria divide5 divide5 divide6 Tamantildeo de

la muestra 17 21 19 Media

muestral n1=5 n2=5 n3=6

1= 17 2= 21 3= 19

Caacutelculo de la gran media

= 15 +18+ 19+ 22+ 11+22 +27+ 18+ 21+ 17+18 +24+ 19+ 16+ 22+ 15 = 19 16

Caacutelculo de la varianza entre columnas

σ2b = Σnj ( - )2 = k-1

n - ( - )2 n( - ) Caacutelculo de la varianza entre columnas

5 17 19 17-19=-2 (-2)2=4 5x4=20 5 21 19 21-19=2 (2)2=4 5x4=20 6 19 19 19-19=0 (0)2=0 6x0 = 0 Σnj( - )

2 =40

σ2b = Σnj ( - )2 = 40= 40 = 20 varianza entre columnas

k-1 3-1 2

Estadiacutestica Administrativa II 12

Estimacioacuten de la varianza dentro de columnas

Meacutetodo de capacitacioacuten 1 Media muestral =17

Estimacioacuten de la varianza dentro de columnas

- ( - )2 15-17=-2 (-2)2=4 18-17=1 (1)2=1 19-17=2 (2)2=4 22-17=5 (5)2=25 11-17=-6 (-6)2=36 Σ( - )2 =70

s21= Σ( - )2 = 70 = 175 varianza de la muestra

n-1 5-1

Meacutetodo de capacitacioacuten 2 Media muestral =21

Estimacioacuten de la varianza dentro de columnas

- ( - )2 22-21=1 (1)2=1 27-21=6 (6)2=36 18-21=-3 (-3)2=9 21-21=0 (0)2=0 17-21=-4 (-4)2=16 Σ( - )2 =62

s22= Σ( - )2 = 62 = 155 varianza de la muestra

n-1 5-1

Meacutetodo de capacitacioacuten 3 Media muestral =19

Estimacioacuten de la varianza dentro de columnas

- ( - )2 18-19=-1 (-1)2=1 24-19=5 (5)2=25 19-19=0 (0)2=0 16-19=-3 (-3)2=9 22-19=3 (-32=9 15-19=-4 (-4)2=16 Σ( - )2 =60

Estadiacutestica Administrativa II 13

s23= Σ( - )2 = 60 = 120 varianza de la muestra

n-1 6-1

σ2w = Σ nj - 1 s2

j = (413)(175) + (413)(155) + (513)(120) = 193 = 14769 nt - k 13

Estadiacutestico F

F = varianza entre columnas = σ2b

Varianza dentro de columnas σ2w

F= 20 = 1354 cociente F 14769

Determinacioacuten de los grados de libertad

Grados de libertad del numerador

Nuacutemero de grados de libertad en el numerador del cociente F

= (nuacutemero de muestras-1)

Grados de libertad del denominador

Nuacutemero de grados de libertad en el denominador del cociente F

= Σ (nj-1)= nt-k

Graacutefica

Se acepta la hipoacutetesis nula

Regioacuten de aceptacioacuten

F= 1354

005 del aacuterea

Distribucioacuten f

381

Valor de tabla

Regioacuten de rechazo

Estadiacutestica Administrativa II 14

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

11-5 479 11-6 479

11-26 480 11-27 480 11-28 480 11-29 480 11-30 480

152 Inferencia sobre una varianza de poblacioacuten (Anova)

Estadiacutestico ji- cuadrada para inferencias sobre una varianza

X2=(n-1)s2 σ2

Intervalo de confianza para σ2

Liacutemite inferior de confianza

σ2L=(n-1)s2 X2

U Liacutemite superior de confianza

σ2U=(n-1)s2 X2

L

Estadiacutestica Administrativa II 15

Ejercicio

Con los siguientes datos obtener el estadiacutestico ji- cuadrada Y el intervalo de

confianza del 95

Tiempo x

50 45 27 66 43 96 45 90 69

153 Inferencia sobre la varianza de dos poblaciones (Anova) Ademaacutes de comparar la varianza de dos poblaciones el principal objetivo de este tema es analizar el cociente que se obtiene al aplicar la foacutermula correspondiente

Coeficiente F para inferencias acerca de dos varianzas

F=S21

S22

Estadiacutestica Administrativa II 16

Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple

21 Estimacioacuten mediante la liacutenea de regresioacuten El anaacutelisis de regresioacuten y correlacioacuten permiten determinar tanto la naturaleza como la fuerza de una relacioacuten entre dos variables En el anaacutelisis de regresioacuten se desarrollaraacute una ecuacioacuten de estimacioacuten a traveacutes de una foacutermula matemaacutetica que relaciona las variables conocidas con la variable desconocida La variable conocida- variable independiente X La variable que tratamos de predecir se llama variable dependiente Y

Figura 2 Fuente (Levin 2004511) 211 Diagrama de dispersioacuten El primer paso para determinar si existe una relacioacuten entre dos variables es examinar la graacutefica de datos observados A esta graacutefica se le llama diagrama de dispersioacuten Un diagrama de dispersioacuten se puede identificar visualmente patrones que indique si las variables estaacuten relacionadas

X

Y

Gastos contra la contaminacioacuten

Emisor de

contaminacioacuten

Pendiente negativa

b) Relacioacuten directa

X

Y

Publicidad

Ventas

Pendiente positiva

a) Relacioacuten directa

Estadiacutestica Administrativa II 17

Figura 3 Fuente (Levin 2004503)

212 Meacutetodo de miacutenimos cuadrados

Liacutenea de estimacioacuten

Y= a+bx Y= variable dependiente a=variable ordenada y b=pendiente de la recta x=variable independiente

Pendiente de la recta de regresioacuten de mejor ajuste

b = Σ XY - n X Y Σ X2 - n X2

b=pendiente de la liacutenea de estimacioacuten de mejor ajuste X= valores de la variable independiente Y= variable valores de la variable dependiente X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente n= nuacutemero de puntos

Estadiacutestica Administrativa II 18

Liacutenea de estimacioacuten

a = Y - bX a= ordenada Y b= pendiente de la ecuacioacuten X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente

Error estaacutendar de la estimacioacuten

Se= Σ(Y-Y)2

n-2 Y= valores de la variable dependiente Y=valores estimados con la ecuacioacuten de estimacioacuten que corresponden a cada valor de Y n= nuacutemero de puntos utilizados para ajustar la liacutenea de regresioacuten Para medir la confiabilidad de la ecuacioacuten de estimacioacuten los especialistas en estadiacutestica han desarrollado el error estaacutendar de estimacioacuten Este error estaacutendar se simboliza por Se y es similar a la desviacioacuten estaacutendar en cuanto a que ambas son medidas de dispersioacuten El error estaacutendar de la estimacioacuten por otra parte mide la variabilidad o dispersioacuten de los valores observados alrededor de la recta de regresioacuten 213 Interpretacioacuten del error estaacutendar de la estimacioacuten Como ocurririacutea en el caso de la desviacioacuten estaacutendar mientras maacutes grande sea el error estaacutendar de la estimacioacuten mayor seraacute la dispersioacuten de los puntos alrededor de la liacutenea de regresioacuten De manera inversa si Se= 0 esperamos que la ecuacioacuten de estimacioacuten sea un estimador ldquoperfectordquo de la variable dependiente En este caso todos los puntos caeriacutean directamente sobre la liacutenea de regresioacuten y no habriacutea puntos dispersos alrededor Usaremos el error estaacutendar de la estimacioacuten como una herramienta de la misma forma que podemos usar la desviacioacuten estaacutendar Esto es suponiendo que los puntos observados siguen una distribucioacuten normal alrededor de la recta de regresioacuten podemos esperar encontrar el 68 de los puntos dentro de plusmn1Se el 955 de los puntos dentro de plusmn2Se y el 997 de los puntos dentro de plusmn3Se

Estadiacutestica Administrativa II 19

Figura 4 Fuente (Levin 2004529)

Debemos observar que el error estaacutendar de la estimacioacuten se mide a lo largo del eje Y y no perpendicularmente desde la recta de regresioacuten 214 Intervalos de prediccioacuten aproximados Podemos concebir al error estaacutendar de la estimacioacuten como una herramienta estadiacutestica que podemos usar para hacer afirmaciones de probabilidad acerca del intervalo alrededor del valor estimado de Y dentro del cual cae el valor real de Y Ejemplo

Y= 375 + 075 X Sustituyendo 4 en X

Y= 375 + 075 (4) = 375 + 300

= 675

Estadiacutestica Administrativa II 20

Intervalo 1 error 2 errores 3 errores

Y plusmn1 Se

Y plusmn2 Se

Y plusmn3 Se

En donde Se = 8660

Sustitucioacuten

Ejemplo A menudo quienes hacen la contabilidad de costos estiman los gastos generales con base en el nivel de produccioacuten Se ha reunido informacioacuten acerca de los gastos generales y las unidades producidas en diferentes plantas y ahora desean estimar una ecuacioacuten de regresioacuten para predecir los gastos generales futuros Gastos generales 191 170 272 155 280 173 234 116 153 178 Unidades 40 42 53 35 56 39 48 30 37 40

a) Determine la variable dependiente e independiente b) Desarrolle una ecuacioacuten de regresioacuten para contabilidad de costos c) Pronostique los gastos generales cuando se producen 50 unidades d) Calcule el error estaacutendar de estimacioacuten

Y +1 Se =

675 + (1) (8660) = 76140 Liacutemite superior del intervalo de prediccioacuten

Y +2 Se =

675 + (2) (8660) = 84820 Liacutemite superior del intervalo de prediccioacuten

Y -1 Se =

675 - (1) (8660) = 58840 Liacutemite inferior del intervalo de prediccioacuten

Y - 2 Se =

675 - (2) (8660) = 50180 Liacutemite inferior del intervalo de prediccioacuten

Estadiacutestica Administrativa II 21

X Y XY X2 Y2 40 191 7640 1600 36481 42 170 7140 1764 28900 53 272 14416 2809 73984 35 155 5425 1225 24025 56 280 15680 3136 78400 39 173 6747 1521 29929 48 234 11232 2304 54756 30 116 3480 900 13456 37 153 5661 1369 23409 40 178 7120 1600 31684 ΣX= 420 ΣY= 1922 ΣXY= 84541 ΣX2= 18228 ΣY2= 395024

b = Σ XY - n X Y = 84541 - 10(42)(1922) = 64915 Σ X2 - n X2 18228 - 10(42)2 a = Y ndash bX = 1922 ndash 64915 (42) = - 804430 Y= a+bx = -804430 + 64915 (50) = 2441320 Se= ΣY2 ndashaΣY ndash b ΣXY = n-2 Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

12-2 531 12-3 531

12-13 531 12-14 531 12-15 531

Estadiacutestica Administrativa II 22

215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten

Coeficiente de determinacioacuten de la muestra

r2= aΣY+bΣXY-nY2

ΣY2 ndash n Y2

Coeficiente de correlacioacuten de la muestra

r= r2

Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten

Estadiacutestica Administrativa II 23

Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables

Y= a + b1 X1 + b2 X2

Ecuacioacuten

na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2

1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2

2 = Σ X2Y

Ejemplo

a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10

Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784

Sumatoria

114 105 85 2463 1590 1435 2367 1571

Matriz

6 105 85 114 105 2367 1435 2463 85 1435 1571 1590

1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25

1 175 14167 19 0 1 -099 884 0 0 361608 21410

361608 b2 = 21410 b2 = 21410 361608 b2 = 059

Estadiacutestica Administrativa II 24

1 b1 -099 b2 = 884 1 b1 -099 (059) = 884

-006 884 1b1 = 884 +006 b1 = 890

1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a

= 2589

Y= a + b1 X1 + b2 X2

y=2589+890(28)+059(10)=28099

Estadiacutestica Administrativa II 25

218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)

Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad

La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos

Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir

donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria

Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados

Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante

Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo

Estadiacutestica Administrativa II 26

Figura 5 Distribucioacuten Homocedaacutestica

Figura 6 Distribucioacuten Heterocedaacutestica

Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten

lineal para hacer estimaciones futuras

Estadiacutestica Administrativa II 27

Unidad 3 Nuacutemeros iacutendice

Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se

calcula encontrando el cociente del valor actual entre el valor base luego se

multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje

Tipos de nuacutemeros iacutendice

Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de

cantidad e iacutendice de valor

Iacutendice de precios

Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida

Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo

Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable

El iacutendice de valor combina los cambios de precio y cantidad para presentar un

iacutendice con maacutes informacioacuten

Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos

como indicadores generales de la condicioacuten econoacutemica de un paiacutes

Factores que pueden distorsionar los nuacutemeros iacutendice

bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados

bull Falta de comparacioacuten de iacutendices

bull Ponderacioacuten no apropiada de los factores

bull Seleccioacuten de una base no apropiada

Estadiacutestica Administrativa II 28

31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores

Iacutendice de cantidad de agregados no ponderados

ΣQi x 100 ΣQo

Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea

1993 1994 1995

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200

Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado

1993 Qo

1994 Q1

1995 Q2

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308

Estadiacutestica Administrativa II 29

Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra

Iacutendice de precios de agregados ponderados

ΣPiQ x 100 ΣPoQ

Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100

Cambio de periodo base

I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base

Estadiacutestica Administrativa II 30

35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos

Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables

Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico

Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios

El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)

Estadiacutestica Administrativa II 31

Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica

37 Deflacioacuten de los valores de series de tiempo

Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios

En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea

La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores

Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero

Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes

Los valores expresados en unidades monetarias corrientes se conocen como valores nominales

Los valores expresados en unidades monetarias constantes se conocen como valores reales

Estadiacutestica Administrativa II 32

38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor

Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos

39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)

Estadiacutestica Administrativa II 33

Siacutembolo Nombre de la compantildeiacutea

AA Alcoa

ALD Allied Signal

AXP American Express

BA Boeing

CAT Caterpillar

CHV Chevron

C CitiGroup

DIS Disney

DD Dupont

EK Eastman Kodak

GE General Electric

GM General Motors

GT Goodyear Tire

HWP Hewlett-Packard

IBM International Business Machines

IP International Paper

JNJ Johnson amp Johnson

JPM JP Morgan Bank

KO Coca Cola

Figura 5 Compantildeiacuteas comprendidas en el Dow Jones

310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos

Praacutectica 2

992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico

elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado

de precios

Estadiacutestica Administrativa II 34

Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida

bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)

42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten

Las principales pruebas no parameacutetricas son las siguientes

bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher

Estadiacutestica Administrativa II 35

bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon

Caracteriacutesticas de algunas pruebas no parameacutetricas

1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos

2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten

3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal

4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados

5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc

6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica

Prueba Caracteriacutestica

Mann- Whitney 2 muestras independientes

Wilcoxon 2 muestras asociadas

Kruskal-Wallis + de 2 muestras independientes

Friedman + de 2 muestras asociadas

Tabla1 Caracteriacutesticas de pruebas no parameacutetricas

Estadiacutestica Administrativa II 36

Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media

Ventajas y desventajas de los meacutetodos parameacutetricos

Desventajas Ventajas bull Ignoran cierta cantidad de

informacioacuten bull No requieren la suposicioacuten de que

una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica

bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas

bull Generalmente es maacutes sencillo realizarlas y entenderlas

bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal

Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo

MHHHHM

1ra 2ra 3ra

Estadiacutestica Administrativa II 37

Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1

n2= nuacutemero de ocurrencias del tipo 2

r= nuacutemero de corridas

4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue

BABBBAAABBABBBBAAAABABAABBBAABAAAABBA

BBAAAABBABBBBAABBABAABB

Valores de la prueba

n1= 29

n2= 31

r= 29

4322 Distribucioacuten de muestreo del estadiacutestico r

El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba

Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente

Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1

n1+n2

Estadiacutestica Administrativa II 38

μr = 2(29)(31) +1

29+31

μr = 1798 +1 60

μr = 2997 +1

μr = 3097

Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)

(n1+n2)2(n1+n2-1)

σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)

σr= (1798) (1738)

(60)2(59)

σr= 1471

σr= 384

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-24 643 14-25 643 14-26 643 14-27 644 14-28 644

Estadiacutestica Administrativa II 39

44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica

Ejemplo

Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado

Miembro del panel Calificacioacuten para

conferencias grandes

Calificacioacuten para

sesiones pequentildeas

Signo de la calificacioacuten

Evaluacioacuten de los dos tipos de

clases

1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -

6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +

La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)

Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20

Estadiacutestica Administrativa II 40

Establecimiento de las hipoacutetesis

Ho p = 05

H1 p ne 05

Se consideran la posibilidades solamente de signos + y - (9+6 =15)

p Ho = 05

q H0 = 05

n= 15

p= 0600 (915)

q= 0400 (615)

Prueba de hipoacutetesis de que no hay diferencia

Error estaacutendar del la proporcioacuten

σp= pq n

σp= (05)(05) 15

σp= 0129

0025

0

0475 del aacuterea

Valor criacutetico Z=-196

Regioacuten de aceptacioacuten

0025

0475 del aacuterea

Valor criacutetico Z=196

Estadiacutestica Administrativa II 41

45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten

Procedimiento de la prueba de rangos con signo de Wilcoxon

Paso1 Para cada par de datos calcule la diferencia d restando el segundo

valor del primero Guarde los signos pero descarte cualquier par para el que

d=0

Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de

la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango

correspondiente Cuando las diferencias tengan el mismo valor numeacuterico

asiacutegneles la media de los rangos implicados en el empate

Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino

Esto es inserte aquellos signos que se ignoraron e el paso dos

Paso 4 Calcule la suma de los valores absolutos de los rangos negativos

Tambieacuten la suma de los rangos positivos

Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon

en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el

procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos

sumas

Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la

diferencia d no es 0

Estadiacutestica Administrativa II 42

Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el

tamantildeo muestral

Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos

muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica

esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico

Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente

2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha

Notacioacuten

T= la maacutes pequentildea de las siguientes dos sumas

1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0

La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T

Estadiacutestica Administrativa II 43

46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2

Rango Calificacioacuten Plantel

1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S

10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S

Estadiacutestica Administrativa II 44

30 1600 S

Estadiacutestica Administrativa II 45

Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500

n1= 15 n2= 15 R1= 247 R2= 218

Estadiacutestico U

U = n1n2 + n1(n1 +1) -R1 2

U= (15)(15) + (15)(16) -247 2

U= 225+120-247

U= 98

Media de la distribucioacuten muestral U

μu = n1n2

2

μu = (15)(15)

2

μu =1125

Estadiacutestica Administrativa II 46

Estadiacutestico U

σU = n1n2 + (n1n2 +1)

12

σU = (15)(15)(15+15+1)

12

σU = 6975 12

σU = 58125

σU = 241

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2

α= 015

Estandarizacioacuten del estadiacutestico U

z = U-μu

σU

z = 98 - 1125 241

z = -0602

144 -144 0 -0602

Valor estandarizado de

la muestra U

Regioacuten de aceptacioacuten

Estadiacutestica Administrativa II 47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras

Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular

Prueba de Wilcoxon de los rangos con signo

Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero

Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande

Prueba de Wilcoxon para contrastar datos pareados

El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 14: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

Estadiacutestica Administrativa II 10

Tambieacuten en casos como la comparacioacuten del kilometraje logrado por cinco clases diferentes de gasolina la prueba de cuaacutel de cuatro meacutetodos de capacitacioacuten produce el aprendizaje maacutes raacutepido etc Los meacutetodos de ANOVA requieren de la distribucioacuten F Propiedades de la distribucioacuten F

1 Es no simeacutetrica se sesga hacia la derecha 2 Los valores F son 0 o positivo pero no negativos 3 Hay una distribucioacuten F para cada par de grados de libertad para el

numerador y el denominador

Figura 1 Fuente (Triola 2006605) Ejemplo

Muestra 1 15 18 19 22 11

Muestra 2 22 27 18 21 17

Muestra 3 18 24 19 16 22 15

Planteamiento de la hipoacutetesis

Ho μ1= μ2= μ3

H1 μ1 μ2 y μ3 no son todas iguales

Estadiacutestica Administrativa II 11

Caacutelculo de la media

Meacutetodo 1 Meacutetodo 2 Meacutetodo 3 Produccioacuten diaria 15 22 18

18 27 24 19 18 19 22 21 16 11 17 22

15 85 105 114 Sumatoria divide5 divide5 divide6 Tamantildeo de

la muestra 17 21 19 Media

muestral n1=5 n2=5 n3=6

1= 17 2= 21 3= 19

Caacutelculo de la gran media

= 15 +18+ 19+ 22+ 11+22 +27+ 18+ 21+ 17+18 +24+ 19+ 16+ 22+ 15 = 19 16

Caacutelculo de la varianza entre columnas

σ2b = Σnj ( - )2 = k-1

n - ( - )2 n( - ) Caacutelculo de la varianza entre columnas

5 17 19 17-19=-2 (-2)2=4 5x4=20 5 21 19 21-19=2 (2)2=4 5x4=20 6 19 19 19-19=0 (0)2=0 6x0 = 0 Σnj( - )

2 =40

σ2b = Σnj ( - )2 = 40= 40 = 20 varianza entre columnas

k-1 3-1 2

Estadiacutestica Administrativa II 12

Estimacioacuten de la varianza dentro de columnas

Meacutetodo de capacitacioacuten 1 Media muestral =17

Estimacioacuten de la varianza dentro de columnas

- ( - )2 15-17=-2 (-2)2=4 18-17=1 (1)2=1 19-17=2 (2)2=4 22-17=5 (5)2=25 11-17=-6 (-6)2=36 Σ( - )2 =70

s21= Σ( - )2 = 70 = 175 varianza de la muestra

n-1 5-1

Meacutetodo de capacitacioacuten 2 Media muestral =21

Estimacioacuten de la varianza dentro de columnas

- ( - )2 22-21=1 (1)2=1 27-21=6 (6)2=36 18-21=-3 (-3)2=9 21-21=0 (0)2=0 17-21=-4 (-4)2=16 Σ( - )2 =62

s22= Σ( - )2 = 62 = 155 varianza de la muestra

n-1 5-1

Meacutetodo de capacitacioacuten 3 Media muestral =19

Estimacioacuten de la varianza dentro de columnas

- ( - )2 18-19=-1 (-1)2=1 24-19=5 (5)2=25 19-19=0 (0)2=0 16-19=-3 (-3)2=9 22-19=3 (-32=9 15-19=-4 (-4)2=16 Σ( - )2 =60

Estadiacutestica Administrativa II 13

s23= Σ( - )2 = 60 = 120 varianza de la muestra

n-1 6-1

σ2w = Σ nj - 1 s2

j = (413)(175) + (413)(155) + (513)(120) = 193 = 14769 nt - k 13

Estadiacutestico F

F = varianza entre columnas = σ2b

Varianza dentro de columnas σ2w

F= 20 = 1354 cociente F 14769

Determinacioacuten de los grados de libertad

Grados de libertad del numerador

Nuacutemero de grados de libertad en el numerador del cociente F

= (nuacutemero de muestras-1)

Grados de libertad del denominador

Nuacutemero de grados de libertad en el denominador del cociente F

= Σ (nj-1)= nt-k

Graacutefica

Se acepta la hipoacutetesis nula

Regioacuten de aceptacioacuten

F= 1354

005 del aacuterea

Distribucioacuten f

381

Valor de tabla

Regioacuten de rechazo

Estadiacutestica Administrativa II 14

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

11-5 479 11-6 479

11-26 480 11-27 480 11-28 480 11-29 480 11-30 480

152 Inferencia sobre una varianza de poblacioacuten (Anova)

Estadiacutestico ji- cuadrada para inferencias sobre una varianza

X2=(n-1)s2 σ2

Intervalo de confianza para σ2

Liacutemite inferior de confianza

σ2L=(n-1)s2 X2

U Liacutemite superior de confianza

σ2U=(n-1)s2 X2

L

Estadiacutestica Administrativa II 15

Ejercicio

Con los siguientes datos obtener el estadiacutestico ji- cuadrada Y el intervalo de

confianza del 95

Tiempo x

50 45 27 66 43 96 45 90 69

153 Inferencia sobre la varianza de dos poblaciones (Anova) Ademaacutes de comparar la varianza de dos poblaciones el principal objetivo de este tema es analizar el cociente que se obtiene al aplicar la foacutermula correspondiente

Coeficiente F para inferencias acerca de dos varianzas

F=S21

S22

Estadiacutestica Administrativa II 16

Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple

21 Estimacioacuten mediante la liacutenea de regresioacuten El anaacutelisis de regresioacuten y correlacioacuten permiten determinar tanto la naturaleza como la fuerza de una relacioacuten entre dos variables En el anaacutelisis de regresioacuten se desarrollaraacute una ecuacioacuten de estimacioacuten a traveacutes de una foacutermula matemaacutetica que relaciona las variables conocidas con la variable desconocida La variable conocida- variable independiente X La variable que tratamos de predecir se llama variable dependiente Y

Figura 2 Fuente (Levin 2004511) 211 Diagrama de dispersioacuten El primer paso para determinar si existe una relacioacuten entre dos variables es examinar la graacutefica de datos observados A esta graacutefica se le llama diagrama de dispersioacuten Un diagrama de dispersioacuten se puede identificar visualmente patrones que indique si las variables estaacuten relacionadas

X

Y

Gastos contra la contaminacioacuten

Emisor de

contaminacioacuten

Pendiente negativa

b) Relacioacuten directa

X

Y

Publicidad

Ventas

Pendiente positiva

a) Relacioacuten directa

Estadiacutestica Administrativa II 17

Figura 3 Fuente (Levin 2004503)

212 Meacutetodo de miacutenimos cuadrados

Liacutenea de estimacioacuten

Y= a+bx Y= variable dependiente a=variable ordenada y b=pendiente de la recta x=variable independiente

Pendiente de la recta de regresioacuten de mejor ajuste

b = Σ XY - n X Y Σ X2 - n X2

b=pendiente de la liacutenea de estimacioacuten de mejor ajuste X= valores de la variable independiente Y= variable valores de la variable dependiente X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente n= nuacutemero de puntos

Estadiacutestica Administrativa II 18

Liacutenea de estimacioacuten

a = Y - bX a= ordenada Y b= pendiente de la ecuacioacuten X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente

Error estaacutendar de la estimacioacuten

Se= Σ(Y-Y)2

n-2 Y= valores de la variable dependiente Y=valores estimados con la ecuacioacuten de estimacioacuten que corresponden a cada valor de Y n= nuacutemero de puntos utilizados para ajustar la liacutenea de regresioacuten Para medir la confiabilidad de la ecuacioacuten de estimacioacuten los especialistas en estadiacutestica han desarrollado el error estaacutendar de estimacioacuten Este error estaacutendar se simboliza por Se y es similar a la desviacioacuten estaacutendar en cuanto a que ambas son medidas de dispersioacuten El error estaacutendar de la estimacioacuten por otra parte mide la variabilidad o dispersioacuten de los valores observados alrededor de la recta de regresioacuten 213 Interpretacioacuten del error estaacutendar de la estimacioacuten Como ocurririacutea en el caso de la desviacioacuten estaacutendar mientras maacutes grande sea el error estaacutendar de la estimacioacuten mayor seraacute la dispersioacuten de los puntos alrededor de la liacutenea de regresioacuten De manera inversa si Se= 0 esperamos que la ecuacioacuten de estimacioacuten sea un estimador ldquoperfectordquo de la variable dependiente En este caso todos los puntos caeriacutean directamente sobre la liacutenea de regresioacuten y no habriacutea puntos dispersos alrededor Usaremos el error estaacutendar de la estimacioacuten como una herramienta de la misma forma que podemos usar la desviacioacuten estaacutendar Esto es suponiendo que los puntos observados siguen una distribucioacuten normal alrededor de la recta de regresioacuten podemos esperar encontrar el 68 de los puntos dentro de plusmn1Se el 955 de los puntos dentro de plusmn2Se y el 997 de los puntos dentro de plusmn3Se

Estadiacutestica Administrativa II 19

Figura 4 Fuente (Levin 2004529)

Debemos observar que el error estaacutendar de la estimacioacuten se mide a lo largo del eje Y y no perpendicularmente desde la recta de regresioacuten 214 Intervalos de prediccioacuten aproximados Podemos concebir al error estaacutendar de la estimacioacuten como una herramienta estadiacutestica que podemos usar para hacer afirmaciones de probabilidad acerca del intervalo alrededor del valor estimado de Y dentro del cual cae el valor real de Y Ejemplo

Y= 375 + 075 X Sustituyendo 4 en X

Y= 375 + 075 (4) = 375 + 300

= 675

Estadiacutestica Administrativa II 20

Intervalo 1 error 2 errores 3 errores

Y plusmn1 Se

Y plusmn2 Se

Y plusmn3 Se

En donde Se = 8660

Sustitucioacuten

Ejemplo A menudo quienes hacen la contabilidad de costos estiman los gastos generales con base en el nivel de produccioacuten Se ha reunido informacioacuten acerca de los gastos generales y las unidades producidas en diferentes plantas y ahora desean estimar una ecuacioacuten de regresioacuten para predecir los gastos generales futuros Gastos generales 191 170 272 155 280 173 234 116 153 178 Unidades 40 42 53 35 56 39 48 30 37 40

a) Determine la variable dependiente e independiente b) Desarrolle una ecuacioacuten de regresioacuten para contabilidad de costos c) Pronostique los gastos generales cuando se producen 50 unidades d) Calcule el error estaacutendar de estimacioacuten

Y +1 Se =

675 + (1) (8660) = 76140 Liacutemite superior del intervalo de prediccioacuten

Y +2 Se =

675 + (2) (8660) = 84820 Liacutemite superior del intervalo de prediccioacuten

Y -1 Se =

675 - (1) (8660) = 58840 Liacutemite inferior del intervalo de prediccioacuten

Y - 2 Se =

675 - (2) (8660) = 50180 Liacutemite inferior del intervalo de prediccioacuten

Estadiacutestica Administrativa II 21

X Y XY X2 Y2 40 191 7640 1600 36481 42 170 7140 1764 28900 53 272 14416 2809 73984 35 155 5425 1225 24025 56 280 15680 3136 78400 39 173 6747 1521 29929 48 234 11232 2304 54756 30 116 3480 900 13456 37 153 5661 1369 23409 40 178 7120 1600 31684 ΣX= 420 ΣY= 1922 ΣXY= 84541 ΣX2= 18228 ΣY2= 395024

b = Σ XY - n X Y = 84541 - 10(42)(1922) = 64915 Σ X2 - n X2 18228 - 10(42)2 a = Y ndash bX = 1922 ndash 64915 (42) = - 804430 Y= a+bx = -804430 + 64915 (50) = 2441320 Se= ΣY2 ndashaΣY ndash b ΣXY = n-2 Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

12-2 531 12-3 531

12-13 531 12-14 531 12-15 531

Estadiacutestica Administrativa II 22

215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten

Coeficiente de determinacioacuten de la muestra

r2= aΣY+bΣXY-nY2

ΣY2 ndash n Y2

Coeficiente de correlacioacuten de la muestra

r= r2

Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten

Estadiacutestica Administrativa II 23

Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables

Y= a + b1 X1 + b2 X2

Ecuacioacuten

na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2

1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2

2 = Σ X2Y

Ejemplo

a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10

Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784

Sumatoria

114 105 85 2463 1590 1435 2367 1571

Matriz

6 105 85 114 105 2367 1435 2463 85 1435 1571 1590

1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25

1 175 14167 19 0 1 -099 884 0 0 361608 21410

361608 b2 = 21410 b2 = 21410 361608 b2 = 059

Estadiacutestica Administrativa II 24

1 b1 -099 b2 = 884 1 b1 -099 (059) = 884

-006 884 1b1 = 884 +006 b1 = 890

1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a

= 2589

Y= a + b1 X1 + b2 X2

y=2589+890(28)+059(10)=28099

Estadiacutestica Administrativa II 25

218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)

Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad

La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos

Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir

donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria

Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados

Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante

Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo

Estadiacutestica Administrativa II 26

Figura 5 Distribucioacuten Homocedaacutestica

Figura 6 Distribucioacuten Heterocedaacutestica

Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten

lineal para hacer estimaciones futuras

Estadiacutestica Administrativa II 27

Unidad 3 Nuacutemeros iacutendice

Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se

calcula encontrando el cociente del valor actual entre el valor base luego se

multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje

Tipos de nuacutemeros iacutendice

Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de

cantidad e iacutendice de valor

Iacutendice de precios

Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida

Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo

Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable

El iacutendice de valor combina los cambios de precio y cantidad para presentar un

iacutendice con maacutes informacioacuten

Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos

como indicadores generales de la condicioacuten econoacutemica de un paiacutes

Factores que pueden distorsionar los nuacutemeros iacutendice

bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados

bull Falta de comparacioacuten de iacutendices

bull Ponderacioacuten no apropiada de los factores

bull Seleccioacuten de una base no apropiada

Estadiacutestica Administrativa II 28

31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores

Iacutendice de cantidad de agregados no ponderados

ΣQi x 100 ΣQo

Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea

1993 1994 1995

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200

Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado

1993 Qo

1994 Q1

1995 Q2

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308

Estadiacutestica Administrativa II 29

Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra

Iacutendice de precios de agregados ponderados

ΣPiQ x 100 ΣPoQ

Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100

Cambio de periodo base

I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base

Estadiacutestica Administrativa II 30

35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos

Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables

Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico

Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios

El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)

Estadiacutestica Administrativa II 31

Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica

37 Deflacioacuten de los valores de series de tiempo

Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios

En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea

La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores

Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero

Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes

Los valores expresados en unidades monetarias corrientes se conocen como valores nominales

Los valores expresados en unidades monetarias constantes se conocen como valores reales

Estadiacutestica Administrativa II 32

38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor

Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos

39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)

Estadiacutestica Administrativa II 33

Siacutembolo Nombre de la compantildeiacutea

AA Alcoa

ALD Allied Signal

AXP American Express

BA Boeing

CAT Caterpillar

CHV Chevron

C CitiGroup

DIS Disney

DD Dupont

EK Eastman Kodak

GE General Electric

GM General Motors

GT Goodyear Tire

HWP Hewlett-Packard

IBM International Business Machines

IP International Paper

JNJ Johnson amp Johnson

JPM JP Morgan Bank

KO Coca Cola

Figura 5 Compantildeiacuteas comprendidas en el Dow Jones

310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos

Praacutectica 2

992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico

elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado

de precios

Estadiacutestica Administrativa II 34

Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida

bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)

42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten

Las principales pruebas no parameacutetricas son las siguientes

bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher

Estadiacutestica Administrativa II 35

bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon

Caracteriacutesticas de algunas pruebas no parameacutetricas

1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos

2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten

3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal

4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados

5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc

6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica

Prueba Caracteriacutestica

Mann- Whitney 2 muestras independientes

Wilcoxon 2 muestras asociadas

Kruskal-Wallis + de 2 muestras independientes

Friedman + de 2 muestras asociadas

Tabla1 Caracteriacutesticas de pruebas no parameacutetricas

Estadiacutestica Administrativa II 36

Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media

Ventajas y desventajas de los meacutetodos parameacutetricos

Desventajas Ventajas bull Ignoran cierta cantidad de

informacioacuten bull No requieren la suposicioacuten de que

una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica

bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas

bull Generalmente es maacutes sencillo realizarlas y entenderlas

bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal

Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo

MHHHHM

1ra 2ra 3ra

Estadiacutestica Administrativa II 37

Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1

n2= nuacutemero de ocurrencias del tipo 2

r= nuacutemero de corridas

4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue

BABBBAAABBABBBBAAAABABAABBBAABAAAABBA

BBAAAABBABBBBAABBABAABB

Valores de la prueba

n1= 29

n2= 31

r= 29

4322 Distribucioacuten de muestreo del estadiacutestico r

El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba

Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente

Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1

n1+n2

Estadiacutestica Administrativa II 38

μr = 2(29)(31) +1

29+31

μr = 1798 +1 60

μr = 2997 +1

μr = 3097

Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)

(n1+n2)2(n1+n2-1)

σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)

σr= (1798) (1738)

(60)2(59)

σr= 1471

σr= 384

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-24 643 14-25 643 14-26 643 14-27 644 14-28 644

Estadiacutestica Administrativa II 39

44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica

Ejemplo

Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado

Miembro del panel Calificacioacuten para

conferencias grandes

Calificacioacuten para

sesiones pequentildeas

Signo de la calificacioacuten

Evaluacioacuten de los dos tipos de

clases

1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -

6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +

La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)

Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20

Estadiacutestica Administrativa II 40

Establecimiento de las hipoacutetesis

Ho p = 05

H1 p ne 05

Se consideran la posibilidades solamente de signos + y - (9+6 =15)

p Ho = 05

q H0 = 05

n= 15

p= 0600 (915)

q= 0400 (615)

Prueba de hipoacutetesis de que no hay diferencia

Error estaacutendar del la proporcioacuten

σp= pq n

σp= (05)(05) 15

σp= 0129

0025

0

0475 del aacuterea

Valor criacutetico Z=-196

Regioacuten de aceptacioacuten

0025

0475 del aacuterea

Valor criacutetico Z=196

Estadiacutestica Administrativa II 41

45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten

Procedimiento de la prueba de rangos con signo de Wilcoxon

Paso1 Para cada par de datos calcule la diferencia d restando el segundo

valor del primero Guarde los signos pero descarte cualquier par para el que

d=0

Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de

la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango

correspondiente Cuando las diferencias tengan el mismo valor numeacuterico

asiacutegneles la media de los rangos implicados en el empate

Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino

Esto es inserte aquellos signos que se ignoraron e el paso dos

Paso 4 Calcule la suma de los valores absolutos de los rangos negativos

Tambieacuten la suma de los rangos positivos

Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon

en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el

procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos

sumas

Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la

diferencia d no es 0

Estadiacutestica Administrativa II 42

Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el

tamantildeo muestral

Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos

muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica

esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico

Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente

2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha

Notacioacuten

T= la maacutes pequentildea de las siguientes dos sumas

1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0

La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T

Estadiacutestica Administrativa II 43

46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2

Rango Calificacioacuten Plantel

1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S

10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S

Estadiacutestica Administrativa II 44

30 1600 S

Estadiacutestica Administrativa II 45

Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500

n1= 15 n2= 15 R1= 247 R2= 218

Estadiacutestico U

U = n1n2 + n1(n1 +1) -R1 2

U= (15)(15) + (15)(16) -247 2

U= 225+120-247

U= 98

Media de la distribucioacuten muestral U

μu = n1n2

2

μu = (15)(15)

2

μu =1125

Estadiacutestica Administrativa II 46

Estadiacutestico U

σU = n1n2 + (n1n2 +1)

12

σU = (15)(15)(15+15+1)

12

σU = 6975 12

σU = 58125

σU = 241

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2

α= 015

Estandarizacioacuten del estadiacutestico U

z = U-μu

σU

z = 98 - 1125 241

z = -0602

144 -144 0 -0602

Valor estandarizado de

la muestra U

Regioacuten de aceptacioacuten

Estadiacutestica Administrativa II 47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras

Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular

Prueba de Wilcoxon de los rangos con signo

Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero

Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande

Prueba de Wilcoxon para contrastar datos pareados

El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 15: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

Estadiacutestica Administrativa II 11

Caacutelculo de la media

Meacutetodo 1 Meacutetodo 2 Meacutetodo 3 Produccioacuten diaria 15 22 18

18 27 24 19 18 19 22 21 16 11 17 22

15 85 105 114 Sumatoria divide5 divide5 divide6 Tamantildeo de

la muestra 17 21 19 Media

muestral n1=5 n2=5 n3=6

1= 17 2= 21 3= 19

Caacutelculo de la gran media

= 15 +18+ 19+ 22+ 11+22 +27+ 18+ 21+ 17+18 +24+ 19+ 16+ 22+ 15 = 19 16

Caacutelculo de la varianza entre columnas

σ2b = Σnj ( - )2 = k-1

n - ( - )2 n( - ) Caacutelculo de la varianza entre columnas

5 17 19 17-19=-2 (-2)2=4 5x4=20 5 21 19 21-19=2 (2)2=4 5x4=20 6 19 19 19-19=0 (0)2=0 6x0 = 0 Σnj( - )

2 =40

σ2b = Σnj ( - )2 = 40= 40 = 20 varianza entre columnas

k-1 3-1 2

Estadiacutestica Administrativa II 12

Estimacioacuten de la varianza dentro de columnas

Meacutetodo de capacitacioacuten 1 Media muestral =17

Estimacioacuten de la varianza dentro de columnas

- ( - )2 15-17=-2 (-2)2=4 18-17=1 (1)2=1 19-17=2 (2)2=4 22-17=5 (5)2=25 11-17=-6 (-6)2=36 Σ( - )2 =70

s21= Σ( - )2 = 70 = 175 varianza de la muestra

n-1 5-1

Meacutetodo de capacitacioacuten 2 Media muestral =21

Estimacioacuten de la varianza dentro de columnas

- ( - )2 22-21=1 (1)2=1 27-21=6 (6)2=36 18-21=-3 (-3)2=9 21-21=0 (0)2=0 17-21=-4 (-4)2=16 Σ( - )2 =62

s22= Σ( - )2 = 62 = 155 varianza de la muestra

n-1 5-1

Meacutetodo de capacitacioacuten 3 Media muestral =19

Estimacioacuten de la varianza dentro de columnas

- ( - )2 18-19=-1 (-1)2=1 24-19=5 (5)2=25 19-19=0 (0)2=0 16-19=-3 (-3)2=9 22-19=3 (-32=9 15-19=-4 (-4)2=16 Σ( - )2 =60

Estadiacutestica Administrativa II 13

s23= Σ( - )2 = 60 = 120 varianza de la muestra

n-1 6-1

σ2w = Σ nj - 1 s2

j = (413)(175) + (413)(155) + (513)(120) = 193 = 14769 nt - k 13

Estadiacutestico F

F = varianza entre columnas = σ2b

Varianza dentro de columnas σ2w

F= 20 = 1354 cociente F 14769

Determinacioacuten de los grados de libertad

Grados de libertad del numerador

Nuacutemero de grados de libertad en el numerador del cociente F

= (nuacutemero de muestras-1)

Grados de libertad del denominador

Nuacutemero de grados de libertad en el denominador del cociente F

= Σ (nj-1)= nt-k

Graacutefica

Se acepta la hipoacutetesis nula

Regioacuten de aceptacioacuten

F= 1354

005 del aacuterea

Distribucioacuten f

381

Valor de tabla

Regioacuten de rechazo

Estadiacutestica Administrativa II 14

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

11-5 479 11-6 479

11-26 480 11-27 480 11-28 480 11-29 480 11-30 480

152 Inferencia sobre una varianza de poblacioacuten (Anova)

Estadiacutestico ji- cuadrada para inferencias sobre una varianza

X2=(n-1)s2 σ2

Intervalo de confianza para σ2

Liacutemite inferior de confianza

σ2L=(n-1)s2 X2

U Liacutemite superior de confianza

σ2U=(n-1)s2 X2

L

Estadiacutestica Administrativa II 15

Ejercicio

Con los siguientes datos obtener el estadiacutestico ji- cuadrada Y el intervalo de

confianza del 95

Tiempo x

50 45 27 66 43 96 45 90 69

153 Inferencia sobre la varianza de dos poblaciones (Anova) Ademaacutes de comparar la varianza de dos poblaciones el principal objetivo de este tema es analizar el cociente que se obtiene al aplicar la foacutermula correspondiente

Coeficiente F para inferencias acerca de dos varianzas

F=S21

S22

Estadiacutestica Administrativa II 16

Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple

21 Estimacioacuten mediante la liacutenea de regresioacuten El anaacutelisis de regresioacuten y correlacioacuten permiten determinar tanto la naturaleza como la fuerza de una relacioacuten entre dos variables En el anaacutelisis de regresioacuten se desarrollaraacute una ecuacioacuten de estimacioacuten a traveacutes de una foacutermula matemaacutetica que relaciona las variables conocidas con la variable desconocida La variable conocida- variable independiente X La variable que tratamos de predecir se llama variable dependiente Y

Figura 2 Fuente (Levin 2004511) 211 Diagrama de dispersioacuten El primer paso para determinar si existe una relacioacuten entre dos variables es examinar la graacutefica de datos observados A esta graacutefica se le llama diagrama de dispersioacuten Un diagrama de dispersioacuten se puede identificar visualmente patrones que indique si las variables estaacuten relacionadas

X

Y

Gastos contra la contaminacioacuten

Emisor de

contaminacioacuten

Pendiente negativa

b) Relacioacuten directa

X

Y

Publicidad

Ventas

Pendiente positiva

a) Relacioacuten directa

Estadiacutestica Administrativa II 17

Figura 3 Fuente (Levin 2004503)

212 Meacutetodo de miacutenimos cuadrados

Liacutenea de estimacioacuten

Y= a+bx Y= variable dependiente a=variable ordenada y b=pendiente de la recta x=variable independiente

Pendiente de la recta de regresioacuten de mejor ajuste

b = Σ XY - n X Y Σ X2 - n X2

b=pendiente de la liacutenea de estimacioacuten de mejor ajuste X= valores de la variable independiente Y= variable valores de la variable dependiente X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente n= nuacutemero de puntos

Estadiacutestica Administrativa II 18

Liacutenea de estimacioacuten

a = Y - bX a= ordenada Y b= pendiente de la ecuacioacuten X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente

Error estaacutendar de la estimacioacuten

Se= Σ(Y-Y)2

n-2 Y= valores de la variable dependiente Y=valores estimados con la ecuacioacuten de estimacioacuten que corresponden a cada valor de Y n= nuacutemero de puntos utilizados para ajustar la liacutenea de regresioacuten Para medir la confiabilidad de la ecuacioacuten de estimacioacuten los especialistas en estadiacutestica han desarrollado el error estaacutendar de estimacioacuten Este error estaacutendar se simboliza por Se y es similar a la desviacioacuten estaacutendar en cuanto a que ambas son medidas de dispersioacuten El error estaacutendar de la estimacioacuten por otra parte mide la variabilidad o dispersioacuten de los valores observados alrededor de la recta de regresioacuten 213 Interpretacioacuten del error estaacutendar de la estimacioacuten Como ocurririacutea en el caso de la desviacioacuten estaacutendar mientras maacutes grande sea el error estaacutendar de la estimacioacuten mayor seraacute la dispersioacuten de los puntos alrededor de la liacutenea de regresioacuten De manera inversa si Se= 0 esperamos que la ecuacioacuten de estimacioacuten sea un estimador ldquoperfectordquo de la variable dependiente En este caso todos los puntos caeriacutean directamente sobre la liacutenea de regresioacuten y no habriacutea puntos dispersos alrededor Usaremos el error estaacutendar de la estimacioacuten como una herramienta de la misma forma que podemos usar la desviacioacuten estaacutendar Esto es suponiendo que los puntos observados siguen una distribucioacuten normal alrededor de la recta de regresioacuten podemos esperar encontrar el 68 de los puntos dentro de plusmn1Se el 955 de los puntos dentro de plusmn2Se y el 997 de los puntos dentro de plusmn3Se

Estadiacutestica Administrativa II 19

Figura 4 Fuente (Levin 2004529)

Debemos observar que el error estaacutendar de la estimacioacuten se mide a lo largo del eje Y y no perpendicularmente desde la recta de regresioacuten 214 Intervalos de prediccioacuten aproximados Podemos concebir al error estaacutendar de la estimacioacuten como una herramienta estadiacutestica que podemos usar para hacer afirmaciones de probabilidad acerca del intervalo alrededor del valor estimado de Y dentro del cual cae el valor real de Y Ejemplo

Y= 375 + 075 X Sustituyendo 4 en X

Y= 375 + 075 (4) = 375 + 300

= 675

Estadiacutestica Administrativa II 20

Intervalo 1 error 2 errores 3 errores

Y plusmn1 Se

Y plusmn2 Se

Y plusmn3 Se

En donde Se = 8660

Sustitucioacuten

Ejemplo A menudo quienes hacen la contabilidad de costos estiman los gastos generales con base en el nivel de produccioacuten Se ha reunido informacioacuten acerca de los gastos generales y las unidades producidas en diferentes plantas y ahora desean estimar una ecuacioacuten de regresioacuten para predecir los gastos generales futuros Gastos generales 191 170 272 155 280 173 234 116 153 178 Unidades 40 42 53 35 56 39 48 30 37 40

a) Determine la variable dependiente e independiente b) Desarrolle una ecuacioacuten de regresioacuten para contabilidad de costos c) Pronostique los gastos generales cuando se producen 50 unidades d) Calcule el error estaacutendar de estimacioacuten

Y +1 Se =

675 + (1) (8660) = 76140 Liacutemite superior del intervalo de prediccioacuten

Y +2 Se =

675 + (2) (8660) = 84820 Liacutemite superior del intervalo de prediccioacuten

Y -1 Se =

675 - (1) (8660) = 58840 Liacutemite inferior del intervalo de prediccioacuten

Y - 2 Se =

675 - (2) (8660) = 50180 Liacutemite inferior del intervalo de prediccioacuten

Estadiacutestica Administrativa II 21

X Y XY X2 Y2 40 191 7640 1600 36481 42 170 7140 1764 28900 53 272 14416 2809 73984 35 155 5425 1225 24025 56 280 15680 3136 78400 39 173 6747 1521 29929 48 234 11232 2304 54756 30 116 3480 900 13456 37 153 5661 1369 23409 40 178 7120 1600 31684 ΣX= 420 ΣY= 1922 ΣXY= 84541 ΣX2= 18228 ΣY2= 395024

b = Σ XY - n X Y = 84541 - 10(42)(1922) = 64915 Σ X2 - n X2 18228 - 10(42)2 a = Y ndash bX = 1922 ndash 64915 (42) = - 804430 Y= a+bx = -804430 + 64915 (50) = 2441320 Se= ΣY2 ndashaΣY ndash b ΣXY = n-2 Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

12-2 531 12-3 531

12-13 531 12-14 531 12-15 531

Estadiacutestica Administrativa II 22

215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten

Coeficiente de determinacioacuten de la muestra

r2= aΣY+bΣXY-nY2

ΣY2 ndash n Y2

Coeficiente de correlacioacuten de la muestra

r= r2

Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten

Estadiacutestica Administrativa II 23

Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables

Y= a + b1 X1 + b2 X2

Ecuacioacuten

na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2

1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2

2 = Σ X2Y

Ejemplo

a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10

Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784

Sumatoria

114 105 85 2463 1590 1435 2367 1571

Matriz

6 105 85 114 105 2367 1435 2463 85 1435 1571 1590

1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25

1 175 14167 19 0 1 -099 884 0 0 361608 21410

361608 b2 = 21410 b2 = 21410 361608 b2 = 059

Estadiacutestica Administrativa II 24

1 b1 -099 b2 = 884 1 b1 -099 (059) = 884

-006 884 1b1 = 884 +006 b1 = 890

1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a

= 2589

Y= a + b1 X1 + b2 X2

y=2589+890(28)+059(10)=28099

Estadiacutestica Administrativa II 25

218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)

Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad

La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos

Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir

donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria

Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados

Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante

Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo

Estadiacutestica Administrativa II 26

Figura 5 Distribucioacuten Homocedaacutestica

Figura 6 Distribucioacuten Heterocedaacutestica

Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten

lineal para hacer estimaciones futuras

Estadiacutestica Administrativa II 27

Unidad 3 Nuacutemeros iacutendice

Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se

calcula encontrando el cociente del valor actual entre el valor base luego se

multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje

Tipos de nuacutemeros iacutendice

Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de

cantidad e iacutendice de valor

Iacutendice de precios

Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida

Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo

Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable

El iacutendice de valor combina los cambios de precio y cantidad para presentar un

iacutendice con maacutes informacioacuten

Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos

como indicadores generales de la condicioacuten econoacutemica de un paiacutes

Factores que pueden distorsionar los nuacutemeros iacutendice

bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados

bull Falta de comparacioacuten de iacutendices

bull Ponderacioacuten no apropiada de los factores

bull Seleccioacuten de una base no apropiada

Estadiacutestica Administrativa II 28

31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores

Iacutendice de cantidad de agregados no ponderados

ΣQi x 100 ΣQo

Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea

1993 1994 1995

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200

Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado

1993 Qo

1994 Q1

1995 Q2

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308

Estadiacutestica Administrativa II 29

Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra

Iacutendice de precios de agregados ponderados

ΣPiQ x 100 ΣPoQ

Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100

Cambio de periodo base

I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base

Estadiacutestica Administrativa II 30

35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos

Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables

Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico

Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios

El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)

Estadiacutestica Administrativa II 31

Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica

37 Deflacioacuten de los valores de series de tiempo

Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios

En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea

La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores

Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero

Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes

Los valores expresados en unidades monetarias corrientes se conocen como valores nominales

Los valores expresados en unidades monetarias constantes se conocen como valores reales

Estadiacutestica Administrativa II 32

38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor

Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos

39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)

Estadiacutestica Administrativa II 33

Siacutembolo Nombre de la compantildeiacutea

AA Alcoa

ALD Allied Signal

AXP American Express

BA Boeing

CAT Caterpillar

CHV Chevron

C CitiGroup

DIS Disney

DD Dupont

EK Eastman Kodak

GE General Electric

GM General Motors

GT Goodyear Tire

HWP Hewlett-Packard

IBM International Business Machines

IP International Paper

JNJ Johnson amp Johnson

JPM JP Morgan Bank

KO Coca Cola

Figura 5 Compantildeiacuteas comprendidas en el Dow Jones

310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos

Praacutectica 2

992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico

elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado

de precios

Estadiacutestica Administrativa II 34

Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida

bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)

42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten

Las principales pruebas no parameacutetricas son las siguientes

bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher

Estadiacutestica Administrativa II 35

bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon

Caracteriacutesticas de algunas pruebas no parameacutetricas

1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos

2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten

3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal

4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados

5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc

6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica

Prueba Caracteriacutestica

Mann- Whitney 2 muestras independientes

Wilcoxon 2 muestras asociadas

Kruskal-Wallis + de 2 muestras independientes

Friedman + de 2 muestras asociadas

Tabla1 Caracteriacutesticas de pruebas no parameacutetricas

Estadiacutestica Administrativa II 36

Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media

Ventajas y desventajas de los meacutetodos parameacutetricos

Desventajas Ventajas bull Ignoran cierta cantidad de

informacioacuten bull No requieren la suposicioacuten de que

una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica

bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas

bull Generalmente es maacutes sencillo realizarlas y entenderlas

bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal

Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo

MHHHHM

1ra 2ra 3ra

Estadiacutestica Administrativa II 37

Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1

n2= nuacutemero de ocurrencias del tipo 2

r= nuacutemero de corridas

4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue

BABBBAAABBABBBBAAAABABAABBBAABAAAABBA

BBAAAABBABBBBAABBABAABB

Valores de la prueba

n1= 29

n2= 31

r= 29

4322 Distribucioacuten de muestreo del estadiacutestico r

El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba

Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente

Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1

n1+n2

Estadiacutestica Administrativa II 38

μr = 2(29)(31) +1

29+31

μr = 1798 +1 60

μr = 2997 +1

μr = 3097

Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)

(n1+n2)2(n1+n2-1)

σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)

σr= (1798) (1738)

(60)2(59)

σr= 1471

σr= 384

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-24 643 14-25 643 14-26 643 14-27 644 14-28 644

Estadiacutestica Administrativa II 39

44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica

Ejemplo

Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado

Miembro del panel Calificacioacuten para

conferencias grandes

Calificacioacuten para

sesiones pequentildeas

Signo de la calificacioacuten

Evaluacioacuten de los dos tipos de

clases

1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -

6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +

La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)

Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20

Estadiacutestica Administrativa II 40

Establecimiento de las hipoacutetesis

Ho p = 05

H1 p ne 05

Se consideran la posibilidades solamente de signos + y - (9+6 =15)

p Ho = 05

q H0 = 05

n= 15

p= 0600 (915)

q= 0400 (615)

Prueba de hipoacutetesis de que no hay diferencia

Error estaacutendar del la proporcioacuten

σp= pq n

σp= (05)(05) 15

σp= 0129

0025

0

0475 del aacuterea

Valor criacutetico Z=-196

Regioacuten de aceptacioacuten

0025

0475 del aacuterea

Valor criacutetico Z=196

Estadiacutestica Administrativa II 41

45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten

Procedimiento de la prueba de rangos con signo de Wilcoxon

Paso1 Para cada par de datos calcule la diferencia d restando el segundo

valor del primero Guarde los signos pero descarte cualquier par para el que

d=0

Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de

la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango

correspondiente Cuando las diferencias tengan el mismo valor numeacuterico

asiacutegneles la media de los rangos implicados en el empate

Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino

Esto es inserte aquellos signos que se ignoraron e el paso dos

Paso 4 Calcule la suma de los valores absolutos de los rangos negativos

Tambieacuten la suma de los rangos positivos

Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon

en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el

procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos

sumas

Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la

diferencia d no es 0

Estadiacutestica Administrativa II 42

Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el

tamantildeo muestral

Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos

muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica

esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico

Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente

2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha

Notacioacuten

T= la maacutes pequentildea de las siguientes dos sumas

1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0

La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T

Estadiacutestica Administrativa II 43

46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2

Rango Calificacioacuten Plantel

1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S

10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S

Estadiacutestica Administrativa II 44

30 1600 S

Estadiacutestica Administrativa II 45

Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500

n1= 15 n2= 15 R1= 247 R2= 218

Estadiacutestico U

U = n1n2 + n1(n1 +1) -R1 2

U= (15)(15) + (15)(16) -247 2

U= 225+120-247

U= 98

Media de la distribucioacuten muestral U

μu = n1n2

2

μu = (15)(15)

2

μu =1125

Estadiacutestica Administrativa II 46

Estadiacutestico U

σU = n1n2 + (n1n2 +1)

12

σU = (15)(15)(15+15+1)

12

σU = 6975 12

σU = 58125

σU = 241

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2

α= 015

Estandarizacioacuten del estadiacutestico U

z = U-μu

σU

z = 98 - 1125 241

z = -0602

144 -144 0 -0602

Valor estandarizado de

la muestra U

Regioacuten de aceptacioacuten

Estadiacutestica Administrativa II 47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras

Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular

Prueba de Wilcoxon de los rangos con signo

Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero

Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande

Prueba de Wilcoxon para contrastar datos pareados

El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 16: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

Estadiacutestica Administrativa II 12

Estimacioacuten de la varianza dentro de columnas

Meacutetodo de capacitacioacuten 1 Media muestral =17

Estimacioacuten de la varianza dentro de columnas

- ( - )2 15-17=-2 (-2)2=4 18-17=1 (1)2=1 19-17=2 (2)2=4 22-17=5 (5)2=25 11-17=-6 (-6)2=36 Σ( - )2 =70

s21= Σ( - )2 = 70 = 175 varianza de la muestra

n-1 5-1

Meacutetodo de capacitacioacuten 2 Media muestral =21

Estimacioacuten de la varianza dentro de columnas

- ( - )2 22-21=1 (1)2=1 27-21=6 (6)2=36 18-21=-3 (-3)2=9 21-21=0 (0)2=0 17-21=-4 (-4)2=16 Σ( - )2 =62

s22= Σ( - )2 = 62 = 155 varianza de la muestra

n-1 5-1

Meacutetodo de capacitacioacuten 3 Media muestral =19

Estimacioacuten de la varianza dentro de columnas

- ( - )2 18-19=-1 (-1)2=1 24-19=5 (5)2=25 19-19=0 (0)2=0 16-19=-3 (-3)2=9 22-19=3 (-32=9 15-19=-4 (-4)2=16 Σ( - )2 =60

Estadiacutestica Administrativa II 13

s23= Σ( - )2 = 60 = 120 varianza de la muestra

n-1 6-1

σ2w = Σ nj - 1 s2

j = (413)(175) + (413)(155) + (513)(120) = 193 = 14769 nt - k 13

Estadiacutestico F

F = varianza entre columnas = σ2b

Varianza dentro de columnas σ2w

F= 20 = 1354 cociente F 14769

Determinacioacuten de los grados de libertad

Grados de libertad del numerador

Nuacutemero de grados de libertad en el numerador del cociente F

= (nuacutemero de muestras-1)

Grados de libertad del denominador

Nuacutemero de grados de libertad en el denominador del cociente F

= Σ (nj-1)= nt-k

Graacutefica

Se acepta la hipoacutetesis nula

Regioacuten de aceptacioacuten

F= 1354

005 del aacuterea

Distribucioacuten f

381

Valor de tabla

Regioacuten de rechazo

Estadiacutestica Administrativa II 14

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

11-5 479 11-6 479

11-26 480 11-27 480 11-28 480 11-29 480 11-30 480

152 Inferencia sobre una varianza de poblacioacuten (Anova)

Estadiacutestico ji- cuadrada para inferencias sobre una varianza

X2=(n-1)s2 σ2

Intervalo de confianza para σ2

Liacutemite inferior de confianza

σ2L=(n-1)s2 X2

U Liacutemite superior de confianza

σ2U=(n-1)s2 X2

L

Estadiacutestica Administrativa II 15

Ejercicio

Con los siguientes datos obtener el estadiacutestico ji- cuadrada Y el intervalo de

confianza del 95

Tiempo x

50 45 27 66 43 96 45 90 69

153 Inferencia sobre la varianza de dos poblaciones (Anova) Ademaacutes de comparar la varianza de dos poblaciones el principal objetivo de este tema es analizar el cociente que se obtiene al aplicar la foacutermula correspondiente

Coeficiente F para inferencias acerca de dos varianzas

F=S21

S22

Estadiacutestica Administrativa II 16

Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple

21 Estimacioacuten mediante la liacutenea de regresioacuten El anaacutelisis de regresioacuten y correlacioacuten permiten determinar tanto la naturaleza como la fuerza de una relacioacuten entre dos variables En el anaacutelisis de regresioacuten se desarrollaraacute una ecuacioacuten de estimacioacuten a traveacutes de una foacutermula matemaacutetica que relaciona las variables conocidas con la variable desconocida La variable conocida- variable independiente X La variable que tratamos de predecir se llama variable dependiente Y

Figura 2 Fuente (Levin 2004511) 211 Diagrama de dispersioacuten El primer paso para determinar si existe una relacioacuten entre dos variables es examinar la graacutefica de datos observados A esta graacutefica se le llama diagrama de dispersioacuten Un diagrama de dispersioacuten se puede identificar visualmente patrones que indique si las variables estaacuten relacionadas

X

Y

Gastos contra la contaminacioacuten

Emisor de

contaminacioacuten

Pendiente negativa

b) Relacioacuten directa

X

Y

Publicidad

Ventas

Pendiente positiva

a) Relacioacuten directa

Estadiacutestica Administrativa II 17

Figura 3 Fuente (Levin 2004503)

212 Meacutetodo de miacutenimos cuadrados

Liacutenea de estimacioacuten

Y= a+bx Y= variable dependiente a=variable ordenada y b=pendiente de la recta x=variable independiente

Pendiente de la recta de regresioacuten de mejor ajuste

b = Σ XY - n X Y Σ X2 - n X2

b=pendiente de la liacutenea de estimacioacuten de mejor ajuste X= valores de la variable independiente Y= variable valores de la variable dependiente X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente n= nuacutemero de puntos

Estadiacutestica Administrativa II 18

Liacutenea de estimacioacuten

a = Y - bX a= ordenada Y b= pendiente de la ecuacioacuten X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente

Error estaacutendar de la estimacioacuten

Se= Σ(Y-Y)2

n-2 Y= valores de la variable dependiente Y=valores estimados con la ecuacioacuten de estimacioacuten que corresponden a cada valor de Y n= nuacutemero de puntos utilizados para ajustar la liacutenea de regresioacuten Para medir la confiabilidad de la ecuacioacuten de estimacioacuten los especialistas en estadiacutestica han desarrollado el error estaacutendar de estimacioacuten Este error estaacutendar se simboliza por Se y es similar a la desviacioacuten estaacutendar en cuanto a que ambas son medidas de dispersioacuten El error estaacutendar de la estimacioacuten por otra parte mide la variabilidad o dispersioacuten de los valores observados alrededor de la recta de regresioacuten 213 Interpretacioacuten del error estaacutendar de la estimacioacuten Como ocurririacutea en el caso de la desviacioacuten estaacutendar mientras maacutes grande sea el error estaacutendar de la estimacioacuten mayor seraacute la dispersioacuten de los puntos alrededor de la liacutenea de regresioacuten De manera inversa si Se= 0 esperamos que la ecuacioacuten de estimacioacuten sea un estimador ldquoperfectordquo de la variable dependiente En este caso todos los puntos caeriacutean directamente sobre la liacutenea de regresioacuten y no habriacutea puntos dispersos alrededor Usaremos el error estaacutendar de la estimacioacuten como una herramienta de la misma forma que podemos usar la desviacioacuten estaacutendar Esto es suponiendo que los puntos observados siguen una distribucioacuten normal alrededor de la recta de regresioacuten podemos esperar encontrar el 68 de los puntos dentro de plusmn1Se el 955 de los puntos dentro de plusmn2Se y el 997 de los puntos dentro de plusmn3Se

Estadiacutestica Administrativa II 19

Figura 4 Fuente (Levin 2004529)

Debemos observar que el error estaacutendar de la estimacioacuten se mide a lo largo del eje Y y no perpendicularmente desde la recta de regresioacuten 214 Intervalos de prediccioacuten aproximados Podemos concebir al error estaacutendar de la estimacioacuten como una herramienta estadiacutestica que podemos usar para hacer afirmaciones de probabilidad acerca del intervalo alrededor del valor estimado de Y dentro del cual cae el valor real de Y Ejemplo

Y= 375 + 075 X Sustituyendo 4 en X

Y= 375 + 075 (4) = 375 + 300

= 675

Estadiacutestica Administrativa II 20

Intervalo 1 error 2 errores 3 errores

Y plusmn1 Se

Y plusmn2 Se

Y plusmn3 Se

En donde Se = 8660

Sustitucioacuten

Ejemplo A menudo quienes hacen la contabilidad de costos estiman los gastos generales con base en el nivel de produccioacuten Se ha reunido informacioacuten acerca de los gastos generales y las unidades producidas en diferentes plantas y ahora desean estimar una ecuacioacuten de regresioacuten para predecir los gastos generales futuros Gastos generales 191 170 272 155 280 173 234 116 153 178 Unidades 40 42 53 35 56 39 48 30 37 40

a) Determine la variable dependiente e independiente b) Desarrolle una ecuacioacuten de regresioacuten para contabilidad de costos c) Pronostique los gastos generales cuando se producen 50 unidades d) Calcule el error estaacutendar de estimacioacuten

Y +1 Se =

675 + (1) (8660) = 76140 Liacutemite superior del intervalo de prediccioacuten

Y +2 Se =

675 + (2) (8660) = 84820 Liacutemite superior del intervalo de prediccioacuten

Y -1 Se =

675 - (1) (8660) = 58840 Liacutemite inferior del intervalo de prediccioacuten

Y - 2 Se =

675 - (2) (8660) = 50180 Liacutemite inferior del intervalo de prediccioacuten

Estadiacutestica Administrativa II 21

X Y XY X2 Y2 40 191 7640 1600 36481 42 170 7140 1764 28900 53 272 14416 2809 73984 35 155 5425 1225 24025 56 280 15680 3136 78400 39 173 6747 1521 29929 48 234 11232 2304 54756 30 116 3480 900 13456 37 153 5661 1369 23409 40 178 7120 1600 31684 ΣX= 420 ΣY= 1922 ΣXY= 84541 ΣX2= 18228 ΣY2= 395024

b = Σ XY - n X Y = 84541 - 10(42)(1922) = 64915 Σ X2 - n X2 18228 - 10(42)2 a = Y ndash bX = 1922 ndash 64915 (42) = - 804430 Y= a+bx = -804430 + 64915 (50) = 2441320 Se= ΣY2 ndashaΣY ndash b ΣXY = n-2 Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

12-2 531 12-3 531

12-13 531 12-14 531 12-15 531

Estadiacutestica Administrativa II 22

215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten

Coeficiente de determinacioacuten de la muestra

r2= aΣY+bΣXY-nY2

ΣY2 ndash n Y2

Coeficiente de correlacioacuten de la muestra

r= r2

Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten

Estadiacutestica Administrativa II 23

Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables

Y= a + b1 X1 + b2 X2

Ecuacioacuten

na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2

1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2

2 = Σ X2Y

Ejemplo

a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10

Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784

Sumatoria

114 105 85 2463 1590 1435 2367 1571

Matriz

6 105 85 114 105 2367 1435 2463 85 1435 1571 1590

1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25

1 175 14167 19 0 1 -099 884 0 0 361608 21410

361608 b2 = 21410 b2 = 21410 361608 b2 = 059

Estadiacutestica Administrativa II 24

1 b1 -099 b2 = 884 1 b1 -099 (059) = 884

-006 884 1b1 = 884 +006 b1 = 890

1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a

= 2589

Y= a + b1 X1 + b2 X2

y=2589+890(28)+059(10)=28099

Estadiacutestica Administrativa II 25

218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)

Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad

La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos

Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir

donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria

Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados

Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante

Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo

Estadiacutestica Administrativa II 26

Figura 5 Distribucioacuten Homocedaacutestica

Figura 6 Distribucioacuten Heterocedaacutestica

Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten

lineal para hacer estimaciones futuras

Estadiacutestica Administrativa II 27

Unidad 3 Nuacutemeros iacutendice

Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se

calcula encontrando el cociente del valor actual entre el valor base luego se

multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje

Tipos de nuacutemeros iacutendice

Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de

cantidad e iacutendice de valor

Iacutendice de precios

Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida

Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo

Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable

El iacutendice de valor combina los cambios de precio y cantidad para presentar un

iacutendice con maacutes informacioacuten

Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos

como indicadores generales de la condicioacuten econoacutemica de un paiacutes

Factores que pueden distorsionar los nuacutemeros iacutendice

bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados

bull Falta de comparacioacuten de iacutendices

bull Ponderacioacuten no apropiada de los factores

bull Seleccioacuten de una base no apropiada

Estadiacutestica Administrativa II 28

31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores

Iacutendice de cantidad de agregados no ponderados

ΣQi x 100 ΣQo

Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea

1993 1994 1995

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200

Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado

1993 Qo

1994 Q1

1995 Q2

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308

Estadiacutestica Administrativa II 29

Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra

Iacutendice de precios de agregados ponderados

ΣPiQ x 100 ΣPoQ

Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100

Cambio de periodo base

I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base

Estadiacutestica Administrativa II 30

35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos

Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables

Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico

Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios

El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)

Estadiacutestica Administrativa II 31

Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica

37 Deflacioacuten de los valores de series de tiempo

Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios

En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea

La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores

Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero

Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes

Los valores expresados en unidades monetarias corrientes se conocen como valores nominales

Los valores expresados en unidades monetarias constantes se conocen como valores reales

Estadiacutestica Administrativa II 32

38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor

Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos

39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)

Estadiacutestica Administrativa II 33

Siacutembolo Nombre de la compantildeiacutea

AA Alcoa

ALD Allied Signal

AXP American Express

BA Boeing

CAT Caterpillar

CHV Chevron

C CitiGroup

DIS Disney

DD Dupont

EK Eastman Kodak

GE General Electric

GM General Motors

GT Goodyear Tire

HWP Hewlett-Packard

IBM International Business Machines

IP International Paper

JNJ Johnson amp Johnson

JPM JP Morgan Bank

KO Coca Cola

Figura 5 Compantildeiacuteas comprendidas en el Dow Jones

310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos

Praacutectica 2

992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico

elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado

de precios

Estadiacutestica Administrativa II 34

Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida

bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)

42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten

Las principales pruebas no parameacutetricas son las siguientes

bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher

Estadiacutestica Administrativa II 35

bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon

Caracteriacutesticas de algunas pruebas no parameacutetricas

1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos

2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten

3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal

4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados

5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc

6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica

Prueba Caracteriacutestica

Mann- Whitney 2 muestras independientes

Wilcoxon 2 muestras asociadas

Kruskal-Wallis + de 2 muestras independientes

Friedman + de 2 muestras asociadas

Tabla1 Caracteriacutesticas de pruebas no parameacutetricas

Estadiacutestica Administrativa II 36

Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media

Ventajas y desventajas de los meacutetodos parameacutetricos

Desventajas Ventajas bull Ignoran cierta cantidad de

informacioacuten bull No requieren la suposicioacuten de que

una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica

bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas

bull Generalmente es maacutes sencillo realizarlas y entenderlas

bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal

Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo

MHHHHM

1ra 2ra 3ra

Estadiacutestica Administrativa II 37

Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1

n2= nuacutemero de ocurrencias del tipo 2

r= nuacutemero de corridas

4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue

BABBBAAABBABBBBAAAABABAABBBAABAAAABBA

BBAAAABBABBBBAABBABAABB

Valores de la prueba

n1= 29

n2= 31

r= 29

4322 Distribucioacuten de muestreo del estadiacutestico r

El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba

Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente

Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1

n1+n2

Estadiacutestica Administrativa II 38

μr = 2(29)(31) +1

29+31

μr = 1798 +1 60

μr = 2997 +1

μr = 3097

Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)

(n1+n2)2(n1+n2-1)

σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)

σr= (1798) (1738)

(60)2(59)

σr= 1471

σr= 384

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-24 643 14-25 643 14-26 643 14-27 644 14-28 644

Estadiacutestica Administrativa II 39

44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica

Ejemplo

Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado

Miembro del panel Calificacioacuten para

conferencias grandes

Calificacioacuten para

sesiones pequentildeas

Signo de la calificacioacuten

Evaluacioacuten de los dos tipos de

clases

1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -

6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +

La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)

Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20

Estadiacutestica Administrativa II 40

Establecimiento de las hipoacutetesis

Ho p = 05

H1 p ne 05

Se consideran la posibilidades solamente de signos + y - (9+6 =15)

p Ho = 05

q H0 = 05

n= 15

p= 0600 (915)

q= 0400 (615)

Prueba de hipoacutetesis de que no hay diferencia

Error estaacutendar del la proporcioacuten

σp= pq n

σp= (05)(05) 15

σp= 0129

0025

0

0475 del aacuterea

Valor criacutetico Z=-196

Regioacuten de aceptacioacuten

0025

0475 del aacuterea

Valor criacutetico Z=196

Estadiacutestica Administrativa II 41

45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten

Procedimiento de la prueba de rangos con signo de Wilcoxon

Paso1 Para cada par de datos calcule la diferencia d restando el segundo

valor del primero Guarde los signos pero descarte cualquier par para el que

d=0

Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de

la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango

correspondiente Cuando las diferencias tengan el mismo valor numeacuterico

asiacutegneles la media de los rangos implicados en el empate

Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino

Esto es inserte aquellos signos que se ignoraron e el paso dos

Paso 4 Calcule la suma de los valores absolutos de los rangos negativos

Tambieacuten la suma de los rangos positivos

Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon

en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el

procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos

sumas

Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la

diferencia d no es 0

Estadiacutestica Administrativa II 42

Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el

tamantildeo muestral

Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos

muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica

esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico

Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente

2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha

Notacioacuten

T= la maacutes pequentildea de las siguientes dos sumas

1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0

La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T

Estadiacutestica Administrativa II 43

46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2

Rango Calificacioacuten Plantel

1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S

10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S

Estadiacutestica Administrativa II 44

30 1600 S

Estadiacutestica Administrativa II 45

Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500

n1= 15 n2= 15 R1= 247 R2= 218

Estadiacutestico U

U = n1n2 + n1(n1 +1) -R1 2

U= (15)(15) + (15)(16) -247 2

U= 225+120-247

U= 98

Media de la distribucioacuten muestral U

μu = n1n2

2

μu = (15)(15)

2

μu =1125

Estadiacutestica Administrativa II 46

Estadiacutestico U

σU = n1n2 + (n1n2 +1)

12

σU = (15)(15)(15+15+1)

12

σU = 6975 12

σU = 58125

σU = 241

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2

α= 015

Estandarizacioacuten del estadiacutestico U

z = U-μu

σU

z = 98 - 1125 241

z = -0602

144 -144 0 -0602

Valor estandarizado de

la muestra U

Regioacuten de aceptacioacuten

Estadiacutestica Administrativa II 47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras

Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular

Prueba de Wilcoxon de los rangos con signo

Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero

Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande

Prueba de Wilcoxon para contrastar datos pareados

El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 17: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

Estadiacutestica Administrativa II 13

s23= Σ( - )2 = 60 = 120 varianza de la muestra

n-1 6-1

σ2w = Σ nj - 1 s2

j = (413)(175) + (413)(155) + (513)(120) = 193 = 14769 nt - k 13

Estadiacutestico F

F = varianza entre columnas = σ2b

Varianza dentro de columnas σ2w

F= 20 = 1354 cociente F 14769

Determinacioacuten de los grados de libertad

Grados de libertad del numerador

Nuacutemero de grados de libertad en el numerador del cociente F

= (nuacutemero de muestras-1)

Grados de libertad del denominador

Nuacutemero de grados de libertad en el denominador del cociente F

= Σ (nj-1)= nt-k

Graacutefica

Se acepta la hipoacutetesis nula

Regioacuten de aceptacioacuten

F= 1354

005 del aacuterea

Distribucioacuten f

381

Valor de tabla

Regioacuten de rechazo

Estadiacutestica Administrativa II 14

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

11-5 479 11-6 479

11-26 480 11-27 480 11-28 480 11-29 480 11-30 480

152 Inferencia sobre una varianza de poblacioacuten (Anova)

Estadiacutestico ji- cuadrada para inferencias sobre una varianza

X2=(n-1)s2 σ2

Intervalo de confianza para σ2

Liacutemite inferior de confianza

σ2L=(n-1)s2 X2

U Liacutemite superior de confianza

σ2U=(n-1)s2 X2

L

Estadiacutestica Administrativa II 15

Ejercicio

Con los siguientes datos obtener el estadiacutestico ji- cuadrada Y el intervalo de

confianza del 95

Tiempo x

50 45 27 66 43 96 45 90 69

153 Inferencia sobre la varianza de dos poblaciones (Anova) Ademaacutes de comparar la varianza de dos poblaciones el principal objetivo de este tema es analizar el cociente que se obtiene al aplicar la foacutermula correspondiente

Coeficiente F para inferencias acerca de dos varianzas

F=S21

S22

Estadiacutestica Administrativa II 16

Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple

21 Estimacioacuten mediante la liacutenea de regresioacuten El anaacutelisis de regresioacuten y correlacioacuten permiten determinar tanto la naturaleza como la fuerza de una relacioacuten entre dos variables En el anaacutelisis de regresioacuten se desarrollaraacute una ecuacioacuten de estimacioacuten a traveacutes de una foacutermula matemaacutetica que relaciona las variables conocidas con la variable desconocida La variable conocida- variable independiente X La variable que tratamos de predecir se llama variable dependiente Y

Figura 2 Fuente (Levin 2004511) 211 Diagrama de dispersioacuten El primer paso para determinar si existe una relacioacuten entre dos variables es examinar la graacutefica de datos observados A esta graacutefica se le llama diagrama de dispersioacuten Un diagrama de dispersioacuten se puede identificar visualmente patrones que indique si las variables estaacuten relacionadas

X

Y

Gastos contra la contaminacioacuten

Emisor de

contaminacioacuten

Pendiente negativa

b) Relacioacuten directa

X

Y

Publicidad

Ventas

Pendiente positiva

a) Relacioacuten directa

Estadiacutestica Administrativa II 17

Figura 3 Fuente (Levin 2004503)

212 Meacutetodo de miacutenimos cuadrados

Liacutenea de estimacioacuten

Y= a+bx Y= variable dependiente a=variable ordenada y b=pendiente de la recta x=variable independiente

Pendiente de la recta de regresioacuten de mejor ajuste

b = Σ XY - n X Y Σ X2 - n X2

b=pendiente de la liacutenea de estimacioacuten de mejor ajuste X= valores de la variable independiente Y= variable valores de la variable dependiente X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente n= nuacutemero de puntos

Estadiacutestica Administrativa II 18

Liacutenea de estimacioacuten

a = Y - bX a= ordenada Y b= pendiente de la ecuacioacuten X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente

Error estaacutendar de la estimacioacuten

Se= Σ(Y-Y)2

n-2 Y= valores de la variable dependiente Y=valores estimados con la ecuacioacuten de estimacioacuten que corresponden a cada valor de Y n= nuacutemero de puntos utilizados para ajustar la liacutenea de regresioacuten Para medir la confiabilidad de la ecuacioacuten de estimacioacuten los especialistas en estadiacutestica han desarrollado el error estaacutendar de estimacioacuten Este error estaacutendar se simboliza por Se y es similar a la desviacioacuten estaacutendar en cuanto a que ambas son medidas de dispersioacuten El error estaacutendar de la estimacioacuten por otra parte mide la variabilidad o dispersioacuten de los valores observados alrededor de la recta de regresioacuten 213 Interpretacioacuten del error estaacutendar de la estimacioacuten Como ocurririacutea en el caso de la desviacioacuten estaacutendar mientras maacutes grande sea el error estaacutendar de la estimacioacuten mayor seraacute la dispersioacuten de los puntos alrededor de la liacutenea de regresioacuten De manera inversa si Se= 0 esperamos que la ecuacioacuten de estimacioacuten sea un estimador ldquoperfectordquo de la variable dependiente En este caso todos los puntos caeriacutean directamente sobre la liacutenea de regresioacuten y no habriacutea puntos dispersos alrededor Usaremos el error estaacutendar de la estimacioacuten como una herramienta de la misma forma que podemos usar la desviacioacuten estaacutendar Esto es suponiendo que los puntos observados siguen una distribucioacuten normal alrededor de la recta de regresioacuten podemos esperar encontrar el 68 de los puntos dentro de plusmn1Se el 955 de los puntos dentro de plusmn2Se y el 997 de los puntos dentro de plusmn3Se

Estadiacutestica Administrativa II 19

Figura 4 Fuente (Levin 2004529)

Debemos observar que el error estaacutendar de la estimacioacuten se mide a lo largo del eje Y y no perpendicularmente desde la recta de regresioacuten 214 Intervalos de prediccioacuten aproximados Podemos concebir al error estaacutendar de la estimacioacuten como una herramienta estadiacutestica que podemos usar para hacer afirmaciones de probabilidad acerca del intervalo alrededor del valor estimado de Y dentro del cual cae el valor real de Y Ejemplo

Y= 375 + 075 X Sustituyendo 4 en X

Y= 375 + 075 (4) = 375 + 300

= 675

Estadiacutestica Administrativa II 20

Intervalo 1 error 2 errores 3 errores

Y plusmn1 Se

Y plusmn2 Se

Y plusmn3 Se

En donde Se = 8660

Sustitucioacuten

Ejemplo A menudo quienes hacen la contabilidad de costos estiman los gastos generales con base en el nivel de produccioacuten Se ha reunido informacioacuten acerca de los gastos generales y las unidades producidas en diferentes plantas y ahora desean estimar una ecuacioacuten de regresioacuten para predecir los gastos generales futuros Gastos generales 191 170 272 155 280 173 234 116 153 178 Unidades 40 42 53 35 56 39 48 30 37 40

a) Determine la variable dependiente e independiente b) Desarrolle una ecuacioacuten de regresioacuten para contabilidad de costos c) Pronostique los gastos generales cuando se producen 50 unidades d) Calcule el error estaacutendar de estimacioacuten

Y +1 Se =

675 + (1) (8660) = 76140 Liacutemite superior del intervalo de prediccioacuten

Y +2 Se =

675 + (2) (8660) = 84820 Liacutemite superior del intervalo de prediccioacuten

Y -1 Se =

675 - (1) (8660) = 58840 Liacutemite inferior del intervalo de prediccioacuten

Y - 2 Se =

675 - (2) (8660) = 50180 Liacutemite inferior del intervalo de prediccioacuten

Estadiacutestica Administrativa II 21

X Y XY X2 Y2 40 191 7640 1600 36481 42 170 7140 1764 28900 53 272 14416 2809 73984 35 155 5425 1225 24025 56 280 15680 3136 78400 39 173 6747 1521 29929 48 234 11232 2304 54756 30 116 3480 900 13456 37 153 5661 1369 23409 40 178 7120 1600 31684 ΣX= 420 ΣY= 1922 ΣXY= 84541 ΣX2= 18228 ΣY2= 395024

b = Σ XY - n X Y = 84541 - 10(42)(1922) = 64915 Σ X2 - n X2 18228 - 10(42)2 a = Y ndash bX = 1922 ndash 64915 (42) = - 804430 Y= a+bx = -804430 + 64915 (50) = 2441320 Se= ΣY2 ndashaΣY ndash b ΣXY = n-2 Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

12-2 531 12-3 531

12-13 531 12-14 531 12-15 531

Estadiacutestica Administrativa II 22

215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten

Coeficiente de determinacioacuten de la muestra

r2= aΣY+bΣXY-nY2

ΣY2 ndash n Y2

Coeficiente de correlacioacuten de la muestra

r= r2

Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten

Estadiacutestica Administrativa II 23

Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables

Y= a + b1 X1 + b2 X2

Ecuacioacuten

na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2

1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2

2 = Σ X2Y

Ejemplo

a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10

Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784

Sumatoria

114 105 85 2463 1590 1435 2367 1571

Matriz

6 105 85 114 105 2367 1435 2463 85 1435 1571 1590

1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25

1 175 14167 19 0 1 -099 884 0 0 361608 21410

361608 b2 = 21410 b2 = 21410 361608 b2 = 059

Estadiacutestica Administrativa II 24

1 b1 -099 b2 = 884 1 b1 -099 (059) = 884

-006 884 1b1 = 884 +006 b1 = 890

1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a

= 2589

Y= a + b1 X1 + b2 X2

y=2589+890(28)+059(10)=28099

Estadiacutestica Administrativa II 25

218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)

Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad

La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos

Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir

donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria

Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados

Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante

Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo

Estadiacutestica Administrativa II 26

Figura 5 Distribucioacuten Homocedaacutestica

Figura 6 Distribucioacuten Heterocedaacutestica

Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten

lineal para hacer estimaciones futuras

Estadiacutestica Administrativa II 27

Unidad 3 Nuacutemeros iacutendice

Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se

calcula encontrando el cociente del valor actual entre el valor base luego se

multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje

Tipos de nuacutemeros iacutendice

Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de

cantidad e iacutendice de valor

Iacutendice de precios

Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida

Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo

Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable

El iacutendice de valor combina los cambios de precio y cantidad para presentar un

iacutendice con maacutes informacioacuten

Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos

como indicadores generales de la condicioacuten econoacutemica de un paiacutes

Factores que pueden distorsionar los nuacutemeros iacutendice

bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados

bull Falta de comparacioacuten de iacutendices

bull Ponderacioacuten no apropiada de los factores

bull Seleccioacuten de una base no apropiada

Estadiacutestica Administrativa II 28

31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores

Iacutendice de cantidad de agregados no ponderados

ΣQi x 100 ΣQo

Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea

1993 1994 1995

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200

Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado

1993 Qo

1994 Q1

1995 Q2

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308

Estadiacutestica Administrativa II 29

Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra

Iacutendice de precios de agregados ponderados

ΣPiQ x 100 ΣPoQ

Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100

Cambio de periodo base

I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base

Estadiacutestica Administrativa II 30

35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos

Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables

Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico

Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios

El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)

Estadiacutestica Administrativa II 31

Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica

37 Deflacioacuten de los valores de series de tiempo

Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios

En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea

La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores

Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero

Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes

Los valores expresados en unidades monetarias corrientes se conocen como valores nominales

Los valores expresados en unidades monetarias constantes se conocen como valores reales

Estadiacutestica Administrativa II 32

38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor

Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos

39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)

Estadiacutestica Administrativa II 33

Siacutembolo Nombre de la compantildeiacutea

AA Alcoa

ALD Allied Signal

AXP American Express

BA Boeing

CAT Caterpillar

CHV Chevron

C CitiGroup

DIS Disney

DD Dupont

EK Eastman Kodak

GE General Electric

GM General Motors

GT Goodyear Tire

HWP Hewlett-Packard

IBM International Business Machines

IP International Paper

JNJ Johnson amp Johnson

JPM JP Morgan Bank

KO Coca Cola

Figura 5 Compantildeiacuteas comprendidas en el Dow Jones

310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos

Praacutectica 2

992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico

elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado

de precios

Estadiacutestica Administrativa II 34

Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida

bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)

42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten

Las principales pruebas no parameacutetricas son las siguientes

bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher

Estadiacutestica Administrativa II 35

bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon

Caracteriacutesticas de algunas pruebas no parameacutetricas

1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos

2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten

3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal

4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados

5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc

6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica

Prueba Caracteriacutestica

Mann- Whitney 2 muestras independientes

Wilcoxon 2 muestras asociadas

Kruskal-Wallis + de 2 muestras independientes

Friedman + de 2 muestras asociadas

Tabla1 Caracteriacutesticas de pruebas no parameacutetricas

Estadiacutestica Administrativa II 36

Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media

Ventajas y desventajas de los meacutetodos parameacutetricos

Desventajas Ventajas bull Ignoran cierta cantidad de

informacioacuten bull No requieren la suposicioacuten de que

una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica

bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas

bull Generalmente es maacutes sencillo realizarlas y entenderlas

bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal

Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo

MHHHHM

1ra 2ra 3ra

Estadiacutestica Administrativa II 37

Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1

n2= nuacutemero de ocurrencias del tipo 2

r= nuacutemero de corridas

4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue

BABBBAAABBABBBBAAAABABAABBBAABAAAABBA

BBAAAABBABBBBAABBABAABB

Valores de la prueba

n1= 29

n2= 31

r= 29

4322 Distribucioacuten de muestreo del estadiacutestico r

El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba

Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente

Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1

n1+n2

Estadiacutestica Administrativa II 38

μr = 2(29)(31) +1

29+31

μr = 1798 +1 60

μr = 2997 +1

μr = 3097

Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)

(n1+n2)2(n1+n2-1)

σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)

σr= (1798) (1738)

(60)2(59)

σr= 1471

σr= 384

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-24 643 14-25 643 14-26 643 14-27 644 14-28 644

Estadiacutestica Administrativa II 39

44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica

Ejemplo

Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado

Miembro del panel Calificacioacuten para

conferencias grandes

Calificacioacuten para

sesiones pequentildeas

Signo de la calificacioacuten

Evaluacioacuten de los dos tipos de

clases

1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -

6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +

La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)

Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20

Estadiacutestica Administrativa II 40

Establecimiento de las hipoacutetesis

Ho p = 05

H1 p ne 05

Se consideran la posibilidades solamente de signos + y - (9+6 =15)

p Ho = 05

q H0 = 05

n= 15

p= 0600 (915)

q= 0400 (615)

Prueba de hipoacutetesis de que no hay diferencia

Error estaacutendar del la proporcioacuten

σp= pq n

σp= (05)(05) 15

σp= 0129

0025

0

0475 del aacuterea

Valor criacutetico Z=-196

Regioacuten de aceptacioacuten

0025

0475 del aacuterea

Valor criacutetico Z=196

Estadiacutestica Administrativa II 41

45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten

Procedimiento de la prueba de rangos con signo de Wilcoxon

Paso1 Para cada par de datos calcule la diferencia d restando el segundo

valor del primero Guarde los signos pero descarte cualquier par para el que

d=0

Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de

la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango

correspondiente Cuando las diferencias tengan el mismo valor numeacuterico

asiacutegneles la media de los rangos implicados en el empate

Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino

Esto es inserte aquellos signos que se ignoraron e el paso dos

Paso 4 Calcule la suma de los valores absolutos de los rangos negativos

Tambieacuten la suma de los rangos positivos

Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon

en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el

procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos

sumas

Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la

diferencia d no es 0

Estadiacutestica Administrativa II 42

Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el

tamantildeo muestral

Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos

muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica

esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico

Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente

2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha

Notacioacuten

T= la maacutes pequentildea de las siguientes dos sumas

1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0

La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T

Estadiacutestica Administrativa II 43

46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2

Rango Calificacioacuten Plantel

1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S

10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S

Estadiacutestica Administrativa II 44

30 1600 S

Estadiacutestica Administrativa II 45

Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500

n1= 15 n2= 15 R1= 247 R2= 218

Estadiacutestico U

U = n1n2 + n1(n1 +1) -R1 2

U= (15)(15) + (15)(16) -247 2

U= 225+120-247

U= 98

Media de la distribucioacuten muestral U

μu = n1n2

2

μu = (15)(15)

2

μu =1125

Estadiacutestica Administrativa II 46

Estadiacutestico U

σU = n1n2 + (n1n2 +1)

12

σU = (15)(15)(15+15+1)

12

σU = 6975 12

σU = 58125

σU = 241

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2

α= 015

Estandarizacioacuten del estadiacutestico U

z = U-μu

σU

z = 98 - 1125 241

z = -0602

144 -144 0 -0602

Valor estandarizado de

la muestra U

Regioacuten de aceptacioacuten

Estadiacutestica Administrativa II 47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras

Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular

Prueba de Wilcoxon de los rangos con signo

Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero

Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande

Prueba de Wilcoxon para contrastar datos pareados

El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 18: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

Estadiacutestica Administrativa II 14

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

11-5 479 11-6 479

11-26 480 11-27 480 11-28 480 11-29 480 11-30 480

152 Inferencia sobre una varianza de poblacioacuten (Anova)

Estadiacutestico ji- cuadrada para inferencias sobre una varianza

X2=(n-1)s2 σ2

Intervalo de confianza para σ2

Liacutemite inferior de confianza

σ2L=(n-1)s2 X2

U Liacutemite superior de confianza

σ2U=(n-1)s2 X2

L

Estadiacutestica Administrativa II 15

Ejercicio

Con los siguientes datos obtener el estadiacutestico ji- cuadrada Y el intervalo de

confianza del 95

Tiempo x

50 45 27 66 43 96 45 90 69

153 Inferencia sobre la varianza de dos poblaciones (Anova) Ademaacutes de comparar la varianza de dos poblaciones el principal objetivo de este tema es analizar el cociente que se obtiene al aplicar la foacutermula correspondiente

Coeficiente F para inferencias acerca de dos varianzas

F=S21

S22

Estadiacutestica Administrativa II 16

Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple

21 Estimacioacuten mediante la liacutenea de regresioacuten El anaacutelisis de regresioacuten y correlacioacuten permiten determinar tanto la naturaleza como la fuerza de una relacioacuten entre dos variables En el anaacutelisis de regresioacuten se desarrollaraacute una ecuacioacuten de estimacioacuten a traveacutes de una foacutermula matemaacutetica que relaciona las variables conocidas con la variable desconocida La variable conocida- variable independiente X La variable que tratamos de predecir se llama variable dependiente Y

Figura 2 Fuente (Levin 2004511) 211 Diagrama de dispersioacuten El primer paso para determinar si existe una relacioacuten entre dos variables es examinar la graacutefica de datos observados A esta graacutefica se le llama diagrama de dispersioacuten Un diagrama de dispersioacuten se puede identificar visualmente patrones que indique si las variables estaacuten relacionadas

X

Y

Gastos contra la contaminacioacuten

Emisor de

contaminacioacuten

Pendiente negativa

b) Relacioacuten directa

X

Y

Publicidad

Ventas

Pendiente positiva

a) Relacioacuten directa

Estadiacutestica Administrativa II 17

Figura 3 Fuente (Levin 2004503)

212 Meacutetodo de miacutenimos cuadrados

Liacutenea de estimacioacuten

Y= a+bx Y= variable dependiente a=variable ordenada y b=pendiente de la recta x=variable independiente

Pendiente de la recta de regresioacuten de mejor ajuste

b = Σ XY - n X Y Σ X2 - n X2

b=pendiente de la liacutenea de estimacioacuten de mejor ajuste X= valores de la variable independiente Y= variable valores de la variable dependiente X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente n= nuacutemero de puntos

Estadiacutestica Administrativa II 18

Liacutenea de estimacioacuten

a = Y - bX a= ordenada Y b= pendiente de la ecuacioacuten X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente

Error estaacutendar de la estimacioacuten

Se= Σ(Y-Y)2

n-2 Y= valores de la variable dependiente Y=valores estimados con la ecuacioacuten de estimacioacuten que corresponden a cada valor de Y n= nuacutemero de puntos utilizados para ajustar la liacutenea de regresioacuten Para medir la confiabilidad de la ecuacioacuten de estimacioacuten los especialistas en estadiacutestica han desarrollado el error estaacutendar de estimacioacuten Este error estaacutendar se simboliza por Se y es similar a la desviacioacuten estaacutendar en cuanto a que ambas son medidas de dispersioacuten El error estaacutendar de la estimacioacuten por otra parte mide la variabilidad o dispersioacuten de los valores observados alrededor de la recta de regresioacuten 213 Interpretacioacuten del error estaacutendar de la estimacioacuten Como ocurririacutea en el caso de la desviacioacuten estaacutendar mientras maacutes grande sea el error estaacutendar de la estimacioacuten mayor seraacute la dispersioacuten de los puntos alrededor de la liacutenea de regresioacuten De manera inversa si Se= 0 esperamos que la ecuacioacuten de estimacioacuten sea un estimador ldquoperfectordquo de la variable dependiente En este caso todos los puntos caeriacutean directamente sobre la liacutenea de regresioacuten y no habriacutea puntos dispersos alrededor Usaremos el error estaacutendar de la estimacioacuten como una herramienta de la misma forma que podemos usar la desviacioacuten estaacutendar Esto es suponiendo que los puntos observados siguen una distribucioacuten normal alrededor de la recta de regresioacuten podemos esperar encontrar el 68 de los puntos dentro de plusmn1Se el 955 de los puntos dentro de plusmn2Se y el 997 de los puntos dentro de plusmn3Se

Estadiacutestica Administrativa II 19

Figura 4 Fuente (Levin 2004529)

Debemos observar que el error estaacutendar de la estimacioacuten se mide a lo largo del eje Y y no perpendicularmente desde la recta de regresioacuten 214 Intervalos de prediccioacuten aproximados Podemos concebir al error estaacutendar de la estimacioacuten como una herramienta estadiacutestica que podemos usar para hacer afirmaciones de probabilidad acerca del intervalo alrededor del valor estimado de Y dentro del cual cae el valor real de Y Ejemplo

Y= 375 + 075 X Sustituyendo 4 en X

Y= 375 + 075 (4) = 375 + 300

= 675

Estadiacutestica Administrativa II 20

Intervalo 1 error 2 errores 3 errores

Y plusmn1 Se

Y plusmn2 Se

Y plusmn3 Se

En donde Se = 8660

Sustitucioacuten

Ejemplo A menudo quienes hacen la contabilidad de costos estiman los gastos generales con base en el nivel de produccioacuten Se ha reunido informacioacuten acerca de los gastos generales y las unidades producidas en diferentes plantas y ahora desean estimar una ecuacioacuten de regresioacuten para predecir los gastos generales futuros Gastos generales 191 170 272 155 280 173 234 116 153 178 Unidades 40 42 53 35 56 39 48 30 37 40

a) Determine la variable dependiente e independiente b) Desarrolle una ecuacioacuten de regresioacuten para contabilidad de costos c) Pronostique los gastos generales cuando se producen 50 unidades d) Calcule el error estaacutendar de estimacioacuten

Y +1 Se =

675 + (1) (8660) = 76140 Liacutemite superior del intervalo de prediccioacuten

Y +2 Se =

675 + (2) (8660) = 84820 Liacutemite superior del intervalo de prediccioacuten

Y -1 Se =

675 - (1) (8660) = 58840 Liacutemite inferior del intervalo de prediccioacuten

Y - 2 Se =

675 - (2) (8660) = 50180 Liacutemite inferior del intervalo de prediccioacuten

Estadiacutestica Administrativa II 21

X Y XY X2 Y2 40 191 7640 1600 36481 42 170 7140 1764 28900 53 272 14416 2809 73984 35 155 5425 1225 24025 56 280 15680 3136 78400 39 173 6747 1521 29929 48 234 11232 2304 54756 30 116 3480 900 13456 37 153 5661 1369 23409 40 178 7120 1600 31684 ΣX= 420 ΣY= 1922 ΣXY= 84541 ΣX2= 18228 ΣY2= 395024

b = Σ XY - n X Y = 84541 - 10(42)(1922) = 64915 Σ X2 - n X2 18228 - 10(42)2 a = Y ndash bX = 1922 ndash 64915 (42) = - 804430 Y= a+bx = -804430 + 64915 (50) = 2441320 Se= ΣY2 ndashaΣY ndash b ΣXY = n-2 Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

12-2 531 12-3 531

12-13 531 12-14 531 12-15 531

Estadiacutestica Administrativa II 22

215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten

Coeficiente de determinacioacuten de la muestra

r2= aΣY+bΣXY-nY2

ΣY2 ndash n Y2

Coeficiente de correlacioacuten de la muestra

r= r2

Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten

Estadiacutestica Administrativa II 23

Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables

Y= a + b1 X1 + b2 X2

Ecuacioacuten

na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2

1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2

2 = Σ X2Y

Ejemplo

a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10

Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784

Sumatoria

114 105 85 2463 1590 1435 2367 1571

Matriz

6 105 85 114 105 2367 1435 2463 85 1435 1571 1590

1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25

1 175 14167 19 0 1 -099 884 0 0 361608 21410

361608 b2 = 21410 b2 = 21410 361608 b2 = 059

Estadiacutestica Administrativa II 24

1 b1 -099 b2 = 884 1 b1 -099 (059) = 884

-006 884 1b1 = 884 +006 b1 = 890

1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a

= 2589

Y= a + b1 X1 + b2 X2

y=2589+890(28)+059(10)=28099

Estadiacutestica Administrativa II 25

218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)

Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad

La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos

Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir

donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria

Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados

Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante

Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo

Estadiacutestica Administrativa II 26

Figura 5 Distribucioacuten Homocedaacutestica

Figura 6 Distribucioacuten Heterocedaacutestica

Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten

lineal para hacer estimaciones futuras

Estadiacutestica Administrativa II 27

Unidad 3 Nuacutemeros iacutendice

Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se

calcula encontrando el cociente del valor actual entre el valor base luego se

multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje

Tipos de nuacutemeros iacutendice

Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de

cantidad e iacutendice de valor

Iacutendice de precios

Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida

Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo

Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable

El iacutendice de valor combina los cambios de precio y cantidad para presentar un

iacutendice con maacutes informacioacuten

Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos

como indicadores generales de la condicioacuten econoacutemica de un paiacutes

Factores que pueden distorsionar los nuacutemeros iacutendice

bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados

bull Falta de comparacioacuten de iacutendices

bull Ponderacioacuten no apropiada de los factores

bull Seleccioacuten de una base no apropiada

Estadiacutestica Administrativa II 28

31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores

Iacutendice de cantidad de agregados no ponderados

ΣQi x 100 ΣQo

Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea

1993 1994 1995

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200

Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado

1993 Qo

1994 Q1

1995 Q2

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308

Estadiacutestica Administrativa II 29

Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra

Iacutendice de precios de agregados ponderados

ΣPiQ x 100 ΣPoQ

Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100

Cambio de periodo base

I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base

Estadiacutestica Administrativa II 30

35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos

Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables

Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico

Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios

El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)

Estadiacutestica Administrativa II 31

Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica

37 Deflacioacuten de los valores de series de tiempo

Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios

En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea

La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores

Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero

Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes

Los valores expresados en unidades monetarias corrientes se conocen como valores nominales

Los valores expresados en unidades monetarias constantes se conocen como valores reales

Estadiacutestica Administrativa II 32

38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor

Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos

39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)

Estadiacutestica Administrativa II 33

Siacutembolo Nombre de la compantildeiacutea

AA Alcoa

ALD Allied Signal

AXP American Express

BA Boeing

CAT Caterpillar

CHV Chevron

C CitiGroup

DIS Disney

DD Dupont

EK Eastman Kodak

GE General Electric

GM General Motors

GT Goodyear Tire

HWP Hewlett-Packard

IBM International Business Machines

IP International Paper

JNJ Johnson amp Johnson

JPM JP Morgan Bank

KO Coca Cola

Figura 5 Compantildeiacuteas comprendidas en el Dow Jones

310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos

Praacutectica 2

992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico

elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado

de precios

Estadiacutestica Administrativa II 34

Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida

bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)

42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten

Las principales pruebas no parameacutetricas son las siguientes

bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher

Estadiacutestica Administrativa II 35

bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon

Caracteriacutesticas de algunas pruebas no parameacutetricas

1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos

2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten

3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal

4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados

5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc

6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica

Prueba Caracteriacutestica

Mann- Whitney 2 muestras independientes

Wilcoxon 2 muestras asociadas

Kruskal-Wallis + de 2 muestras independientes

Friedman + de 2 muestras asociadas

Tabla1 Caracteriacutesticas de pruebas no parameacutetricas

Estadiacutestica Administrativa II 36

Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media

Ventajas y desventajas de los meacutetodos parameacutetricos

Desventajas Ventajas bull Ignoran cierta cantidad de

informacioacuten bull No requieren la suposicioacuten de que

una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica

bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas

bull Generalmente es maacutes sencillo realizarlas y entenderlas

bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal

Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo

MHHHHM

1ra 2ra 3ra

Estadiacutestica Administrativa II 37

Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1

n2= nuacutemero de ocurrencias del tipo 2

r= nuacutemero de corridas

4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue

BABBBAAABBABBBBAAAABABAABBBAABAAAABBA

BBAAAABBABBBBAABBABAABB

Valores de la prueba

n1= 29

n2= 31

r= 29

4322 Distribucioacuten de muestreo del estadiacutestico r

El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba

Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente

Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1

n1+n2

Estadiacutestica Administrativa II 38

μr = 2(29)(31) +1

29+31

μr = 1798 +1 60

μr = 2997 +1

μr = 3097

Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)

(n1+n2)2(n1+n2-1)

σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)

σr= (1798) (1738)

(60)2(59)

σr= 1471

σr= 384

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-24 643 14-25 643 14-26 643 14-27 644 14-28 644

Estadiacutestica Administrativa II 39

44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica

Ejemplo

Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado

Miembro del panel Calificacioacuten para

conferencias grandes

Calificacioacuten para

sesiones pequentildeas

Signo de la calificacioacuten

Evaluacioacuten de los dos tipos de

clases

1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -

6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +

La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)

Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20

Estadiacutestica Administrativa II 40

Establecimiento de las hipoacutetesis

Ho p = 05

H1 p ne 05

Se consideran la posibilidades solamente de signos + y - (9+6 =15)

p Ho = 05

q H0 = 05

n= 15

p= 0600 (915)

q= 0400 (615)

Prueba de hipoacutetesis de que no hay diferencia

Error estaacutendar del la proporcioacuten

σp= pq n

σp= (05)(05) 15

σp= 0129

0025

0

0475 del aacuterea

Valor criacutetico Z=-196

Regioacuten de aceptacioacuten

0025

0475 del aacuterea

Valor criacutetico Z=196

Estadiacutestica Administrativa II 41

45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten

Procedimiento de la prueba de rangos con signo de Wilcoxon

Paso1 Para cada par de datos calcule la diferencia d restando el segundo

valor del primero Guarde los signos pero descarte cualquier par para el que

d=0

Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de

la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango

correspondiente Cuando las diferencias tengan el mismo valor numeacuterico

asiacutegneles la media de los rangos implicados en el empate

Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino

Esto es inserte aquellos signos que se ignoraron e el paso dos

Paso 4 Calcule la suma de los valores absolutos de los rangos negativos

Tambieacuten la suma de los rangos positivos

Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon

en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el

procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos

sumas

Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la

diferencia d no es 0

Estadiacutestica Administrativa II 42

Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el

tamantildeo muestral

Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos

muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica

esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico

Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente

2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha

Notacioacuten

T= la maacutes pequentildea de las siguientes dos sumas

1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0

La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T

Estadiacutestica Administrativa II 43

46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2

Rango Calificacioacuten Plantel

1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S

10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S

Estadiacutestica Administrativa II 44

30 1600 S

Estadiacutestica Administrativa II 45

Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500

n1= 15 n2= 15 R1= 247 R2= 218

Estadiacutestico U

U = n1n2 + n1(n1 +1) -R1 2

U= (15)(15) + (15)(16) -247 2

U= 225+120-247

U= 98

Media de la distribucioacuten muestral U

μu = n1n2

2

μu = (15)(15)

2

μu =1125

Estadiacutestica Administrativa II 46

Estadiacutestico U

σU = n1n2 + (n1n2 +1)

12

σU = (15)(15)(15+15+1)

12

σU = 6975 12

σU = 58125

σU = 241

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2

α= 015

Estandarizacioacuten del estadiacutestico U

z = U-μu

σU

z = 98 - 1125 241

z = -0602

144 -144 0 -0602

Valor estandarizado de

la muestra U

Regioacuten de aceptacioacuten

Estadiacutestica Administrativa II 47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras

Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular

Prueba de Wilcoxon de los rangos con signo

Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero

Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande

Prueba de Wilcoxon para contrastar datos pareados

El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 19: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

Estadiacutestica Administrativa II 15

Ejercicio

Con los siguientes datos obtener el estadiacutestico ji- cuadrada Y el intervalo de

confianza del 95

Tiempo x

50 45 27 66 43 96 45 90 69

153 Inferencia sobre la varianza de dos poblaciones (Anova) Ademaacutes de comparar la varianza de dos poblaciones el principal objetivo de este tema es analizar el cociente que se obtiene al aplicar la foacutermula correspondiente

Coeficiente F para inferencias acerca de dos varianzas

F=S21

S22

Estadiacutestica Administrativa II 16

Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple

21 Estimacioacuten mediante la liacutenea de regresioacuten El anaacutelisis de regresioacuten y correlacioacuten permiten determinar tanto la naturaleza como la fuerza de una relacioacuten entre dos variables En el anaacutelisis de regresioacuten se desarrollaraacute una ecuacioacuten de estimacioacuten a traveacutes de una foacutermula matemaacutetica que relaciona las variables conocidas con la variable desconocida La variable conocida- variable independiente X La variable que tratamos de predecir se llama variable dependiente Y

Figura 2 Fuente (Levin 2004511) 211 Diagrama de dispersioacuten El primer paso para determinar si existe una relacioacuten entre dos variables es examinar la graacutefica de datos observados A esta graacutefica se le llama diagrama de dispersioacuten Un diagrama de dispersioacuten se puede identificar visualmente patrones que indique si las variables estaacuten relacionadas

X

Y

Gastos contra la contaminacioacuten

Emisor de

contaminacioacuten

Pendiente negativa

b) Relacioacuten directa

X

Y

Publicidad

Ventas

Pendiente positiva

a) Relacioacuten directa

Estadiacutestica Administrativa II 17

Figura 3 Fuente (Levin 2004503)

212 Meacutetodo de miacutenimos cuadrados

Liacutenea de estimacioacuten

Y= a+bx Y= variable dependiente a=variable ordenada y b=pendiente de la recta x=variable independiente

Pendiente de la recta de regresioacuten de mejor ajuste

b = Σ XY - n X Y Σ X2 - n X2

b=pendiente de la liacutenea de estimacioacuten de mejor ajuste X= valores de la variable independiente Y= variable valores de la variable dependiente X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente n= nuacutemero de puntos

Estadiacutestica Administrativa II 18

Liacutenea de estimacioacuten

a = Y - bX a= ordenada Y b= pendiente de la ecuacioacuten X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente

Error estaacutendar de la estimacioacuten

Se= Σ(Y-Y)2

n-2 Y= valores de la variable dependiente Y=valores estimados con la ecuacioacuten de estimacioacuten que corresponden a cada valor de Y n= nuacutemero de puntos utilizados para ajustar la liacutenea de regresioacuten Para medir la confiabilidad de la ecuacioacuten de estimacioacuten los especialistas en estadiacutestica han desarrollado el error estaacutendar de estimacioacuten Este error estaacutendar se simboliza por Se y es similar a la desviacioacuten estaacutendar en cuanto a que ambas son medidas de dispersioacuten El error estaacutendar de la estimacioacuten por otra parte mide la variabilidad o dispersioacuten de los valores observados alrededor de la recta de regresioacuten 213 Interpretacioacuten del error estaacutendar de la estimacioacuten Como ocurririacutea en el caso de la desviacioacuten estaacutendar mientras maacutes grande sea el error estaacutendar de la estimacioacuten mayor seraacute la dispersioacuten de los puntos alrededor de la liacutenea de regresioacuten De manera inversa si Se= 0 esperamos que la ecuacioacuten de estimacioacuten sea un estimador ldquoperfectordquo de la variable dependiente En este caso todos los puntos caeriacutean directamente sobre la liacutenea de regresioacuten y no habriacutea puntos dispersos alrededor Usaremos el error estaacutendar de la estimacioacuten como una herramienta de la misma forma que podemos usar la desviacioacuten estaacutendar Esto es suponiendo que los puntos observados siguen una distribucioacuten normal alrededor de la recta de regresioacuten podemos esperar encontrar el 68 de los puntos dentro de plusmn1Se el 955 de los puntos dentro de plusmn2Se y el 997 de los puntos dentro de plusmn3Se

Estadiacutestica Administrativa II 19

Figura 4 Fuente (Levin 2004529)

Debemos observar que el error estaacutendar de la estimacioacuten se mide a lo largo del eje Y y no perpendicularmente desde la recta de regresioacuten 214 Intervalos de prediccioacuten aproximados Podemos concebir al error estaacutendar de la estimacioacuten como una herramienta estadiacutestica que podemos usar para hacer afirmaciones de probabilidad acerca del intervalo alrededor del valor estimado de Y dentro del cual cae el valor real de Y Ejemplo

Y= 375 + 075 X Sustituyendo 4 en X

Y= 375 + 075 (4) = 375 + 300

= 675

Estadiacutestica Administrativa II 20

Intervalo 1 error 2 errores 3 errores

Y plusmn1 Se

Y plusmn2 Se

Y plusmn3 Se

En donde Se = 8660

Sustitucioacuten

Ejemplo A menudo quienes hacen la contabilidad de costos estiman los gastos generales con base en el nivel de produccioacuten Se ha reunido informacioacuten acerca de los gastos generales y las unidades producidas en diferentes plantas y ahora desean estimar una ecuacioacuten de regresioacuten para predecir los gastos generales futuros Gastos generales 191 170 272 155 280 173 234 116 153 178 Unidades 40 42 53 35 56 39 48 30 37 40

a) Determine la variable dependiente e independiente b) Desarrolle una ecuacioacuten de regresioacuten para contabilidad de costos c) Pronostique los gastos generales cuando se producen 50 unidades d) Calcule el error estaacutendar de estimacioacuten

Y +1 Se =

675 + (1) (8660) = 76140 Liacutemite superior del intervalo de prediccioacuten

Y +2 Se =

675 + (2) (8660) = 84820 Liacutemite superior del intervalo de prediccioacuten

Y -1 Se =

675 - (1) (8660) = 58840 Liacutemite inferior del intervalo de prediccioacuten

Y - 2 Se =

675 - (2) (8660) = 50180 Liacutemite inferior del intervalo de prediccioacuten

Estadiacutestica Administrativa II 21

X Y XY X2 Y2 40 191 7640 1600 36481 42 170 7140 1764 28900 53 272 14416 2809 73984 35 155 5425 1225 24025 56 280 15680 3136 78400 39 173 6747 1521 29929 48 234 11232 2304 54756 30 116 3480 900 13456 37 153 5661 1369 23409 40 178 7120 1600 31684 ΣX= 420 ΣY= 1922 ΣXY= 84541 ΣX2= 18228 ΣY2= 395024

b = Σ XY - n X Y = 84541 - 10(42)(1922) = 64915 Σ X2 - n X2 18228 - 10(42)2 a = Y ndash bX = 1922 ndash 64915 (42) = - 804430 Y= a+bx = -804430 + 64915 (50) = 2441320 Se= ΣY2 ndashaΣY ndash b ΣXY = n-2 Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

12-2 531 12-3 531

12-13 531 12-14 531 12-15 531

Estadiacutestica Administrativa II 22

215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten

Coeficiente de determinacioacuten de la muestra

r2= aΣY+bΣXY-nY2

ΣY2 ndash n Y2

Coeficiente de correlacioacuten de la muestra

r= r2

Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten

Estadiacutestica Administrativa II 23

Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables

Y= a + b1 X1 + b2 X2

Ecuacioacuten

na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2

1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2

2 = Σ X2Y

Ejemplo

a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10

Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784

Sumatoria

114 105 85 2463 1590 1435 2367 1571

Matriz

6 105 85 114 105 2367 1435 2463 85 1435 1571 1590

1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25

1 175 14167 19 0 1 -099 884 0 0 361608 21410

361608 b2 = 21410 b2 = 21410 361608 b2 = 059

Estadiacutestica Administrativa II 24

1 b1 -099 b2 = 884 1 b1 -099 (059) = 884

-006 884 1b1 = 884 +006 b1 = 890

1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a

= 2589

Y= a + b1 X1 + b2 X2

y=2589+890(28)+059(10)=28099

Estadiacutestica Administrativa II 25

218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)

Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad

La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos

Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir

donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria

Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados

Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante

Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo

Estadiacutestica Administrativa II 26

Figura 5 Distribucioacuten Homocedaacutestica

Figura 6 Distribucioacuten Heterocedaacutestica

Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten

lineal para hacer estimaciones futuras

Estadiacutestica Administrativa II 27

Unidad 3 Nuacutemeros iacutendice

Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se

calcula encontrando el cociente del valor actual entre el valor base luego se

multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje

Tipos de nuacutemeros iacutendice

Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de

cantidad e iacutendice de valor

Iacutendice de precios

Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida

Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo

Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable

El iacutendice de valor combina los cambios de precio y cantidad para presentar un

iacutendice con maacutes informacioacuten

Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos

como indicadores generales de la condicioacuten econoacutemica de un paiacutes

Factores que pueden distorsionar los nuacutemeros iacutendice

bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados

bull Falta de comparacioacuten de iacutendices

bull Ponderacioacuten no apropiada de los factores

bull Seleccioacuten de una base no apropiada

Estadiacutestica Administrativa II 28

31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores

Iacutendice de cantidad de agregados no ponderados

ΣQi x 100 ΣQo

Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea

1993 1994 1995

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200

Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado

1993 Qo

1994 Q1

1995 Q2

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308

Estadiacutestica Administrativa II 29

Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra

Iacutendice de precios de agregados ponderados

ΣPiQ x 100 ΣPoQ

Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100

Cambio de periodo base

I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base

Estadiacutestica Administrativa II 30

35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos

Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables

Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico

Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios

El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)

Estadiacutestica Administrativa II 31

Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica

37 Deflacioacuten de los valores de series de tiempo

Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios

En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea

La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores

Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero

Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes

Los valores expresados en unidades monetarias corrientes se conocen como valores nominales

Los valores expresados en unidades monetarias constantes se conocen como valores reales

Estadiacutestica Administrativa II 32

38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor

Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos

39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)

Estadiacutestica Administrativa II 33

Siacutembolo Nombre de la compantildeiacutea

AA Alcoa

ALD Allied Signal

AXP American Express

BA Boeing

CAT Caterpillar

CHV Chevron

C CitiGroup

DIS Disney

DD Dupont

EK Eastman Kodak

GE General Electric

GM General Motors

GT Goodyear Tire

HWP Hewlett-Packard

IBM International Business Machines

IP International Paper

JNJ Johnson amp Johnson

JPM JP Morgan Bank

KO Coca Cola

Figura 5 Compantildeiacuteas comprendidas en el Dow Jones

310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos

Praacutectica 2

992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico

elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado

de precios

Estadiacutestica Administrativa II 34

Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida

bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)

42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten

Las principales pruebas no parameacutetricas son las siguientes

bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher

Estadiacutestica Administrativa II 35

bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon

Caracteriacutesticas de algunas pruebas no parameacutetricas

1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos

2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten

3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal

4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados

5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc

6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica

Prueba Caracteriacutestica

Mann- Whitney 2 muestras independientes

Wilcoxon 2 muestras asociadas

Kruskal-Wallis + de 2 muestras independientes

Friedman + de 2 muestras asociadas

Tabla1 Caracteriacutesticas de pruebas no parameacutetricas

Estadiacutestica Administrativa II 36

Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media

Ventajas y desventajas de los meacutetodos parameacutetricos

Desventajas Ventajas bull Ignoran cierta cantidad de

informacioacuten bull No requieren la suposicioacuten de que

una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica

bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas

bull Generalmente es maacutes sencillo realizarlas y entenderlas

bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal

Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo

MHHHHM

1ra 2ra 3ra

Estadiacutestica Administrativa II 37

Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1

n2= nuacutemero de ocurrencias del tipo 2

r= nuacutemero de corridas

4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue

BABBBAAABBABBBBAAAABABAABBBAABAAAABBA

BBAAAABBABBBBAABBABAABB

Valores de la prueba

n1= 29

n2= 31

r= 29

4322 Distribucioacuten de muestreo del estadiacutestico r

El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba

Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente

Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1

n1+n2

Estadiacutestica Administrativa II 38

μr = 2(29)(31) +1

29+31

μr = 1798 +1 60

μr = 2997 +1

μr = 3097

Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)

(n1+n2)2(n1+n2-1)

σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)

σr= (1798) (1738)

(60)2(59)

σr= 1471

σr= 384

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-24 643 14-25 643 14-26 643 14-27 644 14-28 644

Estadiacutestica Administrativa II 39

44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica

Ejemplo

Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado

Miembro del panel Calificacioacuten para

conferencias grandes

Calificacioacuten para

sesiones pequentildeas

Signo de la calificacioacuten

Evaluacioacuten de los dos tipos de

clases

1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -

6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +

La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)

Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20

Estadiacutestica Administrativa II 40

Establecimiento de las hipoacutetesis

Ho p = 05

H1 p ne 05

Se consideran la posibilidades solamente de signos + y - (9+6 =15)

p Ho = 05

q H0 = 05

n= 15

p= 0600 (915)

q= 0400 (615)

Prueba de hipoacutetesis de que no hay diferencia

Error estaacutendar del la proporcioacuten

σp= pq n

σp= (05)(05) 15

σp= 0129

0025

0

0475 del aacuterea

Valor criacutetico Z=-196

Regioacuten de aceptacioacuten

0025

0475 del aacuterea

Valor criacutetico Z=196

Estadiacutestica Administrativa II 41

45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten

Procedimiento de la prueba de rangos con signo de Wilcoxon

Paso1 Para cada par de datos calcule la diferencia d restando el segundo

valor del primero Guarde los signos pero descarte cualquier par para el que

d=0

Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de

la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango

correspondiente Cuando las diferencias tengan el mismo valor numeacuterico

asiacutegneles la media de los rangos implicados en el empate

Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino

Esto es inserte aquellos signos que se ignoraron e el paso dos

Paso 4 Calcule la suma de los valores absolutos de los rangos negativos

Tambieacuten la suma de los rangos positivos

Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon

en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el

procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos

sumas

Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la

diferencia d no es 0

Estadiacutestica Administrativa II 42

Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el

tamantildeo muestral

Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos

muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica

esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico

Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente

2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha

Notacioacuten

T= la maacutes pequentildea de las siguientes dos sumas

1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0

La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T

Estadiacutestica Administrativa II 43

46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2

Rango Calificacioacuten Plantel

1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S

10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S

Estadiacutestica Administrativa II 44

30 1600 S

Estadiacutestica Administrativa II 45

Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500

n1= 15 n2= 15 R1= 247 R2= 218

Estadiacutestico U

U = n1n2 + n1(n1 +1) -R1 2

U= (15)(15) + (15)(16) -247 2

U= 225+120-247

U= 98

Media de la distribucioacuten muestral U

μu = n1n2

2

μu = (15)(15)

2

μu =1125

Estadiacutestica Administrativa II 46

Estadiacutestico U

σU = n1n2 + (n1n2 +1)

12

σU = (15)(15)(15+15+1)

12

σU = 6975 12

σU = 58125

σU = 241

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2

α= 015

Estandarizacioacuten del estadiacutestico U

z = U-μu

σU

z = 98 - 1125 241

z = -0602

144 -144 0 -0602

Valor estandarizado de

la muestra U

Regioacuten de aceptacioacuten

Estadiacutestica Administrativa II 47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras

Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular

Prueba de Wilcoxon de los rangos con signo

Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero

Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande

Prueba de Wilcoxon para contrastar datos pareados

El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 20: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

Estadiacutestica Administrativa II 16

Unidad 2 Anaacutelisis de regresioacuten correlacioacuten lineal simple y muacuteltiple

21 Estimacioacuten mediante la liacutenea de regresioacuten El anaacutelisis de regresioacuten y correlacioacuten permiten determinar tanto la naturaleza como la fuerza de una relacioacuten entre dos variables En el anaacutelisis de regresioacuten se desarrollaraacute una ecuacioacuten de estimacioacuten a traveacutes de una foacutermula matemaacutetica que relaciona las variables conocidas con la variable desconocida La variable conocida- variable independiente X La variable que tratamos de predecir se llama variable dependiente Y

Figura 2 Fuente (Levin 2004511) 211 Diagrama de dispersioacuten El primer paso para determinar si existe una relacioacuten entre dos variables es examinar la graacutefica de datos observados A esta graacutefica se le llama diagrama de dispersioacuten Un diagrama de dispersioacuten se puede identificar visualmente patrones que indique si las variables estaacuten relacionadas

X

Y

Gastos contra la contaminacioacuten

Emisor de

contaminacioacuten

Pendiente negativa

b) Relacioacuten directa

X

Y

Publicidad

Ventas

Pendiente positiva

a) Relacioacuten directa

Estadiacutestica Administrativa II 17

Figura 3 Fuente (Levin 2004503)

212 Meacutetodo de miacutenimos cuadrados

Liacutenea de estimacioacuten

Y= a+bx Y= variable dependiente a=variable ordenada y b=pendiente de la recta x=variable independiente

Pendiente de la recta de regresioacuten de mejor ajuste

b = Σ XY - n X Y Σ X2 - n X2

b=pendiente de la liacutenea de estimacioacuten de mejor ajuste X= valores de la variable independiente Y= variable valores de la variable dependiente X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente n= nuacutemero de puntos

Estadiacutestica Administrativa II 18

Liacutenea de estimacioacuten

a = Y - bX a= ordenada Y b= pendiente de la ecuacioacuten X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente

Error estaacutendar de la estimacioacuten

Se= Σ(Y-Y)2

n-2 Y= valores de la variable dependiente Y=valores estimados con la ecuacioacuten de estimacioacuten que corresponden a cada valor de Y n= nuacutemero de puntos utilizados para ajustar la liacutenea de regresioacuten Para medir la confiabilidad de la ecuacioacuten de estimacioacuten los especialistas en estadiacutestica han desarrollado el error estaacutendar de estimacioacuten Este error estaacutendar se simboliza por Se y es similar a la desviacioacuten estaacutendar en cuanto a que ambas son medidas de dispersioacuten El error estaacutendar de la estimacioacuten por otra parte mide la variabilidad o dispersioacuten de los valores observados alrededor de la recta de regresioacuten 213 Interpretacioacuten del error estaacutendar de la estimacioacuten Como ocurririacutea en el caso de la desviacioacuten estaacutendar mientras maacutes grande sea el error estaacutendar de la estimacioacuten mayor seraacute la dispersioacuten de los puntos alrededor de la liacutenea de regresioacuten De manera inversa si Se= 0 esperamos que la ecuacioacuten de estimacioacuten sea un estimador ldquoperfectordquo de la variable dependiente En este caso todos los puntos caeriacutean directamente sobre la liacutenea de regresioacuten y no habriacutea puntos dispersos alrededor Usaremos el error estaacutendar de la estimacioacuten como una herramienta de la misma forma que podemos usar la desviacioacuten estaacutendar Esto es suponiendo que los puntos observados siguen una distribucioacuten normal alrededor de la recta de regresioacuten podemos esperar encontrar el 68 de los puntos dentro de plusmn1Se el 955 de los puntos dentro de plusmn2Se y el 997 de los puntos dentro de plusmn3Se

Estadiacutestica Administrativa II 19

Figura 4 Fuente (Levin 2004529)

Debemos observar que el error estaacutendar de la estimacioacuten se mide a lo largo del eje Y y no perpendicularmente desde la recta de regresioacuten 214 Intervalos de prediccioacuten aproximados Podemos concebir al error estaacutendar de la estimacioacuten como una herramienta estadiacutestica que podemos usar para hacer afirmaciones de probabilidad acerca del intervalo alrededor del valor estimado de Y dentro del cual cae el valor real de Y Ejemplo

Y= 375 + 075 X Sustituyendo 4 en X

Y= 375 + 075 (4) = 375 + 300

= 675

Estadiacutestica Administrativa II 20

Intervalo 1 error 2 errores 3 errores

Y plusmn1 Se

Y plusmn2 Se

Y plusmn3 Se

En donde Se = 8660

Sustitucioacuten

Ejemplo A menudo quienes hacen la contabilidad de costos estiman los gastos generales con base en el nivel de produccioacuten Se ha reunido informacioacuten acerca de los gastos generales y las unidades producidas en diferentes plantas y ahora desean estimar una ecuacioacuten de regresioacuten para predecir los gastos generales futuros Gastos generales 191 170 272 155 280 173 234 116 153 178 Unidades 40 42 53 35 56 39 48 30 37 40

a) Determine la variable dependiente e independiente b) Desarrolle una ecuacioacuten de regresioacuten para contabilidad de costos c) Pronostique los gastos generales cuando se producen 50 unidades d) Calcule el error estaacutendar de estimacioacuten

Y +1 Se =

675 + (1) (8660) = 76140 Liacutemite superior del intervalo de prediccioacuten

Y +2 Se =

675 + (2) (8660) = 84820 Liacutemite superior del intervalo de prediccioacuten

Y -1 Se =

675 - (1) (8660) = 58840 Liacutemite inferior del intervalo de prediccioacuten

Y - 2 Se =

675 - (2) (8660) = 50180 Liacutemite inferior del intervalo de prediccioacuten

Estadiacutestica Administrativa II 21

X Y XY X2 Y2 40 191 7640 1600 36481 42 170 7140 1764 28900 53 272 14416 2809 73984 35 155 5425 1225 24025 56 280 15680 3136 78400 39 173 6747 1521 29929 48 234 11232 2304 54756 30 116 3480 900 13456 37 153 5661 1369 23409 40 178 7120 1600 31684 ΣX= 420 ΣY= 1922 ΣXY= 84541 ΣX2= 18228 ΣY2= 395024

b = Σ XY - n X Y = 84541 - 10(42)(1922) = 64915 Σ X2 - n X2 18228 - 10(42)2 a = Y ndash bX = 1922 ndash 64915 (42) = - 804430 Y= a+bx = -804430 + 64915 (50) = 2441320 Se= ΣY2 ndashaΣY ndash b ΣXY = n-2 Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

12-2 531 12-3 531

12-13 531 12-14 531 12-15 531

Estadiacutestica Administrativa II 22

215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten

Coeficiente de determinacioacuten de la muestra

r2= aΣY+bΣXY-nY2

ΣY2 ndash n Y2

Coeficiente de correlacioacuten de la muestra

r= r2

Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten

Estadiacutestica Administrativa II 23

Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables

Y= a + b1 X1 + b2 X2

Ecuacioacuten

na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2

1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2

2 = Σ X2Y

Ejemplo

a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10

Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784

Sumatoria

114 105 85 2463 1590 1435 2367 1571

Matriz

6 105 85 114 105 2367 1435 2463 85 1435 1571 1590

1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25

1 175 14167 19 0 1 -099 884 0 0 361608 21410

361608 b2 = 21410 b2 = 21410 361608 b2 = 059

Estadiacutestica Administrativa II 24

1 b1 -099 b2 = 884 1 b1 -099 (059) = 884

-006 884 1b1 = 884 +006 b1 = 890

1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a

= 2589

Y= a + b1 X1 + b2 X2

y=2589+890(28)+059(10)=28099

Estadiacutestica Administrativa II 25

218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)

Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad

La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos

Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir

donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria

Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados

Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante

Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo

Estadiacutestica Administrativa II 26

Figura 5 Distribucioacuten Homocedaacutestica

Figura 6 Distribucioacuten Heterocedaacutestica

Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten

lineal para hacer estimaciones futuras

Estadiacutestica Administrativa II 27

Unidad 3 Nuacutemeros iacutendice

Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se

calcula encontrando el cociente del valor actual entre el valor base luego se

multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje

Tipos de nuacutemeros iacutendice

Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de

cantidad e iacutendice de valor

Iacutendice de precios

Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida

Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo

Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable

El iacutendice de valor combina los cambios de precio y cantidad para presentar un

iacutendice con maacutes informacioacuten

Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos

como indicadores generales de la condicioacuten econoacutemica de un paiacutes

Factores que pueden distorsionar los nuacutemeros iacutendice

bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados

bull Falta de comparacioacuten de iacutendices

bull Ponderacioacuten no apropiada de los factores

bull Seleccioacuten de una base no apropiada

Estadiacutestica Administrativa II 28

31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores

Iacutendice de cantidad de agregados no ponderados

ΣQi x 100 ΣQo

Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea

1993 1994 1995

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200

Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado

1993 Qo

1994 Q1

1995 Q2

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308

Estadiacutestica Administrativa II 29

Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra

Iacutendice de precios de agregados ponderados

ΣPiQ x 100 ΣPoQ

Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100

Cambio de periodo base

I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base

Estadiacutestica Administrativa II 30

35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos

Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables

Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico

Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios

El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)

Estadiacutestica Administrativa II 31

Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica

37 Deflacioacuten de los valores de series de tiempo

Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios

En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea

La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores

Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero

Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes

Los valores expresados en unidades monetarias corrientes se conocen como valores nominales

Los valores expresados en unidades monetarias constantes se conocen como valores reales

Estadiacutestica Administrativa II 32

38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor

Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos

39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)

Estadiacutestica Administrativa II 33

Siacutembolo Nombre de la compantildeiacutea

AA Alcoa

ALD Allied Signal

AXP American Express

BA Boeing

CAT Caterpillar

CHV Chevron

C CitiGroup

DIS Disney

DD Dupont

EK Eastman Kodak

GE General Electric

GM General Motors

GT Goodyear Tire

HWP Hewlett-Packard

IBM International Business Machines

IP International Paper

JNJ Johnson amp Johnson

JPM JP Morgan Bank

KO Coca Cola

Figura 5 Compantildeiacuteas comprendidas en el Dow Jones

310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos

Praacutectica 2

992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico

elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado

de precios

Estadiacutestica Administrativa II 34

Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida

bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)

42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten

Las principales pruebas no parameacutetricas son las siguientes

bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher

Estadiacutestica Administrativa II 35

bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon

Caracteriacutesticas de algunas pruebas no parameacutetricas

1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos

2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten

3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal

4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados

5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc

6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica

Prueba Caracteriacutestica

Mann- Whitney 2 muestras independientes

Wilcoxon 2 muestras asociadas

Kruskal-Wallis + de 2 muestras independientes

Friedman + de 2 muestras asociadas

Tabla1 Caracteriacutesticas de pruebas no parameacutetricas

Estadiacutestica Administrativa II 36

Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media

Ventajas y desventajas de los meacutetodos parameacutetricos

Desventajas Ventajas bull Ignoran cierta cantidad de

informacioacuten bull No requieren la suposicioacuten de que

una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica

bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas

bull Generalmente es maacutes sencillo realizarlas y entenderlas

bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal

Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo

MHHHHM

1ra 2ra 3ra

Estadiacutestica Administrativa II 37

Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1

n2= nuacutemero de ocurrencias del tipo 2

r= nuacutemero de corridas

4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue

BABBBAAABBABBBBAAAABABAABBBAABAAAABBA

BBAAAABBABBBBAABBABAABB

Valores de la prueba

n1= 29

n2= 31

r= 29

4322 Distribucioacuten de muestreo del estadiacutestico r

El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba

Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente

Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1

n1+n2

Estadiacutestica Administrativa II 38

μr = 2(29)(31) +1

29+31

μr = 1798 +1 60

μr = 2997 +1

μr = 3097

Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)

(n1+n2)2(n1+n2-1)

σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)

σr= (1798) (1738)

(60)2(59)

σr= 1471

σr= 384

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-24 643 14-25 643 14-26 643 14-27 644 14-28 644

Estadiacutestica Administrativa II 39

44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica

Ejemplo

Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado

Miembro del panel Calificacioacuten para

conferencias grandes

Calificacioacuten para

sesiones pequentildeas

Signo de la calificacioacuten

Evaluacioacuten de los dos tipos de

clases

1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -

6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +

La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)

Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20

Estadiacutestica Administrativa II 40

Establecimiento de las hipoacutetesis

Ho p = 05

H1 p ne 05

Se consideran la posibilidades solamente de signos + y - (9+6 =15)

p Ho = 05

q H0 = 05

n= 15

p= 0600 (915)

q= 0400 (615)

Prueba de hipoacutetesis de que no hay diferencia

Error estaacutendar del la proporcioacuten

σp= pq n

σp= (05)(05) 15

σp= 0129

0025

0

0475 del aacuterea

Valor criacutetico Z=-196

Regioacuten de aceptacioacuten

0025

0475 del aacuterea

Valor criacutetico Z=196

Estadiacutestica Administrativa II 41

45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten

Procedimiento de la prueba de rangos con signo de Wilcoxon

Paso1 Para cada par de datos calcule la diferencia d restando el segundo

valor del primero Guarde los signos pero descarte cualquier par para el que

d=0

Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de

la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango

correspondiente Cuando las diferencias tengan el mismo valor numeacuterico

asiacutegneles la media de los rangos implicados en el empate

Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino

Esto es inserte aquellos signos que se ignoraron e el paso dos

Paso 4 Calcule la suma de los valores absolutos de los rangos negativos

Tambieacuten la suma de los rangos positivos

Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon

en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el

procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos

sumas

Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la

diferencia d no es 0

Estadiacutestica Administrativa II 42

Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el

tamantildeo muestral

Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos

muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica

esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico

Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente

2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha

Notacioacuten

T= la maacutes pequentildea de las siguientes dos sumas

1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0

La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T

Estadiacutestica Administrativa II 43

46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2

Rango Calificacioacuten Plantel

1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S

10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S

Estadiacutestica Administrativa II 44

30 1600 S

Estadiacutestica Administrativa II 45

Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500

n1= 15 n2= 15 R1= 247 R2= 218

Estadiacutestico U

U = n1n2 + n1(n1 +1) -R1 2

U= (15)(15) + (15)(16) -247 2

U= 225+120-247

U= 98

Media de la distribucioacuten muestral U

μu = n1n2

2

μu = (15)(15)

2

μu =1125

Estadiacutestica Administrativa II 46

Estadiacutestico U

σU = n1n2 + (n1n2 +1)

12

σU = (15)(15)(15+15+1)

12

σU = 6975 12

σU = 58125

σU = 241

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2

α= 015

Estandarizacioacuten del estadiacutestico U

z = U-μu

σU

z = 98 - 1125 241

z = -0602

144 -144 0 -0602

Valor estandarizado de

la muestra U

Regioacuten de aceptacioacuten

Estadiacutestica Administrativa II 47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras

Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular

Prueba de Wilcoxon de los rangos con signo

Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero

Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande

Prueba de Wilcoxon para contrastar datos pareados

El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 21: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

Estadiacutestica Administrativa II 17

Figura 3 Fuente (Levin 2004503)

212 Meacutetodo de miacutenimos cuadrados

Liacutenea de estimacioacuten

Y= a+bx Y= variable dependiente a=variable ordenada y b=pendiente de la recta x=variable independiente

Pendiente de la recta de regresioacuten de mejor ajuste

b = Σ XY - n X Y Σ X2 - n X2

b=pendiente de la liacutenea de estimacioacuten de mejor ajuste X= valores de la variable independiente Y= variable valores de la variable dependiente X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente n= nuacutemero de puntos

Estadiacutestica Administrativa II 18

Liacutenea de estimacioacuten

a = Y - bX a= ordenada Y b= pendiente de la ecuacioacuten X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente

Error estaacutendar de la estimacioacuten

Se= Σ(Y-Y)2

n-2 Y= valores de la variable dependiente Y=valores estimados con la ecuacioacuten de estimacioacuten que corresponden a cada valor de Y n= nuacutemero de puntos utilizados para ajustar la liacutenea de regresioacuten Para medir la confiabilidad de la ecuacioacuten de estimacioacuten los especialistas en estadiacutestica han desarrollado el error estaacutendar de estimacioacuten Este error estaacutendar se simboliza por Se y es similar a la desviacioacuten estaacutendar en cuanto a que ambas son medidas de dispersioacuten El error estaacutendar de la estimacioacuten por otra parte mide la variabilidad o dispersioacuten de los valores observados alrededor de la recta de regresioacuten 213 Interpretacioacuten del error estaacutendar de la estimacioacuten Como ocurririacutea en el caso de la desviacioacuten estaacutendar mientras maacutes grande sea el error estaacutendar de la estimacioacuten mayor seraacute la dispersioacuten de los puntos alrededor de la liacutenea de regresioacuten De manera inversa si Se= 0 esperamos que la ecuacioacuten de estimacioacuten sea un estimador ldquoperfectordquo de la variable dependiente En este caso todos los puntos caeriacutean directamente sobre la liacutenea de regresioacuten y no habriacutea puntos dispersos alrededor Usaremos el error estaacutendar de la estimacioacuten como una herramienta de la misma forma que podemos usar la desviacioacuten estaacutendar Esto es suponiendo que los puntos observados siguen una distribucioacuten normal alrededor de la recta de regresioacuten podemos esperar encontrar el 68 de los puntos dentro de plusmn1Se el 955 de los puntos dentro de plusmn2Se y el 997 de los puntos dentro de plusmn3Se

Estadiacutestica Administrativa II 19

Figura 4 Fuente (Levin 2004529)

Debemos observar que el error estaacutendar de la estimacioacuten se mide a lo largo del eje Y y no perpendicularmente desde la recta de regresioacuten 214 Intervalos de prediccioacuten aproximados Podemos concebir al error estaacutendar de la estimacioacuten como una herramienta estadiacutestica que podemos usar para hacer afirmaciones de probabilidad acerca del intervalo alrededor del valor estimado de Y dentro del cual cae el valor real de Y Ejemplo

Y= 375 + 075 X Sustituyendo 4 en X

Y= 375 + 075 (4) = 375 + 300

= 675

Estadiacutestica Administrativa II 20

Intervalo 1 error 2 errores 3 errores

Y plusmn1 Se

Y plusmn2 Se

Y plusmn3 Se

En donde Se = 8660

Sustitucioacuten

Ejemplo A menudo quienes hacen la contabilidad de costos estiman los gastos generales con base en el nivel de produccioacuten Se ha reunido informacioacuten acerca de los gastos generales y las unidades producidas en diferentes plantas y ahora desean estimar una ecuacioacuten de regresioacuten para predecir los gastos generales futuros Gastos generales 191 170 272 155 280 173 234 116 153 178 Unidades 40 42 53 35 56 39 48 30 37 40

a) Determine la variable dependiente e independiente b) Desarrolle una ecuacioacuten de regresioacuten para contabilidad de costos c) Pronostique los gastos generales cuando se producen 50 unidades d) Calcule el error estaacutendar de estimacioacuten

Y +1 Se =

675 + (1) (8660) = 76140 Liacutemite superior del intervalo de prediccioacuten

Y +2 Se =

675 + (2) (8660) = 84820 Liacutemite superior del intervalo de prediccioacuten

Y -1 Se =

675 - (1) (8660) = 58840 Liacutemite inferior del intervalo de prediccioacuten

Y - 2 Se =

675 - (2) (8660) = 50180 Liacutemite inferior del intervalo de prediccioacuten

Estadiacutestica Administrativa II 21

X Y XY X2 Y2 40 191 7640 1600 36481 42 170 7140 1764 28900 53 272 14416 2809 73984 35 155 5425 1225 24025 56 280 15680 3136 78400 39 173 6747 1521 29929 48 234 11232 2304 54756 30 116 3480 900 13456 37 153 5661 1369 23409 40 178 7120 1600 31684 ΣX= 420 ΣY= 1922 ΣXY= 84541 ΣX2= 18228 ΣY2= 395024

b = Σ XY - n X Y = 84541 - 10(42)(1922) = 64915 Σ X2 - n X2 18228 - 10(42)2 a = Y ndash bX = 1922 ndash 64915 (42) = - 804430 Y= a+bx = -804430 + 64915 (50) = 2441320 Se= ΣY2 ndashaΣY ndash b ΣXY = n-2 Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

12-2 531 12-3 531

12-13 531 12-14 531 12-15 531

Estadiacutestica Administrativa II 22

215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten

Coeficiente de determinacioacuten de la muestra

r2= aΣY+bΣXY-nY2

ΣY2 ndash n Y2

Coeficiente de correlacioacuten de la muestra

r= r2

Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten

Estadiacutestica Administrativa II 23

Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables

Y= a + b1 X1 + b2 X2

Ecuacioacuten

na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2

1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2

2 = Σ X2Y

Ejemplo

a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10

Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784

Sumatoria

114 105 85 2463 1590 1435 2367 1571

Matriz

6 105 85 114 105 2367 1435 2463 85 1435 1571 1590

1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25

1 175 14167 19 0 1 -099 884 0 0 361608 21410

361608 b2 = 21410 b2 = 21410 361608 b2 = 059

Estadiacutestica Administrativa II 24

1 b1 -099 b2 = 884 1 b1 -099 (059) = 884

-006 884 1b1 = 884 +006 b1 = 890

1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a

= 2589

Y= a + b1 X1 + b2 X2

y=2589+890(28)+059(10)=28099

Estadiacutestica Administrativa II 25

218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)

Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad

La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos

Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir

donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria

Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados

Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante

Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo

Estadiacutestica Administrativa II 26

Figura 5 Distribucioacuten Homocedaacutestica

Figura 6 Distribucioacuten Heterocedaacutestica

Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten

lineal para hacer estimaciones futuras

Estadiacutestica Administrativa II 27

Unidad 3 Nuacutemeros iacutendice

Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se

calcula encontrando el cociente del valor actual entre el valor base luego se

multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje

Tipos de nuacutemeros iacutendice

Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de

cantidad e iacutendice de valor

Iacutendice de precios

Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida

Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo

Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable

El iacutendice de valor combina los cambios de precio y cantidad para presentar un

iacutendice con maacutes informacioacuten

Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos

como indicadores generales de la condicioacuten econoacutemica de un paiacutes

Factores que pueden distorsionar los nuacutemeros iacutendice

bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados

bull Falta de comparacioacuten de iacutendices

bull Ponderacioacuten no apropiada de los factores

bull Seleccioacuten de una base no apropiada

Estadiacutestica Administrativa II 28

31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores

Iacutendice de cantidad de agregados no ponderados

ΣQi x 100 ΣQo

Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea

1993 1994 1995

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200

Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado

1993 Qo

1994 Q1

1995 Q2

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308

Estadiacutestica Administrativa II 29

Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra

Iacutendice de precios de agregados ponderados

ΣPiQ x 100 ΣPoQ

Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100

Cambio de periodo base

I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base

Estadiacutestica Administrativa II 30

35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos

Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables

Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico

Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios

El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)

Estadiacutestica Administrativa II 31

Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica

37 Deflacioacuten de los valores de series de tiempo

Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios

En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea

La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores

Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero

Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes

Los valores expresados en unidades monetarias corrientes se conocen como valores nominales

Los valores expresados en unidades monetarias constantes se conocen como valores reales

Estadiacutestica Administrativa II 32

38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor

Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos

39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)

Estadiacutestica Administrativa II 33

Siacutembolo Nombre de la compantildeiacutea

AA Alcoa

ALD Allied Signal

AXP American Express

BA Boeing

CAT Caterpillar

CHV Chevron

C CitiGroup

DIS Disney

DD Dupont

EK Eastman Kodak

GE General Electric

GM General Motors

GT Goodyear Tire

HWP Hewlett-Packard

IBM International Business Machines

IP International Paper

JNJ Johnson amp Johnson

JPM JP Morgan Bank

KO Coca Cola

Figura 5 Compantildeiacuteas comprendidas en el Dow Jones

310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos

Praacutectica 2

992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico

elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado

de precios

Estadiacutestica Administrativa II 34

Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida

bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)

42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten

Las principales pruebas no parameacutetricas son las siguientes

bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher

Estadiacutestica Administrativa II 35

bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon

Caracteriacutesticas de algunas pruebas no parameacutetricas

1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos

2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten

3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal

4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados

5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc

6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica

Prueba Caracteriacutestica

Mann- Whitney 2 muestras independientes

Wilcoxon 2 muestras asociadas

Kruskal-Wallis + de 2 muestras independientes

Friedman + de 2 muestras asociadas

Tabla1 Caracteriacutesticas de pruebas no parameacutetricas

Estadiacutestica Administrativa II 36

Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media

Ventajas y desventajas de los meacutetodos parameacutetricos

Desventajas Ventajas bull Ignoran cierta cantidad de

informacioacuten bull No requieren la suposicioacuten de que

una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica

bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas

bull Generalmente es maacutes sencillo realizarlas y entenderlas

bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal

Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo

MHHHHM

1ra 2ra 3ra

Estadiacutestica Administrativa II 37

Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1

n2= nuacutemero de ocurrencias del tipo 2

r= nuacutemero de corridas

4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue

BABBBAAABBABBBBAAAABABAABBBAABAAAABBA

BBAAAABBABBBBAABBABAABB

Valores de la prueba

n1= 29

n2= 31

r= 29

4322 Distribucioacuten de muestreo del estadiacutestico r

El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba

Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente

Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1

n1+n2

Estadiacutestica Administrativa II 38

μr = 2(29)(31) +1

29+31

μr = 1798 +1 60

μr = 2997 +1

μr = 3097

Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)

(n1+n2)2(n1+n2-1)

σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)

σr= (1798) (1738)

(60)2(59)

σr= 1471

σr= 384

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-24 643 14-25 643 14-26 643 14-27 644 14-28 644

Estadiacutestica Administrativa II 39

44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica

Ejemplo

Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado

Miembro del panel Calificacioacuten para

conferencias grandes

Calificacioacuten para

sesiones pequentildeas

Signo de la calificacioacuten

Evaluacioacuten de los dos tipos de

clases

1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -

6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +

La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)

Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20

Estadiacutestica Administrativa II 40

Establecimiento de las hipoacutetesis

Ho p = 05

H1 p ne 05

Se consideran la posibilidades solamente de signos + y - (9+6 =15)

p Ho = 05

q H0 = 05

n= 15

p= 0600 (915)

q= 0400 (615)

Prueba de hipoacutetesis de que no hay diferencia

Error estaacutendar del la proporcioacuten

σp= pq n

σp= (05)(05) 15

σp= 0129

0025

0

0475 del aacuterea

Valor criacutetico Z=-196

Regioacuten de aceptacioacuten

0025

0475 del aacuterea

Valor criacutetico Z=196

Estadiacutestica Administrativa II 41

45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten

Procedimiento de la prueba de rangos con signo de Wilcoxon

Paso1 Para cada par de datos calcule la diferencia d restando el segundo

valor del primero Guarde los signos pero descarte cualquier par para el que

d=0

Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de

la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango

correspondiente Cuando las diferencias tengan el mismo valor numeacuterico

asiacutegneles la media de los rangos implicados en el empate

Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino

Esto es inserte aquellos signos que se ignoraron e el paso dos

Paso 4 Calcule la suma de los valores absolutos de los rangos negativos

Tambieacuten la suma de los rangos positivos

Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon

en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el

procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos

sumas

Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la

diferencia d no es 0

Estadiacutestica Administrativa II 42

Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el

tamantildeo muestral

Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos

muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica

esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico

Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente

2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha

Notacioacuten

T= la maacutes pequentildea de las siguientes dos sumas

1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0

La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T

Estadiacutestica Administrativa II 43

46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2

Rango Calificacioacuten Plantel

1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S

10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S

Estadiacutestica Administrativa II 44

30 1600 S

Estadiacutestica Administrativa II 45

Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500

n1= 15 n2= 15 R1= 247 R2= 218

Estadiacutestico U

U = n1n2 + n1(n1 +1) -R1 2

U= (15)(15) + (15)(16) -247 2

U= 225+120-247

U= 98

Media de la distribucioacuten muestral U

μu = n1n2

2

μu = (15)(15)

2

μu =1125

Estadiacutestica Administrativa II 46

Estadiacutestico U

σU = n1n2 + (n1n2 +1)

12

σU = (15)(15)(15+15+1)

12

σU = 6975 12

σU = 58125

σU = 241

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2

α= 015

Estandarizacioacuten del estadiacutestico U

z = U-μu

σU

z = 98 - 1125 241

z = -0602

144 -144 0 -0602

Valor estandarizado de

la muestra U

Regioacuten de aceptacioacuten

Estadiacutestica Administrativa II 47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras

Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular

Prueba de Wilcoxon de los rangos con signo

Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero

Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande

Prueba de Wilcoxon para contrastar datos pareados

El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 22: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

Estadiacutestica Administrativa II 18

Liacutenea de estimacioacuten

a = Y - bX a= ordenada Y b= pendiente de la ecuacioacuten X= media de los valores de la variable independiente Y= media de los valores de la variable dependiente

Error estaacutendar de la estimacioacuten

Se= Σ(Y-Y)2

n-2 Y= valores de la variable dependiente Y=valores estimados con la ecuacioacuten de estimacioacuten que corresponden a cada valor de Y n= nuacutemero de puntos utilizados para ajustar la liacutenea de regresioacuten Para medir la confiabilidad de la ecuacioacuten de estimacioacuten los especialistas en estadiacutestica han desarrollado el error estaacutendar de estimacioacuten Este error estaacutendar se simboliza por Se y es similar a la desviacioacuten estaacutendar en cuanto a que ambas son medidas de dispersioacuten El error estaacutendar de la estimacioacuten por otra parte mide la variabilidad o dispersioacuten de los valores observados alrededor de la recta de regresioacuten 213 Interpretacioacuten del error estaacutendar de la estimacioacuten Como ocurririacutea en el caso de la desviacioacuten estaacutendar mientras maacutes grande sea el error estaacutendar de la estimacioacuten mayor seraacute la dispersioacuten de los puntos alrededor de la liacutenea de regresioacuten De manera inversa si Se= 0 esperamos que la ecuacioacuten de estimacioacuten sea un estimador ldquoperfectordquo de la variable dependiente En este caso todos los puntos caeriacutean directamente sobre la liacutenea de regresioacuten y no habriacutea puntos dispersos alrededor Usaremos el error estaacutendar de la estimacioacuten como una herramienta de la misma forma que podemos usar la desviacioacuten estaacutendar Esto es suponiendo que los puntos observados siguen una distribucioacuten normal alrededor de la recta de regresioacuten podemos esperar encontrar el 68 de los puntos dentro de plusmn1Se el 955 de los puntos dentro de plusmn2Se y el 997 de los puntos dentro de plusmn3Se

Estadiacutestica Administrativa II 19

Figura 4 Fuente (Levin 2004529)

Debemos observar que el error estaacutendar de la estimacioacuten se mide a lo largo del eje Y y no perpendicularmente desde la recta de regresioacuten 214 Intervalos de prediccioacuten aproximados Podemos concebir al error estaacutendar de la estimacioacuten como una herramienta estadiacutestica que podemos usar para hacer afirmaciones de probabilidad acerca del intervalo alrededor del valor estimado de Y dentro del cual cae el valor real de Y Ejemplo

Y= 375 + 075 X Sustituyendo 4 en X

Y= 375 + 075 (4) = 375 + 300

= 675

Estadiacutestica Administrativa II 20

Intervalo 1 error 2 errores 3 errores

Y plusmn1 Se

Y plusmn2 Se

Y plusmn3 Se

En donde Se = 8660

Sustitucioacuten

Ejemplo A menudo quienes hacen la contabilidad de costos estiman los gastos generales con base en el nivel de produccioacuten Se ha reunido informacioacuten acerca de los gastos generales y las unidades producidas en diferentes plantas y ahora desean estimar una ecuacioacuten de regresioacuten para predecir los gastos generales futuros Gastos generales 191 170 272 155 280 173 234 116 153 178 Unidades 40 42 53 35 56 39 48 30 37 40

a) Determine la variable dependiente e independiente b) Desarrolle una ecuacioacuten de regresioacuten para contabilidad de costos c) Pronostique los gastos generales cuando se producen 50 unidades d) Calcule el error estaacutendar de estimacioacuten

Y +1 Se =

675 + (1) (8660) = 76140 Liacutemite superior del intervalo de prediccioacuten

Y +2 Se =

675 + (2) (8660) = 84820 Liacutemite superior del intervalo de prediccioacuten

Y -1 Se =

675 - (1) (8660) = 58840 Liacutemite inferior del intervalo de prediccioacuten

Y - 2 Se =

675 - (2) (8660) = 50180 Liacutemite inferior del intervalo de prediccioacuten

Estadiacutestica Administrativa II 21

X Y XY X2 Y2 40 191 7640 1600 36481 42 170 7140 1764 28900 53 272 14416 2809 73984 35 155 5425 1225 24025 56 280 15680 3136 78400 39 173 6747 1521 29929 48 234 11232 2304 54756 30 116 3480 900 13456 37 153 5661 1369 23409 40 178 7120 1600 31684 ΣX= 420 ΣY= 1922 ΣXY= 84541 ΣX2= 18228 ΣY2= 395024

b = Σ XY - n X Y = 84541 - 10(42)(1922) = 64915 Σ X2 - n X2 18228 - 10(42)2 a = Y ndash bX = 1922 ndash 64915 (42) = - 804430 Y= a+bx = -804430 + 64915 (50) = 2441320 Se= ΣY2 ndashaΣY ndash b ΣXY = n-2 Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

12-2 531 12-3 531

12-13 531 12-14 531 12-15 531

Estadiacutestica Administrativa II 22

215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten

Coeficiente de determinacioacuten de la muestra

r2= aΣY+bΣXY-nY2

ΣY2 ndash n Y2

Coeficiente de correlacioacuten de la muestra

r= r2

Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten

Estadiacutestica Administrativa II 23

Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables

Y= a + b1 X1 + b2 X2

Ecuacioacuten

na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2

1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2

2 = Σ X2Y

Ejemplo

a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10

Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784

Sumatoria

114 105 85 2463 1590 1435 2367 1571

Matriz

6 105 85 114 105 2367 1435 2463 85 1435 1571 1590

1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25

1 175 14167 19 0 1 -099 884 0 0 361608 21410

361608 b2 = 21410 b2 = 21410 361608 b2 = 059

Estadiacutestica Administrativa II 24

1 b1 -099 b2 = 884 1 b1 -099 (059) = 884

-006 884 1b1 = 884 +006 b1 = 890

1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a

= 2589

Y= a + b1 X1 + b2 X2

y=2589+890(28)+059(10)=28099

Estadiacutestica Administrativa II 25

218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)

Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad

La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos

Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir

donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria

Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados

Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante

Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo

Estadiacutestica Administrativa II 26

Figura 5 Distribucioacuten Homocedaacutestica

Figura 6 Distribucioacuten Heterocedaacutestica

Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten

lineal para hacer estimaciones futuras

Estadiacutestica Administrativa II 27

Unidad 3 Nuacutemeros iacutendice

Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se

calcula encontrando el cociente del valor actual entre el valor base luego se

multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje

Tipos de nuacutemeros iacutendice

Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de

cantidad e iacutendice de valor

Iacutendice de precios

Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida

Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo

Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable

El iacutendice de valor combina los cambios de precio y cantidad para presentar un

iacutendice con maacutes informacioacuten

Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos

como indicadores generales de la condicioacuten econoacutemica de un paiacutes

Factores que pueden distorsionar los nuacutemeros iacutendice

bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados

bull Falta de comparacioacuten de iacutendices

bull Ponderacioacuten no apropiada de los factores

bull Seleccioacuten de una base no apropiada

Estadiacutestica Administrativa II 28

31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores

Iacutendice de cantidad de agregados no ponderados

ΣQi x 100 ΣQo

Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea

1993 1994 1995

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200

Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado

1993 Qo

1994 Q1

1995 Q2

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308

Estadiacutestica Administrativa II 29

Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra

Iacutendice de precios de agregados ponderados

ΣPiQ x 100 ΣPoQ

Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100

Cambio de periodo base

I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base

Estadiacutestica Administrativa II 30

35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos

Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables

Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico

Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios

El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)

Estadiacutestica Administrativa II 31

Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica

37 Deflacioacuten de los valores de series de tiempo

Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios

En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea

La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores

Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero

Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes

Los valores expresados en unidades monetarias corrientes se conocen como valores nominales

Los valores expresados en unidades monetarias constantes se conocen como valores reales

Estadiacutestica Administrativa II 32

38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor

Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos

39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)

Estadiacutestica Administrativa II 33

Siacutembolo Nombre de la compantildeiacutea

AA Alcoa

ALD Allied Signal

AXP American Express

BA Boeing

CAT Caterpillar

CHV Chevron

C CitiGroup

DIS Disney

DD Dupont

EK Eastman Kodak

GE General Electric

GM General Motors

GT Goodyear Tire

HWP Hewlett-Packard

IBM International Business Machines

IP International Paper

JNJ Johnson amp Johnson

JPM JP Morgan Bank

KO Coca Cola

Figura 5 Compantildeiacuteas comprendidas en el Dow Jones

310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos

Praacutectica 2

992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico

elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado

de precios

Estadiacutestica Administrativa II 34

Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida

bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)

42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten

Las principales pruebas no parameacutetricas son las siguientes

bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher

Estadiacutestica Administrativa II 35

bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon

Caracteriacutesticas de algunas pruebas no parameacutetricas

1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos

2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten

3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal

4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados

5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc

6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica

Prueba Caracteriacutestica

Mann- Whitney 2 muestras independientes

Wilcoxon 2 muestras asociadas

Kruskal-Wallis + de 2 muestras independientes

Friedman + de 2 muestras asociadas

Tabla1 Caracteriacutesticas de pruebas no parameacutetricas

Estadiacutestica Administrativa II 36

Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media

Ventajas y desventajas de los meacutetodos parameacutetricos

Desventajas Ventajas bull Ignoran cierta cantidad de

informacioacuten bull No requieren la suposicioacuten de que

una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica

bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas

bull Generalmente es maacutes sencillo realizarlas y entenderlas

bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal

Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo

MHHHHM

1ra 2ra 3ra

Estadiacutestica Administrativa II 37

Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1

n2= nuacutemero de ocurrencias del tipo 2

r= nuacutemero de corridas

4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue

BABBBAAABBABBBBAAAABABAABBBAABAAAABBA

BBAAAABBABBBBAABBABAABB

Valores de la prueba

n1= 29

n2= 31

r= 29

4322 Distribucioacuten de muestreo del estadiacutestico r

El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba

Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente

Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1

n1+n2

Estadiacutestica Administrativa II 38

μr = 2(29)(31) +1

29+31

μr = 1798 +1 60

μr = 2997 +1

μr = 3097

Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)

(n1+n2)2(n1+n2-1)

σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)

σr= (1798) (1738)

(60)2(59)

σr= 1471

σr= 384

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-24 643 14-25 643 14-26 643 14-27 644 14-28 644

Estadiacutestica Administrativa II 39

44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica

Ejemplo

Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado

Miembro del panel Calificacioacuten para

conferencias grandes

Calificacioacuten para

sesiones pequentildeas

Signo de la calificacioacuten

Evaluacioacuten de los dos tipos de

clases

1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -

6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +

La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)

Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20

Estadiacutestica Administrativa II 40

Establecimiento de las hipoacutetesis

Ho p = 05

H1 p ne 05

Se consideran la posibilidades solamente de signos + y - (9+6 =15)

p Ho = 05

q H0 = 05

n= 15

p= 0600 (915)

q= 0400 (615)

Prueba de hipoacutetesis de que no hay diferencia

Error estaacutendar del la proporcioacuten

σp= pq n

σp= (05)(05) 15

σp= 0129

0025

0

0475 del aacuterea

Valor criacutetico Z=-196

Regioacuten de aceptacioacuten

0025

0475 del aacuterea

Valor criacutetico Z=196

Estadiacutestica Administrativa II 41

45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten

Procedimiento de la prueba de rangos con signo de Wilcoxon

Paso1 Para cada par de datos calcule la diferencia d restando el segundo

valor del primero Guarde los signos pero descarte cualquier par para el que

d=0

Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de

la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango

correspondiente Cuando las diferencias tengan el mismo valor numeacuterico

asiacutegneles la media de los rangos implicados en el empate

Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino

Esto es inserte aquellos signos que se ignoraron e el paso dos

Paso 4 Calcule la suma de los valores absolutos de los rangos negativos

Tambieacuten la suma de los rangos positivos

Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon

en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el

procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos

sumas

Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la

diferencia d no es 0

Estadiacutestica Administrativa II 42

Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el

tamantildeo muestral

Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos

muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica

esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico

Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente

2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha

Notacioacuten

T= la maacutes pequentildea de las siguientes dos sumas

1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0

La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T

Estadiacutestica Administrativa II 43

46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2

Rango Calificacioacuten Plantel

1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S

10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S

Estadiacutestica Administrativa II 44

30 1600 S

Estadiacutestica Administrativa II 45

Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500

n1= 15 n2= 15 R1= 247 R2= 218

Estadiacutestico U

U = n1n2 + n1(n1 +1) -R1 2

U= (15)(15) + (15)(16) -247 2

U= 225+120-247

U= 98

Media de la distribucioacuten muestral U

μu = n1n2

2

μu = (15)(15)

2

μu =1125

Estadiacutestica Administrativa II 46

Estadiacutestico U

σU = n1n2 + (n1n2 +1)

12

σU = (15)(15)(15+15+1)

12

σU = 6975 12

σU = 58125

σU = 241

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2

α= 015

Estandarizacioacuten del estadiacutestico U

z = U-μu

σU

z = 98 - 1125 241

z = -0602

144 -144 0 -0602

Valor estandarizado de

la muestra U

Regioacuten de aceptacioacuten

Estadiacutestica Administrativa II 47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras

Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular

Prueba de Wilcoxon de los rangos con signo

Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero

Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande

Prueba de Wilcoxon para contrastar datos pareados

El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 23: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

Estadiacutestica Administrativa II 19

Figura 4 Fuente (Levin 2004529)

Debemos observar que el error estaacutendar de la estimacioacuten se mide a lo largo del eje Y y no perpendicularmente desde la recta de regresioacuten 214 Intervalos de prediccioacuten aproximados Podemos concebir al error estaacutendar de la estimacioacuten como una herramienta estadiacutestica que podemos usar para hacer afirmaciones de probabilidad acerca del intervalo alrededor del valor estimado de Y dentro del cual cae el valor real de Y Ejemplo

Y= 375 + 075 X Sustituyendo 4 en X

Y= 375 + 075 (4) = 375 + 300

= 675

Estadiacutestica Administrativa II 20

Intervalo 1 error 2 errores 3 errores

Y plusmn1 Se

Y plusmn2 Se

Y plusmn3 Se

En donde Se = 8660

Sustitucioacuten

Ejemplo A menudo quienes hacen la contabilidad de costos estiman los gastos generales con base en el nivel de produccioacuten Se ha reunido informacioacuten acerca de los gastos generales y las unidades producidas en diferentes plantas y ahora desean estimar una ecuacioacuten de regresioacuten para predecir los gastos generales futuros Gastos generales 191 170 272 155 280 173 234 116 153 178 Unidades 40 42 53 35 56 39 48 30 37 40

a) Determine la variable dependiente e independiente b) Desarrolle una ecuacioacuten de regresioacuten para contabilidad de costos c) Pronostique los gastos generales cuando se producen 50 unidades d) Calcule el error estaacutendar de estimacioacuten

Y +1 Se =

675 + (1) (8660) = 76140 Liacutemite superior del intervalo de prediccioacuten

Y +2 Se =

675 + (2) (8660) = 84820 Liacutemite superior del intervalo de prediccioacuten

Y -1 Se =

675 - (1) (8660) = 58840 Liacutemite inferior del intervalo de prediccioacuten

Y - 2 Se =

675 - (2) (8660) = 50180 Liacutemite inferior del intervalo de prediccioacuten

Estadiacutestica Administrativa II 21

X Y XY X2 Y2 40 191 7640 1600 36481 42 170 7140 1764 28900 53 272 14416 2809 73984 35 155 5425 1225 24025 56 280 15680 3136 78400 39 173 6747 1521 29929 48 234 11232 2304 54756 30 116 3480 900 13456 37 153 5661 1369 23409 40 178 7120 1600 31684 ΣX= 420 ΣY= 1922 ΣXY= 84541 ΣX2= 18228 ΣY2= 395024

b = Σ XY - n X Y = 84541 - 10(42)(1922) = 64915 Σ X2 - n X2 18228 - 10(42)2 a = Y ndash bX = 1922 ndash 64915 (42) = - 804430 Y= a+bx = -804430 + 64915 (50) = 2441320 Se= ΣY2 ndashaΣY ndash b ΣXY = n-2 Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

12-2 531 12-3 531

12-13 531 12-14 531 12-15 531

Estadiacutestica Administrativa II 22

215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten

Coeficiente de determinacioacuten de la muestra

r2= aΣY+bΣXY-nY2

ΣY2 ndash n Y2

Coeficiente de correlacioacuten de la muestra

r= r2

Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten

Estadiacutestica Administrativa II 23

Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables

Y= a + b1 X1 + b2 X2

Ecuacioacuten

na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2

1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2

2 = Σ X2Y

Ejemplo

a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10

Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784

Sumatoria

114 105 85 2463 1590 1435 2367 1571

Matriz

6 105 85 114 105 2367 1435 2463 85 1435 1571 1590

1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25

1 175 14167 19 0 1 -099 884 0 0 361608 21410

361608 b2 = 21410 b2 = 21410 361608 b2 = 059

Estadiacutestica Administrativa II 24

1 b1 -099 b2 = 884 1 b1 -099 (059) = 884

-006 884 1b1 = 884 +006 b1 = 890

1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a

= 2589

Y= a + b1 X1 + b2 X2

y=2589+890(28)+059(10)=28099

Estadiacutestica Administrativa II 25

218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)

Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad

La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos

Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir

donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria

Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados

Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante

Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo

Estadiacutestica Administrativa II 26

Figura 5 Distribucioacuten Homocedaacutestica

Figura 6 Distribucioacuten Heterocedaacutestica

Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten

lineal para hacer estimaciones futuras

Estadiacutestica Administrativa II 27

Unidad 3 Nuacutemeros iacutendice

Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se

calcula encontrando el cociente del valor actual entre el valor base luego se

multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje

Tipos de nuacutemeros iacutendice

Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de

cantidad e iacutendice de valor

Iacutendice de precios

Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida

Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo

Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable

El iacutendice de valor combina los cambios de precio y cantidad para presentar un

iacutendice con maacutes informacioacuten

Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos

como indicadores generales de la condicioacuten econoacutemica de un paiacutes

Factores que pueden distorsionar los nuacutemeros iacutendice

bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados

bull Falta de comparacioacuten de iacutendices

bull Ponderacioacuten no apropiada de los factores

bull Seleccioacuten de una base no apropiada

Estadiacutestica Administrativa II 28

31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores

Iacutendice de cantidad de agregados no ponderados

ΣQi x 100 ΣQo

Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea

1993 1994 1995

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200

Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado

1993 Qo

1994 Q1

1995 Q2

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308

Estadiacutestica Administrativa II 29

Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra

Iacutendice de precios de agregados ponderados

ΣPiQ x 100 ΣPoQ

Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100

Cambio de periodo base

I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base

Estadiacutestica Administrativa II 30

35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos

Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables

Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico

Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios

El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)

Estadiacutestica Administrativa II 31

Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica

37 Deflacioacuten de los valores de series de tiempo

Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios

En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea

La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores

Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero

Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes

Los valores expresados en unidades monetarias corrientes se conocen como valores nominales

Los valores expresados en unidades monetarias constantes se conocen como valores reales

Estadiacutestica Administrativa II 32

38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor

Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos

39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)

Estadiacutestica Administrativa II 33

Siacutembolo Nombre de la compantildeiacutea

AA Alcoa

ALD Allied Signal

AXP American Express

BA Boeing

CAT Caterpillar

CHV Chevron

C CitiGroup

DIS Disney

DD Dupont

EK Eastman Kodak

GE General Electric

GM General Motors

GT Goodyear Tire

HWP Hewlett-Packard

IBM International Business Machines

IP International Paper

JNJ Johnson amp Johnson

JPM JP Morgan Bank

KO Coca Cola

Figura 5 Compantildeiacuteas comprendidas en el Dow Jones

310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos

Praacutectica 2

992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico

elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado

de precios

Estadiacutestica Administrativa II 34

Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida

bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)

42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten

Las principales pruebas no parameacutetricas son las siguientes

bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher

Estadiacutestica Administrativa II 35

bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon

Caracteriacutesticas de algunas pruebas no parameacutetricas

1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos

2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten

3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal

4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados

5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc

6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica

Prueba Caracteriacutestica

Mann- Whitney 2 muestras independientes

Wilcoxon 2 muestras asociadas

Kruskal-Wallis + de 2 muestras independientes

Friedman + de 2 muestras asociadas

Tabla1 Caracteriacutesticas de pruebas no parameacutetricas

Estadiacutestica Administrativa II 36

Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media

Ventajas y desventajas de los meacutetodos parameacutetricos

Desventajas Ventajas bull Ignoran cierta cantidad de

informacioacuten bull No requieren la suposicioacuten de que

una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica

bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas

bull Generalmente es maacutes sencillo realizarlas y entenderlas

bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal

Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo

MHHHHM

1ra 2ra 3ra

Estadiacutestica Administrativa II 37

Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1

n2= nuacutemero de ocurrencias del tipo 2

r= nuacutemero de corridas

4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue

BABBBAAABBABBBBAAAABABAABBBAABAAAABBA

BBAAAABBABBBBAABBABAABB

Valores de la prueba

n1= 29

n2= 31

r= 29

4322 Distribucioacuten de muestreo del estadiacutestico r

El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba

Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente

Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1

n1+n2

Estadiacutestica Administrativa II 38

μr = 2(29)(31) +1

29+31

μr = 1798 +1 60

μr = 2997 +1

μr = 3097

Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)

(n1+n2)2(n1+n2-1)

σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)

σr= (1798) (1738)

(60)2(59)

σr= 1471

σr= 384

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-24 643 14-25 643 14-26 643 14-27 644 14-28 644

Estadiacutestica Administrativa II 39

44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica

Ejemplo

Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado

Miembro del panel Calificacioacuten para

conferencias grandes

Calificacioacuten para

sesiones pequentildeas

Signo de la calificacioacuten

Evaluacioacuten de los dos tipos de

clases

1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -

6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +

La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)

Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20

Estadiacutestica Administrativa II 40

Establecimiento de las hipoacutetesis

Ho p = 05

H1 p ne 05

Se consideran la posibilidades solamente de signos + y - (9+6 =15)

p Ho = 05

q H0 = 05

n= 15

p= 0600 (915)

q= 0400 (615)

Prueba de hipoacutetesis de que no hay diferencia

Error estaacutendar del la proporcioacuten

σp= pq n

σp= (05)(05) 15

σp= 0129

0025

0

0475 del aacuterea

Valor criacutetico Z=-196

Regioacuten de aceptacioacuten

0025

0475 del aacuterea

Valor criacutetico Z=196

Estadiacutestica Administrativa II 41

45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten

Procedimiento de la prueba de rangos con signo de Wilcoxon

Paso1 Para cada par de datos calcule la diferencia d restando el segundo

valor del primero Guarde los signos pero descarte cualquier par para el que

d=0

Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de

la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango

correspondiente Cuando las diferencias tengan el mismo valor numeacuterico

asiacutegneles la media de los rangos implicados en el empate

Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino

Esto es inserte aquellos signos que se ignoraron e el paso dos

Paso 4 Calcule la suma de los valores absolutos de los rangos negativos

Tambieacuten la suma de los rangos positivos

Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon

en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el

procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos

sumas

Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la

diferencia d no es 0

Estadiacutestica Administrativa II 42

Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el

tamantildeo muestral

Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos

muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica

esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico

Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente

2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha

Notacioacuten

T= la maacutes pequentildea de las siguientes dos sumas

1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0

La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T

Estadiacutestica Administrativa II 43

46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2

Rango Calificacioacuten Plantel

1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S

10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S

Estadiacutestica Administrativa II 44

30 1600 S

Estadiacutestica Administrativa II 45

Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500

n1= 15 n2= 15 R1= 247 R2= 218

Estadiacutestico U

U = n1n2 + n1(n1 +1) -R1 2

U= (15)(15) + (15)(16) -247 2

U= 225+120-247

U= 98

Media de la distribucioacuten muestral U

μu = n1n2

2

μu = (15)(15)

2

μu =1125

Estadiacutestica Administrativa II 46

Estadiacutestico U

σU = n1n2 + (n1n2 +1)

12

σU = (15)(15)(15+15+1)

12

σU = 6975 12

σU = 58125

σU = 241

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2

α= 015

Estandarizacioacuten del estadiacutestico U

z = U-μu

σU

z = 98 - 1125 241

z = -0602

144 -144 0 -0602

Valor estandarizado de

la muestra U

Regioacuten de aceptacioacuten

Estadiacutestica Administrativa II 47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras

Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular

Prueba de Wilcoxon de los rangos con signo

Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero

Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande

Prueba de Wilcoxon para contrastar datos pareados

El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 24: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

Estadiacutestica Administrativa II 20

Intervalo 1 error 2 errores 3 errores

Y plusmn1 Se

Y plusmn2 Se

Y plusmn3 Se

En donde Se = 8660

Sustitucioacuten

Ejemplo A menudo quienes hacen la contabilidad de costos estiman los gastos generales con base en el nivel de produccioacuten Se ha reunido informacioacuten acerca de los gastos generales y las unidades producidas en diferentes plantas y ahora desean estimar una ecuacioacuten de regresioacuten para predecir los gastos generales futuros Gastos generales 191 170 272 155 280 173 234 116 153 178 Unidades 40 42 53 35 56 39 48 30 37 40

a) Determine la variable dependiente e independiente b) Desarrolle una ecuacioacuten de regresioacuten para contabilidad de costos c) Pronostique los gastos generales cuando se producen 50 unidades d) Calcule el error estaacutendar de estimacioacuten

Y +1 Se =

675 + (1) (8660) = 76140 Liacutemite superior del intervalo de prediccioacuten

Y +2 Se =

675 + (2) (8660) = 84820 Liacutemite superior del intervalo de prediccioacuten

Y -1 Se =

675 - (1) (8660) = 58840 Liacutemite inferior del intervalo de prediccioacuten

Y - 2 Se =

675 - (2) (8660) = 50180 Liacutemite inferior del intervalo de prediccioacuten

Estadiacutestica Administrativa II 21

X Y XY X2 Y2 40 191 7640 1600 36481 42 170 7140 1764 28900 53 272 14416 2809 73984 35 155 5425 1225 24025 56 280 15680 3136 78400 39 173 6747 1521 29929 48 234 11232 2304 54756 30 116 3480 900 13456 37 153 5661 1369 23409 40 178 7120 1600 31684 ΣX= 420 ΣY= 1922 ΣXY= 84541 ΣX2= 18228 ΣY2= 395024

b = Σ XY - n X Y = 84541 - 10(42)(1922) = 64915 Σ X2 - n X2 18228 - 10(42)2 a = Y ndash bX = 1922 ndash 64915 (42) = - 804430 Y= a+bx = -804430 + 64915 (50) = 2441320 Se= ΣY2 ndashaΣY ndash b ΣXY = n-2 Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

12-2 531 12-3 531

12-13 531 12-14 531 12-15 531

Estadiacutestica Administrativa II 22

215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten

Coeficiente de determinacioacuten de la muestra

r2= aΣY+bΣXY-nY2

ΣY2 ndash n Y2

Coeficiente de correlacioacuten de la muestra

r= r2

Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten

Estadiacutestica Administrativa II 23

Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables

Y= a + b1 X1 + b2 X2

Ecuacioacuten

na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2

1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2

2 = Σ X2Y

Ejemplo

a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10

Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784

Sumatoria

114 105 85 2463 1590 1435 2367 1571

Matriz

6 105 85 114 105 2367 1435 2463 85 1435 1571 1590

1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25

1 175 14167 19 0 1 -099 884 0 0 361608 21410

361608 b2 = 21410 b2 = 21410 361608 b2 = 059

Estadiacutestica Administrativa II 24

1 b1 -099 b2 = 884 1 b1 -099 (059) = 884

-006 884 1b1 = 884 +006 b1 = 890

1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a

= 2589

Y= a + b1 X1 + b2 X2

y=2589+890(28)+059(10)=28099

Estadiacutestica Administrativa II 25

218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)

Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad

La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos

Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir

donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria

Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados

Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante

Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo

Estadiacutestica Administrativa II 26

Figura 5 Distribucioacuten Homocedaacutestica

Figura 6 Distribucioacuten Heterocedaacutestica

Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten

lineal para hacer estimaciones futuras

Estadiacutestica Administrativa II 27

Unidad 3 Nuacutemeros iacutendice

Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se

calcula encontrando el cociente del valor actual entre el valor base luego se

multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje

Tipos de nuacutemeros iacutendice

Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de

cantidad e iacutendice de valor

Iacutendice de precios

Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida

Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo

Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable

El iacutendice de valor combina los cambios de precio y cantidad para presentar un

iacutendice con maacutes informacioacuten

Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos

como indicadores generales de la condicioacuten econoacutemica de un paiacutes

Factores que pueden distorsionar los nuacutemeros iacutendice

bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados

bull Falta de comparacioacuten de iacutendices

bull Ponderacioacuten no apropiada de los factores

bull Seleccioacuten de una base no apropiada

Estadiacutestica Administrativa II 28

31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores

Iacutendice de cantidad de agregados no ponderados

ΣQi x 100 ΣQo

Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea

1993 1994 1995

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200

Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado

1993 Qo

1994 Q1

1995 Q2

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308

Estadiacutestica Administrativa II 29

Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra

Iacutendice de precios de agregados ponderados

ΣPiQ x 100 ΣPoQ

Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100

Cambio de periodo base

I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base

Estadiacutestica Administrativa II 30

35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos

Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables

Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico

Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios

El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)

Estadiacutestica Administrativa II 31

Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica

37 Deflacioacuten de los valores de series de tiempo

Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios

En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea

La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores

Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero

Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes

Los valores expresados en unidades monetarias corrientes se conocen como valores nominales

Los valores expresados en unidades monetarias constantes se conocen como valores reales

Estadiacutestica Administrativa II 32

38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor

Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos

39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)

Estadiacutestica Administrativa II 33

Siacutembolo Nombre de la compantildeiacutea

AA Alcoa

ALD Allied Signal

AXP American Express

BA Boeing

CAT Caterpillar

CHV Chevron

C CitiGroup

DIS Disney

DD Dupont

EK Eastman Kodak

GE General Electric

GM General Motors

GT Goodyear Tire

HWP Hewlett-Packard

IBM International Business Machines

IP International Paper

JNJ Johnson amp Johnson

JPM JP Morgan Bank

KO Coca Cola

Figura 5 Compantildeiacuteas comprendidas en el Dow Jones

310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos

Praacutectica 2

992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico

elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado

de precios

Estadiacutestica Administrativa II 34

Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida

bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)

42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten

Las principales pruebas no parameacutetricas son las siguientes

bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher

Estadiacutestica Administrativa II 35

bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon

Caracteriacutesticas de algunas pruebas no parameacutetricas

1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos

2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten

3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal

4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados

5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc

6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica

Prueba Caracteriacutestica

Mann- Whitney 2 muestras independientes

Wilcoxon 2 muestras asociadas

Kruskal-Wallis + de 2 muestras independientes

Friedman + de 2 muestras asociadas

Tabla1 Caracteriacutesticas de pruebas no parameacutetricas

Estadiacutestica Administrativa II 36

Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media

Ventajas y desventajas de los meacutetodos parameacutetricos

Desventajas Ventajas bull Ignoran cierta cantidad de

informacioacuten bull No requieren la suposicioacuten de que

una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica

bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas

bull Generalmente es maacutes sencillo realizarlas y entenderlas

bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal

Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo

MHHHHM

1ra 2ra 3ra

Estadiacutestica Administrativa II 37

Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1

n2= nuacutemero de ocurrencias del tipo 2

r= nuacutemero de corridas

4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue

BABBBAAABBABBBBAAAABABAABBBAABAAAABBA

BBAAAABBABBBBAABBABAABB

Valores de la prueba

n1= 29

n2= 31

r= 29

4322 Distribucioacuten de muestreo del estadiacutestico r

El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba

Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente

Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1

n1+n2

Estadiacutestica Administrativa II 38

μr = 2(29)(31) +1

29+31

μr = 1798 +1 60

μr = 2997 +1

μr = 3097

Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)

(n1+n2)2(n1+n2-1)

σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)

σr= (1798) (1738)

(60)2(59)

σr= 1471

σr= 384

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-24 643 14-25 643 14-26 643 14-27 644 14-28 644

Estadiacutestica Administrativa II 39

44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica

Ejemplo

Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado

Miembro del panel Calificacioacuten para

conferencias grandes

Calificacioacuten para

sesiones pequentildeas

Signo de la calificacioacuten

Evaluacioacuten de los dos tipos de

clases

1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -

6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +

La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)

Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20

Estadiacutestica Administrativa II 40

Establecimiento de las hipoacutetesis

Ho p = 05

H1 p ne 05

Se consideran la posibilidades solamente de signos + y - (9+6 =15)

p Ho = 05

q H0 = 05

n= 15

p= 0600 (915)

q= 0400 (615)

Prueba de hipoacutetesis de que no hay diferencia

Error estaacutendar del la proporcioacuten

σp= pq n

σp= (05)(05) 15

σp= 0129

0025

0

0475 del aacuterea

Valor criacutetico Z=-196

Regioacuten de aceptacioacuten

0025

0475 del aacuterea

Valor criacutetico Z=196

Estadiacutestica Administrativa II 41

45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten

Procedimiento de la prueba de rangos con signo de Wilcoxon

Paso1 Para cada par de datos calcule la diferencia d restando el segundo

valor del primero Guarde los signos pero descarte cualquier par para el que

d=0

Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de

la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango

correspondiente Cuando las diferencias tengan el mismo valor numeacuterico

asiacutegneles la media de los rangos implicados en el empate

Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino

Esto es inserte aquellos signos que se ignoraron e el paso dos

Paso 4 Calcule la suma de los valores absolutos de los rangos negativos

Tambieacuten la suma de los rangos positivos

Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon

en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el

procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos

sumas

Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la

diferencia d no es 0

Estadiacutestica Administrativa II 42

Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el

tamantildeo muestral

Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos

muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica

esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico

Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente

2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha

Notacioacuten

T= la maacutes pequentildea de las siguientes dos sumas

1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0

La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T

Estadiacutestica Administrativa II 43

46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2

Rango Calificacioacuten Plantel

1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S

10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S

Estadiacutestica Administrativa II 44

30 1600 S

Estadiacutestica Administrativa II 45

Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500

n1= 15 n2= 15 R1= 247 R2= 218

Estadiacutestico U

U = n1n2 + n1(n1 +1) -R1 2

U= (15)(15) + (15)(16) -247 2

U= 225+120-247

U= 98

Media de la distribucioacuten muestral U

μu = n1n2

2

μu = (15)(15)

2

μu =1125

Estadiacutestica Administrativa II 46

Estadiacutestico U

σU = n1n2 + (n1n2 +1)

12

σU = (15)(15)(15+15+1)

12

σU = 6975 12

σU = 58125

σU = 241

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2

α= 015

Estandarizacioacuten del estadiacutestico U

z = U-μu

σU

z = 98 - 1125 241

z = -0602

144 -144 0 -0602

Valor estandarizado de

la muestra U

Regioacuten de aceptacioacuten

Estadiacutestica Administrativa II 47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras

Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular

Prueba de Wilcoxon de los rangos con signo

Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero

Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande

Prueba de Wilcoxon para contrastar datos pareados

El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 25: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

Estadiacutestica Administrativa II 21

X Y XY X2 Y2 40 191 7640 1600 36481 42 170 7140 1764 28900 53 272 14416 2809 73984 35 155 5425 1225 24025 56 280 15680 3136 78400 39 173 6747 1521 29929 48 234 11232 2304 54756 30 116 3480 900 13456 37 153 5661 1369 23409 40 178 7120 1600 31684 ΣX= 420 ΣY= 1922 ΣXY= 84541 ΣX2= 18228 ΣY2= 395024

b = Σ XY - n X Y = 84541 - 10(42)(1922) = 64915 Σ X2 - n X2 18228 - 10(42)2 a = Y ndash bX = 1922 ndash 64915 (42) = - 804430 Y= a+bx = -804430 + 64915 (50) = 2441320 Se= ΣY2 ndashaΣY ndash b ΣXY = n-2 Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

12-2 531 12-3 531

12-13 531 12-14 531 12-15 531

Estadiacutestica Administrativa II 22

215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten

Coeficiente de determinacioacuten de la muestra

r2= aΣY+bΣXY-nY2

ΣY2 ndash n Y2

Coeficiente de correlacioacuten de la muestra

r= r2

Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten

Estadiacutestica Administrativa II 23

Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables

Y= a + b1 X1 + b2 X2

Ecuacioacuten

na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2

1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2

2 = Σ X2Y

Ejemplo

a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10

Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784

Sumatoria

114 105 85 2463 1590 1435 2367 1571

Matriz

6 105 85 114 105 2367 1435 2463 85 1435 1571 1590

1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25

1 175 14167 19 0 1 -099 884 0 0 361608 21410

361608 b2 = 21410 b2 = 21410 361608 b2 = 059

Estadiacutestica Administrativa II 24

1 b1 -099 b2 = 884 1 b1 -099 (059) = 884

-006 884 1b1 = 884 +006 b1 = 890

1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a

= 2589

Y= a + b1 X1 + b2 X2

y=2589+890(28)+059(10)=28099

Estadiacutestica Administrativa II 25

218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)

Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad

La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos

Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir

donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria

Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados

Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante

Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo

Estadiacutestica Administrativa II 26

Figura 5 Distribucioacuten Homocedaacutestica

Figura 6 Distribucioacuten Heterocedaacutestica

Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten

lineal para hacer estimaciones futuras

Estadiacutestica Administrativa II 27

Unidad 3 Nuacutemeros iacutendice

Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se

calcula encontrando el cociente del valor actual entre el valor base luego se

multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje

Tipos de nuacutemeros iacutendice

Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de

cantidad e iacutendice de valor

Iacutendice de precios

Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida

Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo

Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable

El iacutendice de valor combina los cambios de precio y cantidad para presentar un

iacutendice con maacutes informacioacuten

Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos

como indicadores generales de la condicioacuten econoacutemica de un paiacutes

Factores que pueden distorsionar los nuacutemeros iacutendice

bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados

bull Falta de comparacioacuten de iacutendices

bull Ponderacioacuten no apropiada de los factores

bull Seleccioacuten de una base no apropiada

Estadiacutestica Administrativa II 28

31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores

Iacutendice de cantidad de agregados no ponderados

ΣQi x 100 ΣQo

Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea

1993 1994 1995

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200

Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado

1993 Qo

1994 Q1

1995 Q2

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308

Estadiacutestica Administrativa II 29

Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra

Iacutendice de precios de agregados ponderados

ΣPiQ x 100 ΣPoQ

Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100

Cambio de periodo base

I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base

Estadiacutestica Administrativa II 30

35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos

Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables

Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico

Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios

El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)

Estadiacutestica Administrativa II 31

Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica

37 Deflacioacuten de los valores de series de tiempo

Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios

En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea

La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores

Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero

Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes

Los valores expresados en unidades monetarias corrientes se conocen como valores nominales

Los valores expresados en unidades monetarias constantes se conocen como valores reales

Estadiacutestica Administrativa II 32

38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor

Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos

39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)

Estadiacutestica Administrativa II 33

Siacutembolo Nombre de la compantildeiacutea

AA Alcoa

ALD Allied Signal

AXP American Express

BA Boeing

CAT Caterpillar

CHV Chevron

C CitiGroup

DIS Disney

DD Dupont

EK Eastman Kodak

GE General Electric

GM General Motors

GT Goodyear Tire

HWP Hewlett-Packard

IBM International Business Machines

IP International Paper

JNJ Johnson amp Johnson

JPM JP Morgan Bank

KO Coca Cola

Figura 5 Compantildeiacuteas comprendidas en el Dow Jones

310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos

Praacutectica 2

992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico

elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado

de precios

Estadiacutestica Administrativa II 34

Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida

bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)

42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten

Las principales pruebas no parameacutetricas son las siguientes

bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher

Estadiacutestica Administrativa II 35

bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon

Caracteriacutesticas de algunas pruebas no parameacutetricas

1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos

2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten

3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal

4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados

5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc

6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica

Prueba Caracteriacutestica

Mann- Whitney 2 muestras independientes

Wilcoxon 2 muestras asociadas

Kruskal-Wallis + de 2 muestras independientes

Friedman + de 2 muestras asociadas

Tabla1 Caracteriacutesticas de pruebas no parameacutetricas

Estadiacutestica Administrativa II 36

Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media

Ventajas y desventajas de los meacutetodos parameacutetricos

Desventajas Ventajas bull Ignoran cierta cantidad de

informacioacuten bull No requieren la suposicioacuten de que

una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica

bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas

bull Generalmente es maacutes sencillo realizarlas y entenderlas

bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal

Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo

MHHHHM

1ra 2ra 3ra

Estadiacutestica Administrativa II 37

Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1

n2= nuacutemero de ocurrencias del tipo 2

r= nuacutemero de corridas

4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue

BABBBAAABBABBBBAAAABABAABBBAABAAAABBA

BBAAAABBABBBBAABBABAABB

Valores de la prueba

n1= 29

n2= 31

r= 29

4322 Distribucioacuten de muestreo del estadiacutestico r

El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba

Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente

Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1

n1+n2

Estadiacutestica Administrativa II 38

μr = 2(29)(31) +1

29+31

μr = 1798 +1 60

μr = 2997 +1

μr = 3097

Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)

(n1+n2)2(n1+n2-1)

σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)

σr= (1798) (1738)

(60)2(59)

σr= 1471

σr= 384

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-24 643 14-25 643 14-26 643 14-27 644 14-28 644

Estadiacutestica Administrativa II 39

44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica

Ejemplo

Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado

Miembro del panel Calificacioacuten para

conferencias grandes

Calificacioacuten para

sesiones pequentildeas

Signo de la calificacioacuten

Evaluacioacuten de los dos tipos de

clases

1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -

6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +

La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)

Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20

Estadiacutestica Administrativa II 40

Establecimiento de las hipoacutetesis

Ho p = 05

H1 p ne 05

Se consideran la posibilidades solamente de signos + y - (9+6 =15)

p Ho = 05

q H0 = 05

n= 15

p= 0600 (915)

q= 0400 (615)

Prueba de hipoacutetesis de que no hay diferencia

Error estaacutendar del la proporcioacuten

σp= pq n

σp= (05)(05) 15

σp= 0129

0025

0

0475 del aacuterea

Valor criacutetico Z=-196

Regioacuten de aceptacioacuten

0025

0475 del aacuterea

Valor criacutetico Z=196

Estadiacutestica Administrativa II 41

45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten

Procedimiento de la prueba de rangos con signo de Wilcoxon

Paso1 Para cada par de datos calcule la diferencia d restando el segundo

valor del primero Guarde los signos pero descarte cualquier par para el que

d=0

Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de

la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango

correspondiente Cuando las diferencias tengan el mismo valor numeacuterico

asiacutegneles la media de los rangos implicados en el empate

Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino

Esto es inserte aquellos signos que se ignoraron e el paso dos

Paso 4 Calcule la suma de los valores absolutos de los rangos negativos

Tambieacuten la suma de los rangos positivos

Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon

en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el

procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos

sumas

Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la

diferencia d no es 0

Estadiacutestica Administrativa II 42

Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el

tamantildeo muestral

Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos

muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica

esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico

Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente

2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha

Notacioacuten

T= la maacutes pequentildea de las siguientes dos sumas

1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0

La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T

Estadiacutestica Administrativa II 43

46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2

Rango Calificacioacuten Plantel

1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S

10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S

Estadiacutestica Administrativa II 44

30 1600 S

Estadiacutestica Administrativa II 45

Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500

n1= 15 n2= 15 R1= 247 R2= 218

Estadiacutestico U

U = n1n2 + n1(n1 +1) -R1 2

U= (15)(15) + (15)(16) -247 2

U= 225+120-247

U= 98

Media de la distribucioacuten muestral U

μu = n1n2

2

μu = (15)(15)

2

μu =1125

Estadiacutestica Administrativa II 46

Estadiacutestico U

σU = n1n2 + (n1n2 +1)

12

σU = (15)(15)(15+15+1)

12

σU = 6975 12

σU = 58125

σU = 241

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2

α= 015

Estandarizacioacuten del estadiacutestico U

z = U-μu

σU

z = 98 - 1125 241

z = -0602

144 -144 0 -0602

Valor estandarizado de

la muestra U

Regioacuten de aceptacioacuten

Estadiacutestica Administrativa II 47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras

Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular

Prueba de Wilcoxon de los rangos con signo

Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero

Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande

Prueba de Wilcoxon para contrastar datos pareados

El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 26: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

Estadiacutestica Administrativa II 22

215 Anaacutelisis de correlacioacuten El anaacutelisis de correlacioacuten es la herramienta estadiacutestica que podemos usar para describir el grado en el que una variable estaacute linealmente relacionada con otra El coeficiente de determinacioacuten es la principal forma en que podemos medir el grado o fuerza de la asociacioacuten que existe entre dos variables X y Y debido a que usamos una muestra de puntos para desarrollar rectas de regresioacuten

Coeficiente de determinacioacuten de la muestra

r2= aΣY+bΣXY-nY2

ΣY2 ndash n Y2

Coeficiente de correlacioacuten de la muestra

r= r2

Ejercicio Con los datos de los ejercicios anteriores obteacuten el coeficiente de determinacioacuten y el coeficiente de correlacioacuten 216 Paquete computacional para la solucioacuten de problemas Resolver ejercicios en excel 217 Regresioacuten muacuteltiple y anaacutelisis de correlacioacuten Podemos utilizar maacutes de una variable independiente para estimar la variable dependiente e intentar aumentar la precisioacuten de la estimacioacuten Este proceso se conoce como anaacutelisis de regresioacuten muacuteltiple y correlacioacuten La principal ventaja de la regresioacuten muacuteltiple es que nos permite utilizar maacutes informacioacuten disponible para estimar la variable dependiente En algunas ocasiones la correlacioacuten entre dos variables puede resultar insuficiente para determinar una ecuacioacuten de estimacioacuten confiable sin embargo si agregamos los datos de maacutes variables independientes podemos determinar una ecuacioacuten de estimacioacuten que describa la relacioacuten con mayor precisioacuten

Estadiacutestica Administrativa II 23

Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables

Y= a + b1 X1 + b2 X2

Ecuacioacuten

na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2

1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2

2 = Σ X2Y

Ejemplo

a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10

Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784

Sumatoria

114 105 85 2463 1590 1435 2367 1571

Matriz

6 105 85 114 105 2367 1435 2463 85 1435 1571 1590

1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25

1 175 14167 19 0 1 -099 884 0 0 361608 21410

361608 b2 = 21410 b2 = 21410 361608 b2 = 059

Estadiacutestica Administrativa II 24

1 b1 -099 b2 = 884 1 b1 -099 (059) = 884

-006 884 1b1 = 884 +006 b1 = 890

1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a

= 2589

Y= a + b1 X1 + b2 X2

y=2589+890(28)+059(10)=28099

Estadiacutestica Administrativa II 25

218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)

Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad

La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos

Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir

donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria

Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados

Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante

Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo

Estadiacutestica Administrativa II 26

Figura 5 Distribucioacuten Homocedaacutestica

Figura 6 Distribucioacuten Heterocedaacutestica

Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten

lineal para hacer estimaciones futuras

Estadiacutestica Administrativa II 27

Unidad 3 Nuacutemeros iacutendice

Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se

calcula encontrando el cociente del valor actual entre el valor base luego se

multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje

Tipos de nuacutemeros iacutendice

Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de

cantidad e iacutendice de valor

Iacutendice de precios

Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida

Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo

Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable

El iacutendice de valor combina los cambios de precio y cantidad para presentar un

iacutendice con maacutes informacioacuten

Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos

como indicadores generales de la condicioacuten econoacutemica de un paiacutes

Factores que pueden distorsionar los nuacutemeros iacutendice

bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados

bull Falta de comparacioacuten de iacutendices

bull Ponderacioacuten no apropiada de los factores

bull Seleccioacuten de una base no apropiada

Estadiacutestica Administrativa II 28

31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores

Iacutendice de cantidad de agregados no ponderados

ΣQi x 100 ΣQo

Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea

1993 1994 1995

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200

Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado

1993 Qo

1994 Q1

1995 Q2

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308

Estadiacutestica Administrativa II 29

Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra

Iacutendice de precios de agregados ponderados

ΣPiQ x 100 ΣPoQ

Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100

Cambio de periodo base

I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base

Estadiacutestica Administrativa II 30

35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos

Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables

Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico

Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios

El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)

Estadiacutestica Administrativa II 31

Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica

37 Deflacioacuten de los valores de series de tiempo

Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios

En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea

La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores

Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero

Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes

Los valores expresados en unidades monetarias corrientes se conocen como valores nominales

Los valores expresados en unidades monetarias constantes se conocen como valores reales

Estadiacutestica Administrativa II 32

38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor

Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos

39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)

Estadiacutestica Administrativa II 33

Siacutembolo Nombre de la compantildeiacutea

AA Alcoa

ALD Allied Signal

AXP American Express

BA Boeing

CAT Caterpillar

CHV Chevron

C CitiGroup

DIS Disney

DD Dupont

EK Eastman Kodak

GE General Electric

GM General Motors

GT Goodyear Tire

HWP Hewlett-Packard

IBM International Business Machines

IP International Paper

JNJ Johnson amp Johnson

JPM JP Morgan Bank

KO Coca Cola

Figura 5 Compantildeiacuteas comprendidas en el Dow Jones

310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos

Praacutectica 2

992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico

elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado

de precios

Estadiacutestica Administrativa II 34

Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida

bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)

42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten

Las principales pruebas no parameacutetricas son las siguientes

bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher

Estadiacutestica Administrativa II 35

bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon

Caracteriacutesticas de algunas pruebas no parameacutetricas

1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos

2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten

3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal

4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados

5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc

6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica

Prueba Caracteriacutestica

Mann- Whitney 2 muestras independientes

Wilcoxon 2 muestras asociadas

Kruskal-Wallis + de 2 muestras independientes

Friedman + de 2 muestras asociadas

Tabla1 Caracteriacutesticas de pruebas no parameacutetricas

Estadiacutestica Administrativa II 36

Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media

Ventajas y desventajas de los meacutetodos parameacutetricos

Desventajas Ventajas bull Ignoran cierta cantidad de

informacioacuten bull No requieren la suposicioacuten de que

una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica

bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas

bull Generalmente es maacutes sencillo realizarlas y entenderlas

bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal

Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo

MHHHHM

1ra 2ra 3ra

Estadiacutestica Administrativa II 37

Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1

n2= nuacutemero de ocurrencias del tipo 2

r= nuacutemero de corridas

4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue

BABBBAAABBABBBBAAAABABAABBBAABAAAABBA

BBAAAABBABBBBAABBABAABB

Valores de la prueba

n1= 29

n2= 31

r= 29

4322 Distribucioacuten de muestreo del estadiacutestico r

El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba

Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente

Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1

n1+n2

Estadiacutestica Administrativa II 38

μr = 2(29)(31) +1

29+31

μr = 1798 +1 60

μr = 2997 +1

μr = 3097

Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)

(n1+n2)2(n1+n2-1)

σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)

σr= (1798) (1738)

(60)2(59)

σr= 1471

σr= 384

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-24 643 14-25 643 14-26 643 14-27 644 14-28 644

Estadiacutestica Administrativa II 39

44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica

Ejemplo

Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado

Miembro del panel Calificacioacuten para

conferencias grandes

Calificacioacuten para

sesiones pequentildeas

Signo de la calificacioacuten

Evaluacioacuten de los dos tipos de

clases

1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -

6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +

La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)

Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20

Estadiacutestica Administrativa II 40

Establecimiento de las hipoacutetesis

Ho p = 05

H1 p ne 05

Se consideran la posibilidades solamente de signos + y - (9+6 =15)

p Ho = 05

q H0 = 05

n= 15

p= 0600 (915)

q= 0400 (615)

Prueba de hipoacutetesis de que no hay diferencia

Error estaacutendar del la proporcioacuten

σp= pq n

σp= (05)(05) 15

σp= 0129

0025

0

0475 del aacuterea

Valor criacutetico Z=-196

Regioacuten de aceptacioacuten

0025

0475 del aacuterea

Valor criacutetico Z=196

Estadiacutestica Administrativa II 41

45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten

Procedimiento de la prueba de rangos con signo de Wilcoxon

Paso1 Para cada par de datos calcule la diferencia d restando el segundo

valor del primero Guarde los signos pero descarte cualquier par para el que

d=0

Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de

la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango

correspondiente Cuando las diferencias tengan el mismo valor numeacuterico

asiacutegneles la media de los rangos implicados en el empate

Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino

Esto es inserte aquellos signos que se ignoraron e el paso dos

Paso 4 Calcule la suma de los valores absolutos de los rangos negativos

Tambieacuten la suma de los rangos positivos

Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon

en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el

procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos

sumas

Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la

diferencia d no es 0

Estadiacutestica Administrativa II 42

Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el

tamantildeo muestral

Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos

muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica

esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico

Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente

2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha

Notacioacuten

T= la maacutes pequentildea de las siguientes dos sumas

1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0

La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T

Estadiacutestica Administrativa II 43

46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2

Rango Calificacioacuten Plantel

1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S

10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S

Estadiacutestica Administrativa II 44

30 1600 S

Estadiacutestica Administrativa II 45

Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500

n1= 15 n2= 15 R1= 247 R2= 218

Estadiacutestico U

U = n1n2 + n1(n1 +1) -R1 2

U= (15)(15) + (15)(16) -247 2

U= 225+120-247

U= 98

Media de la distribucioacuten muestral U

μu = n1n2

2

μu = (15)(15)

2

μu =1125

Estadiacutestica Administrativa II 46

Estadiacutestico U

σU = n1n2 + (n1n2 +1)

12

σU = (15)(15)(15+15+1)

12

σU = 6975 12

σU = 58125

σU = 241

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2

α= 015

Estandarizacioacuten del estadiacutestico U

z = U-μu

σU

z = 98 - 1125 241

z = -0602

144 -144 0 -0602

Valor estandarizado de

la muestra U

Regioacuten de aceptacioacuten

Estadiacutestica Administrativa II 47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras

Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular

Prueba de Wilcoxon de los rangos con signo

Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero

Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande

Prueba de Wilcoxon para contrastar datos pareados

El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 27: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

Estadiacutestica Administrativa II 23

Ecuacioacuten de estimacioacuten que describe la relacioacuten entre tres variables

Y= a + b1 X1 + b2 X2

Ecuacioacuten

na + b1 ΣX1 + b2 ΣX2 = ΣY aΣX1 + b1 ΣX2

1 + b2 Σ X1X2 = Σ X1Y aΣX2 + b1 Σ X1X2 + b2 ΣX2

2 = Σ X2Y

Ejemplo

a) Calcular el plano de regresioacuten muacuteltiple b) Prediga Y cuando X1=28 y x2=10

Y X1 X2 X1y X2y X1X2 X12 X22 10 8 4 80 40 32 64 166 177 21 9 357 153 189 441 81 18 14 11 252 198 154 196 121 26 17 20 442 520 340 289 400 35 36 13 1260 455 468 1296 169 8 9 28 72 224 252 81 784

Sumatoria

114 105 85 2463 1590 1435 2367 1571

Matriz

6 105 85 114 105 2367 1435 2463 85 1435 1571 1590

1 175 14167 19 0 5295 -52535 468 0 -525 366805 -25

1 175 14167 19 0 1 -099 884 0 0 361608 21410

361608 b2 = 21410 b2 = 21410 361608 b2 = 059

Estadiacutestica Administrativa II 24

1 b1 -099 b2 = 884 1 b1 -099 (059) = 884

-006 884 1b1 = 884 +006 b1 = 890

1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a

= 2589

Y= a + b1 X1 + b2 X2

y=2589+890(28)+059(10)=28099

Estadiacutestica Administrativa II 25

218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)

Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad

La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos

Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir

donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria

Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados

Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante

Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo

Estadiacutestica Administrativa II 26

Figura 5 Distribucioacuten Homocedaacutestica

Figura 6 Distribucioacuten Heterocedaacutestica

Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten

lineal para hacer estimaciones futuras

Estadiacutestica Administrativa II 27

Unidad 3 Nuacutemeros iacutendice

Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se

calcula encontrando el cociente del valor actual entre el valor base luego se

multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje

Tipos de nuacutemeros iacutendice

Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de

cantidad e iacutendice de valor

Iacutendice de precios

Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida

Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo

Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable

El iacutendice de valor combina los cambios de precio y cantidad para presentar un

iacutendice con maacutes informacioacuten

Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos

como indicadores generales de la condicioacuten econoacutemica de un paiacutes

Factores que pueden distorsionar los nuacutemeros iacutendice

bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados

bull Falta de comparacioacuten de iacutendices

bull Ponderacioacuten no apropiada de los factores

bull Seleccioacuten de una base no apropiada

Estadiacutestica Administrativa II 28

31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores

Iacutendice de cantidad de agregados no ponderados

ΣQi x 100 ΣQo

Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea

1993 1994 1995

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200

Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado

1993 Qo

1994 Q1

1995 Q2

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308

Estadiacutestica Administrativa II 29

Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra

Iacutendice de precios de agregados ponderados

ΣPiQ x 100 ΣPoQ

Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100

Cambio de periodo base

I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base

Estadiacutestica Administrativa II 30

35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos

Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables

Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico

Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios

El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)

Estadiacutestica Administrativa II 31

Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica

37 Deflacioacuten de los valores de series de tiempo

Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios

En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea

La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores

Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero

Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes

Los valores expresados en unidades monetarias corrientes se conocen como valores nominales

Los valores expresados en unidades monetarias constantes se conocen como valores reales

Estadiacutestica Administrativa II 32

38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor

Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos

39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)

Estadiacutestica Administrativa II 33

Siacutembolo Nombre de la compantildeiacutea

AA Alcoa

ALD Allied Signal

AXP American Express

BA Boeing

CAT Caterpillar

CHV Chevron

C CitiGroup

DIS Disney

DD Dupont

EK Eastman Kodak

GE General Electric

GM General Motors

GT Goodyear Tire

HWP Hewlett-Packard

IBM International Business Machines

IP International Paper

JNJ Johnson amp Johnson

JPM JP Morgan Bank

KO Coca Cola

Figura 5 Compantildeiacuteas comprendidas en el Dow Jones

310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos

Praacutectica 2

992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico

elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado

de precios

Estadiacutestica Administrativa II 34

Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida

bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)

42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten

Las principales pruebas no parameacutetricas son las siguientes

bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher

Estadiacutestica Administrativa II 35

bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon

Caracteriacutesticas de algunas pruebas no parameacutetricas

1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos

2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten

3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal

4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados

5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc

6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica

Prueba Caracteriacutestica

Mann- Whitney 2 muestras independientes

Wilcoxon 2 muestras asociadas

Kruskal-Wallis + de 2 muestras independientes

Friedman + de 2 muestras asociadas

Tabla1 Caracteriacutesticas de pruebas no parameacutetricas

Estadiacutestica Administrativa II 36

Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media

Ventajas y desventajas de los meacutetodos parameacutetricos

Desventajas Ventajas bull Ignoran cierta cantidad de

informacioacuten bull No requieren la suposicioacuten de que

una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica

bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas

bull Generalmente es maacutes sencillo realizarlas y entenderlas

bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal

Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo

MHHHHM

1ra 2ra 3ra

Estadiacutestica Administrativa II 37

Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1

n2= nuacutemero de ocurrencias del tipo 2

r= nuacutemero de corridas

4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue

BABBBAAABBABBBBAAAABABAABBBAABAAAABBA

BBAAAABBABBBBAABBABAABB

Valores de la prueba

n1= 29

n2= 31

r= 29

4322 Distribucioacuten de muestreo del estadiacutestico r

El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba

Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente

Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1

n1+n2

Estadiacutestica Administrativa II 38

μr = 2(29)(31) +1

29+31

μr = 1798 +1 60

μr = 2997 +1

μr = 3097

Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)

(n1+n2)2(n1+n2-1)

σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)

σr= (1798) (1738)

(60)2(59)

σr= 1471

σr= 384

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-24 643 14-25 643 14-26 643 14-27 644 14-28 644

Estadiacutestica Administrativa II 39

44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica

Ejemplo

Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado

Miembro del panel Calificacioacuten para

conferencias grandes

Calificacioacuten para

sesiones pequentildeas

Signo de la calificacioacuten

Evaluacioacuten de los dos tipos de

clases

1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -

6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +

La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)

Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20

Estadiacutestica Administrativa II 40

Establecimiento de las hipoacutetesis

Ho p = 05

H1 p ne 05

Se consideran la posibilidades solamente de signos + y - (9+6 =15)

p Ho = 05

q H0 = 05

n= 15

p= 0600 (915)

q= 0400 (615)

Prueba de hipoacutetesis de que no hay diferencia

Error estaacutendar del la proporcioacuten

σp= pq n

σp= (05)(05) 15

σp= 0129

0025

0

0475 del aacuterea

Valor criacutetico Z=-196

Regioacuten de aceptacioacuten

0025

0475 del aacuterea

Valor criacutetico Z=196

Estadiacutestica Administrativa II 41

45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten

Procedimiento de la prueba de rangos con signo de Wilcoxon

Paso1 Para cada par de datos calcule la diferencia d restando el segundo

valor del primero Guarde los signos pero descarte cualquier par para el que

d=0

Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de

la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango

correspondiente Cuando las diferencias tengan el mismo valor numeacuterico

asiacutegneles la media de los rangos implicados en el empate

Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino

Esto es inserte aquellos signos que se ignoraron e el paso dos

Paso 4 Calcule la suma de los valores absolutos de los rangos negativos

Tambieacuten la suma de los rangos positivos

Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon

en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el

procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos

sumas

Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la

diferencia d no es 0

Estadiacutestica Administrativa II 42

Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el

tamantildeo muestral

Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos

muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica

esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico

Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente

2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha

Notacioacuten

T= la maacutes pequentildea de las siguientes dos sumas

1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0

La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T

Estadiacutestica Administrativa II 43

46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2

Rango Calificacioacuten Plantel

1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S

10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S

Estadiacutestica Administrativa II 44

30 1600 S

Estadiacutestica Administrativa II 45

Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500

n1= 15 n2= 15 R1= 247 R2= 218

Estadiacutestico U

U = n1n2 + n1(n1 +1) -R1 2

U= (15)(15) + (15)(16) -247 2

U= 225+120-247

U= 98

Media de la distribucioacuten muestral U

μu = n1n2

2

μu = (15)(15)

2

μu =1125

Estadiacutestica Administrativa II 46

Estadiacutestico U

σU = n1n2 + (n1n2 +1)

12

σU = (15)(15)(15+15+1)

12

σU = 6975 12

σU = 58125

σU = 241

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2

α= 015

Estandarizacioacuten del estadiacutestico U

z = U-μu

σU

z = 98 - 1125 241

z = -0602

144 -144 0 -0602

Valor estandarizado de

la muestra U

Regioacuten de aceptacioacuten

Estadiacutestica Administrativa II 47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras

Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular

Prueba de Wilcoxon de los rangos con signo

Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero

Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande

Prueba de Wilcoxon para contrastar datos pareados

El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 28: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

Estadiacutestica Administrativa II 24

1 b1 -099 b2 = 884 1 b1 -099 (059) = 884

-006 884 1b1 = 884 +006 b1 = 890

1a +175b1 +14167b2 = 19 1a +175(890) +14167 (059) = 19 1a +16411 = 19 1a = 19-16411 a

= 2589

Y= a + b1 X1 + b2 X2

y=2589+890(28)+059(10)=28099

Estadiacutestica Administrativa II 25

218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)

Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad

La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos

Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir

donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria

Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados

Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante

Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo

Estadiacutestica Administrativa II 26

Figura 5 Distribucioacuten Homocedaacutestica

Figura 6 Distribucioacuten Heterocedaacutestica

Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten

lineal para hacer estimaciones futuras

Estadiacutestica Administrativa II 27

Unidad 3 Nuacutemeros iacutendice

Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se

calcula encontrando el cociente del valor actual entre el valor base luego se

multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje

Tipos de nuacutemeros iacutendice

Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de

cantidad e iacutendice de valor

Iacutendice de precios

Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida

Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo

Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable

El iacutendice de valor combina los cambios de precio y cantidad para presentar un

iacutendice con maacutes informacioacuten

Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos

como indicadores generales de la condicioacuten econoacutemica de un paiacutes

Factores que pueden distorsionar los nuacutemeros iacutendice

bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados

bull Falta de comparacioacuten de iacutendices

bull Ponderacioacuten no apropiada de los factores

bull Seleccioacuten de una base no apropiada

Estadiacutestica Administrativa II 28

31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores

Iacutendice de cantidad de agregados no ponderados

ΣQi x 100 ΣQo

Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea

1993 1994 1995

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200

Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado

1993 Qo

1994 Q1

1995 Q2

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308

Estadiacutestica Administrativa II 29

Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra

Iacutendice de precios de agregados ponderados

ΣPiQ x 100 ΣPoQ

Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100

Cambio de periodo base

I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base

Estadiacutestica Administrativa II 30

35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos

Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables

Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico

Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios

El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)

Estadiacutestica Administrativa II 31

Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica

37 Deflacioacuten de los valores de series de tiempo

Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios

En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea

La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores

Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero

Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes

Los valores expresados en unidades monetarias corrientes se conocen como valores nominales

Los valores expresados en unidades monetarias constantes se conocen como valores reales

Estadiacutestica Administrativa II 32

38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor

Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos

39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)

Estadiacutestica Administrativa II 33

Siacutembolo Nombre de la compantildeiacutea

AA Alcoa

ALD Allied Signal

AXP American Express

BA Boeing

CAT Caterpillar

CHV Chevron

C CitiGroup

DIS Disney

DD Dupont

EK Eastman Kodak

GE General Electric

GM General Motors

GT Goodyear Tire

HWP Hewlett-Packard

IBM International Business Machines

IP International Paper

JNJ Johnson amp Johnson

JPM JP Morgan Bank

KO Coca Cola

Figura 5 Compantildeiacuteas comprendidas en el Dow Jones

310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos

Praacutectica 2

992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico

elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado

de precios

Estadiacutestica Administrativa II 34

Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida

bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)

42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten

Las principales pruebas no parameacutetricas son las siguientes

bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher

Estadiacutestica Administrativa II 35

bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon

Caracteriacutesticas de algunas pruebas no parameacutetricas

1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos

2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten

3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal

4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados

5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc

6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica

Prueba Caracteriacutestica

Mann- Whitney 2 muestras independientes

Wilcoxon 2 muestras asociadas

Kruskal-Wallis + de 2 muestras independientes

Friedman + de 2 muestras asociadas

Tabla1 Caracteriacutesticas de pruebas no parameacutetricas

Estadiacutestica Administrativa II 36

Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media

Ventajas y desventajas de los meacutetodos parameacutetricos

Desventajas Ventajas bull Ignoran cierta cantidad de

informacioacuten bull No requieren la suposicioacuten de que

una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica

bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas

bull Generalmente es maacutes sencillo realizarlas y entenderlas

bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal

Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo

MHHHHM

1ra 2ra 3ra

Estadiacutestica Administrativa II 37

Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1

n2= nuacutemero de ocurrencias del tipo 2

r= nuacutemero de corridas

4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue

BABBBAAABBABBBBAAAABABAABBBAABAAAABBA

BBAAAABBABBBBAABBABAABB

Valores de la prueba

n1= 29

n2= 31

r= 29

4322 Distribucioacuten de muestreo del estadiacutestico r

El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba

Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente

Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1

n1+n2

Estadiacutestica Administrativa II 38

μr = 2(29)(31) +1

29+31

μr = 1798 +1 60

μr = 2997 +1

μr = 3097

Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)

(n1+n2)2(n1+n2-1)

σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)

σr= (1798) (1738)

(60)2(59)

σr= 1471

σr= 384

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-24 643 14-25 643 14-26 643 14-27 644 14-28 644

Estadiacutestica Administrativa II 39

44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica

Ejemplo

Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado

Miembro del panel Calificacioacuten para

conferencias grandes

Calificacioacuten para

sesiones pequentildeas

Signo de la calificacioacuten

Evaluacioacuten de los dos tipos de

clases

1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -

6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +

La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)

Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20

Estadiacutestica Administrativa II 40

Establecimiento de las hipoacutetesis

Ho p = 05

H1 p ne 05

Se consideran la posibilidades solamente de signos + y - (9+6 =15)

p Ho = 05

q H0 = 05

n= 15

p= 0600 (915)

q= 0400 (615)

Prueba de hipoacutetesis de que no hay diferencia

Error estaacutendar del la proporcioacuten

σp= pq n

σp= (05)(05) 15

σp= 0129

0025

0

0475 del aacuterea

Valor criacutetico Z=-196

Regioacuten de aceptacioacuten

0025

0475 del aacuterea

Valor criacutetico Z=196

Estadiacutestica Administrativa II 41

45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten

Procedimiento de la prueba de rangos con signo de Wilcoxon

Paso1 Para cada par de datos calcule la diferencia d restando el segundo

valor del primero Guarde los signos pero descarte cualquier par para el que

d=0

Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de

la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango

correspondiente Cuando las diferencias tengan el mismo valor numeacuterico

asiacutegneles la media de los rangos implicados en el empate

Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino

Esto es inserte aquellos signos que se ignoraron e el paso dos

Paso 4 Calcule la suma de los valores absolutos de los rangos negativos

Tambieacuten la suma de los rangos positivos

Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon

en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el

procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos

sumas

Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la

diferencia d no es 0

Estadiacutestica Administrativa II 42

Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el

tamantildeo muestral

Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos

muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica

esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico

Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente

2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha

Notacioacuten

T= la maacutes pequentildea de las siguientes dos sumas

1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0

La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T

Estadiacutestica Administrativa II 43

46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2

Rango Calificacioacuten Plantel

1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S

10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S

Estadiacutestica Administrativa II 44

30 1600 S

Estadiacutestica Administrativa II 45

Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500

n1= 15 n2= 15 R1= 247 R2= 218

Estadiacutestico U

U = n1n2 + n1(n1 +1) -R1 2

U= (15)(15) + (15)(16) -247 2

U= 225+120-247

U= 98

Media de la distribucioacuten muestral U

μu = n1n2

2

μu = (15)(15)

2

μu =1125

Estadiacutestica Administrativa II 46

Estadiacutestico U

σU = n1n2 + (n1n2 +1)

12

σU = (15)(15)(15+15+1)

12

σU = 6975 12

σU = 58125

σU = 241

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2

α= 015

Estandarizacioacuten del estadiacutestico U

z = U-μu

σU

z = 98 - 1125 241

z = -0602

144 -144 0 -0602

Valor estandarizado de

la muestra U

Regioacuten de aceptacioacuten

Estadiacutestica Administrativa II 47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras

Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular

Prueba de Wilcoxon de los rangos con signo

Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero

Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande

Prueba de Wilcoxon para contrastar datos pareados

El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 29: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

Estadiacutestica Administrativa II 25

218 Usos de variables ficticias La regresioacuten muacuteltiple nos permitiraacute tambieacuten ajustar tanto curvas como rectas Usando las teacutecnicas de variables ficticias podemos incluir factores cualitativos en la regresioacuten muacuteltiple Las variables ficticias y las curvas de ajuste son solamente dos de las muchas teacutecnicas de modelado que se pueden utilizar en la regresioacuten muacuteltiple para aumentar la precisioacuten de las ecuaciones de estimacioacuten 219 Residuales y graacuteficas de residuales Residuo es la diferencia entre el valor de Y y el valor pronosticado de Y es decir (Y - Yrsquo)

Cuando los residuos permanecen constantes para todos los valores de Yrsquo esta condicioacuten se llama homoscedasticidad

La homocedasticidad es una propiedad fundamental del modelo de regresioacuten lineal general y estaacute dentro de sus supuestos claacutesicos baacutesicos

Se dice que existe homocedasticidad cuando la varianza de los errores estocaacutesticos de la regresioacuten es la misma para cada observacioacuten i (de 1 a n observaciones) es decir

donde es un escalar constante para todo i Lo que significariacutea que habriacutea una distribucioacuten de probabilidad de ideacutentica amplitud para cada variable aleatoria

Esta cualidad es necesaria seguacuten el Teorema de Gauss-Maacuterkov para que en un modelo los coeficientes estimados sean los mejores o eficientes lineales e insesgados

Cuando no se cumple esta situacioacuten decimos que existe heterocedasticidad que es cuando la varianza de cada termino de perturbacioacuten (ui) no es un nuacutemero constante

Este fenoacutemeno suele ser muy comuacuten en datos de Corte Transversal y tambieacuten se presenta menos frecuentemente en series de tiempo

Estadiacutestica Administrativa II 26

Figura 5 Distribucioacuten Homocedaacutestica

Figura 6 Distribucioacuten Heterocedaacutestica

Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten

lineal para hacer estimaciones futuras

Estadiacutestica Administrativa II 27

Unidad 3 Nuacutemeros iacutendice

Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se

calcula encontrando el cociente del valor actual entre el valor base luego se

multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje

Tipos de nuacutemeros iacutendice

Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de

cantidad e iacutendice de valor

Iacutendice de precios

Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida

Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo

Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable

El iacutendice de valor combina los cambios de precio y cantidad para presentar un

iacutendice con maacutes informacioacuten

Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos

como indicadores generales de la condicioacuten econoacutemica de un paiacutes

Factores que pueden distorsionar los nuacutemeros iacutendice

bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados

bull Falta de comparacioacuten de iacutendices

bull Ponderacioacuten no apropiada de los factores

bull Seleccioacuten de una base no apropiada

Estadiacutestica Administrativa II 28

31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores

Iacutendice de cantidad de agregados no ponderados

ΣQi x 100 ΣQo

Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea

1993 1994 1995

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200

Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado

1993 Qo

1994 Q1

1995 Q2

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308

Estadiacutestica Administrativa II 29

Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra

Iacutendice de precios de agregados ponderados

ΣPiQ x 100 ΣPoQ

Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100

Cambio de periodo base

I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base

Estadiacutestica Administrativa II 30

35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos

Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables

Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico

Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios

El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)

Estadiacutestica Administrativa II 31

Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica

37 Deflacioacuten de los valores de series de tiempo

Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios

En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea

La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores

Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero

Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes

Los valores expresados en unidades monetarias corrientes se conocen como valores nominales

Los valores expresados en unidades monetarias constantes se conocen como valores reales

Estadiacutestica Administrativa II 32

38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor

Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos

39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)

Estadiacutestica Administrativa II 33

Siacutembolo Nombre de la compantildeiacutea

AA Alcoa

ALD Allied Signal

AXP American Express

BA Boeing

CAT Caterpillar

CHV Chevron

C CitiGroup

DIS Disney

DD Dupont

EK Eastman Kodak

GE General Electric

GM General Motors

GT Goodyear Tire

HWP Hewlett-Packard

IBM International Business Machines

IP International Paper

JNJ Johnson amp Johnson

JPM JP Morgan Bank

KO Coca Cola

Figura 5 Compantildeiacuteas comprendidas en el Dow Jones

310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos

Praacutectica 2

992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico

elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado

de precios

Estadiacutestica Administrativa II 34

Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida

bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)

42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten

Las principales pruebas no parameacutetricas son las siguientes

bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher

Estadiacutestica Administrativa II 35

bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon

Caracteriacutesticas de algunas pruebas no parameacutetricas

1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos

2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten

3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal

4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados

5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc

6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica

Prueba Caracteriacutestica

Mann- Whitney 2 muestras independientes

Wilcoxon 2 muestras asociadas

Kruskal-Wallis + de 2 muestras independientes

Friedman + de 2 muestras asociadas

Tabla1 Caracteriacutesticas de pruebas no parameacutetricas

Estadiacutestica Administrativa II 36

Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media

Ventajas y desventajas de los meacutetodos parameacutetricos

Desventajas Ventajas bull Ignoran cierta cantidad de

informacioacuten bull No requieren la suposicioacuten de que

una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica

bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas

bull Generalmente es maacutes sencillo realizarlas y entenderlas

bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal

Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo

MHHHHM

1ra 2ra 3ra

Estadiacutestica Administrativa II 37

Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1

n2= nuacutemero de ocurrencias del tipo 2

r= nuacutemero de corridas

4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue

BABBBAAABBABBBBAAAABABAABBBAABAAAABBA

BBAAAABBABBBBAABBABAABB

Valores de la prueba

n1= 29

n2= 31

r= 29

4322 Distribucioacuten de muestreo del estadiacutestico r

El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba

Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente

Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1

n1+n2

Estadiacutestica Administrativa II 38

μr = 2(29)(31) +1

29+31

μr = 1798 +1 60

μr = 2997 +1

μr = 3097

Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)

(n1+n2)2(n1+n2-1)

σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)

σr= (1798) (1738)

(60)2(59)

σr= 1471

σr= 384

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-24 643 14-25 643 14-26 643 14-27 644 14-28 644

Estadiacutestica Administrativa II 39

44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica

Ejemplo

Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado

Miembro del panel Calificacioacuten para

conferencias grandes

Calificacioacuten para

sesiones pequentildeas

Signo de la calificacioacuten

Evaluacioacuten de los dos tipos de

clases

1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -

6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +

La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)

Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20

Estadiacutestica Administrativa II 40

Establecimiento de las hipoacutetesis

Ho p = 05

H1 p ne 05

Se consideran la posibilidades solamente de signos + y - (9+6 =15)

p Ho = 05

q H0 = 05

n= 15

p= 0600 (915)

q= 0400 (615)

Prueba de hipoacutetesis de que no hay diferencia

Error estaacutendar del la proporcioacuten

σp= pq n

σp= (05)(05) 15

σp= 0129

0025

0

0475 del aacuterea

Valor criacutetico Z=-196

Regioacuten de aceptacioacuten

0025

0475 del aacuterea

Valor criacutetico Z=196

Estadiacutestica Administrativa II 41

45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten

Procedimiento de la prueba de rangos con signo de Wilcoxon

Paso1 Para cada par de datos calcule la diferencia d restando el segundo

valor del primero Guarde los signos pero descarte cualquier par para el que

d=0

Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de

la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango

correspondiente Cuando las diferencias tengan el mismo valor numeacuterico

asiacutegneles la media de los rangos implicados en el empate

Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino

Esto es inserte aquellos signos que se ignoraron e el paso dos

Paso 4 Calcule la suma de los valores absolutos de los rangos negativos

Tambieacuten la suma de los rangos positivos

Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon

en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el

procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos

sumas

Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la

diferencia d no es 0

Estadiacutestica Administrativa II 42

Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el

tamantildeo muestral

Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos

muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica

esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico

Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente

2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha

Notacioacuten

T= la maacutes pequentildea de las siguientes dos sumas

1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0

La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T

Estadiacutestica Administrativa II 43

46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2

Rango Calificacioacuten Plantel

1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S

10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S

Estadiacutestica Administrativa II 44

30 1600 S

Estadiacutestica Administrativa II 45

Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500

n1= 15 n2= 15 R1= 247 R2= 218

Estadiacutestico U

U = n1n2 + n1(n1 +1) -R1 2

U= (15)(15) + (15)(16) -247 2

U= 225+120-247

U= 98

Media de la distribucioacuten muestral U

μu = n1n2

2

μu = (15)(15)

2

μu =1125

Estadiacutestica Administrativa II 46

Estadiacutestico U

σU = n1n2 + (n1n2 +1)

12

σU = (15)(15)(15+15+1)

12

σU = 6975 12

σU = 58125

σU = 241

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2

α= 015

Estandarizacioacuten del estadiacutestico U

z = U-μu

σU

z = 98 - 1125 241

z = -0602

144 -144 0 -0602

Valor estandarizado de

la muestra U

Regioacuten de aceptacioacuten

Estadiacutestica Administrativa II 47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras

Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular

Prueba de Wilcoxon de los rangos con signo

Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero

Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande

Prueba de Wilcoxon para contrastar datos pareados

El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 30: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

Estadiacutestica Administrativa II 26

Figura 5 Distribucioacuten Homocedaacutestica

Figura 6 Distribucioacuten Heterocedaacutestica

Praacutectica 1 992256 Con los datos histoacutericos de ventas de una empresa aplicaraacute la regresioacuten

lineal para hacer estimaciones futuras

Estadiacutestica Administrativa II 27

Unidad 3 Nuacutemeros iacutendice

Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se

calcula encontrando el cociente del valor actual entre el valor base luego se

multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje

Tipos de nuacutemeros iacutendice

Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de

cantidad e iacutendice de valor

Iacutendice de precios

Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida

Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo

Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable

El iacutendice de valor combina los cambios de precio y cantidad para presentar un

iacutendice con maacutes informacioacuten

Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos

como indicadores generales de la condicioacuten econoacutemica de un paiacutes

Factores que pueden distorsionar los nuacutemeros iacutendice

bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados

bull Falta de comparacioacuten de iacutendices

bull Ponderacioacuten no apropiada de los factores

bull Seleccioacuten de una base no apropiada

Estadiacutestica Administrativa II 28

31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores

Iacutendice de cantidad de agregados no ponderados

ΣQi x 100 ΣQo

Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea

1993 1994 1995

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200

Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado

1993 Qo

1994 Q1

1995 Q2

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308

Estadiacutestica Administrativa II 29

Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra

Iacutendice de precios de agregados ponderados

ΣPiQ x 100 ΣPoQ

Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100

Cambio de periodo base

I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base

Estadiacutestica Administrativa II 30

35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos

Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables

Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico

Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios

El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)

Estadiacutestica Administrativa II 31

Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica

37 Deflacioacuten de los valores de series de tiempo

Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios

En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea

La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores

Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero

Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes

Los valores expresados en unidades monetarias corrientes se conocen como valores nominales

Los valores expresados en unidades monetarias constantes se conocen como valores reales

Estadiacutestica Administrativa II 32

38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor

Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos

39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)

Estadiacutestica Administrativa II 33

Siacutembolo Nombre de la compantildeiacutea

AA Alcoa

ALD Allied Signal

AXP American Express

BA Boeing

CAT Caterpillar

CHV Chevron

C CitiGroup

DIS Disney

DD Dupont

EK Eastman Kodak

GE General Electric

GM General Motors

GT Goodyear Tire

HWP Hewlett-Packard

IBM International Business Machines

IP International Paper

JNJ Johnson amp Johnson

JPM JP Morgan Bank

KO Coca Cola

Figura 5 Compantildeiacuteas comprendidas en el Dow Jones

310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos

Praacutectica 2

992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico

elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado

de precios

Estadiacutestica Administrativa II 34

Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida

bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)

42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten

Las principales pruebas no parameacutetricas son las siguientes

bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher

Estadiacutestica Administrativa II 35

bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon

Caracteriacutesticas de algunas pruebas no parameacutetricas

1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos

2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten

3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal

4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados

5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc

6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica

Prueba Caracteriacutestica

Mann- Whitney 2 muestras independientes

Wilcoxon 2 muestras asociadas

Kruskal-Wallis + de 2 muestras independientes

Friedman + de 2 muestras asociadas

Tabla1 Caracteriacutesticas de pruebas no parameacutetricas

Estadiacutestica Administrativa II 36

Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media

Ventajas y desventajas de los meacutetodos parameacutetricos

Desventajas Ventajas bull Ignoran cierta cantidad de

informacioacuten bull No requieren la suposicioacuten de que

una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica

bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas

bull Generalmente es maacutes sencillo realizarlas y entenderlas

bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal

Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo

MHHHHM

1ra 2ra 3ra

Estadiacutestica Administrativa II 37

Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1

n2= nuacutemero de ocurrencias del tipo 2

r= nuacutemero de corridas

4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue

BABBBAAABBABBBBAAAABABAABBBAABAAAABBA

BBAAAABBABBBBAABBABAABB

Valores de la prueba

n1= 29

n2= 31

r= 29

4322 Distribucioacuten de muestreo del estadiacutestico r

El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba

Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente

Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1

n1+n2

Estadiacutestica Administrativa II 38

μr = 2(29)(31) +1

29+31

μr = 1798 +1 60

μr = 2997 +1

μr = 3097

Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)

(n1+n2)2(n1+n2-1)

σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)

σr= (1798) (1738)

(60)2(59)

σr= 1471

σr= 384

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-24 643 14-25 643 14-26 643 14-27 644 14-28 644

Estadiacutestica Administrativa II 39

44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica

Ejemplo

Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado

Miembro del panel Calificacioacuten para

conferencias grandes

Calificacioacuten para

sesiones pequentildeas

Signo de la calificacioacuten

Evaluacioacuten de los dos tipos de

clases

1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -

6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +

La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)

Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20

Estadiacutestica Administrativa II 40

Establecimiento de las hipoacutetesis

Ho p = 05

H1 p ne 05

Se consideran la posibilidades solamente de signos + y - (9+6 =15)

p Ho = 05

q H0 = 05

n= 15

p= 0600 (915)

q= 0400 (615)

Prueba de hipoacutetesis de que no hay diferencia

Error estaacutendar del la proporcioacuten

σp= pq n

σp= (05)(05) 15

σp= 0129

0025

0

0475 del aacuterea

Valor criacutetico Z=-196

Regioacuten de aceptacioacuten

0025

0475 del aacuterea

Valor criacutetico Z=196

Estadiacutestica Administrativa II 41

45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten

Procedimiento de la prueba de rangos con signo de Wilcoxon

Paso1 Para cada par de datos calcule la diferencia d restando el segundo

valor del primero Guarde los signos pero descarte cualquier par para el que

d=0

Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de

la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango

correspondiente Cuando las diferencias tengan el mismo valor numeacuterico

asiacutegneles la media de los rangos implicados en el empate

Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino

Esto es inserte aquellos signos que se ignoraron e el paso dos

Paso 4 Calcule la suma de los valores absolutos de los rangos negativos

Tambieacuten la suma de los rangos positivos

Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon

en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el

procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos

sumas

Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la

diferencia d no es 0

Estadiacutestica Administrativa II 42

Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el

tamantildeo muestral

Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos

muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica

esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico

Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente

2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha

Notacioacuten

T= la maacutes pequentildea de las siguientes dos sumas

1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0

La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T

Estadiacutestica Administrativa II 43

46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2

Rango Calificacioacuten Plantel

1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S

10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S

Estadiacutestica Administrativa II 44

30 1600 S

Estadiacutestica Administrativa II 45

Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500

n1= 15 n2= 15 R1= 247 R2= 218

Estadiacutestico U

U = n1n2 + n1(n1 +1) -R1 2

U= (15)(15) + (15)(16) -247 2

U= 225+120-247

U= 98

Media de la distribucioacuten muestral U

μu = n1n2

2

μu = (15)(15)

2

μu =1125

Estadiacutestica Administrativa II 46

Estadiacutestico U

σU = n1n2 + (n1n2 +1)

12

σU = (15)(15)(15+15+1)

12

σU = 6975 12

σU = 58125

σU = 241

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2

α= 015

Estandarizacioacuten del estadiacutestico U

z = U-μu

σU

z = 98 - 1125 241

z = -0602

144 -144 0 -0602

Valor estandarizado de

la muestra U

Regioacuten de aceptacioacuten

Estadiacutestica Administrativa II 47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras

Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular

Prueba de Wilcoxon de los rangos con signo

Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero

Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande

Prueba de Wilcoxon para contrastar datos pareados

El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 31: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

Estadiacutestica Administrativa II 27

Unidad 3 Nuacutemeros iacutendice

Un nuacutemero iacutendice mide cuaacutento ha cambiado una variable con el tiempo Se

calcula encontrando el cociente del valor actual entre el valor base luego se

multiplica el nuacutemero resultante por cien por lo tanto se expresa en porcentaje

Tipos de nuacutemeros iacutendice

Existen tres tipos principales de nuacutemeros iacutendice iacutendice de precios iacutendice de

cantidad e iacutendice de valor

Iacutendice de precios

Compara niveles de precio de un periodo a otro El iacutendice de precios al consumidor (IPC) clasificado por los gobiernos de los paiacuteses mide los cambios globales de precios de un conjunto de bienes y servicios al consumidor y se usa para definir el costo de vida

Iacutendice de cantidad Mide cuaacutento cambia el nuacutemero o la cantidad de una variable con el tiempo

Iacutendice de valor Mide los cambios del valor monetario total es decir mide el cambio del valor en dinero de una variable

El iacutendice de valor combina los cambios de precio y cantidad para presentar un

iacutendice con maacutes informacioacuten

Los nuacutemeros iacutendice como el IPC a menudo se citan en informes noticiosos

como indicadores generales de la condicioacuten econoacutemica de un paiacutes

Factores que pueden distorsionar los nuacutemeros iacutendice

bull Nuacutemero limitado de datos o dificultad para encontrar datos adecuados

bull Falta de comparacioacuten de iacutendices

bull Ponderacioacuten no apropiada de los factores

bull Seleccioacuten de una base no apropiada

Estadiacutestica Administrativa II 28

31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores

Iacutendice de cantidad de agregados no ponderados

ΣQi x 100 ΣQo

Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea

1993 1994 1995

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200

Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado

1993 Qo

1994 Q1

1995 Q2

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308

Estadiacutestica Administrativa II 29

Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra

Iacutendice de precios de agregados ponderados

ΣPiQ x 100 ΣPoQ

Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100

Cambio de periodo base

I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base

Estadiacutestica Administrativa II 30

35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos

Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables

Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico

Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios

El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)

Estadiacutestica Administrativa II 31

Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica

37 Deflacioacuten de los valores de series de tiempo

Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios

En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea

La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores

Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero

Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes

Los valores expresados en unidades monetarias corrientes se conocen como valores nominales

Los valores expresados en unidades monetarias constantes se conocen como valores reales

Estadiacutestica Administrativa II 32

38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor

Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos

39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)

Estadiacutestica Administrativa II 33

Siacutembolo Nombre de la compantildeiacutea

AA Alcoa

ALD Allied Signal

AXP American Express

BA Boeing

CAT Caterpillar

CHV Chevron

C CitiGroup

DIS Disney

DD Dupont

EK Eastman Kodak

GE General Electric

GM General Motors

GT Goodyear Tire

HWP Hewlett-Packard

IBM International Business Machines

IP International Paper

JNJ Johnson amp Johnson

JPM JP Morgan Bank

KO Coca Cola

Figura 5 Compantildeiacuteas comprendidas en el Dow Jones

310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos

Praacutectica 2

992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico

elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado

de precios

Estadiacutestica Administrativa II 34

Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida

bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)

42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten

Las principales pruebas no parameacutetricas son las siguientes

bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher

Estadiacutestica Administrativa II 35

bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon

Caracteriacutesticas de algunas pruebas no parameacutetricas

1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos

2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten

3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal

4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados

5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc

6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica

Prueba Caracteriacutestica

Mann- Whitney 2 muestras independientes

Wilcoxon 2 muestras asociadas

Kruskal-Wallis + de 2 muestras independientes

Friedman + de 2 muestras asociadas

Tabla1 Caracteriacutesticas de pruebas no parameacutetricas

Estadiacutestica Administrativa II 36

Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media

Ventajas y desventajas de los meacutetodos parameacutetricos

Desventajas Ventajas bull Ignoran cierta cantidad de

informacioacuten bull No requieren la suposicioacuten de que

una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica

bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas

bull Generalmente es maacutes sencillo realizarlas y entenderlas

bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal

Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo

MHHHHM

1ra 2ra 3ra

Estadiacutestica Administrativa II 37

Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1

n2= nuacutemero de ocurrencias del tipo 2

r= nuacutemero de corridas

4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue

BABBBAAABBABBBBAAAABABAABBBAABAAAABBA

BBAAAABBABBBBAABBABAABB

Valores de la prueba

n1= 29

n2= 31

r= 29

4322 Distribucioacuten de muestreo del estadiacutestico r

El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba

Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente

Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1

n1+n2

Estadiacutestica Administrativa II 38

μr = 2(29)(31) +1

29+31

μr = 1798 +1 60

μr = 2997 +1

μr = 3097

Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)

(n1+n2)2(n1+n2-1)

σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)

σr= (1798) (1738)

(60)2(59)

σr= 1471

σr= 384

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-24 643 14-25 643 14-26 643 14-27 644 14-28 644

Estadiacutestica Administrativa II 39

44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica

Ejemplo

Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado

Miembro del panel Calificacioacuten para

conferencias grandes

Calificacioacuten para

sesiones pequentildeas

Signo de la calificacioacuten

Evaluacioacuten de los dos tipos de

clases

1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -

6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +

La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)

Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20

Estadiacutestica Administrativa II 40

Establecimiento de las hipoacutetesis

Ho p = 05

H1 p ne 05

Se consideran la posibilidades solamente de signos + y - (9+6 =15)

p Ho = 05

q H0 = 05

n= 15

p= 0600 (915)

q= 0400 (615)

Prueba de hipoacutetesis de que no hay diferencia

Error estaacutendar del la proporcioacuten

σp= pq n

σp= (05)(05) 15

σp= 0129

0025

0

0475 del aacuterea

Valor criacutetico Z=-196

Regioacuten de aceptacioacuten

0025

0475 del aacuterea

Valor criacutetico Z=196

Estadiacutestica Administrativa II 41

45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten

Procedimiento de la prueba de rangos con signo de Wilcoxon

Paso1 Para cada par de datos calcule la diferencia d restando el segundo

valor del primero Guarde los signos pero descarte cualquier par para el que

d=0

Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de

la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango

correspondiente Cuando las diferencias tengan el mismo valor numeacuterico

asiacutegneles la media de los rangos implicados en el empate

Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino

Esto es inserte aquellos signos que se ignoraron e el paso dos

Paso 4 Calcule la suma de los valores absolutos de los rangos negativos

Tambieacuten la suma de los rangos positivos

Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon

en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el

procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos

sumas

Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la

diferencia d no es 0

Estadiacutestica Administrativa II 42

Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el

tamantildeo muestral

Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos

muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica

esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico

Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente

2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha

Notacioacuten

T= la maacutes pequentildea de las siguientes dos sumas

1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0

La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T

Estadiacutestica Administrativa II 43

46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2

Rango Calificacioacuten Plantel

1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S

10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S

Estadiacutestica Administrativa II 44

30 1600 S

Estadiacutestica Administrativa II 45

Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500

n1= 15 n2= 15 R1= 247 R2= 218

Estadiacutestico U

U = n1n2 + n1(n1 +1) -R1 2

U= (15)(15) + (15)(16) -247 2

U= 225+120-247

U= 98

Media de la distribucioacuten muestral U

μu = n1n2

2

μu = (15)(15)

2

μu =1125

Estadiacutestica Administrativa II 46

Estadiacutestico U

σU = n1n2 + (n1n2 +1)

12

σU = (15)(15)(15+15+1)

12

σU = 6975 12

σU = 58125

σU = 241

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2

α= 015

Estandarizacioacuten del estadiacutestico U

z = U-μu

σU

z = 98 - 1125 241

z = -0602

144 -144 0 -0602

Valor estandarizado de

la muestra U

Regioacuten de aceptacioacuten

Estadiacutestica Administrativa II 47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras

Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular

Prueba de Wilcoxon de los rangos con signo

Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero

Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande

Prueba de Wilcoxon para contrastar datos pareados

El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 32: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

Estadiacutestica Administrativa II 28

31 Elaboracioacuten de iacutendices simples 32 Iacutendices agregados de precio El iacutendice de agregados no ponderados es un iacutendice compuesto No ponderado significa que todos los valores considerados tienen la misma importancia de agregados quiere decir que sumamos todos los valores

Iacutendice de cantidad de agregados no ponderados

ΣQi x 100 ΣQo

Qi=cantidad de cada elemento del compuesto en el antildeo para el que se desea el iacutendice Qo= cantidad de cada elemento del compuesto en el antildeo base Ejemplo El vicepresidente de ventas de la empresa ldquoXrdquo estaacute examinando la tasa de comisioacuten para lntildeos empleados durante los uacuteltimos 3 antildeos En la siguiente tabla se muestran las ganancias por comisiones de los cinco mejores vendedores de la compantildeiacutea

1993 1994 1995

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200

Considerando a 1993 como el periodo base exprese las ganancias por comisiones de 1994 y 1995 en teacuterminos de un iacutendice de agregado no ponderado

1993 Qo

1994 Q1

1995 Q2

Empleado A 48500 55100 63800 Empleado B 41900 46200 60150 Empleado C 38750 43500 46700 Empleado D 36300 45400 39900 Empleado E 33850 38300 50200 199300 228500 260750 19930000 22850000 26075000 199300 199300 199300 =100 =1147 =1308

Estadiacutestica Administrativa II 29

Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra

Iacutendice de precios de agregados ponderados

ΣPiQ x 100 ΣPoQ

Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100

Cambio de periodo base

I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base

Estadiacutestica Administrativa II 30

35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos

Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables

Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico

Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios

El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)

Estadiacutestica Administrativa II 31

Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica

37 Deflacioacuten de los valores de series de tiempo

Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios

En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea

La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores

Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero

Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes

Los valores expresados en unidades monetarias corrientes se conocen como valores nominales

Los valores expresados en unidades monetarias constantes se conocen como valores reales

Estadiacutestica Administrativa II 32

38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor

Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos

39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)

Estadiacutestica Administrativa II 33

Siacutembolo Nombre de la compantildeiacutea

AA Alcoa

ALD Allied Signal

AXP American Express

BA Boeing

CAT Caterpillar

CHV Chevron

C CitiGroup

DIS Disney

DD Dupont

EK Eastman Kodak

GE General Electric

GM General Motors

GT Goodyear Tire

HWP Hewlett-Packard

IBM International Business Machines

IP International Paper

JNJ Johnson amp Johnson

JPM JP Morgan Bank

KO Coca Cola

Figura 5 Compantildeiacuteas comprendidas en el Dow Jones

310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos

Praacutectica 2

992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico

elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado

de precios

Estadiacutestica Administrativa II 34

Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida

bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)

42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten

Las principales pruebas no parameacutetricas son las siguientes

bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher

Estadiacutestica Administrativa II 35

bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon

Caracteriacutesticas de algunas pruebas no parameacutetricas

1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos

2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten

3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal

4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados

5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc

6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica

Prueba Caracteriacutestica

Mann- Whitney 2 muestras independientes

Wilcoxon 2 muestras asociadas

Kruskal-Wallis + de 2 muestras independientes

Friedman + de 2 muestras asociadas

Tabla1 Caracteriacutesticas de pruebas no parameacutetricas

Estadiacutestica Administrativa II 36

Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media

Ventajas y desventajas de los meacutetodos parameacutetricos

Desventajas Ventajas bull Ignoran cierta cantidad de

informacioacuten bull No requieren la suposicioacuten de que

una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica

bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas

bull Generalmente es maacutes sencillo realizarlas y entenderlas

bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal

Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo

MHHHHM

1ra 2ra 3ra

Estadiacutestica Administrativa II 37

Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1

n2= nuacutemero de ocurrencias del tipo 2

r= nuacutemero de corridas

4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue

BABBBAAABBABBBBAAAABABAABBBAABAAAABBA

BBAAAABBABBBBAABBABAABB

Valores de la prueba

n1= 29

n2= 31

r= 29

4322 Distribucioacuten de muestreo del estadiacutestico r

El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba

Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente

Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1

n1+n2

Estadiacutestica Administrativa II 38

μr = 2(29)(31) +1

29+31

μr = 1798 +1 60

μr = 2997 +1

μr = 3097

Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)

(n1+n2)2(n1+n2-1)

σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)

σr= (1798) (1738)

(60)2(59)

σr= 1471

σr= 384

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-24 643 14-25 643 14-26 643 14-27 644 14-28 644

Estadiacutestica Administrativa II 39

44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica

Ejemplo

Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado

Miembro del panel Calificacioacuten para

conferencias grandes

Calificacioacuten para

sesiones pequentildeas

Signo de la calificacioacuten

Evaluacioacuten de los dos tipos de

clases

1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -

6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +

La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)

Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20

Estadiacutestica Administrativa II 40

Establecimiento de las hipoacutetesis

Ho p = 05

H1 p ne 05

Se consideran la posibilidades solamente de signos + y - (9+6 =15)

p Ho = 05

q H0 = 05

n= 15

p= 0600 (915)

q= 0400 (615)

Prueba de hipoacutetesis de que no hay diferencia

Error estaacutendar del la proporcioacuten

σp= pq n

σp= (05)(05) 15

σp= 0129

0025

0

0475 del aacuterea

Valor criacutetico Z=-196

Regioacuten de aceptacioacuten

0025

0475 del aacuterea

Valor criacutetico Z=196

Estadiacutestica Administrativa II 41

45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten

Procedimiento de la prueba de rangos con signo de Wilcoxon

Paso1 Para cada par de datos calcule la diferencia d restando el segundo

valor del primero Guarde los signos pero descarte cualquier par para el que

d=0

Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de

la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango

correspondiente Cuando las diferencias tengan el mismo valor numeacuterico

asiacutegneles la media de los rangos implicados en el empate

Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino

Esto es inserte aquellos signos que se ignoraron e el paso dos

Paso 4 Calcule la suma de los valores absolutos de los rangos negativos

Tambieacuten la suma de los rangos positivos

Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon

en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el

procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos

sumas

Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la

diferencia d no es 0

Estadiacutestica Administrativa II 42

Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el

tamantildeo muestral

Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos

muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica

esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico

Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente

2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha

Notacioacuten

T= la maacutes pequentildea de las siguientes dos sumas

1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0

La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T

Estadiacutestica Administrativa II 43

46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2

Rango Calificacioacuten Plantel

1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S

10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S

Estadiacutestica Administrativa II 44

30 1600 S

Estadiacutestica Administrativa II 45

Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500

n1= 15 n2= 15 R1= 247 R2= 218

Estadiacutestico U

U = n1n2 + n1(n1 +1) -R1 2

U= (15)(15) + (15)(16) -247 2

U= 225+120-247

U= 98

Media de la distribucioacuten muestral U

μu = n1n2

2

μu = (15)(15)

2

μu =1125

Estadiacutestica Administrativa II 46

Estadiacutestico U

σU = n1n2 + (n1n2 +1)

12

σU = (15)(15)(15+15+1)

12

σU = 6975 12

σU = 58125

σU = 241

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2

α= 015

Estandarizacioacuten del estadiacutestico U

z = U-μu

σU

z = 98 - 1125 241

z = -0602

144 -144 0 -0602

Valor estandarizado de

la muestra U

Regioacuten de aceptacioacuten

Estadiacutestica Administrativa II 47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras

Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular

Prueba de Wilcoxon de los rangos con signo

Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero

Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande

Prueba de Wilcoxon para contrastar datos pareados

El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 33: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

Estadiacutestica Administrativa II 29

Iacutendice de agregados ponderado Cuando se calcula un iacutendice se tiene que asignar una importancia mayor a los cambios en algunas variables que en otras Esta ponderacioacuten permite mejorar la precisioacuten de la estimacioacuten del nivel general de precios basado en una muestra

Iacutendice de precios de agregados ponderados

ΣPiQ x 100 ΣPoQ

Pi=precio de cada elemento del compuesto en del antildeo actual Po= precio de cada elemento del compuesto en del antildeo actual antildeo base Q= factor de ponderacioacuten de cantidad seleccionado 33 Relativos eslabonados Son iacutendices cuya base es siempre periodo anterior En consecuencia respecto de un conjunto de relativos eslabonados de valores anuales de ventas cada numero iacutendice representa una comparacioacuten porcentual con el antildeo anterior Estos relativos son uacutetiles para destacar comparaciones entre un antildeo y otro pero resultan inconvenientes como base de comparaciones a largo plazo 34 Cambio de periodo base La base de una serie establecida de nuacutemeros iacutendices suele cambiarse a un antildeo maacutes reciente para que las comparaciones actuales sean maacutes significativas Partiendo del supuesto de que no se dispone de las cantidades originales en las que se apoya la serie de nuacutemeros iacutendices el periodo base de un numero iacutendice puede cambiarse dividiendo cada iacutendice (original) entre el iacutendice del antildeo base recieacuten determinado y multiplicando el resultado por 100

Cambio de periodo base

I nuevo = Iacutendice antiguo x100 Iacutendice antiguo de la nueva base

Estadiacutestica Administrativa II 30

35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos

Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables

Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico

Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios

El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)

Estadiacutestica Administrativa II 31

Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica

37 Deflacioacuten de los valores de series de tiempo

Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios

En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea

La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores

Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero

Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes

Los valores expresados en unidades monetarias corrientes se conocen como valores nominales

Los valores expresados en unidades monetarias constantes se conocen como valores reales

Estadiacutestica Administrativa II 32

38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor

Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos

39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)

Estadiacutestica Administrativa II 33

Siacutembolo Nombre de la compantildeiacutea

AA Alcoa

ALD Allied Signal

AXP American Express

BA Boeing

CAT Caterpillar

CHV Chevron

C CitiGroup

DIS Disney

DD Dupont

EK Eastman Kodak

GE General Electric

GM General Motors

GT Goodyear Tire

HWP Hewlett-Packard

IBM International Business Machines

IP International Paper

JNJ Johnson amp Johnson

JPM JP Morgan Bank

KO Coca Cola

Figura 5 Compantildeiacuteas comprendidas en el Dow Jones

310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos

Praacutectica 2

992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico

elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado

de precios

Estadiacutestica Administrativa II 34

Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida

bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)

42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten

Las principales pruebas no parameacutetricas son las siguientes

bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher

Estadiacutestica Administrativa II 35

bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon

Caracteriacutesticas de algunas pruebas no parameacutetricas

1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos

2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten

3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal

4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados

5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc

6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica

Prueba Caracteriacutestica

Mann- Whitney 2 muestras independientes

Wilcoxon 2 muestras asociadas

Kruskal-Wallis + de 2 muestras independientes

Friedman + de 2 muestras asociadas

Tabla1 Caracteriacutesticas de pruebas no parameacutetricas

Estadiacutestica Administrativa II 36

Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media

Ventajas y desventajas de los meacutetodos parameacutetricos

Desventajas Ventajas bull Ignoran cierta cantidad de

informacioacuten bull No requieren la suposicioacuten de que

una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica

bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas

bull Generalmente es maacutes sencillo realizarlas y entenderlas

bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal

Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo

MHHHHM

1ra 2ra 3ra

Estadiacutestica Administrativa II 37

Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1

n2= nuacutemero de ocurrencias del tipo 2

r= nuacutemero de corridas

4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue

BABBBAAABBABBBBAAAABABAABBBAABAAAABBA

BBAAAABBABBBBAABBABAABB

Valores de la prueba

n1= 29

n2= 31

r= 29

4322 Distribucioacuten de muestreo del estadiacutestico r

El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba

Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente

Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1

n1+n2

Estadiacutestica Administrativa II 38

μr = 2(29)(31) +1

29+31

μr = 1798 +1 60

μr = 2997 +1

μr = 3097

Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)

(n1+n2)2(n1+n2-1)

σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)

σr= (1798) (1738)

(60)2(59)

σr= 1471

σr= 384

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-24 643 14-25 643 14-26 643 14-27 644 14-28 644

Estadiacutestica Administrativa II 39

44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica

Ejemplo

Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado

Miembro del panel Calificacioacuten para

conferencias grandes

Calificacioacuten para

sesiones pequentildeas

Signo de la calificacioacuten

Evaluacioacuten de los dos tipos de

clases

1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -

6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +

La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)

Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20

Estadiacutestica Administrativa II 40

Establecimiento de las hipoacutetesis

Ho p = 05

H1 p ne 05

Se consideran la posibilidades solamente de signos + y - (9+6 =15)

p Ho = 05

q H0 = 05

n= 15

p= 0600 (915)

q= 0400 (615)

Prueba de hipoacutetesis de que no hay diferencia

Error estaacutendar del la proporcioacuten

σp= pq n

σp= (05)(05) 15

σp= 0129

0025

0

0475 del aacuterea

Valor criacutetico Z=-196

Regioacuten de aceptacioacuten

0025

0475 del aacuterea

Valor criacutetico Z=196

Estadiacutestica Administrativa II 41

45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten

Procedimiento de la prueba de rangos con signo de Wilcoxon

Paso1 Para cada par de datos calcule la diferencia d restando el segundo

valor del primero Guarde los signos pero descarte cualquier par para el que

d=0

Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de

la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango

correspondiente Cuando las diferencias tengan el mismo valor numeacuterico

asiacutegneles la media de los rangos implicados en el empate

Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino

Esto es inserte aquellos signos que se ignoraron e el paso dos

Paso 4 Calcule la suma de los valores absolutos de los rangos negativos

Tambieacuten la suma de los rangos positivos

Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon

en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el

procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos

sumas

Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la

diferencia d no es 0

Estadiacutestica Administrativa II 42

Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el

tamantildeo muestral

Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos

muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica

esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico

Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente

2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha

Notacioacuten

T= la maacutes pequentildea de las siguientes dos sumas

1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0

La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T

Estadiacutestica Administrativa II 43

46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2

Rango Calificacioacuten Plantel

1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S

10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S

Estadiacutestica Administrativa II 44

30 1600 S

Estadiacutestica Administrativa II 45

Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500

n1= 15 n2= 15 R1= 247 R2= 218

Estadiacutestico U

U = n1n2 + n1(n1 +1) -R1 2

U= (15)(15) + (15)(16) -247 2

U= 225+120-247

U= 98

Media de la distribucioacuten muestral U

μu = n1n2

2

μu = (15)(15)

2

μu =1125

Estadiacutestica Administrativa II 46

Estadiacutestico U

σU = n1n2 + (n1n2 +1)

12

σU = (15)(15)(15+15+1)

12

σU = 6975 12

σU = 58125

σU = 241

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2

α= 015

Estandarizacioacuten del estadiacutestico U

z = U-μu

σU

z = 98 - 1125 241

z = -0602

144 -144 0 -0602

Valor estandarizado de

la muestra U

Regioacuten de aceptacioacuten

Estadiacutestica Administrativa II 47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras

Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular

Prueba de Wilcoxon de los rangos con signo

Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero

Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande

Prueba de Wilcoxon para contrastar datos pareados

El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 34: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

Estadiacutestica Administrativa II 30

35 Fusioacuten de dos series de nuacutemeros iacutendice Es frecuente que un nuacutemero iacutendice sufra cambios a causa de la adiccioacuten de ciertos productos nuevos o de la exclusioacuten de ciertos productos antiguos asiacute como de cambios en el antildeo base Sin embargo para efectos de continuidad histoacuterica es deseable contar con una serie uniforme de nuacutemeros iacutendices Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una serie continua de nuacutemeros iacutendices debe haber un antildeo de empalme de las dos series en relacioacuten con el cual se hayan calculado ambos nuacutemeros iacutendices Generalmente el antildeo de empalme es tambieacuten la nueva base porque es el antildeo en que se ha antildeadido yo eliminado productos del iacutendice agregado Los nuacutemeros iacutendices que deben modificarse en el proceso de fusioacuten son los iacutendices de la antigua serie Este cambio se realiza dividiendo el nuevo numero iacutendice del antildeo de empalme entre el antiguo iacutendice de ese antildeo y multiplicando despueacutes por este cociente cada uno de los nuacutemeros iacutendices de la antigua serie de los nuacutemeros iacutendices 36 Iacutendice de precios al consumidor (IPC) Es el iacutendice maacutes conocido de los que se han publicado dada su utilidad como indicador de la tasa de inflacioacuten y del costo de vidahellip se trata de un iacutendice agregado de precios sobre una canasta baacutesica de varios cientos de bienes y servicios cuya ponderaciones son reflejo de los patrones de compra de los consumidores urbanos

Para que las variaciones en el iacutendice se deban soacutelo a modificaciones en los precios y no a otros factores como por ejemplo el cambio en los haacutebitos de compra de los consumidores es necesario que las ponderaciones de los bienes y servicios sean las mismas en los periacuteodos cuyos precios se comparan y a su vez que las especificaciones de esos bienes y servicios de la canasta deben ser comparables

Aislar la evolucioacuten de los precios es una tarea complicada La variacioacuten temporal en el gasto que un hogar destina para la compra de determinado bien o servicio se origina conjuntamente por factores de precio y por factores de volumen fiacutesico

Los iacutendices de precios tratan de medir el efecto de los factores de precio esto es la cantidad de dinero pagada por una unidad de bien o servicio de determinada calidad Seriacutea oacuteptimo entonces que los iacutendices de precios no estuvieran distorsionados por cambios en la calidad de los productos o servicios

El proceso de elaboracioacuten de un iacutendice puro de precios conlleva mucho trabajo debido a la dificultad que implica separar los factores que no se deben en forma exclusiva a los precios pero que tambieacuten inciden en el valor de los bienes y servicios (cantidad volumen caracteriacutesticas fiacutesicas y funcionales durabilidad calidad prestigio que otorga su consumo lugar de adquisicioacuten momento y volumen de la adquisicioacuten etceacutetera)

Estadiacutestica Administrativa II 31

Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica

37 Deflacioacuten de los valores de series de tiempo

Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios

En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea

La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores

Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero

Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes

Los valores expresados en unidades monetarias corrientes se conocen como valores nominales

Los valores expresados en unidades monetarias constantes se conocen como valores reales

Estadiacutestica Administrativa II 32

38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor

Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos

39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)

Estadiacutestica Administrativa II 33

Siacutembolo Nombre de la compantildeiacutea

AA Alcoa

ALD Allied Signal

AXP American Express

BA Boeing

CAT Caterpillar

CHV Chevron

C CitiGroup

DIS Disney

DD Dupont

EK Eastman Kodak

GE General Electric

GM General Motors

GT Goodyear Tire

HWP Hewlett-Packard

IBM International Business Machines

IP International Paper

JNJ Johnson amp Johnson

JPM JP Morgan Bank

KO Coca Cola

Figura 5 Compantildeiacuteas comprendidas en el Dow Jones

310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos

Praacutectica 2

992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico

elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado

de precios

Estadiacutestica Administrativa II 34

Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida

bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)

42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten

Las principales pruebas no parameacutetricas son las siguientes

bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher

Estadiacutestica Administrativa II 35

bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon

Caracteriacutesticas de algunas pruebas no parameacutetricas

1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos

2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten

3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal

4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados

5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc

6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica

Prueba Caracteriacutestica

Mann- Whitney 2 muestras independientes

Wilcoxon 2 muestras asociadas

Kruskal-Wallis + de 2 muestras independientes

Friedman + de 2 muestras asociadas

Tabla1 Caracteriacutesticas de pruebas no parameacutetricas

Estadiacutestica Administrativa II 36

Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media

Ventajas y desventajas de los meacutetodos parameacutetricos

Desventajas Ventajas bull Ignoran cierta cantidad de

informacioacuten bull No requieren la suposicioacuten de que

una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica

bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas

bull Generalmente es maacutes sencillo realizarlas y entenderlas

bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal

Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo

MHHHHM

1ra 2ra 3ra

Estadiacutestica Administrativa II 37

Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1

n2= nuacutemero de ocurrencias del tipo 2

r= nuacutemero de corridas

4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue

BABBBAAABBABBBBAAAABABAABBBAABAAAABBA

BBAAAABBABBBBAABBABAABB

Valores de la prueba

n1= 29

n2= 31

r= 29

4322 Distribucioacuten de muestreo del estadiacutestico r

El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba

Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente

Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1

n1+n2

Estadiacutestica Administrativa II 38

μr = 2(29)(31) +1

29+31

μr = 1798 +1 60

μr = 2997 +1

μr = 3097

Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)

(n1+n2)2(n1+n2-1)

σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)

σr= (1798) (1738)

(60)2(59)

σr= 1471

σr= 384

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-24 643 14-25 643 14-26 643 14-27 644 14-28 644

Estadiacutestica Administrativa II 39

44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica

Ejemplo

Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado

Miembro del panel Calificacioacuten para

conferencias grandes

Calificacioacuten para

sesiones pequentildeas

Signo de la calificacioacuten

Evaluacioacuten de los dos tipos de

clases

1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -

6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +

La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)

Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20

Estadiacutestica Administrativa II 40

Establecimiento de las hipoacutetesis

Ho p = 05

H1 p ne 05

Se consideran la posibilidades solamente de signos + y - (9+6 =15)

p Ho = 05

q H0 = 05

n= 15

p= 0600 (915)

q= 0400 (615)

Prueba de hipoacutetesis de que no hay diferencia

Error estaacutendar del la proporcioacuten

σp= pq n

σp= (05)(05) 15

σp= 0129

0025

0

0475 del aacuterea

Valor criacutetico Z=-196

Regioacuten de aceptacioacuten

0025

0475 del aacuterea

Valor criacutetico Z=196

Estadiacutestica Administrativa II 41

45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten

Procedimiento de la prueba de rangos con signo de Wilcoxon

Paso1 Para cada par de datos calcule la diferencia d restando el segundo

valor del primero Guarde los signos pero descarte cualquier par para el que

d=0

Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de

la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango

correspondiente Cuando las diferencias tengan el mismo valor numeacuterico

asiacutegneles la media de los rangos implicados en el empate

Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino

Esto es inserte aquellos signos que se ignoraron e el paso dos

Paso 4 Calcule la suma de los valores absolutos de los rangos negativos

Tambieacuten la suma de los rangos positivos

Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon

en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el

procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos

sumas

Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la

diferencia d no es 0

Estadiacutestica Administrativa II 42

Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el

tamantildeo muestral

Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos

muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica

esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico

Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente

2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha

Notacioacuten

T= la maacutes pequentildea de las siguientes dos sumas

1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0

La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T

Estadiacutestica Administrativa II 43

46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2

Rango Calificacioacuten Plantel

1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S

10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S

Estadiacutestica Administrativa II 44

30 1600 S

Estadiacutestica Administrativa II 45

Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500

n1= 15 n2= 15 R1= 247 R2= 218

Estadiacutestico U

U = n1n2 + n1(n1 +1) -R1 2

U= (15)(15) + (15)(16) -247 2

U= 225+120-247

U= 98

Media de la distribucioacuten muestral U

μu = n1n2

2

μu = (15)(15)

2

μu =1125

Estadiacutestica Administrativa II 46

Estadiacutestico U

σU = n1n2 + (n1n2 +1)

12

σU = (15)(15)(15+15+1)

12

σU = 6975 12

σU = 58125

σU = 241

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2

α= 015

Estandarizacioacuten del estadiacutestico U

z = U-μu

σU

z = 98 - 1125 241

z = -0602

144 -144 0 -0602

Valor estandarizado de

la muestra U

Regioacuten de aceptacioacuten

Estadiacutestica Administrativa II 47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras

Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular

Prueba de Wilcoxon de los rangos con signo

Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero

Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande

Prueba de Wilcoxon para contrastar datos pareados

El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 35: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

Estadiacutestica Administrativa II 31

Por otra parte debido a los cambios en los patrones de consumo de la poblacioacuten de referencia existe la necesidad de revisar y modificar si fuera necesario la canasta de consumo asiacute como la poblacioacuten de referencia y los negocios informantes para que el iacutendice se mantenga actualizado sea representativo y uacutetil en la praacutectica

37 Deflacioacuten de los valores de series de tiempo

Situacioacuten opuesta a la inflacioacuten en la que aumenta el valor de la unidad monetaria como resultante de la baja de los precios Se produce deflacioacuten cuando la masa monetaria crece a un ritmo menor que la oferta total de bienes y servicios

En la praacutectica esto casi nunca sucede pues los gobiernos aumentan la oferta monetaria a un ritmo suficiente como para compensar ese crecimiento de no hacerlo podriacutean darse bajas en los salarios nominales con el consiguiente malestar social que esto produciriacutea

La deflacioacuten de series monetarias consiste en eliminar el efecto que los cambios en los precios de los bienes tienen sobre las series de valores

Cuando queremos conocer la evolucioacuten de una serie de valores a lo largo del tiempo por ejemplo beneficios de una empresa produccioacuten de una industria salarios de los empleados de una empresa ingresos de los hogares etc nos encontramos habitualmente con los valores estaacuten en unidades monetarias de cada periodo esto es los valores se refieren a unidades monetarias corrientes Esto va a hacer que los valores no sean directamente comparables puesto que las alteraciones de los precios de un periodo a otro confieren distinto poder adquisitivo a las unidades monetarias En otras palabras el efecto de la inflacioacuten (o deflacioacuten) modifica la capacidad de compra del dinero

Para conocer los cambios reales experimentados por la serie a lo largo del periodo de intereacutes tendremos que expresar todos los valores de dicha serie en unidades monetarias de un mismo periodo es decir en unidades monetarias constantes

Los valores expresados en unidades monetarias corrientes se conocen como valores nominales

Los valores expresados en unidades monetarias constantes se conocen como valores reales

Estadiacutestica Administrativa II 32

38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor

Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos

39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)

Estadiacutestica Administrativa II 33

Siacutembolo Nombre de la compantildeiacutea

AA Alcoa

ALD Allied Signal

AXP American Express

BA Boeing

CAT Caterpillar

CHV Chevron

C CitiGroup

DIS Disney

DD Dupont

EK Eastman Kodak

GE General Electric

GM General Motors

GT Goodyear Tire

HWP Hewlett-Packard

IBM International Business Machines

IP International Paper

JNJ Johnson amp Johnson

JPM JP Morgan Bank

KO Coca Cola

Figura 5 Compantildeiacuteas comprendidas en el Dow Jones

310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos

Praacutectica 2

992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico

elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado

de precios

Estadiacutestica Administrativa II 34

Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida

bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)

42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten

Las principales pruebas no parameacutetricas son las siguientes

bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher

Estadiacutestica Administrativa II 35

bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon

Caracteriacutesticas de algunas pruebas no parameacutetricas

1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos

2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten

3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal

4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados

5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc

6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica

Prueba Caracteriacutestica

Mann- Whitney 2 muestras independientes

Wilcoxon 2 muestras asociadas

Kruskal-Wallis + de 2 muestras independientes

Friedman + de 2 muestras asociadas

Tabla1 Caracteriacutesticas de pruebas no parameacutetricas

Estadiacutestica Administrativa II 36

Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media

Ventajas y desventajas de los meacutetodos parameacutetricos

Desventajas Ventajas bull Ignoran cierta cantidad de

informacioacuten bull No requieren la suposicioacuten de que

una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica

bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas

bull Generalmente es maacutes sencillo realizarlas y entenderlas

bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal

Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo

MHHHHM

1ra 2ra 3ra

Estadiacutestica Administrativa II 37

Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1

n2= nuacutemero de ocurrencias del tipo 2

r= nuacutemero de corridas

4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue

BABBBAAABBABBBBAAAABABAABBBAABAAAABBA

BBAAAABBABBBBAABBABAABB

Valores de la prueba

n1= 29

n2= 31

r= 29

4322 Distribucioacuten de muestreo del estadiacutestico r

El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba

Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente

Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1

n1+n2

Estadiacutestica Administrativa II 38

μr = 2(29)(31) +1

29+31

μr = 1798 +1 60

μr = 2997 +1

μr = 3097

Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)

(n1+n2)2(n1+n2-1)

σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)

σr= (1798) (1738)

(60)2(59)

σr= 1471

σr= 384

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-24 643 14-25 643 14-26 643 14-27 644 14-28 644

Estadiacutestica Administrativa II 39

44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica

Ejemplo

Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado

Miembro del panel Calificacioacuten para

conferencias grandes

Calificacioacuten para

sesiones pequentildeas

Signo de la calificacioacuten

Evaluacioacuten de los dos tipos de

clases

1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -

6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +

La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)

Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20

Estadiacutestica Administrativa II 40

Establecimiento de las hipoacutetesis

Ho p = 05

H1 p ne 05

Se consideran la posibilidades solamente de signos + y - (9+6 =15)

p Ho = 05

q H0 = 05

n= 15

p= 0600 (915)

q= 0400 (615)

Prueba de hipoacutetesis de que no hay diferencia

Error estaacutendar del la proporcioacuten

σp= pq n

σp= (05)(05) 15

σp= 0129

0025

0

0475 del aacuterea

Valor criacutetico Z=-196

Regioacuten de aceptacioacuten

0025

0475 del aacuterea

Valor criacutetico Z=196

Estadiacutestica Administrativa II 41

45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten

Procedimiento de la prueba de rangos con signo de Wilcoxon

Paso1 Para cada par de datos calcule la diferencia d restando el segundo

valor del primero Guarde los signos pero descarte cualquier par para el que

d=0

Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de

la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango

correspondiente Cuando las diferencias tengan el mismo valor numeacuterico

asiacutegneles la media de los rangos implicados en el empate

Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino

Esto es inserte aquellos signos que se ignoraron e el paso dos

Paso 4 Calcule la suma de los valores absolutos de los rangos negativos

Tambieacuten la suma de los rangos positivos

Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon

en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el

procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos

sumas

Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la

diferencia d no es 0

Estadiacutestica Administrativa II 42

Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el

tamantildeo muestral

Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos

muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica

esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico

Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente

2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha

Notacioacuten

T= la maacutes pequentildea de las siguientes dos sumas

1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0

La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T

Estadiacutestica Administrativa II 43

46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2

Rango Calificacioacuten Plantel

1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S

10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S

Estadiacutestica Administrativa II 44

30 1600 S

Estadiacutestica Administrativa II 45

Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500

n1= 15 n2= 15 R1= 247 R2= 218

Estadiacutestico U

U = n1n2 + n1(n1 +1) -R1 2

U= (15)(15) + (15)(16) -247 2

U= 225+120-247

U= 98

Media de la distribucioacuten muestral U

μu = n1n2

2

μu = (15)(15)

2

μu =1125

Estadiacutestica Administrativa II 46

Estadiacutestico U

σU = n1n2 + (n1n2 +1)

12

σU = (15)(15)(15+15+1)

12

σU = 6975 12

σU = 58125

σU = 241

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2

α= 015

Estandarizacioacuten del estadiacutestico U

z = U-μu

σU

z = 98 - 1125 241

z = -0602

144 -144 0 -0602

Valor estandarizado de

la muestra U

Regioacuten de aceptacioacuten

Estadiacutestica Administrativa II 47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras

Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular

Prueba de Wilcoxon de los rangos con signo

Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero

Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande

Prueba de Wilcoxon para contrastar datos pareados

El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 36: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

Estadiacutestica Administrativa II 32

38 Iacutendice de precios al productor (IPP) Incluye tres iacutendices diferentes de materias primas materias intermedias y bienes terminados Se le considera un importante indicador liacuteder de la tasa de inflacioacuten debido a la probabilidad de que incrementos en los precios de los bienes terminados den origen a subsecuentes incrementos en precios al consumidor

Es el producto resultante de una investigacioacuten estadiacutestica de caraacutecter estrateacutegico que permite medir la variacioacuten porcentual promedio de los precios al por menor de un conjunto de bienes y servicios Para entender mejor la naturaleza del IPP se debe pensar en el iacutendice como una medida del porcentaje de cambio a traveacutes del tiempo del costo promedio de una gran canasta de bienes y servicios comprados por los hogares de Colombia manteniendo constante la calidad y la cantidad de los bienes La diferencia con el IPC radica en las agrupaciones en las que estaacute dividido el iacutendice El IPP tiene en cuenta las siguientes agrupaciones Alimentos y animales vivos bebidas y tabaco materias primas no combustibles y lubricantes aceites y grasas vegetales y animales productos quiacutemicos artiacuteculos manufacturados maquinaria y equipo de transporte artiacuteculos manufacturados diversos

39 Promedios de precios bursaacutetiles de DowJones Los promedios de precios bursaacutetiles de Dow Jones muestra los promedios de las acciones en el ramo de la industria el transporte y de servicios puacuteblicos toma como muestra 30 mercados Se trata de un promedio ponderado cuyas ponderaciones ha sido revisadas varias veces a causa de cambios en el valor nominal de las acciones y modificaciones en las compantildeiacuteas incluidas en el iacutendice Este iacutendice es representativo de las 30 mayores compantildeiacuteas industriales de Estados Unidos y se compila sumando los precios de sus acciones y luego dividieacutendolos por una constante El divisor del Dow Jones se ajusta perioacutedicamente a fin de reflejar el fraccionamiento o divisioacuten de las acciones (ver Split) Este promedio empezoacute a compilarse en 1896 con los tiacutetulos de 12 firmas entre ellas las entonces American Tobaco Tennessee Coal and Iron Chicago Gas American Sugar y la uacutenica sobreviviente hoy General Electric En 1916 ya eran 20 Y a partir de 1928 pasaron a ser 30 sin que hasta ahora haya variado esa cantidad A continuacioacuten las compantildeiacuteas comprendidas en el Dow Jones y los siacutembolos bajos los cuales se cotizan en la Bolsa de Nueva York (NYSE)

Estadiacutestica Administrativa II 33

Siacutembolo Nombre de la compantildeiacutea

AA Alcoa

ALD Allied Signal

AXP American Express

BA Boeing

CAT Caterpillar

CHV Chevron

C CitiGroup

DIS Disney

DD Dupont

EK Eastman Kodak

GE General Electric

GM General Motors

GT Goodyear Tire

HWP Hewlett-Packard

IBM International Business Machines

IP International Paper

JNJ Johnson amp Johnson

JPM JP Morgan Bank

KO Coca Cola

Figura 5 Compantildeiacuteas comprendidas en el Dow Jones

310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos

Praacutectica 2

992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico

elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado

de precios

Estadiacutestica Administrativa II 34

Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida

bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)

42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten

Las principales pruebas no parameacutetricas son las siguientes

bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher

Estadiacutestica Administrativa II 35

bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon

Caracteriacutesticas de algunas pruebas no parameacutetricas

1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos

2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten

3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal

4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados

5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc

6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica

Prueba Caracteriacutestica

Mann- Whitney 2 muestras independientes

Wilcoxon 2 muestras asociadas

Kruskal-Wallis + de 2 muestras independientes

Friedman + de 2 muestras asociadas

Tabla1 Caracteriacutesticas de pruebas no parameacutetricas

Estadiacutestica Administrativa II 36

Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media

Ventajas y desventajas de los meacutetodos parameacutetricos

Desventajas Ventajas bull Ignoran cierta cantidad de

informacioacuten bull No requieren la suposicioacuten de que

una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica

bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas

bull Generalmente es maacutes sencillo realizarlas y entenderlas

bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal

Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo

MHHHHM

1ra 2ra 3ra

Estadiacutestica Administrativa II 37

Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1

n2= nuacutemero de ocurrencias del tipo 2

r= nuacutemero de corridas

4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue

BABBBAAABBABBBBAAAABABAABBBAABAAAABBA

BBAAAABBABBBBAABBABAABB

Valores de la prueba

n1= 29

n2= 31

r= 29

4322 Distribucioacuten de muestreo del estadiacutestico r

El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba

Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente

Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1

n1+n2

Estadiacutestica Administrativa II 38

μr = 2(29)(31) +1

29+31

μr = 1798 +1 60

μr = 2997 +1

μr = 3097

Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)

(n1+n2)2(n1+n2-1)

σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)

σr= (1798) (1738)

(60)2(59)

σr= 1471

σr= 384

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-24 643 14-25 643 14-26 643 14-27 644 14-28 644

Estadiacutestica Administrativa II 39

44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica

Ejemplo

Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado

Miembro del panel Calificacioacuten para

conferencias grandes

Calificacioacuten para

sesiones pequentildeas

Signo de la calificacioacuten

Evaluacioacuten de los dos tipos de

clases

1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -

6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +

La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)

Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20

Estadiacutestica Administrativa II 40

Establecimiento de las hipoacutetesis

Ho p = 05

H1 p ne 05

Se consideran la posibilidades solamente de signos + y - (9+6 =15)

p Ho = 05

q H0 = 05

n= 15

p= 0600 (915)

q= 0400 (615)

Prueba de hipoacutetesis de que no hay diferencia

Error estaacutendar del la proporcioacuten

σp= pq n

σp= (05)(05) 15

σp= 0129

0025

0

0475 del aacuterea

Valor criacutetico Z=-196

Regioacuten de aceptacioacuten

0025

0475 del aacuterea

Valor criacutetico Z=196

Estadiacutestica Administrativa II 41

45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten

Procedimiento de la prueba de rangos con signo de Wilcoxon

Paso1 Para cada par de datos calcule la diferencia d restando el segundo

valor del primero Guarde los signos pero descarte cualquier par para el que

d=0

Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de

la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango

correspondiente Cuando las diferencias tengan el mismo valor numeacuterico

asiacutegneles la media de los rangos implicados en el empate

Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino

Esto es inserte aquellos signos que se ignoraron e el paso dos

Paso 4 Calcule la suma de los valores absolutos de los rangos negativos

Tambieacuten la suma de los rangos positivos

Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon

en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el

procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos

sumas

Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la

diferencia d no es 0

Estadiacutestica Administrativa II 42

Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el

tamantildeo muestral

Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos

muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica

esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico

Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente

2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha

Notacioacuten

T= la maacutes pequentildea de las siguientes dos sumas

1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0

La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T

Estadiacutestica Administrativa II 43

46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2

Rango Calificacioacuten Plantel

1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S

10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S

Estadiacutestica Administrativa II 44

30 1600 S

Estadiacutestica Administrativa II 45

Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500

n1= 15 n2= 15 R1= 247 R2= 218

Estadiacutestico U

U = n1n2 + n1(n1 +1) -R1 2

U= (15)(15) + (15)(16) -247 2

U= 225+120-247

U= 98

Media de la distribucioacuten muestral U

μu = n1n2

2

μu = (15)(15)

2

μu =1125

Estadiacutestica Administrativa II 46

Estadiacutestico U

σU = n1n2 + (n1n2 +1)

12

σU = (15)(15)(15+15+1)

12

σU = 6975 12

σU = 58125

σU = 241

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2

α= 015

Estandarizacioacuten del estadiacutestico U

z = U-μu

σU

z = 98 - 1125 241

z = -0602

144 -144 0 -0602

Valor estandarizado de

la muestra U

Regioacuten de aceptacioacuten

Estadiacutestica Administrativa II 47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras

Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular

Prueba de Wilcoxon de los rangos con signo

Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero

Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande

Prueba de Wilcoxon para contrastar datos pareados

El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 37: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

Estadiacutestica Administrativa II 33

Siacutembolo Nombre de la compantildeiacutea

AA Alcoa

ALD Allied Signal

AXP American Express

BA Boeing

CAT Caterpillar

CHV Chevron

C CitiGroup

DIS Disney

DD Dupont

EK Eastman Kodak

GE General Electric

GM General Motors

GT Goodyear Tire

HWP Hewlett-Packard

IBM International Business Machines

IP International Paper

JNJ Johnson amp Johnson

JPM JP Morgan Bank

KO Coca Cola

Figura 5 Compantildeiacuteas comprendidas en el Dow Jones

310 Iacutendice de produccioacuten industrial Es un iacutendice agregado de cantidadhellip y es una medida de la produccioacuten de faacutebricas minas y plantas eleacutectricas y gaseras del paiacutes Por lo tanto es un indicador importante del estado de la economiacutea Se trata de un promedio ponderado de relativos de cantidad El Iacutendice de Produccioacuten Industrial (IPI) es un indicador coyuntural que mide la evolucioacuten mensual de la actividad productiva de las ramas industriales excluida la construccioacuten contenidas en la Clasificacioacuten Nacional de Actividades Econoacutemicas 2009 (CNAE-2009) Mide por tanto la evolucioacuten conjunta de la cantidad y de la calidad eliminando la influencia de los precios Para su obtencioacuten se realiza una encuesta continua de periodicidad mensual que investiga todos los meses maacutes de 13200 establecimientos

Praacutectica 2

992256 Con datos investigados en revistas al consumidor o del Banco de Meacutexico

elaboraraacute los iacutendices simples de precio y cantidad asiacute como agregado

de precios

Estadiacutestica Administrativa II 34

Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida

bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)

42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten

Las principales pruebas no parameacutetricas son las siguientes

bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher

Estadiacutestica Administrativa II 35

bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon

Caracteriacutesticas de algunas pruebas no parameacutetricas

1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos

2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten

3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal

4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados

5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc

6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica

Prueba Caracteriacutestica

Mann- Whitney 2 muestras independientes

Wilcoxon 2 muestras asociadas

Kruskal-Wallis + de 2 muestras independientes

Friedman + de 2 muestras asociadas

Tabla1 Caracteriacutesticas de pruebas no parameacutetricas

Estadiacutestica Administrativa II 36

Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media

Ventajas y desventajas de los meacutetodos parameacutetricos

Desventajas Ventajas bull Ignoran cierta cantidad de

informacioacuten bull No requieren la suposicioacuten de que

una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica

bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas

bull Generalmente es maacutes sencillo realizarlas y entenderlas

bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal

Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo

MHHHHM

1ra 2ra 3ra

Estadiacutestica Administrativa II 37

Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1

n2= nuacutemero de ocurrencias del tipo 2

r= nuacutemero de corridas

4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue

BABBBAAABBABBBBAAAABABAABBBAABAAAABBA

BBAAAABBABBBBAABBABAABB

Valores de la prueba

n1= 29

n2= 31

r= 29

4322 Distribucioacuten de muestreo del estadiacutestico r

El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba

Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente

Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1

n1+n2

Estadiacutestica Administrativa II 38

μr = 2(29)(31) +1

29+31

μr = 1798 +1 60

μr = 2997 +1

μr = 3097

Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)

(n1+n2)2(n1+n2-1)

σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)

σr= (1798) (1738)

(60)2(59)

σr= 1471

σr= 384

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-24 643 14-25 643 14-26 643 14-27 644 14-28 644

Estadiacutestica Administrativa II 39

44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica

Ejemplo

Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado

Miembro del panel Calificacioacuten para

conferencias grandes

Calificacioacuten para

sesiones pequentildeas

Signo de la calificacioacuten

Evaluacioacuten de los dos tipos de

clases

1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -

6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +

La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)

Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20

Estadiacutestica Administrativa II 40

Establecimiento de las hipoacutetesis

Ho p = 05

H1 p ne 05

Se consideran la posibilidades solamente de signos + y - (9+6 =15)

p Ho = 05

q H0 = 05

n= 15

p= 0600 (915)

q= 0400 (615)

Prueba de hipoacutetesis de que no hay diferencia

Error estaacutendar del la proporcioacuten

σp= pq n

σp= (05)(05) 15

σp= 0129

0025

0

0475 del aacuterea

Valor criacutetico Z=-196

Regioacuten de aceptacioacuten

0025

0475 del aacuterea

Valor criacutetico Z=196

Estadiacutestica Administrativa II 41

45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten

Procedimiento de la prueba de rangos con signo de Wilcoxon

Paso1 Para cada par de datos calcule la diferencia d restando el segundo

valor del primero Guarde los signos pero descarte cualquier par para el que

d=0

Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de

la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango

correspondiente Cuando las diferencias tengan el mismo valor numeacuterico

asiacutegneles la media de los rangos implicados en el empate

Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino

Esto es inserte aquellos signos que se ignoraron e el paso dos

Paso 4 Calcule la suma de los valores absolutos de los rangos negativos

Tambieacuten la suma de los rangos positivos

Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon

en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el

procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos

sumas

Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la

diferencia d no es 0

Estadiacutestica Administrativa II 42

Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el

tamantildeo muestral

Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos

muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica

esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico

Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente

2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha

Notacioacuten

T= la maacutes pequentildea de las siguientes dos sumas

1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0

La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T

Estadiacutestica Administrativa II 43

46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2

Rango Calificacioacuten Plantel

1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S

10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S

Estadiacutestica Administrativa II 44

30 1600 S

Estadiacutestica Administrativa II 45

Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500

n1= 15 n2= 15 R1= 247 R2= 218

Estadiacutestico U

U = n1n2 + n1(n1 +1) -R1 2

U= (15)(15) + (15)(16) -247 2

U= 225+120-247

U= 98

Media de la distribucioacuten muestral U

μu = n1n2

2

μu = (15)(15)

2

μu =1125

Estadiacutestica Administrativa II 46

Estadiacutestico U

σU = n1n2 + (n1n2 +1)

12

σU = (15)(15)(15+15+1)

12

σU = 6975 12

σU = 58125

σU = 241

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2

α= 015

Estandarizacioacuten del estadiacutestico U

z = U-μu

σU

z = 98 - 1125 241

z = -0602

144 -144 0 -0602

Valor estandarizado de

la muestra U

Regioacuten de aceptacioacuten

Estadiacutestica Administrativa II 47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras

Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular

Prueba de Wilcoxon de los rangos con signo

Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero

Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande

Prueba de Wilcoxon para contrastar datos pareados

El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 38: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

Estadiacutestica Administrativa II 34

Unidad 4 Estadiacutestica no parameacutetrica 41 Escala de medicioacuten Las escalas de medicioacuten son una sucesioacuten de medidas que permiten organizar datos en orden jeraacuterquico Las escalas de medicioacuten pueden ser clasificadas de acuerdo a una degradacioacuten de las caracteriacutesticas de las variables Estas escalas son nominales ordinales o racionales Seguacuten pasa de una escala a otra el atributo o la cualidad aumenta Las escalas de medicioacuten ofrecen informacioacuten sobre la clasificacioacuten de variables discretas o continuas Toda vez que dicha clasificacioacuten determina la seleccioacuten de la graacutefica adecuada En la estadiacutestica descriptiva y con el fin de realizar pruebas de significancia las variables se clasifican de la siguiente manera de acuerdo con su nivel de medida

bull Nominal (tambieacuten categoacuterica o discreta) bull Ordinal bull De intervalo (continua) bull De razoacuten o racional (continua)

42 Meacutetodos estadiacutesticos contra no parameacutetricos Las teacutecnicas estadiacutesticas de estimacioacuten de paraacutemetros intervalos de confianza y prueba de hipoacutetesis son en conjunto denominadas estadiacutestica parameacutetrica y son aplicadas baacutesicamente a variables contiacutenuas Estas teacutecnicas se basan en especificar una forma de distribucioacuten de la variable aleatoria y de los estadiacutesticos derivados de los datos En estadiacutestica parameacutetrica se asume que la poblacioacuten de la cual la muestra es extraiacuteda es normal o aproximadamente normal Esta propiedad es necesaria para que la prueba de hipoacutetesis sea vaacutelida Sin embargo en un gran nuacutemero de casos no se puede determinar la distribucioacuten original ni la distribucioacuten de los estadiacutesticos por lo que en realidad no tenemos paraacutemetros a estimar Tenemos solo distribuciones que comparar Esto se llama estadiacutestica no-parameacutetrica Las hipoacutetesis de una prueba no parameacutetrica se refiere a algo distinto del valor de un paraacutemetro de la poblacioacuten

Las principales pruebas no parameacutetricas son las siguientes

bull Prueba χsup2 de Pearson bull Prueba binomial bull Prueba de Anderson-Darling bull Prueba de Cochran bull Prueba de Cohen kappa bull Prueba de Fisher

Estadiacutestica Administrativa II 35

bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon

Caracteriacutesticas de algunas pruebas no parameacutetricas

1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos

2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten

3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal

4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados

5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc

6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica

Prueba Caracteriacutestica

Mann- Whitney 2 muestras independientes

Wilcoxon 2 muestras asociadas

Kruskal-Wallis + de 2 muestras independientes

Friedman + de 2 muestras asociadas

Tabla1 Caracteriacutesticas de pruebas no parameacutetricas

Estadiacutestica Administrativa II 36

Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media

Ventajas y desventajas de los meacutetodos parameacutetricos

Desventajas Ventajas bull Ignoran cierta cantidad de

informacioacuten bull No requieren la suposicioacuten de que

una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica

bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas

bull Generalmente es maacutes sencillo realizarlas y entenderlas

bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal

Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo

MHHHHM

1ra 2ra 3ra

Estadiacutestica Administrativa II 37

Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1

n2= nuacutemero de ocurrencias del tipo 2

r= nuacutemero de corridas

4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue

BABBBAAABBABBBBAAAABABAABBBAABAAAABBA

BBAAAABBABBBBAABBABAABB

Valores de la prueba

n1= 29

n2= 31

r= 29

4322 Distribucioacuten de muestreo del estadiacutestico r

El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba

Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente

Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1

n1+n2

Estadiacutestica Administrativa II 38

μr = 2(29)(31) +1

29+31

μr = 1798 +1 60

μr = 2997 +1

μr = 3097

Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)

(n1+n2)2(n1+n2-1)

σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)

σr= (1798) (1738)

(60)2(59)

σr= 1471

σr= 384

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-24 643 14-25 643 14-26 643 14-27 644 14-28 644

Estadiacutestica Administrativa II 39

44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica

Ejemplo

Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado

Miembro del panel Calificacioacuten para

conferencias grandes

Calificacioacuten para

sesiones pequentildeas

Signo de la calificacioacuten

Evaluacioacuten de los dos tipos de

clases

1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -

6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +

La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)

Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20

Estadiacutestica Administrativa II 40

Establecimiento de las hipoacutetesis

Ho p = 05

H1 p ne 05

Se consideran la posibilidades solamente de signos + y - (9+6 =15)

p Ho = 05

q H0 = 05

n= 15

p= 0600 (915)

q= 0400 (615)

Prueba de hipoacutetesis de que no hay diferencia

Error estaacutendar del la proporcioacuten

σp= pq n

σp= (05)(05) 15

σp= 0129

0025

0

0475 del aacuterea

Valor criacutetico Z=-196

Regioacuten de aceptacioacuten

0025

0475 del aacuterea

Valor criacutetico Z=196

Estadiacutestica Administrativa II 41

45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten

Procedimiento de la prueba de rangos con signo de Wilcoxon

Paso1 Para cada par de datos calcule la diferencia d restando el segundo

valor del primero Guarde los signos pero descarte cualquier par para el que

d=0

Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de

la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango

correspondiente Cuando las diferencias tengan el mismo valor numeacuterico

asiacutegneles la media de los rangos implicados en el empate

Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino

Esto es inserte aquellos signos que se ignoraron e el paso dos

Paso 4 Calcule la suma de los valores absolutos de los rangos negativos

Tambieacuten la suma de los rangos positivos

Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon

en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el

procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos

sumas

Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la

diferencia d no es 0

Estadiacutestica Administrativa II 42

Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el

tamantildeo muestral

Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos

muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica

esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico

Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente

2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha

Notacioacuten

T= la maacutes pequentildea de las siguientes dos sumas

1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0

La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T

Estadiacutestica Administrativa II 43

46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2

Rango Calificacioacuten Plantel

1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S

10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S

Estadiacutestica Administrativa II 44

30 1600 S

Estadiacutestica Administrativa II 45

Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500

n1= 15 n2= 15 R1= 247 R2= 218

Estadiacutestico U

U = n1n2 + n1(n1 +1) -R1 2

U= (15)(15) + (15)(16) -247 2

U= 225+120-247

U= 98

Media de la distribucioacuten muestral U

μu = n1n2

2

μu = (15)(15)

2

μu =1125

Estadiacutestica Administrativa II 46

Estadiacutestico U

σU = n1n2 + (n1n2 +1)

12

σU = (15)(15)(15+15+1)

12

σU = 6975 12

σU = 58125

σU = 241

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2

α= 015

Estandarizacioacuten del estadiacutestico U

z = U-μu

σU

z = 98 - 1125 241

z = -0602

144 -144 0 -0602

Valor estandarizado de

la muestra U

Regioacuten de aceptacioacuten

Estadiacutestica Administrativa II 47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras

Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular

Prueba de Wilcoxon de los rangos con signo

Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero

Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande

Prueba de Wilcoxon para contrastar datos pareados

El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 39: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

Estadiacutestica Administrativa II 35

bull Prueba de Friedman bull Prueba de Kendall bull Prueba de Kolmogoacuterov-Smirnov bull Prueba de Kruskal-Wallis bull Prueba de Kuiper bull Prueba de Mann-Whitney o prueba de Wilcoxon bull Prueba de McNemar bull Prueba de la mediana bull Prueba de Siegel-Tukey bull Coeficiente de correlacioacuten de Spearman bull Tablas de contingencia bull Prueba de Wald-Wolfowitz bull Prueba de los signos de Wilcoxon

Caracteriacutesticas de algunas pruebas no parameacutetricas

1 Prueba de signo para datos pares los signos positivo o negativo sustituyen a valores cuantitativos

2 Prueba de suma de rangos tambieacuten llamada prueba U de Mann-Whitney que puede usarse para determinar si dos muestras independientes de sacaron de la misma poblacioacuten

3 Prueba de suma de rangos Kruskal ndash Wallis generaliza el anaacutelisis de varianza para poder prescindir de la suposicioacuten de que las poblaciones tienen distribucioacuten normal

4 Prueba de corridas de una sola muestra es un meacutetodo para determinar la aleatoriedad con la que se han seleccionado los elementos muestreados

5 Correlacioacuten de rango meacutetodo para hacer el anaacutelisis de correlacioacuten cuando no se dispone de los datos para usar la forma numeacuterica pero cuando la informacioacuten es suficiente para clasificar los datos como primero segundo tercero etc

6 Prueba de Kolmogorov meacutetodo para determinar la bondad de ajuste entre una muestra observada y una distribucioacuten de probabilidad teoacuterica

Prueba Caracteriacutestica

Mann- Whitney 2 muestras independientes

Wilcoxon 2 muestras asociadas

Kruskal-Wallis + de 2 muestras independientes

Friedman + de 2 muestras asociadas

Tabla1 Caracteriacutesticas de pruebas no parameacutetricas

Estadiacutestica Administrativa II 36

Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media

Ventajas y desventajas de los meacutetodos parameacutetricos

Desventajas Ventajas bull Ignoran cierta cantidad de

informacioacuten bull No requieren la suposicioacuten de que

una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica

bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas

bull Generalmente es maacutes sencillo realizarlas y entenderlas

bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal

Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo

MHHHHM

1ra 2ra 3ra

Estadiacutestica Administrativa II 37

Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1

n2= nuacutemero de ocurrencias del tipo 2

r= nuacutemero de corridas

4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue

BABBBAAABBABBBBAAAABABAABBBAABAAAABBA

BBAAAABBABBBBAABBABAABB

Valores de la prueba

n1= 29

n2= 31

r= 29

4322 Distribucioacuten de muestreo del estadiacutestico r

El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba

Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente

Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1

n1+n2

Estadiacutestica Administrativa II 38

μr = 2(29)(31) +1

29+31

μr = 1798 +1 60

μr = 2997 +1

μr = 3097

Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)

(n1+n2)2(n1+n2-1)

σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)

σr= (1798) (1738)

(60)2(59)

σr= 1471

σr= 384

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-24 643 14-25 643 14-26 643 14-27 644 14-28 644

Estadiacutestica Administrativa II 39

44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica

Ejemplo

Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado

Miembro del panel Calificacioacuten para

conferencias grandes

Calificacioacuten para

sesiones pequentildeas

Signo de la calificacioacuten

Evaluacioacuten de los dos tipos de

clases

1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -

6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +

La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)

Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20

Estadiacutestica Administrativa II 40

Establecimiento de las hipoacutetesis

Ho p = 05

H1 p ne 05

Se consideran la posibilidades solamente de signos + y - (9+6 =15)

p Ho = 05

q H0 = 05

n= 15

p= 0600 (915)

q= 0400 (615)

Prueba de hipoacutetesis de que no hay diferencia

Error estaacutendar del la proporcioacuten

σp= pq n

σp= (05)(05) 15

σp= 0129

0025

0

0475 del aacuterea

Valor criacutetico Z=-196

Regioacuten de aceptacioacuten

0025

0475 del aacuterea

Valor criacutetico Z=196

Estadiacutestica Administrativa II 41

45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten

Procedimiento de la prueba de rangos con signo de Wilcoxon

Paso1 Para cada par de datos calcule la diferencia d restando el segundo

valor del primero Guarde los signos pero descarte cualquier par para el que

d=0

Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de

la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango

correspondiente Cuando las diferencias tengan el mismo valor numeacuterico

asiacutegneles la media de los rangos implicados en el empate

Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino

Esto es inserte aquellos signos que se ignoraron e el paso dos

Paso 4 Calcule la suma de los valores absolutos de los rangos negativos

Tambieacuten la suma de los rangos positivos

Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon

en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el

procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos

sumas

Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la

diferencia d no es 0

Estadiacutestica Administrativa II 42

Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el

tamantildeo muestral

Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos

muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica

esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico

Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente

2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha

Notacioacuten

T= la maacutes pequentildea de las siguientes dos sumas

1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0

La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T

Estadiacutestica Administrativa II 43

46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2

Rango Calificacioacuten Plantel

1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S

10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S

Estadiacutestica Administrativa II 44

30 1600 S

Estadiacutestica Administrativa II 45

Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500

n1= 15 n2= 15 R1= 247 R2= 218

Estadiacutestico U

U = n1n2 + n1(n1 +1) -R1 2

U= (15)(15) + (15)(16) -247 2

U= 225+120-247

U= 98

Media de la distribucioacuten muestral U

μu = n1n2

2

μu = (15)(15)

2

μu =1125

Estadiacutestica Administrativa II 46

Estadiacutestico U

σU = n1n2 + (n1n2 +1)

12

σU = (15)(15)(15+15+1)

12

σU = 6975 12

σU = 58125

σU = 241

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2

α= 015

Estandarizacioacuten del estadiacutestico U

z = U-μu

σU

z = 98 - 1125 241

z = -0602

144 -144 0 -0602

Valor estandarizado de

la muestra U

Regioacuten de aceptacioacuten

Estadiacutestica Administrativa II 47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras

Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular

Prueba de Wilcoxon de los rangos con signo

Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero

Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande

Prueba de Wilcoxon para contrastar datos pareados

El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 40: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

Estadiacutestica Administrativa II 36

Las pruebas no parameacutetricas no requieren asumir normalidad de la poblacioacuten y la mayoriacutea se basan en el ordenamiento de los datos El paraacutemetro que se usa para hacer las pruebas estadiacutesticas es la Mediana y Media

Ventajas y desventajas de los meacutetodos parameacutetricos

Desventajas Ventajas bull Ignoran cierta cantidad de

informacioacuten bull No requieren la suposicioacuten de que

una poblacioacuten estaacute distribuida en forma de curva normal u otra forma especiacutefica

bull A menudo no son tan eficientes o claras como las pruebas parameacutetricas

bull Generalmente es maacutes sencillo realizarlas y entenderlas

bull Algunas veces no se requiere un ordenamiento o clasificacioacuten formal

Tabla1 Ventajas y desventajas de los meacutetodos no parameacutetricas 43 Prueba de corridas para aleatoriedad 431 Concepto de aleatoriedad Aleatorio se asocia a todo proceso cuyo resultado no es previsible maacutes que en razoacuten de la intervencioacuten del azar El teacutermino aleatoriedad se usa a menudo como sinoacutenimo con un nuacutemero de propiedades estadiacutesticas medibles tales como la carencia de tendencias o correlacioacuten El resultado de todo suceso aleatorio no puede determinarse en ninguacuten caso antes de que este se produzca El estudio de los fenoacutemenos aleatorios queda dentro del aacutembito de la teoriacutea de la probabilidad y en un marco maacutes amplio en el de la estadiacutestica 432 Teoriacutea de corridas Una corrida es una secuencia de ocurrencias ideacutenticas precedidas y seguidas de ocurrencias diferentes Ejemplo

MHHHHM

1ra 2ra 3ra

Estadiacutestica Administrativa II 37

Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1

n2= nuacutemero de ocurrencias del tipo 2

r= nuacutemero de corridas

4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue

BABBBAAABBABBBBAAAABABAABBBAABAAAABBA

BBAAAABBABBBBAABBABAABB

Valores de la prueba

n1= 29

n2= 31

r= 29

4322 Distribucioacuten de muestreo del estadiacutestico r

El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba

Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente

Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1

n1+n2

Estadiacutestica Administrativa II 38

μr = 2(29)(31) +1

29+31

μr = 1798 +1 60

μr = 2997 +1

μr = 3097

Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)

(n1+n2)2(n1+n2-1)

σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)

σr= (1798) (1738)

(60)2(59)

σr= 1471

σr= 384

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-24 643 14-25 643 14-26 643 14-27 644 14-28 644

Estadiacutestica Administrativa II 39

44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica

Ejemplo

Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado

Miembro del panel Calificacioacuten para

conferencias grandes

Calificacioacuten para

sesiones pequentildeas

Signo de la calificacioacuten

Evaluacioacuten de los dos tipos de

clases

1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -

6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +

La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)

Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20

Estadiacutestica Administrativa II 40

Establecimiento de las hipoacutetesis

Ho p = 05

H1 p ne 05

Se consideran la posibilidades solamente de signos + y - (9+6 =15)

p Ho = 05

q H0 = 05

n= 15

p= 0600 (915)

q= 0400 (615)

Prueba de hipoacutetesis de que no hay diferencia

Error estaacutendar del la proporcioacuten

σp= pq n

σp= (05)(05) 15

σp= 0129

0025

0

0475 del aacuterea

Valor criacutetico Z=-196

Regioacuten de aceptacioacuten

0025

0475 del aacuterea

Valor criacutetico Z=196

Estadiacutestica Administrativa II 41

45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten

Procedimiento de la prueba de rangos con signo de Wilcoxon

Paso1 Para cada par de datos calcule la diferencia d restando el segundo

valor del primero Guarde los signos pero descarte cualquier par para el que

d=0

Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de

la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango

correspondiente Cuando las diferencias tengan el mismo valor numeacuterico

asiacutegneles la media de los rangos implicados en el empate

Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino

Esto es inserte aquellos signos que se ignoraron e el paso dos

Paso 4 Calcule la suma de los valores absolutos de los rangos negativos

Tambieacuten la suma de los rangos positivos

Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon

en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el

procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos

sumas

Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la

diferencia d no es 0

Estadiacutestica Administrativa II 42

Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el

tamantildeo muestral

Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos

muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica

esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico

Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente

2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha

Notacioacuten

T= la maacutes pequentildea de las siguientes dos sumas

1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0

La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T

Estadiacutestica Administrativa II 43

46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2

Rango Calificacioacuten Plantel

1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S

10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S

Estadiacutestica Administrativa II 44

30 1600 S

Estadiacutestica Administrativa II 45

Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500

n1= 15 n2= 15 R1= 247 R2= 218

Estadiacutestico U

U = n1n2 + n1(n1 +1) -R1 2

U= (15)(15) + (15)(16) -247 2

U= 225+120-247

U= 98

Media de la distribucioacuten muestral U

μu = n1n2

2

μu = (15)(15)

2

μu =1125

Estadiacutestica Administrativa II 46

Estadiacutestico U

σU = n1n2 + (n1n2 +1)

12

σU = (15)(15)(15+15+1)

12

σU = 6975 12

σU = 58125

σU = 241

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2

α= 015

Estandarizacioacuten del estadiacutestico U

z = U-μu

σU

z = 98 - 1125 241

z = -0602

144 -144 0 -0602

Valor estandarizado de

la muestra U

Regioacuten de aceptacioacuten

Estadiacutestica Administrativa II 47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras

Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular

Prueba de Wilcoxon de los rangos con signo

Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero

Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande

Prueba de Wilcoxon para contrastar datos pareados

El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 41: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

Estadiacutestica Administrativa II 37

Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes siacutembolos n1= nuacutemero de ocurrencias del tipo 1

n2= nuacutemero de ocurrencias del tipo 2

r= nuacutemero de corridas

4321 Prueba de corridas de una sola muestra Un fabricante de cereal para el desayuno usa una maacutequina para introducir aleatoriamente uno de los dos tipos de muntildeecos en cada caja La compantildeiacutea desea una aleatoriedad tal que no todos los nintildeos de un vecindario terminen con el mismo muntildeeco Los probadores eligen muestras de 60 cajas sucesivas para ver si la maacutequina estaacute mezclando adecuadamente los dos tipos de muntildeecos Usado los siacutembolos A y B para representar los dos tipos de muntildeecos un probador reportoacute que uno de estos lotes se presentoacute como sigue

BABBBAAABBABBBBAAAABABAABBBAABAAAABBA

BBAAAABBABBBBAABBABAABB

Valores de la prueba

n1= 29

n2= 31

r= 29

4322 Distribucioacuten de muestreo del estadiacutestico r

El nuacutemero de corridas r es un estadiacutestico con su propia distribucioacuten de muestreo especial y su propia prueba

Una prueba de corridas de una sola muestra estaacute basada en la idea de que muy pocas o demasiadas corridas muestran que los elementos no fueron elegidos aleatoriamente

Media de la distribucioacuten muestral del estadiacutestico r μr=2n1n2 +1

n1+n2

Estadiacutestica Administrativa II 38

μr = 2(29)(31) +1

29+31

μr = 1798 +1 60

μr = 2997 +1

μr = 3097

Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)

(n1+n2)2(n1+n2-1)

σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)

σr= (1798) (1738)

(60)2(59)

σr= 1471

σr= 384

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-24 643 14-25 643 14-26 643 14-27 644 14-28 644

Estadiacutestica Administrativa II 39

44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica

Ejemplo

Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado

Miembro del panel Calificacioacuten para

conferencias grandes

Calificacioacuten para

sesiones pequentildeas

Signo de la calificacioacuten

Evaluacioacuten de los dos tipos de

clases

1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -

6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +

La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)

Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20

Estadiacutestica Administrativa II 40

Establecimiento de las hipoacutetesis

Ho p = 05

H1 p ne 05

Se consideran la posibilidades solamente de signos + y - (9+6 =15)

p Ho = 05

q H0 = 05

n= 15

p= 0600 (915)

q= 0400 (615)

Prueba de hipoacutetesis de que no hay diferencia

Error estaacutendar del la proporcioacuten

σp= pq n

σp= (05)(05) 15

σp= 0129

0025

0

0475 del aacuterea

Valor criacutetico Z=-196

Regioacuten de aceptacioacuten

0025

0475 del aacuterea

Valor criacutetico Z=196

Estadiacutestica Administrativa II 41

45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten

Procedimiento de la prueba de rangos con signo de Wilcoxon

Paso1 Para cada par de datos calcule la diferencia d restando el segundo

valor del primero Guarde los signos pero descarte cualquier par para el que

d=0

Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de

la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango

correspondiente Cuando las diferencias tengan el mismo valor numeacuterico

asiacutegneles la media de los rangos implicados en el empate

Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino

Esto es inserte aquellos signos que se ignoraron e el paso dos

Paso 4 Calcule la suma de los valores absolutos de los rangos negativos

Tambieacuten la suma de los rangos positivos

Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon

en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el

procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos

sumas

Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la

diferencia d no es 0

Estadiacutestica Administrativa II 42

Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el

tamantildeo muestral

Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos

muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica

esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico

Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente

2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha

Notacioacuten

T= la maacutes pequentildea de las siguientes dos sumas

1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0

La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T

Estadiacutestica Administrativa II 43

46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2

Rango Calificacioacuten Plantel

1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S

10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S

Estadiacutestica Administrativa II 44

30 1600 S

Estadiacutestica Administrativa II 45

Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500

n1= 15 n2= 15 R1= 247 R2= 218

Estadiacutestico U

U = n1n2 + n1(n1 +1) -R1 2

U= (15)(15) + (15)(16) -247 2

U= 225+120-247

U= 98

Media de la distribucioacuten muestral U

μu = n1n2

2

μu = (15)(15)

2

μu =1125

Estadiacutestica Administrativa II 46

Estadiacutestico U

σU = n1n2 + (n1n2 +1)

12

σU = (15)(15)(15+15+1)

12

σU = 6975 12

σU = 58125

σU = 241

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2

α= 015

Estandarizacioacuten del estadiacutestico U

z = U-μu

σU

z = 98 - 1125 241

z = -0602

144 -144 0 -0602

Valor estandarizado de

la muestra U

Regioacuten de aceptacioacuten

Estadiacutestica Administrativa II 47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras

Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular

Prueba de Wilcoxon de los rangos con signo

Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero

Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande

Prueba de Wilcoxon para contrastar datos pareados

El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 42: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

Estadiacutestica Administrativa II 38

μr = 2(29)(31) +1

29+31

μr = 1798 +1 60

μr = 2997 +1

μr = 3097

Error estaacutendar del estadiacutestico r σr= 2n1n2(2n1n2- n1- n2)

(n1+n2)2(n1+n2-1)

σr= 2(29)(31) ( 2(29)(31) - 29- 31) (29+31)2(29+31-1)

σr= (1798) (1738)

(60)2(59)

σr= 1471

σr= 384

Ejercicios Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-24 643 14-25 643 14-26 643 14-27 644 14-28 644

Estadiacutestica Administrativa II 39

44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica

Ejemplo

Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado

Miembro del panel Calificacioacuten para

conferencias grandes

Calificacioacuten para

sesiones pequentildeas

Signo de la calificacioacuten

Evaluacioacuten de los dos tipos de

clases

1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -

6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +

La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)

Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20

Estadiacutestica Administrativa II 40

Establecimiento de las hipoacutetesis

Ho p = 05

H1 p ne 05

Se consideran la posibilidades solamente de signos + y - (9+6 =15)

p Ho = 05

q H0 = 05

n= 15

p= 0600 (915)

q= 0400 (615)

Prueba de hipoacutetesis de que no hay diferencia

Error estaacutendar del la proporcioacuten

σp= pq n

σp= (05)(05) 15

σp= 0129

0025

0

0475 del aacuterea

Valor criacutetico Z=-196

Regioacuten de aceptacioacuten

0025

0475 del aacuterea

Valor criacutetico Z=196

Estadiacutestica Administrativa II 41

45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten

Procedimiento de la prueba de rangos con signo de Wilcoxon

Paso1 Para cada par de datos calcule la diferencia d restando el segundo

valor del primero Guarde los signos pero descarte cualquier par para el que

d=0

Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de

la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango

correspondiente Cuando las diferencias tengan el mismo valor numeacuterico

asiacutegneles la media de los rangos implicados en el empate

Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino

Esto es inserte aquellos signos que se ignoraron e el paso dos

Paso 4 Calcule la suma de los valores absolutos de los rangos negativos

Tambieacuten la suma de los rangos positivos

Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon

en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el

procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos

sumas

Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la

diferencia d no es 0

Estadiacutestica Administrativa II 42

Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el

tamantildeo muestral

Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos

muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica

esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico

Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente

2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha

Notacioacuten

T= la maacutes pequentildea de las siguientes dos sumas

1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0

La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T

Estadiacutestica Administrativa II 43

46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2

Rango Calificacioacuten Plantel

1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S

10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S

Estadiacutestica Administrativa II 44

30 1600 S

Estadiacutestica Administrativa II 45

Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500

n1= 15 n2= 15 R1= 247 R2= 218

Estadiacutestico U

U = n1n2 + n1(n1 +1) -R1 2

U= (15)(15) + (15)(16) -247 2

U= 225+120-247

U= 98

Media de la distribucioacuten muestral U

μu = n1n2

2

μu = (15)(15)

2

μu =1125

Estadiacutestica Administrativa II 46

Estadiacutestico U

σU = n1n2 + (n1n2 +1)

12

σU = (15)(15)(15+15+1)

12

σU = 6975 12

σU = 58125

σU = 241

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2

α= 015

Estandarizacioacuten del estadiacutestico U

z = U-μu

σU

z = 98 - 1125 241

z = -0602

144 -144 0 -0602

Valor estandarizado de

la muestra U

Regioacuten de aceptacioacuten

Estadiacutestica Administrativa II 47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras

Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular

Prueba de Wilcoxon de los rangos con signo

Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero

Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande

Prueba de Wilcoxon para contrastar datos pareados

El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 43: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

Estadiacutestica Administrativa II 39

44 Una muestra prueba de signos Una de las pruebas no parameacutetricas maacutes faacuteciles es la de prueba de signos Su nombre se debe a que estaacute basada en la direccioacuten (o signo de maacutes o menos) de un par de observaciones y no en su magnitud numeacuterica

Ejemplo

Se considera un panel de prueba de 40 estudiantes que evaluacutea la efectividad de dos tipos de clases Conferencias grandes de profesores de tiempo completo sesiones pequentildeas con ayudantes de posgrado

Miembro del panel Calificacioacuten para

conferencias grandes

Calificacioacuten para

sesiones pequentildeas

Signo de la calificacioacuten

Evaluacioacuten de los dos tipos de

clases

1 2 3 - 2 1 2 - 3 4 2 + 4 4 3 + 5 3 4 -

6 3 2 + 7 4 2 + 8 2 1 + 9 4 3 + 10 1 1 0 11 3 2 + 12 3 3 0 13 4 4 0 14 4 4 0 15 4 3 + 16 1 2 - 17 1 3 - 18 2 2 0 19 2 3 - 20 4 3 +

La calificacioacuten 4 es excelente y la 1 es mala El signo + significa que el estudiante prefiere las conferencias grandes un signo menos indica una preferencia por sesiones pequentildeas un 0 representa un empate (sin preferencia)

Nuacutemero de signos + 9 Nuacutemero de signos - 6 Nuacutemero de ceros 5 Tamantildeo total de la muestra 20

Estadiacutestica Administrativa II 40

Establecimiento de las hipoacutetesis

Ho p = 05

H1 p ne 05

Se consideran la posibilidades solamente de signos + y - (9+6 =15)

p Ho = 05

q H0 = 05

n= 15

p= 0600 (915)

q= 0400 (615)

Prueba de hipoacutetesis de que no hay diferencia

Error estaacutendar del la proporcioacuten

σp= pq n

σp= (05)(05) 15

σp= 0129

0025

0

0475 del aacuterea

Valor criacutetico Z=-196

Regioacuten de aceptacioacuten

0025

0475 del aacuterea

Valor criacutetico Z=196

Estadiacutestica Administrativa II 41

45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten

Procedimiento de la prueba de rangos con signo de Wilcoxon

Paso1 Para cada par de datos calcule la diferencia d restando el segundo

valor del primero Guarde los signos pero descarte cualquier par para el que

d=0

Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de

la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango

correspondiente Cuando las diferencias tengan el mismo valor numeacuterico

asiacutegneles la media de los rangos implicados en el empate

Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino

Esto es inserte aquellos signos que se ignoraron e el paso dos

Paso 4 Calcule la suma de los valores absolutos de los rangos negativos

Tambieacuten la suma de los rangos positivos

Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon

en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el

procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos

sumas

Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la

diferencia d no es 0

Estadiacutestica Administrativa II 42

Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el

tamantildeo muestral

Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos

muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica

esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico

Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente

2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha

Notacioacuten

T= la maacutes pequentildea de las siguientes dos sumas

1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0

La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T

Estadiacutestica Administrativa II 43

46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2

Rango Calificacioacuten Plantel

1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S

10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S

Estadiacutestica Administrativa II 44

30 1600 S

Estadiacutestica Administrativa II 45

Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500

n1= 15 n2= 15 R1= 247 R2= 218

Estadiacutestico U

U = n1n2 + n1(n1 +1) -R1 2

U= (15)(15) + (15)(16) -247 2

U= 225+120-247

U= 98

Media de la distribucioacuten muestral U

μu = n1n2

2

μu = (15)(15)

2

μu =1125

Estadiacutestica Administrativa II 46

Estadiacutestico U

σU = n1n2 + (n1n2 +1)

12

σU = (15)(15)(15+15+1)

12

σU = 6975 12

σU = 58125

σU = 241

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2

α= 015

Estandarizacioacuten del estadiacutestico U

z = U-μu

σU

z = 98 - 1125 241

z = -0602

144 -144 0 -0602

Valor estandarizado de

la muestra U

Regioacuten de aceptacioacuten

Estadiacutestica Administrativa II 47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras

Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular

Prueba de Wilcoxon de los rangos con signo

Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero

Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande

Prueba de Wilcoxon para contrastar datos pareados

El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 44: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

Estadiacutestica Administrativa II 40

Establecimiento de las hipoacutetesis

Ho p = 05

H1 p ne 05

Se consideran la posibilidades solamente de signos + y - (9+6 =15)

p Ho = 05

q H0 = 05

n= 15

p= 0600 (915)

q= 0400 (615)

Prueba de hipoacutetesis de que no hay diferencia

Error estaacutendar del la proporcioacuten

σp= pq n

σp= (05)(05) 15

σp= 0129

0025

0

0475 del aacuterea

Valor criacutetico Z=-196

Regioacuten de aceptacioacuten

0025

0475 del aacuterea

Valor criacutetico Z=196

Estadiacutestica Administrativa II 41

45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten

Procedimiento de la prueba de rangos con signo de Wilcoxon

Paso1 Para cada par de datos calcule la diferencia d restando el segundo

valor del primero Guarde los signos pero descarte cualquier par para el que

d=0

Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de

la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango

correspondiente Cuando las diferencias tengan el mismo valor numeacuterico

asiacutegneles la media de los rangos implicados en el empate

Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino

Esto es inserte aquellos signos que se ignoraron e el paso dos

Paso 4 Calcule la suma de los valores absolutos de los rangos negativos

Tambieacuten la suma de los rangos positivos

Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon

en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el

procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos

sumas

Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la

diferencia d no es 0

Estadiacutestica Administrativa II 42

Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el

tamantildeo muestral

Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos

muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica

esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico

Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente

2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha

Notacioacuten

T= la maacutes pequentildea de las siguientes dos sumas

1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0

La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T

Estadiacutestica Administrativa II 43

46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2

Rango Calificacioacuten Plantel

1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S

10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S

Estadiacutestica Administrativa II 44

30 1600 S

Estadiacutestica Administrativa II 45

Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500

n1= 15 n2= 15 R1= 247 R2= 218

Estadiacutestico U

U = n1n2 + n1(n1 +1) -R1 2

U= (15)(15) + (15)(16) -247 2

U= 225+120-247

U= 98

Media de la distribucioacuten muestral U

μu = n1n2

2

μu = (15)(15)

2

μu =1125

Estadiacutestica Administrativa II 46

Estadiacutestico U

σU = n1n2 + (n1n2 +1)

12

σU = (15)(15)(15+15+1)

12

σU = 6975 12

σU = 58125

σU = 241

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2

α= 015

Estandarizacioacuten del estadiacutestico U

z = U-μu

σU

z = 98 - 1125 241

z = -0602

144 -144 0 -0602

Valor estandarizado de

la muestra U

Regioacuten de aceptacioacuten

Estadiacutestica Administrativa II 47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras

Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular

Prueba de Wilcoxon de los rangos con signo

Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero

Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande

Prueba de Wilcoxon para contrastar datos pareados

El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 45: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

Estadiacutestica Administrativa II 41

45 Una muestra prueba de Wilcoxon Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza maacutes informacioacuten que la prueba de signos tiende a proporcionar conclusiones que reflejan mejor la verdadera naturaleza de los datos La prueba de rangos con signo de Wilcoxon es una prueba no parameacutetrica que utiliza rangos ordenaos de datos maestrales consistentes en datos apareados Se usa para probar las diferencias en las distribuciones poblacionales por lo que la hipoacutetesis nula y alternativa son las siguientes Ho las dos muestras provienen de poblaciones con la misma distribucioacuten H1 las dos muestras provienen de poblaciones con la misma distribucioacuten

Procedimiento de la prueba de rangos con signo de Wilcoxon

Paso1 Para cada par de datos calcule la diferencia d restando el segundo

valor del primero Guarde los signos pero descarte cualquier par para el que

d=0

Paso 2 Ignore los signos de las diferencias luego acomode las diferencias de

la maacutes baja a la maacutes alta y remplace las diferencias por el valor del rango

correspondiente Cuando las diferencias tengan el mismo valor numeacuterico

asiacutegneles la media de los rangos implicados en el empate

Paso 3 Adjunte a cada rango el si el signo de la diferencia de la que provino

Esto es inserte aquellos signos que se ignoraron e el paso dos

Paso 4 Calcule la suma de los valores absolutos de los rangos negativos

Tambieacuten la suma de los rangos positivos

Paso 5 Permita que T sea la maacutes pequentildea de las dos sumas que se calcularon

en el paso 4 Es posible utilizar cualquier suma aunque para simplificar el

procedimiento seleccionamos arbitrariamente la maacutes pequentildea de las dos

sumas

Paso 6 Permita que n sea el nuacutemero de pares de datos para los que la

diferencia d no es 0

Estadiacutestica Administrativa II 42

Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el

tamantildeo muestral

Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos

muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica

esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico

Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente

2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha

Notacioacuten

T= la maacutes pequentildea de las siguientes dos sumas

1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0

La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T

Estadiacutestica Administrativa II 43

46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2

Rango Calificacioacuten Plantel

1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S

10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S

Estadiacutestica Administrativa II 44

30 1600 S

Estadiacutestica Administrativa II 45

Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500

n1= 15 n2= 15 R1= 247 R2= 218

Estadiacutestico U

U = n1n2 + n1(n1 +1) -R1 2

U= (15)(15) + (15)(16) -247 2

U= 225+120-247

U= 98

Media de la distribucioacuten muestral U

μu = n1n2

2

μu = (15)(15)

2

μu =1125

Estadiacutestica Administrativa II 46

Estadiacutestico U

σU = n1n2 + (n1n2 +1)

12

σU = (15)(15)(15+15+1)

12

σU = 6975 12

σU = 58125

σU = 241

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2

α= 015

Estandarizacioacuten del estadiacutestico U

z = U-μu

σU

z = 98 - 1125 241

z = -0602

144 -144 0 -0602

Valor estandarizado de

la muestra U

Regioacuten de aceptacioacuten

Estadiacutestica Administrativa II 47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras

Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular

Prueba de Wilcoxon de los rangos con signo

Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero

Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande

Prueba de Wilcoxon para contrastar datos pareados

El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 46: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

Estadiacutestica Administrativa II 42

Paso 7 Determine el estadiacutestico de prueba y los valores criacuteticos con base en el

tamantildeo muestral

Paso 8 Cundo Plantee la conclusioacuten rechace la hipoacutetesis nula si los datos

muestrales le llevan a un estadiacutestico de prueba que estaacute en la regioacuten criacutetica

esto es cuando el estadiacutestico de prueba es menor que o igual al valor criacutetico

Supuestos 1 Los datos consisten en datos apareados que se seleccionaron aleatoriamente

2 La poblacioacuten de las diferencias (calculadas de los pares de datos) tiene una distribucioacuten que es aproximadamente simeacutetrica lo que quiere decir que la mitad izquierda de su histograma es aproximadamente una imagen de espejo de la mitad derecha

Notacioacuten

T= la maacutes pequentildea de las siguientes dos sumas

1 La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean 0

La suma de los rangos positivos de las diferencias d que no sean 0 Estadiacutestico de prueba Si n lt o igual a 30 el estadiacutestico de prueba es T

Estadiacutestica Administrativa II 43

46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2

Rango Calificacioacuten Plantel

1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S

10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S

Estadiacutestica Administrativa II 44

30 1600 S

Estadiacutestica Administrativa II 45

Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500

n1= 15 n2= 15 R1= 247 R2= 218

Estadiacutestico U

U = n1n2 + n1(n1 +1) -R1 2

U= (15)(15) + (15)(16) -247 2

U= 225+120-247

U= 98

Media de la distribucioacuten muestral U

μu = n1n2

2

μu = (15)(15)

2

μu =1125

Estadiacutestica Administrativa II 46

Estadiacutestico U

σU = n1n2 + (n1n2 +1)

12

σU = (15)(15)(15+15+1)

12

σU = 6975 12

σU = 58125

σU = 241

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2

α= 015

Estandarizacioacuten del estadiacutestico U

z = U-μu

σU

z = 98 - 1125 241

z = -0602

144 -144 0 -0602

Valor estandarizado de

la muestra U

Regioacuten de aceptacioacuten

Estadiacutestica Administrativa II 47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras

Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular

Prueba de Wilcoxon de los rangos con signo

Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero

Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande

Prueba de Wilcoxon para contrastar datos pareados

El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 47: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

Estadiacutestica Administrativa II 43

46 Dos muestras prueba de Mann-Whitney A esta prueba se le llama suma de rangos porque depende de los rangos o clasificaciones de las observaciones de muestra La prueba de Mann-Whitney se usa cuando se tienen dos poblaciones El uso de esta prueba permite determinar si las muestras independientes se obtuvieron de la misma poblacioacuten Simbologiacutea n1= nuacutemero de elementos de la muestra 1 n2= nuacutemero de elementos de la muestra 2 R1= suma de los rangos de los elementos de la muestra 1 R2= suma de los rangos de los elementos de la muestra 2

Rango Calificacioacuten Plantel

1 500 S 2 550 S 3 600 A 4 650 S 5 725 S 6 750 A 7 775 A 8 800 A 9 830 S

10 850 A 11 890 S 12 900 S 13 920 S 14 925 S 15 950 A 16 1000 A 17 1050 A 18 1100 A 19 1120 S 20 1140 S 21 1150 A 22 1200 A 23 1240 S 24 1250 A 25 1300 A 26 1360 S 27 1400 A 28 1500 A 29 1550 S

Estadiacutestica Administrativa II 44

30 1600 S

Estadiacutestica Administrativa II 45

Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500

n1= 15 n2= 15 R1= 247 R2= 218

Estadiacutestico U

U = n1n2 + n1(n1 +1) -R1 2

U= (15)(15) + (15)(16) -247 2

U= 225+120-247

U= 98

Media de la distribucioacuten muestral U

μu = n1n2

2

μu = (15)(15)

2

μu =1125

Estadiacutestica Administrativa II 46

Estadiacutestico U

σU = n1n2 + (n1n2 +1)

12

σU = (15)(15)(15+15+1)

12

σU = 6975 12

σU = 58125

σU = 241

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2

α= 015

Estandarizacioacuten del estadiacutestico U

z = U-μu

σU

z = 98 - 1125 241

z = -0602

144 -144 0 -0602

Valor estandarizado de

la muestra U

Regioacuten de aceptacioacuten

Estadiacutestica Administrativa II 47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras

Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular

Prueba de Wilcoxon de los rangos con signo

Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero

Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande

Prueba de Wilcoxon para contrastar datos pareados

El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 48: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

Estadiacutestica Administrativa II 44

30 1600 S

Estadiacutestica Administrativa II 45

Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500

n1= 15 n2= 15 R1= 247 R2= 218

Estadiacutestico U

U = n1n2 + n1(n1 +1) -R1 2

U= (15)(15) + (15)(16) -247 2

U= 225+120-247

U= 98

Media de la distribucioacuten muestral U

μu = n1n2

2

μu = (15)(15)

2

μu =1125

Estadiacutestica Administrativa II 46

Estadiacutestico U

σU = n1n2 + (n1n2 +1)

12

σU = (15)(15)(15+15+1)

12

σU = 6975 12

σU = 58125

σU = 241

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2

α= 015

Estandarizacioacuten del estadiacutestico U

z = U-μu

σU

z = 98 - 1125 241

z = -0602

144 -144 0 -0602

Valor estandarizado de

la muestra U

Regioacuten de aceptacioacuten

Estadiacutestica Administrativa II 47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras

Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular

Prueba de Wilcoxon de los rangos con signo

Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero

Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande

Prueba de Wilcoxon para contrastar datos pareados

El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 49: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

Estadiacutestica Administrativa II 45

Nota no necesariamente el nuacutemero de muestras debe ser igual Ejemplo La junta directiva de una gran universidad desea probar la hipoacutetesis de que las calificaciones promedio de una prueba de dos planteles de la universidad son iguales Se deben clasificar las calificaciones en orden ascendente indicando junto a cada una el siacutembolo del plantel Plantel A 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775 B 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500

n1= 15 n2= 15 R1= 247 R2= 218

Estadiacutestico U

U = n1n2 + n1(n1 +1) -R1 2

U= (15)(15) + (15)(16) -247 2

U= 225+120-247

U= 98

Media de la distribucioacuten muestral U

μu = n1n2

2

μu = (15)(15)

2

μu =1125

Estadiacutestica Administrativa II 46

Estadiacutestico U

σU = n1n2 + (n1n2 +1)

12

σU = (15)(15)(15+15+1)

12

σU = 6975 12

σU = 58125

σU = 241

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2

α= 015

Estandarizacioacuten del estadiacutestico U

z = U-μu

σU

z = 98 - 1125 241

z = -0602

144 -144 0 -0602

Valor estandarizado de

la muestra U

Regioacuten de aceptacioacuten

Estadiacutestica Administrativa II 47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras

Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular

Prueba de Wilcoxon de los rangos con signo

Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero

Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande

Prueba de Wilcoxon para contrastar datos pareados

El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 50: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

Estadiacutestica Administrativa II 46

Estadiacutestico U

σU = n1n2 + (n1n2 +1)

12

σU = (15)(15)(15+15+1)

12

σU = 6975 12

σU = 58125

σU = 241

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico U puede aproximarse por la distribucioacuten normal cuando tanto n1 como n2 son mayores que 10 por lo tanto se usaraacute la tabla de la distribucioacuten normal estaacutendar para hacer la prueba La junta de directores desea probar al nivel de significancia de 15 la hipoacutetesis de que estas muestras fueron extraiacutedas de poblaciones ideacutenticas H0 μ1= μ2 H1 μ1ne μ2

α= 015

Estandarizacioacuten del estadiacutestico U

z = U-μu

σU

z = 98 - 1125 241

z = -0602

144 -144 0 -0602

Valor estandarizado de

la muestra U

Regioacuten de aceptacioacuten

Estadiacutestica Administrativa II 47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras

Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular

Prueba de Wilcoxon de los rangos con signo

Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero

Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande

Prueba de Wilcoxon para contrastar datos pareados

El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 51: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

Estadiacutestica Administrativa II 47

Observaciones apareadas prueba de Wilcoxon

La prueba de los signos de Wilcoxon es una prueba no parameacutetrica para comparar la mediana de dos muestras relacionadas y determinar si existen diferencias entre ellas Se utiliza como alternativa a la prueba t de Student cuando no se puede suponer la normalidad de dichas muestras

Debe su nombre a Frank Wilcoxon que la publicoacute en 1945 Asimismo se utiliza cuando la variable subyacente es continua pero presupone ninguacuten tipo de distribucioacuten particular

Prueba de Wilcoxon de los rangos con signo

Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros datos y sea X1 X2 Xn los valores observados Se calcula las diferencias X1-M0 X2-M0 Xn-M0 Si la hipoacutetesis nula fuera cierta estas diferencias se distribuiriacutean de forma simeacutetrica en torno a cero

Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y se ordenan de menor a mayor asignaacutendoles su rango (nuacutemero de orden) Si hubiera dos o maacutes diferencias con igual valor (empates) se les asigna el rango medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna el valor 25 a ambas) Ahora calculamos R+ la suma de todos los rangos de las diferencias positivas aquellas en las que Xi es mayor que M0 y R- la suma de todos los rangos correspondientes a las diferencias negativas Si la hipoacutetesis nula es cierta ambos estadiacutesticos deberaacuten ser parecidos mientras que si nuestros datos tienen a ser maacutes altos que la mediana M0 se reflejaraacute en un valor mayor de R+ y al contrario si son maacutes bajos Se trata de contrastar si la menor de las sumas de rangos es excesivamente pequentildea para ser atribuida al azar o lo que es equivalente si la mayor de las dos sumas de rangos es excesivamente grande

Prueba de Wilcoxon para contrastar datos pareados

El mismo razonamiento lo podemos aplicar cuando tenemos una muestra de parejas de valores por ejemplo antes y despueacutes del tratamiento que podemos denominar (X1Y1) (X2Y2) (XnYn) De la misma forma ahora calcularemos las diferencias X1-Y1 X2-Y2 Xn-Yn y las ordenaremos en valor absoluto asignaacutendoles el rango correspondiente Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi) y la suma de rangos negativos R- Ahora la hipoacutetesis nula es que esas diferencias proceden de una distribucioacuten simeacutetrica en torno a cero y si fuera cierta los valores de R+ y R- seraacuten parecidos

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 52: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

Estadiacutestica Administrativa II 48

49 Varias muestras independientes prueba de Krauskal-Wallis La prueba de Krauskal-Wallis es una extensioacuten de la prueba Mann-Whitney para casos en que estaacuten involucradas maacutes de dos poblaciones Esta prueba tambieacuten depende de los rangos de las observaciones de la muestra Ejemplo

Rango calificaciones Meacutetodo de capacitacioacuten

Calificaciones del examen escrito

1 50 S

2 55 VC 3 57 AC 4 65 AC 5 68 S

6 70 VC 7 74 VC 8 77 S 9 78 A C 10 80 AC 11 81 S 12 82 VC 13 83 S 14 84 S 15 88 VC 16 89 AC 17 91 S 18 92 S 19 93 VC 20 94 S

Estadiacutestico K

K = 12 R2j -3 (n+1)

n(n+1) nj

K= 12 (61)2 + (42)2 + (107)2 -3(20+1)

20(20+1) 6 5 9

K = 1143

Σ

[ ]

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 53: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

Estadiacutestica Administrativa II 49

Prueba de hipoacutetesis La distribucioacuten muestral del estadiacutestico K puede aproximarse por una distribucioacuten ji-cuadrada cuando los tamantildeos de todas las muestras son al menos 5 Grados de libertad k-1 (3-1)= 2 H0 μ1= μ2= μ3 H1 μ1 μ2 μ3 no todas son iguales

α= 010

Ejercicios

Realizar los siguientes ejercicios del libro

1) Levin I Richard Estadiacutestica para administradores Editorial Prentice-Hall

Nuacutemero Paacutegina

14-14 637 14-55 637 14-16 637 14-17 637 14-18 637

4605

010 de aacuterea

Regioacuten de aceptacioacuten

Valor de la muestra

K= 1143

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 54: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

Estadiacutestica Administrativa II 50

Praacutectica 3 992256 Recopilar datos econoacutemicos de diversas fuentes para efectuar

comparacioacuten y anaacutelisis entre la estadiacutestica y la estadiacutestico no parameacutetrica efectuando ademaacutes una prueba de hipoacutetesis

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 55: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

BIBLIOGRAFIA

bull Levin Richard I y Rubin David S (2004) Estadiacutestica para administracioacuten y

economiacutea (7aed) Meacutexico 2004

bull Levin Richard I y Rubin David S (2004) Ji-cuadrada y anaacutelisis de varianza

En estadiacutestica para administracioacuten y economiacutea (pp 447-508) Meacutexico Pearson

educacioacuten

bull Triola Mario F (2004) Estadiacutestica Meacutexico Pearson educacioacuten

bull Mongomery Douglas C (2007) Probabilidad y estadiacutestica aplicadas a la

ingenieriacutea Meacutexico Limusa Wiley

Referencias de internet http mathuprm edu ~edgar uprmedu

httpeswikipediaorgwikiNivel_de_medidaEscalas_de_mediciC3B3n

httpeswikipediaorgwikiEstadC3ADstica_no_paramC3A9trica

httpwwwestadisticafacilcom

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia
Page 56: TECNOLÓGICO DE ESTUDIOS SUPERIORES DEL · PDF fileLos administradores necesitan saber si las ... cierta distribución de probabilidad para representar la ... Levin I. Richard. Estadística

StAta

  • CARATULA
  • INDICE
  • INTRODUCCIOacute1
  • Unidad 1 pruebas dela bondad de ajuste docx
  • Unidad 2 anaacutelisis de regresioacuten y correlacioacuten
    • Praacutectica 1
      • Unidad 3 nuacutemeros iacutendice
        • Praacutectica 2
          • Unidad 4estadiacutestica no parameacutetrica
            • Praacutectica 3
              • bibliografia