Tema 1. Práctica 4. Inferencia Estadística.pdf

7
Silvia Rescalvo Martín PRÁCTICA 4. INFERENCIA ESTADÍSTICA II. CONTRASTE DE HIPÓTESIS SOBRE MEDIAS DE POBLACIONES Consideramos los datos de la muestra de empleados recogidos en el archivo empleados.sav. Comenzamos realizando un resumen descriptivo de los datos a través de la opción Analizar > Estadísticos descriptivos > Descriptivos. Ejemplo 1 Realizar un resumen descriptivo de la variable salario para el grupo de los hombres y de las mujeres por separado. Estadísticos descriptivos Sexo N Mínimo Máximo Media Desv. típ. Hombre Salario actual 258 $19,650 $135,000 $41,441.78 $19,499.214 N válido (según lista) 258 Mujer Salario actual 216 $15,750 $58,125 $26,031.92 $7,558.021 N válido (según lista) 216 A la vista de los datos obtenidos, observamos que el salario de los varones superior al de las mujeres en una cantidad considerable. Así, mientras que las mujeres tienen un salario medio de 26.031,92$, el de los varones es 41.441,7$, lo que supone prácticamente doblar la cantidad. II.1. CONTRASTE SOBRE LA MEDIA DE UNA POBLACIÓN NORMAL Consideramos ahora los contrastes sobre la media de una población (supuesta normal). Para ello utilizamos el procedimiento test para una sola muestra (Analizar...Comparar Medias...Prueba t para una muestra). Esto nos permite contrastar si la media difiere o no de un valor asumido en la hipótesis nula. Además nos dará un intervalo de confianza para la diferencia de la media en la muestra y el valor especificado en la hipótesis. Ejemplo 2 Contrastar al nivel de significación del 5% que el salario medio de las mujeres es igual a 41442. H: “el salario medio de las mujeres es igual a 41442” H: “el salario medio de las mujeres distinto de 41442” Aceptar Hsupone que el salario de la mujer es igual y solo igual a 41.442$

Transcript of Tema 1. Práctica 4. Inferencia Estadística.pdf

Page 1: Tema 1. Práctica 4. Inferencia Estadística.pdf

Silvia Rescalvo Martín 

PRÁCTICA4.INFERENCIAESTADÍSTICA

II.CONTRASTEDEHIPÓTESISSOBREMEDIASDEPOBLACIONES

Consideramos  los datos de la muestra de empleados recogidos en el archivo empleados.sav. Comenzamos 

realizando un resumen descriptivo de  los datos a través de  la opción Analizar > Estadísticos descriptivos > 

Descriptivos. 

  

Ejemplo  1  Realizar  un  resumen  descriptivo  de  la  variable  salario  para  el  grupo  de  los  hombres  y  de  las 

mujeres por separado. 

 

Estadísticos descriptivos

Sexo N Mínimo Máximo Media Desv. típ.

Hombre Salario actual 258 $19,650 $135,000 $41,441.78 $19,499.214

N válido (según lista) 258

Mujer Salario actual 216 $15,750 $58,125 $26,031.92 $7,558.021

N válido (según lista) 216

A la vista de los datos obtenidos, observamos que el salario de los varones superior al de las mujeres en una 

cantidad  considerable.  Así, mientras  que  las mujeres  tienen  un  salario   medio  de  26.031,92$,  el  de  los 

varones es 41.441,7$, lo que supone prácticamente doblar la cantidad. 

 

II.1.CONTRASTESOBRELAMEDIADEUNAPOBLACIÓNNORMAL

Consideramos ahora los contrastes sobre la media de una población (supuesta normal). Para ello utilizamos 

el procedimiento   test para una sola muestra  (Analizar...Comparar Medias...Prueba  t para una muestra). 

Esto nos permite contrastar si  la media difiere o no de un valor asumido en  la hipótesis nula. Además nos 

dará un  intervalo de  confianza para  la diferencia de  la media en  la muestra  y el  valor especificado en  la 

hipótesis.  

 

Ejemplo 2 Contrastar al nivel de significación del 5% que el salario medio de las mujeres es igual a 41442. 

H₀: “el salario medio de las mujeres es igual a  41442” 

H₁: “el salario medio de las mujeres distinto de 41442” 

Aceptar H₀ supone que el salario de la mujer es igual y solo igual a 41.442$ 

 

Page 2: Tema 1. Práctica 4. Inferencia Estadística.pdf

Estadísticos para una muestra

N Media Desviación típ. Error típ. de la media

Salario actual 216 $26,031.92 $7,558.021 $514.258

 

El cuadro resumen obtenido, muestra que en el caso de las mujeres, el salario medio es 25.031,92 $ con una 

desviación  típica de 7.558,02. Según estos datos,  la muestra se encuentra en una horquilla de más/menos 

7.558,02 $ en torno a la media. 

Esto nos lleva a pensar que nos alejamos de H₀. 

Prueba para una muestra

Valor de prueba = 41442

t gl Sig. (bilateral) Diferencia de medias

95% Intervalo de confianza para la diferencia

Inferior Superior

Salario actual -29,966 215 ,000 -$15,410.079 -$16,423.71 -$14,396.45

A  la vista de  los datos obtenidos p‐valor es  igual a 0,000, por  lo que, siendo  inferior al valor de alfa 0,05) 

rechazamos la hipótesis nula, lo que significa que el salario medio de las mujeres es distinto de 41442 

 

 

Ejercicio  propuesto  1.    Realizar  un  resumen  descriptivo  de  la  variable  salario  para  los  empleados  que 

proceden de una minoría étnica y los que no por separado.  

 

Estadísticos descriptivos

Clasificación de minorías N Mínimo Máximo Media Desv. típ.

No Salario actual 370 $15,750 $135,000 $36,023.31 $18,044.096

N válido (según lista) 370

Sí Salario actual 104 $16,350 $100,000 $28,713.94 $11,421.638

N válido (según lista) 104

 

A través de los estadísticos utilizados observamos que hecha la agrupación diferenciada entre empleados que 

proceden de una minoría étnica y aquellos que no, la media del salario de las personas que no proceden de 

una minoría  étnica  es  de  36.023,31$  (con  una  desviación  típica  de  18.044.10$)  y  la  de  aquellos  que  si 

proceden de minoría étnica es 28.713,94$ (con una desviación típica de 11.421,69$).  

 

De  lo que debemos deducir que el  salario medio de  las personas que pertenecen a una minoría étnica es 

menor que el de aquellos otros trabajadores que no pertenecen a ellos. 

 

Contrastar al nivel de significación del 5% que el salario medio de las los empleados de una minoría étnica es 

36023. 

H₀: “El salario medio de los empleados procedentes de una minoría étnica es igual y solo igual a 36023” 

H₁: “El salario medio de los empleados procedentes de una minoría étnica es distinto a 36023” 

Page 3: Tema 1. Práctica 4. Inferencia Estadística.pdf

 Estadísticos para una muestra

Clasificación de minorías N Media Desviación típ. Error típ. de la media

Sí Salario actual 104 $28,713.94 $11,421.638 $1,119.984

 

 

El cuadro resumen obtenido, muestra que en el caso de  los trabajadores  incluidos en una minoría étnica, el 

salario medio  es  28.731,94$  con  una  desviación  típica  de  11.421,64.  Según  estos  datos,  la muestra  se 

encuentra en una horquilla de más/menos 11.421,64$ en torno a la media. 

Esto nos lleva a pensar que nos alejamos de H₀. 

 

 Prueba para una muestra

Clasificación de minorías

Valor de prueba = 36023

t gl Sig. (bilateral)

Diferencia de medias

95% Intervalo de confianza para la diferencia

Inferior Superior

Sí Salario actual -6,526

103 ,000 -$7,309.058 -$9,530.28 -$5,087.83

 

 

A  la vista de  los datos obtenidos p‐valor es  igual a 0,000, por  lo que, siendo  inferior al valor de alfa 0,05) 

rechazamos la hipótesis nula, lo que significa que el salario medio de las mujeres es distinto de 36.023$. 

La interpretación de los datos de la tabla nos indica que la diferencia entre el salario medio de los empleados 

que proceden de una minoría étnica está entre ‐9.530,28$ y ‐5.087,83$ y esto significa que el salario medio 

de  los empleados procedentes de una minoría étnica no es 36.023$ sino que se encuentra por debajo en al 

menos 9.530,28 $ 

 

 

II.2.CONTRASTEPARALAIGUALDADDEMEDIASDEDOSPOBLACIONES

 

Test T para igualdad de medias de 2 muestras relacionadas o con datos apareados  

Consideramos los contrastes sobre dos medias. Comenzamos por el caso de muestras apareadas y para ello 

utilizaremos  el  procedimiento  de  test  para muestras  apareadas  (Analizar...Comparar Medias...Prueba  t 

para muestras relacionadas). Por muestras apareadas entenderemos el caso en que se mide dos variables 

para el mismo  individuo o  caso. El objetivo por  tanto es  contrastar  si  las medias de dichas  variables  son 

iguales. Un ejemplo de muestras relacionadas son los datos de las variable “salini” y “salario" que recogen, 

para cada empleado, los salarios iniciales (al entrar en la empresa) y el salario actual. 

 

 

 

 

Page 4: Tema 1. Práctica 4. Inferencia Estadística.pdf

Ejemplo 3 Contrastar la hipótesis de que el salario medio actual (variable salario) es igual al inicial (variable 

salini) para el grupo de las mujeres a un nivel de significación del 5%. 

 

H₀: “El salario medio actual de las mujeres es igual y solo igual salario medio inicial” 

H₁: “El salario medio actual de las mujeres es distinto del salario medio inicial” 

Estadísticos de muestras relacionadas

Media N Desviación típ. Error típ. de la media

Par 1 Salario actual $26,031.92 216 $7,558.021 $514.258

Salario inicial $13,091.97 216 $2,935.599 $199.742

Podemos observar que  la media del salario actual es más elevada que  la media del salario  inicial. La media 

del salario actual está en $26.031,92 y  la media del salario  inicial está en $13.091,97. Esas medidas tienen 

una dispersión que la desviación típica y éste es elevado por lo que podemos decir que se trata de números 

imprecisos. Eso significa que si hubiese cogido otra muestra el resultado sería distinto. 

 

El cuadro resumen obtenido, muestra que en el caso de  las mujeres, el salario medio actual es 26.031,92 $ 

con  una  desviación  típica  de  7,558.02, mientras que el  salario  medio  inicial  era  de  13.091,97$  con  una 

desviación  típica  de  2.935,60.  Esta  desviación  típica,  que muestra  la  dispersión  de  la muestra,  es  elevada 

sobre todo en el caso del salario actual, por lo que tenemos un resultado impreciso. 

Todos estos resultados nos llevan a pensar que nos alejamos de H₀. 

Prueba de muestras relacionadas

Diferencias relacionadas t gl Sig. (bilateral) Media Desviación

típ. Error típ. de la media

95% Intervalo de confianza para la diferencia

Inferior Superior

Par 1

Salario actual - Salario inicial

$12,939.954 $5,661.085 $385.188 $12,180.725 $13,699.182 33,594 215 ,000

 

Si nos finamos en el p‐valor, que es 0,000 y esto es menor que 0,05, por lo que se rechaza la hipótesis nula, 

es decir, el salario medio actual es muy diferente al salario medio inicial. 

El salario a lo largo de los años va aumentando. El salario se incrementa $según nos dice la desviación típica. 

 

A  la vista de  los datos obtenidos p‐valor es  igual a 0,000, por  lo que, siendo  inferior al valor de alfa  (0,05) 

rechazamos  la  hipótesis  nula,  lo  que  significa  que  el  salario medio  actual  de  las mujeres  es  distinto  del 

salario medio  inicial. La  interpretación de  los datos de  la tabla nos  indica que  la diferencia entre el salario 

medio actual y el inical está entre 12.180,73$ y 13.699,18$. 

 

 

 

 

Page 5: Tema 1. Práctica 4. Inferencia Estadística.pdf

Test de muestras independientes  

 

Consideramos ahora el caso de dos muestras independientes y de nuevo el objetivo es comparar las medias 

de  las  poblaciones  de  las  que  proceden.  Para  ello  utilizaremos  el  procedimiento  de  test  para muestras 

independientes (Analizar...Comparar Medias...Prueba t para muestras independientes). 

 

Ejemplo 4 Contrastar la hipótesis de igual tiempo medio en el empleo (variable “tiempemp”) para el grupo 

que sí es minoría étnica y el que no lo es. Al mismo tiempo contrastar también la hipótesis de igual media de 

años de educación (variable “educ”) para los dos grupos de la variable minoría. Realizar los contrastes a un 

nivel de significación del 5%.  

 

Contraste 1 

H₀:  “La media  de  “tiempemp”  es  la misma  en  ambos  grupos  independientemente  de  que  procedan  de 

minorías étnicas o no” 

H₁: “La media de “tiempemp” es distinta dependiendo de que el grupo proceda de minorías étnicas o no” 

 

Contraste 2 

H₀: “La media de “educ” es  la misma en ambos grupos  independientemente de que procedan de minorías 

étnicas o no” 

H₁:   “La media “educ” es distinta dependiendo de que el grupo proceda de minorías étnicas o no” 

  Estadísticos de grupo

Clasificación de minorías N Media Desviación típ. Error típ. de la

media

Meses desde el contrato No 370 80,85 10,082 ,524

Sí 104 82,05 9,978 ,978

Nivel educativo No 370 13,69 2,942 ,153

Sí 104 12,77 2,555 ,251

 

Según  los datos ofrecidos por  la tabla de estadísticos podemos observar en  la variable “tiempemp”   (meses 

desde el contrato) para el grupo de trabajadores que pertenecen a minoría étnica, la media de tiempo es de 

82,05 meses  y para  los que no pertenecen a  este  colectivo,  la media  es de 80,85 meses. Como  se puede 

observar hay una diferencia escasa entre ambos. 

 

En el caso de  la variable “educ”  (nivel educativo), para el grupo de trabajadores que pertenecen a minoría 

étnica,  la media es de 12,77   y para  los que no pertenecen a este colectivo,  la media es de 13,69. Como se 

puede observar la  diferencia entre ambos es pequeña. 

 

 

 

 

Page 6: Tema 1. Práctica 4. Inferencia Estadística.pdf

Prueba de muestras independientes

Prueba de Levene para la igualdad de varianzas

Prueba T para la igualdad de medias

F Sig. t gl Sig. (bilateral)

Diferencia de medias

Error típ. de la diferencia

95% Intervalo de confianza para la diferencia

Inferior Superior

Meses desde el contrato

Se han asumido varianzas iguales

,015 ,903 -1,077

472 ,282 -1,202 1,116 -3,396 ,992

No se han asumido varianzas iguales

-1,083

166,762 ,280 -1,202 1,110 -3,394 ,989

Nivel educativo

Se han asumido varianzas iguales

6,201 ,013 2,913 472 ,004 ,925 ,318 ,301 1,550

No se han asumido varianzas iguales

3,152 186,843 ,002 ,925 ,294 ,346 1,504

Contraste  1 

H₀: varianzas iguales.  

Como el p‐valor es 0,903 y este es mayor que 0,05, se acepta la hipótesis nula, que significa que las varianzas 

son iguales. 

El p‐valor es 0,282 y esto es mayor que 0,05 por  lo que  se acepta  la hipótesis nula, esto  significa que  la 

media de la variable “tiempemp” es igual en el procedente de minorías étnicas del grupo que no procede de 

minorías étnicas. 

 

Contraste 2 

H₀: varianzas iguales.  

Como el p‐valor es 0,013 y esto es menor que 0,05, se rechaza la hipótesis nula y por lo tanto las varianzas 

no son iguales. 

EL p‐valor es 0,002 y esto es menor que 0,05 por  lo que se rechaza la hipótesis nula, es decir,  la media de 

“educ”  no  es  igual  en  el  grupo  procedente  de minoría  étnica  y  en  el  grupo  no  procedente  de minorías 

étnicas. 

 

 

 

 

 

Page 7: Tema 1. Práctica 4. Inferencia Estadística.pdf

Ejercicio propuesto 2.   Contrastar  la hipótesis de  igual media de años de educación (variable “educ”) para 

hombres y mujeres a un nivel de significación del 5%. 

 

H₀: “La media de “educ” es igual y solo igual en hombres y en mujeres” 

H₁: “La media de “educ” es distinta en hombres y en mujeres”  Estadísticos de grupo

Sexo N Media Desviación típ. Error típ. de la

media

Nivel educativo Hombre 258 14,43 2,979 ,185

Mujer 216 12,37 2,319 ,158

Entre  los  datos  obtenidos  con  los  estadísticos  de  este  grupo  podemos  observar  para  la  variable  “nivel 

educativo” que para los hombres, la media es de 14,43 mientras que en el caso de  las mujeres, la media es 

de 12,37 meses, no hay mucha diferencia ambos es pequeña. 

 Prueba de muestras independientes

Prueba de Levene para la igualdad de varianzas

Prueba T para la igualdad de medias

F Sig. t gl Sig. (bilateral)

Diferencia de medias

Error típ. de la diferencia

95% Intervalo de confianza para la diferencia

Inferior Superior

Nivel educativo

Se han asumido varianzas iguales

17,884 ,000 8,276 472 ,000 2,060 ,249 1,571 2,549

No se han asumido varianzas iguales

8,458 469,595 ,000 2,060 ,244 1,581 2,538

H₀: varianzas iguales. Como el p‐valor es 0,000 y esto es menor que 0,05, se rechaza la hipótesis nula y esto 

significa que las varianzas no son iguales. 

 

EL p‐valor es 0,000 y esto es menor que 0,05 por lo que se rechaza la hipótesis nula (H₀), es decir, la media 

de “educ” no es igual para hombres que para mujeres.