Soluciones al examen de Estadística Aplicada a las ... 2009/Junio20091SB1.pdf · 90% de...

6
Soluciones al examen de Estadística Aplicada a las Ciencias Sociales Junio 2009 1ª Semana Ejercicio 1. Una agente de igualdad está interesada en conocer las diferencias salariales en España entre hombres y mujeres (brecha salarial) en las empresas de un sector. Realiza una encuesta a 400 trabajadores y otra a un número igual de trabajadoras que ocupan un puesto de trabajo similar al de los hombres y obtiene los siguientes resultados: salario medio Desviación típica Hombres 58000 15200 Mujeres 49400 12300 A partir de estos datos ¿puede afirmarse que las mujeres españolas que trabajan en ese sector cobran menos que los hombres cuando realizan el mismo trabajo? Ejercicio 2. Un investigador encuentra que en un determinado sector el “salario bruto anual” (Y) mantiene la siguiente relación con los “años de antigüedad en la empresa” (X) Para los hombres: Y = 35.000+1.500·X Para las mujeres: Y = 32.000+1.200·X Represente en el mismo eje cartesiano ambas rectas. Si un trabajador y una trabajadora son contratados a la vez ¿cuál será la diferencia de salario entre ambos diez años más tarde? Ejercicio 3. Entre los pacientes de una determinada consulta de un centro de salud hemos seleccionado aleatoriamente a 8 y les hemos preguntado en junio por su grado de satisfacción (de 1 a 10). En diciembre, tras un cambio en la consulta, hemos vuelto a interrogar a los mismos pacientes y hemos obtenido resultados distintos, como observamos en la tabla siguiente: Pacientes 1 2 3 4 5 6 7 8 Junio 6 8 5 4 6 5 4 3 Diciembre 5 9 5 7 6 6 4 2 ¿Puede decirse, con un nivel de confianza del 95%, que ha aumentado la satisfacción de los pacientes? Ejercicio 4. Una muestra de 100 personas (de una población de 200.000) nos da unos ingresos medios de 42.000€ con una desviación típica de 10.000€. Halle el intervalo en el que se encontrarán, con un 90% de probabilidad, los ingresos medios de todas las muestras de 100 individuos que podemos extraer de la misma población.

Transcript of Soluciones al examen de Estadística Aplicada a las ... 2009/Junio20091SB1.pdf · 90% de...

Page 1: Soluciones al examen de Estadística Aplicada a las ... 2009/Junio20091SB1.pdf · 90% de probabilidad, los ingresos medios de todas las muestras de 100 individuos que podemos extraer

Soluciones al examen de Estadística Aplicada a las Ciencias Sociales

Junio 2009 1ª Semana

Ejercicio 1.

Una agente de igualdad está interesada en conocer las diferencias salariales en España entre hombres y mujeres (brecha salarial) en las empresas de un sector. Realiza una encuesta a 400 trabajadores y otra a un número igual de trabajadoras que ocupan un puesto de trabajo similar al de los hombres y obtiene los siguientes resultados:

salario medio Desviación típicaHombres 58000 15200 Mujeres 49400 12300

A partir de estos datos ¿puede afirmarse que las mujeres españolas que trabajan en ese sector cobran menos que los hombres cuando realizan el mismo trabajo?

Ejercicio 2.

Un investigador encuentra que en un determinado sector el “salario bruto anual” (Y) mantiene la siguiente relación con los “años de antigüedad en la empresa” (X)

Para los hombres: Y = 35.000+1.500·X

Para las mujeres: Y = 32.000+1.200·X

Represente en el mismo eje cartesiano ambas rectas.

Si un trabajador y una trabajadora son contratados a la vez ¿cuál será la diferencia de salario entre ambos diez años más tarde?

Ejercicio 3.

Entre los pacientes de una determinada consulta de un centro de salud hemos seleccionado aleatoriamente a 8 y les hemos preguntado en junio por su grado de satisfacción (de 1 a 10). En diciembre, tras un cambio en la consulta, hemos vuelto a interrogar a los mismos pacientes y hemos obtenido resultados distintos, como observamos en la tabla siguiente:

Pacientes 1 2 3 4 5 6 7 8 Junio 6 8 5 4 6 5 4 3 Diciembre 5 9 5 7 6 6 4 2

¿Puede decirse, con un nivel de confianza del 95%, que ha aumentado la satisfacción de los pacientes?

Ejercicio 4.

Una muestra de 100 personas (de una población de 200.000) nos da unos ingresos medios de 42.000€ con una desviación típica de 10.000€. Halle el intervalo en el que se encontrarán, con un 90% de probabilidad, los ingresos medios de todas las muestras de 100 individuos que podemos extraer de la misma población.

Page 2: Soluciones al examen de Estadística Aplicada a las ... 2009/Junio20091SB1.pdf · 90% de probabilidad, los ingresos medios de todas las muestras de 100 individuos que podemos extraer

RESPUESTAS

Ejercicio 1.

Para saber si en la población se da la misma desigualdad entre las medias de hombres y mujeres que en la muestra realizaremos un contraste de hipótesis unilateral de diferencia entre medias.

La hipótesis nula de partida establece la igualdad de las medias en la población y la alternativa que la media salarial de hombres es superior a la de mujeres:

mh

mh

H

H

:

:

1

0

A continuación establecemos el criterio de aceptación o rechazo de la hipótesis nula para un nivel de confianza que establecemos en el 95% de una distribución normal.

Consultando las tablas de área bajo la curva normal, y siendo la prueba unilateral, buscamos el valor crítico de Z, que para un 95% es Zc = 1,645

Calculamos a continuación la prueba estadística a partir de los datos de las dos muestras:

21

21

xx

e

xxZ

Obtenemos primero las desviaciones típicas de las distribuciones muestrales para ambas muestras:

95,760399

200.15

11

1

1

n

S x

x

77,615399

300.12

12

2

2

n

S x

x

Page 3: Soluciones al examen de Estadística Aplicada a las ... 2009/Junio20091SB1.pdf · 90% de probabilidad, los ingresos medios de todas las muestras de 100 individuos que podemos extraer

89,978)77,615·()95,760( 2222

2121

xxxx

Por tanto el valor Z empírico será:

78,889,978

49400000.58

21

21

xx

e

xxZ

El valor obtenido permite rechazar la hipótesis nula de igualdad entre medias de hombres y mujeres incluso para un nivel de significación menor que 0,01 (Zc=2,33).

Ejercicio 2.

Para representar las rectas en un gráfico debemos dar valores a la variable independiente X (tiempo) y obtener así los valores de la variable dependiente Y (salario). Bastará con obtener dos valores para cada recta. El primer valor X=0 nos proporciona el punto de corte del eje de ordenadas y la recta, y el valor X=10 nos proporciona el salario tras diez años de antigüedad.

Para los hombres Y=35.000+1.500·X

X=0 ; Y= 35.000

X=10 ; Y=35.000+(1.500)·(10)=50.000

Para las mujeres Y=32.000+1.200·X

X=0 ; Y=32.000

X=10 ; Y=32.000+(1.200)·(10)=44.000

Resumiendo en una tabla:

Hombres Mujeres X Y X Y 0 35.000 0 32.000 10 50.000 10 44.000

Una vez obtenidos los valores de Y para cada valor de X en las dos rectas, tomaremos cada par de valores (xi,yi) como las coordenadas de los puntos que llevaremos a la representación gráfica:

Cada pareja de puntos determina la recta correspondiente:

Recta hombres (0, 35000) ; (10, 50000)

Recta de mujeres (0, 32000) ; (10, 44000)

Page 4: Soluciones al examen de Estadística Aplicada a las ... 2009/Junio20091SB1.pdf · 90% de probabilidad, los ingresos medios de todas las muestras de 100 individuos que podemos extraer

La diferencia entre los salarios brutos anuales al cabo de 10 años sería de 6.000 €. Obsérvese que al ser el coeficiente b (la pendiente) superior en la recta de hombres (1500) que en la de mujeres (1200), la diferencia no puede sino aumentar con los años según el modelo lineal.

Ejercicio 3.

Realizaremos una prueba de hipótesis para comprobar el posible aumento de la satisfacción en la población de pacientes. Al tratarse de muestras repetidas a las mismas personas utilizaremos para el

cálculo de la prueba la media de la diferencia dx entre los valores antes y después en cada individuo.

La hipótesis nula se enuncia en el sentido de que no hay diferencias en la población, y por tanto la media de las diferencias es cero. Y la hipótesis alternativa en el sentido de que la media de las diferencias es mayor que cero.

0:

0:

1

0

d

d

H

H

Page 5: Soluciones al examen de Estadística Aplicada a las ... 2009/Junio20091SB1.pdf · 90% de probabilidad, los ingresos medios de todas las muestras de 100 individuos que podemos extraer

Utilizaremos la distribución t de Student por haber un número pequeño de casos en la muestra

d

ddxt

Pacientes Junio Diciembre

1 6 5 -1 0,375 -1,375 1,890625 2 8 9 1 0,375 0,625 0,390625 3 5 5 0 0,375 -0,375 0,140625 4 4 7 3 0,375 2,625 6,890625 5 6 6 0 0,375 -0,375 0,140625 6 5 6 1 0,375 0,625 0,390625 7 4 4 0 0,375 -0,375 0,140625 8 3 2 -1 0,375 -1,375 1,890625

Totales 3 11,875

3dX

375,08

3dX

2183,18

875,11)( 2

n

xxS i

xd

46,07

218,1

1

n

Sdx

d

Calculamos a continuación el valor empírico de te que compararemos con el valor crítico dado por el nivel de significación del 0,05 y 7 grados de libertad: tc = 1,895

8143,046,0

0375,0

d

dd

e

xt

Por tanto al ser te < tc no podemos rechazar la hipótesis nula y concluimos que no ha habido

cambios significativos en la satisfacción de los pacientes de la población.

Ejercicio 4.

Para construir el intervalo debemos convertir el nivel de significación en puntuación tipificada Z.

Para un nivel de confianza del 90%, puesto que las tablas sólo representan la mitad de la curva, dividimos por dos el nivel de confianza 0,90/2 = 0,45 y buscamos en la tabla el valor de Z más próximo para ese valor: Z=1,645

Obtenemos a continuación el valor de la desviación típica de la distribución muestral de las medias:

04,005.11100

000.10

1

n

S xx

dx )( dd XX 2)( dd XX dX

Page 6: Soluciones al examen de Estadística Aplicada a las ... 2009/Junio20091SB1.pdf · 90% de probabilidad, los ingresos medios de todas las muestras de 100 individuos que podemos extraer

El intervalo será:

04,005.1645,1000.42 x

Zx

Restando y sumando el error de estimación x

Z a la media x , obtenemos los límites del

intervalo:

Límite inferior: 40.346,71

Límite superior: 43.653,29 Los límites definen el intervalo dentro del cual se encontrarán el 90% de las medias que podríamos obtener de todas las muestras posibles de esa población.