Resolucion Taller No 5 Estadistica

26
Ministerio de Educación y Justicia Universidad Tecnológica Nacional Facultad Regional San Rafael Cátedra: Probabilidad y Estadística Profesor: Lic. Oscar Raúl Zapata JTP: Lic. Andrea Roldán ATP: Ing. Valeria Cordero Taller N º 5 Muestreo Ciclo Lectivo: 2014 Ejercicio Nº 1 1. Dadas las investigaciones que se indican a continuación, se pide determinar para cada caso: a- Población de estudio. b- Unidad de análisis. c- Variable. d- Tipo de muestreo (probabilístico, no probabilístico) a- Técnica de muestreo utilizada. I. A efectos de realizar un estudio sobre el comportamiento dentro de la clase, el profesor ha solicitado a todos los alumnos que escriban en un papel su nombre, a continuación extrae al azar 4 papeles con los cuales forma un grupo y así sucesivamente hasta concluir con todos los papeles. a- Población de estudio: alumnos de la clase b- Unidad de análisis: alumno c- Variable: comportamiento dentro de la clase d- Tipo de muestreo (probabilístico, no probabilístico): probabilístico. a- Técnica de muestreo utilizada: Muestreo aleatorio simple (MAS) II. Para estudiar las infracciones cometidas en una esquina, ante un cartel de “Pare”, un equipo de observación ha permanecido de 8 de la mañana a 8 de la tarde, durante tres días consecutivos, registrando una de cada tres de las infracciones observadas en ese tiempo. a- Población de estudio: vehículos que pasan por una esquina b- Unidad de análisis: vehículo c- Variable: infracciones cometidas Taller Nº 5 1

description

taller de estadistica resuelto resolucion de problemas estadistica

Transcript of Resolucion Taller No 5 Estadistica

Page 1: Resolucion Taller No 5 Estadistica

Ministerio de Educación y JusticiaUniversidad Tecnológica Nacional

Facultad Regional San Rafael

Cátedra: Probabilidad y Estadística Profesor: Lic. Oscar Raúl Zapata JTP: Lic. Andrea Roldán

ATP: Ing. Valeria Cordero Taller N º 5 Muestreo Ciclo Lectivo: 2014

Ejercicio Nº 1

1. Dadas las investigaciones que se indican a continuación, se pide determinar para cada caso:

a- Población de estudio.

b- Unidad de análisis.

c- Variable.

d- Tipo de muestreo (probabilístico, no probabilístico)

a- Técnica de muestreo utilizada.

I. A efectos de realizar un estudio sobre el comportamiento dentro de la clase, el profesor ha solicitado a

todos los alumnos que escriban en un papel su nombre, a continuación extrae al azar 4 papeles con los

cuales forma un grupo y así sucesivamente hasta concluir con todos los papeles.

a- Población de estudio: alumnos de la clase

b- Unidad de análisis: alumno

c- Variable: comportamiento dentro de la clase

d- Tipo de muestreo (probabilístico, no probabilístico): probabilístico.

a- Técnica de muestreo utilizada: Muestreo aleatorio simple (MAS)

II. Para estudiar las infracciones cometidas en una esquina, ante un cartel de “Pare”, un equipo de

observación ha permanecido de 8 de la mañana a 8 de la tarde, durante tres días consecutivos,

registrando una de cada tres de las infracciones observadas en ese tiempo.

a- Población de estudio: vehículos que pasan por una esquina

b- Unidad de análisis: vehículo

c- Variable: infracciones cometidas

d- Tipo de muestreo (probabilístico, no probabilístico): muestreo no probabilístico

a- Técnica de muestreo utilizada: Muestreo intencional (MI)

III. Con el fin de investigar los coeficientes intelectuales de los estudiantes de una universidad, se obtiene

un listado de los estudiantes matriculados, numerados del 1 al 20000, de los cuales se extrae una

muestra de 100, mediante un generador de números aleatorios.

a- Población de estudio: estudiantes matriculados de una universidad

b- Unidad de análisis: estudiante

c- Variable: coeficiente intelectual

d- Tipo de muestreo (probabilístico, no probabilístico): probabilístico sin reposición.

a- Técnica de muestreo utilizada: Muestreo aleatorio simple (MAS)

Taller Nº 5 1

Page 2: Resolucion Taller No 5 Estadistica

Ministerio de Educación y JusticiaUniversidad Tecnológica Nacional

Facultad Regional San Rafael

IV. Un ingeniero que supervisa la calidad de producción en una fábrica de laminados, desea determinar la

proporción de fallas en el producto final. Decide tomar una muestra de 50 láminas en un día, para lo

cual, durante cinco horas seguidas, toma las últimas diez láminas producidas y cuenta el número de

fallas.

a- Población de estudio: láminas producidas

b- Unidad de análisis: lámina

c- Variable: fallas

d- Tipo de muestreo (probabilístico, no probabilístico): no probabilístico.

a- Técnica de muestreo utilizada: Muestreo intencional (MI)

V. Para observar el comportamiento de una red de distribución eléctrica de media tensión en una ciudad,

se toman 10 muestras de igual cantidad de viviendas con una superficie cubierta similar,

posteriormente a las mismas se miden los kw. Consumidos durante la primer semana de un mes.

a- Población de estudio: viviendas de una ciudad con superficie similar

b- Unidad de análisis: vivienda

c- Variable: comportamiento de la red eléctrica / consumo en Kw.

d- Tipo de muestreo (probabilístico, no probabilístico): no probabilístico.

a- Técnica de muestreo utilizada: Muestreo intencional (MI)

VI. Se desea conocer la inserción profesional, de los egresados de las carreras de ingeniería de la UTN

FRSR, por lo cual, se realiza una encuesta en fecebook a los estudiantes de último año de cada

especialidad, cuantificando a aquellos que han recibido algún ofrecimiento laboral.

a- Población de estudio: egresados de ingeniería de la UTN

b- Unidad de análisis: estudiante de último año

c- Variable: ofrecimiento laboral

d- Tipo de muestreo (probabilístico, no probabilístico): no probabilístico.

a- Técnica de muestreo utilizada: Muestreo intencional (MI)

Ejercicio Nº 2

1. Sobre los datos presentados en la tabla siguiente, indicar:

a- Población de estudiob- Unidad de análisisc- Variable/sd- Tipo y clasificación de variable/s

Universidad Tecnológica Nacional Estudiantes de Ingeniería según condición laboral

Especialidad Total TrabajanCivil 8.040 1.769Aeronáutica 4.002 1.385Electromecánica 5.473 940

Taller Nº 5 2

Page 3: Resolucion Taller No 5 Estadistica

Ministerio de Educación y JusticiaUniversidad Tecnológica Nacional

Facultad Regional San Rafael

Industrial 11.076 2.671Química 6.884 1.496Electrónica 6.703 1.635

Fuente: Ministerio de Educación de la Nación. Anuario de Estadísticas Universitarias, 2008.

a- Población de estudio: estudiantes de ingeniería

b- Unidad de análisis: estudiante

c- Variable/s: Especialidad/ condición laboral

d- Tipo y clasificación de variable/s: Cualitativa nominal / Cualitativa nominal

2. Para realizar un muestreo que incluya a todas las especialidades, sugiera la técnica a utilizar y

los pasos a seguir, fundamentando.

Aunque no sabemos el parámetro que vamos a estimar a partir de la muestra, la técnica adecuada para

realizar un muestreo de esta población, que incluya a todas las especialidades, sería Muestreo

estratificado, porque tenemos cierto conocimiento de la población a estudiar.

Pasos a seguir:

1- Determinar la cantidad por especialidad de los estudiantes que no trabajan.

2- Determinar la cantidad de estratos que formarán parte de la muestra: en este caso serán 8 estratos,

en primer lugar las 6 especialidades, y 2 estratos más, porque deseamos incluir a los jóvenes según su

condición laboral (contamos con esta información)

a- seis estratos: Especialidad

b- Dos sub-estratos: Trabajan - No trabajan

3- Establecer el nivel de confiabilidad con el cual se va a trabajar.

4- Calcular el tamaño de la muestra, asignando las proporciones adecuadas a cada estrato.

Si la consigna no hubiese especificado incluir todas las especialidades, podría haber realizado

previamente un muestreo al azar de las especialidades, en vez de incluirlas a todas, pero siempre

calculando la cantidad de especialidades que deberían incluirse en la muestra de forma probabilística.

Ejercicio Nº 3

Una población consta de los números 2, 3, 6, y 11. Consideremos todas las posibles muestras de

tamaño 2 que puedan tomarse con reposición, de esa población.

Las muestras posibles son 4(4)= 16

2,2 6,2

2,3 6,3

2,6 6,6

2,11 6,11

3,2 11,2

3,3 11,3

Taller Nº 5 3

Page 4: Resolucion Taller No 5 Estadistica

Ministerio de Educación y JusticiaUniversidad Tecnológica Nacional

Facultad Regional San Rafael

3,6 11,6

3,11 11,11

a. Hallar la media de la población

μ=2+3+6+114

=224

=5,5

b. La desviación típica de la población

σ 2=(2−5,5 )2+(3−5,5 )2+ (6−5,5 )2+(11−5 )2

4=¿

σ 2=12,25+6,25+0,25+30,254

=494

=12,25

σ=√12,25=3,5

c. La media de la distribución de muestreo de medias

Calculamos la media a cada muestra:

2,2 2,0 6,2 4,0

2,3 2,5 6,3 4,5

2,6 4,0 6,6 6,0

2,11 6,5 6,11 8,5

3,2 2,5 11,2 6,5

3,3 3,0 11,3 7,0

3,6 4,5 11,6 8.5

3,11 7,0 11,11 11,0

La media de la distribución muestral de medias es:

μx= Suma de tod as lasmedias muestrales16 =8816= 5,5d. La desviación típica de la distribución de muestreo de medias

σ x2=∑ (x−μx¿)

2/n¿

Med (x- med) (x- med)^22 -3,5 12,25

2,5 -3 92,5 -3 93 -2,5 6,254 -1,5 2,254 -1,5 2,25

4,5 -1 14,5 -1 1

Taller Nº 5 4

Page 5: Resolucion Taller No 5 Estadistica

Ministerio de Educación y JusticiaUniversidad Tecnológica Nacional

Facultad Regional San Rafael

6 0,5 0,256,5 1 16,5 1 17 1,5 2,257 1,5 2,25

8,5 3 911 5,5 30,258,5 3 9

98

σ x2=¿ 98

16=¿6,125 = σ2

n=12,25

2=6,125

σ x=√6,125≅ 2,47 = σ√n= 3,5√2

e. ¿Qué conclusión obtenemos al observar estas medidas?

Por teorema del límite central, el comportamiento de la distribución de muestreo de medias, tendrá

comportamiento normal.

Se cumple entonces que: μ=μx

Y que la varianza del muestreo de medias es igual a la varianza de la población /n

Ejercicio Nº 4

A continuación se presenta una tabla con datos de una población de estudiantes.

a. Construir 30 muestras por muestreo aleatorio simple de tamaño 4. (En Excel)Las muestras posibles son 4(4)= 16

2,2 6,2

2,3 6,3

2,6 6,6

2,11 6,11

3,2 11,2

3,3 11,3

Taller Nº 5 5

Peso en Kg. Número de estudiantes60-62 563-65 1866-68 4269-71 2772-74 8

Page 6: Resolucion Taller No 5 Estadistica

Ministerio de Educación y JusticiaUniversidad Tecnológica Nacional

Facultad Regional San Rafael

3,6 11,6

3,11 11,11

a. Hallar la media de la población

μ=2+3+6+114

=224

=5,5

b. La desviación típica de la población

σ 2=(2−5,5 )2+(3−5,5 )2+ (6−5,5 )2+(11−5 )2

4=¿

σ 2=12,25+6,25+0,25+30,254

=494

=12,25

σ=√12,25=3,5

c. La media de la distribución de muestreo de medias

Calculamos la media a cada muestra:

2,2 2,0 6,2 4,0

2,3 2,5 6,3 4,5

2,6 4,0 6,6 6,0

2,11 6,5 6,11 8,5

3,2 2,5 11,2 6,5

3,3 3,0 11,3 7,0

3,6 4,5 11,6 8.5

3,11 7,0 11,11 11,0

La media de la distribución muestral de medias es:

μx= Suma de tod as lasmedias muestrales16 =8816= 5,5d. La desviación típica de la distribución de muestreo de medias

σ x2=∑ (x−μx¿)

2/n¿

Med (x- med) (x- med)^22 -3,5 12,25

2,5 -3 92,5 -3 93 -2,5 6,254 -1,5 2,254 -1,5 2,25

4,5 -1 14,5 -1 1

Taller Nº 5 6

Page 7: Resolucion Taller No 5 Estadistica

Ministerio de Educación y JusticiaUniversidad Tecnológica Nacional

Facultad Regional San Rafael

6 0,5 0,256,5 1 16,5 1 17 1,5 2,257 1,5 2,25

8,5 3 911 5,5 30,258,5 3 9

98

σ x2=¿ 98

16=¿6,125 = σ2

n=12,25

2=6,125

σ x=√6,125≅ 2,47 = σ√n= 3,5√2

e. ¿Qué conclusión obtenemos al observar estas medidas?

Por teorema del límite central, el comportamiento de la distribución de muestreo de medias, tenderá a un

comportamiento normal.

Se cumple entonces que: μ=μx

Y que la varianza del muestreo de medias es menor a la varianza de la población.

Ejercicio Nº 4

A continuación se presenta una tabla con datos de una población de estudiantes.

a. Construir 30 muestras por muestreo aleatorio simple de tamaño 4. (En Excel)

Para realizar un MAS de tamaño cuatro, debemos tener en cuenta que los datos están agrupados.

Consideramos primero el tamaño de la población N= 100, lo cual exige que asignemos un número de 0 a

99 a cada uno de los valores de variable, de acuerdo a las frecuencias que conforman los intervalos. (ver

tabla).

Marcas de clase (Xc)

Peso en Kg.

Número de estudiantes

Asignamos un número

61 60-62 5 00 a 04

Taller Nº 5 7

Peso en Kg. Número de estudiantes60-62 563-65 1866-68 4269-71 2772-74 8

Page 8: Resolucion Taller No 5 Estadistica

Ministerio de Educación y JusticiaUniversidad Tecnológica Nacional

Facultad Regional San Rafael

64 63-65 18 05 a 2267 66-68 42 23 a 6470 69-71 27 65 a 9173 72-74 8 92 a 99

N 100Posteriormente utilizando el generador de números aleatorios, extraemos conjuntos de cuatro números,

entre 0 y 99.

Por ejemplo: el primer conjunto está formado por (85; 42; 82; 11). Observo ahora en qué intervalos están

incluidos. La muestra estará formada por las marcas de clase correspondientes:

Marcas de clase (Xc)

Peso en Kg.

Número de estudiantes

Asignamos un número

61 60-62 5 00 a 0464 63-65 18 05 a 22 1167 66-68 42 23 a 64 4270 69-71 27 65 a 9173 72-74 8 92 a 99 82;85

N 100Así la primera muestra estará formada por: (64; 67; 73; 73). Como el problema me pide, voy a construir

de la misma manera las treinta muestras. Para facilitar el trabajo, puedo construir una tabla:

Números Muestras Media Números Muestras Media85; 42; 82; 11 64 67 73 73 68;30;28;57 70 67 67 67

26;68;72;57 67 70 70 67 73;13;97;73 70 64 73 70 77;13;55;29 70 64 67 67 66;41;18;37 70 67 64 67 85;77;76;61 70 70 70 67 37;43;80;35 67 67 70 67 41;40;2;37 67 67 61 67 80;89;29;87 70 70 67 70

90;55;81;96 70 67 70 73 63;29;50;10 67 67 67 64 54;63;89;17 67 67 70 64 69;99;72;36 70 73 70 67 79;31;68;68 70 67 70 70 14;41;56;39 64 67 67 67 71;10;75;62 70 64 70 67 60;50;56;54 67 67 67 67 41;3;97;56 67 61 73 67 40;41;29;10 67 67 67 64 19;1;41;31 64 61 67 67 50;18;72;95 67 64 70 73

37;71;91;47 67 70 70 67 27;82;8;78 67 70 64 70 12;33;71;90 64 67 70 70 15;16;17;92 64 64 64 73 27;80;49;86 67 70 67 70 94;97;46;25 73 73 67 67 38;35;91;13 67 67 70 64 40;57;99;98 67 67 73 73

b. Calcular la media y la desviación típica de la distribución muestral.

Calculamos ahora la media aritmética a cada una de las muestras. Podemos hacerlo rápidamente en Excel, utilizando la misma tabla.

Muestras Media Muestras Media64 67 73 73 69,25 70 67 67 67 67,7567 70 70 67 68,5 70 64 73 70 69,25

Taller Nº 5 8

Page 9: Resolucion Taller No 5 Estadistica

Ministerio de Educación y JusticiaUniversidad Tecnológica Nacional

Facultad Regional San Rafael

70 64 67 67 67 70 67 64 67 6770 70 70 67 69,25 67 67 70 67 67,7567 67 61 67 65,5 70 70 67 70 69,2570 67 70 73 70 67 67 67 64 66,2567 67 70 64 67 70 73 70 67 7070 67 70 70 69,25 64 67 67 67 66,2570 64 70 67 67,75 67 67 67 67 6767 61 73 67 67 67 67 67 64 66,2564 61 67 67 64,75 67 64 70 73 68,567 70 70 67 68,5 67 70 64 70 67,7564 67 70 70 67,75 64 64 64 73 66,2567 70 67 70 68,5 73 73 67 67 7067 67 70 64 67 67 67 73 73 70

Ahora calculamos la media de la distribución muestral de medias:

μx= Suma de todas lasmediasmuestrales30 =2036,2530 = 67,9Por teorema del límite central, sabemos que µ=67,9 Kg.

Calculamos la desviación estándar:

σ x2=∑ (x−μx¿)

2/n¿

σ x2=¿ 59,718

30=¿1,99Kg2

σ x=√1,99≅ 1,41 Kgc. Formular las conclusiones de los resultados obtenidos.

Por teorema del límite central, sabemos que la media de la distribución del muestreo de medias, es un

estimador insesgado de la media de la población, la cual será µ=67,9 Kg.

Y la desviación estándar de la distribución de medias, será menor a la poblacional.

Ejercicio Nº 5

Para analizar el crecimiento de ciertas algas, se elige una muestra piloto de 13 plantas y se miden

obteniendo una talla promedio de la muestra de 5.3 centímetros y una varianza muestral de 19.2

El investigador desea determinar el tamaño de muestra mínimo necesario, usando la técnica

MAS, para estimar la talla promedio de las algas en la población, con una confianza de 95% y un

Taller Nº 5 9

Page 10: Resolucion Taller No 5 Estadistica

Ministerio de Educación y JusticiaUniversidad Tecnológica Nacional

Facultad Regional San Rafael

error de estimación, no mayor a 2 centímetros; si en la población hay 200 plantas de algas

¿Cuántas deben elegirse para constituir la muestra?

Primero, Identificar la variable en estudio y los parámetros involucrados.

X = Talla de las algas (en centímetros). En este caso se debe suponer que X N ¿) y los parámetros

involucrados son dos: μ ;σ2 donde μ es la talla promedio de las algas en la población y σ es la

desviación estándar de la talla de las algas.

Segundo, Estimar los parámetros.

En este caso se tiene, del enunciado del problema, que X = 5.3 cm. es un estimador de μ y S2 19.2 cm2

es un estimador de σ 2.

Tercero, sabemos que debemos utilizar MAS para determinar la muestra mínima

necesaria para estimar la talla media de la población de alga, y:

El problema define una confiabilidad de 95%:

Para 1-α/2= 95% → Z= 1.96

Y un error de estimación no mayor a 2 cm.

Cuarto, Determinar el tamaño de muestra.

n0=[Z (∝/2)/ε ]2Sx2

n0= [1.96/2]219.2=18.42≅ 19 Si n0/N≤0.05

→n 0N= 19/200 = 0.095 ≥0.05→

n´=n0

1+n0N

= 19

1+19200

= 191+0.095

=17.35≅ 18

Para estimar la talla media de las algas en la población, usando un diseño MAS con una confianza de

95% y un error de estimación no mayor a 2 centímetros, el investigador debe elegir al menos 18 algas en

la muestra.

Ejercicio Nº 6

En el proceso de fabricación de ciertos celulares, generalmente el 10% de los mismos, presenta

algún defecto de fabricación. Para analizar la calidad del producto se desea estimar la proporción

de artículos defectuosos de un lote de 2000 celulares, listo para ser embarcado.

¿Cuántos celulares deben ser elegidos del lote si se desea una confianza de 95% y un error de

estimación no mayor a 0.05?

Primero, Identificar la variable en estudio y los parámetros involucrados.

Taller Nº 5 10

Page 11: Resolucion Taller No 5 Estadistica

Ministerio de Educación y JusticiaUniversidad Tecnológica Nacional

Facultad Regional San Rafael

X = artículos defectuosos. En este caso el parámetro de interés es p(x)= proporción de artículos

defectuosos y el parámetro involucrado es ρ̂ = 0,1 (10%) el cual estima a P

Segundo, determinamos la técnica de muestreo que debemos utilizar (MAS) para determinar la

muestra mínima necesaria y estimar la proporción de población.

El problema define una confiabilidad de 95%:

Para 1-α/2= 95% → Z= 1.96

Y un error de estimación no mayor a 0,05.

Y conocemos que el lote completo (la población de estudio) es N= 2000 celulares.

Tercero, determinar el tamaño de muestra.

n0=[ Z α¿2

ε ]2

ρ̂(1− ρ̂)

n0= [1.96/0.05]20.1∗0.9=138.2976≅ 139 Si n0/N≤0.05ó si no conocemos el tamaño de la población.

→n 0N= 139/2000 = 0.695 ≥0.05→

n´=n0

1+n0N

= 139

1+1392000

= 1391+0.695

=82.0059≅ 83

Para estimar la proporción de celulares con fallas en la población, usando un diseño MAS con una

confianza de 95% y un error de estimación no mayor a 0.05, el investigador debe elegir al menos 83

celulares del lote.

Ejercicio Nº7

Se desea estimar en una estación de piscicultura, el tamaño medio de truchas y la proporción de

truchas que cumplen las normas para el consumo, sabiendo que la población, está formada por

310 truchas, distribuidas en tres estanques con la siguiente información.

Estanque N σ2 p1 155 25 0.802 62 225 0.253 93 100 0.50Total 310

a) ¿Cuántas truchas se debe elegir en la muestra del cultivo y por estanque para estimar el

tamaño medio, si se desea una confianza de 95% y un error no mayor a 2 centímetros? Si usamos

la técnica MAE con asignación proporcional.

Primero, Identificar la variable en estudio y los parámetros involucrados.

Taller Nº 5 11

Page 12: Resolucion Taller No 5 Estadistica

Ministerio de Educación y JusticiaUniversidad Tecnológica Nacional

Facultad Regional San Rafael

X = Tamaño de las truchas (en centímetros). En este caso se debe suponer que X N ¿) y los

parámetros involucrados son dos: μ ;σ2 donde μ es el tamaño promedio de las truchas en la población y

σ es la desviación estándar.

Segundo, Estimar los parámetros.

En este caso se desconoce la media poblacional pero se conoceσ 2 para cada estanque.

σ 12=25cm2σ2

2=225cm2σ32=100cm2

Tercero, sabemos que debemos utilizar MAE para determinar la muestra mínima necesaria para

estimar el tamaño medio de la población de truchas:

El problema define una confiabilidad de 95%:

Para 1-α/2= 95% → Z= 1.96

Y un error de estimación no mayor a 2 cm.

N= 310 truchas, de las cuales 155 corresponden al estanque 1; 62 al estanque 2 y 93 al estanque 3.

Cuarto, determinar el tamaño de muestra, para el cual tendremos que calcular una muestra por

cada estanque:

n0=[Z (∝/2)/ε ]2Sx2

n0= [1.96/2]2[ 155310 ]25+[ 62310 ]225+[ 93310 ]100=84.035≅ 85 Si n0/N≤0.05ó si no conocemos el

tamaño de la población.

→n0N

= 85/310 = 0.2742 ≥0.05→

n´=n0

1+n0N

= 85

1+85310

= 851+0.2742

=66.7085≅ 67

n1´ = n

´ 155310

= 67∗155310

=33.5≅ 34

n2´ = n

´ 62310

= 67∗62310

=13.4≅ 13

n2´ = n

´ 93310

= 67∗93310

=20.1≅ 20

Para estimar el tamaño medio de la población de truchas, usando un diseño MAE con una confianza de

95% y un error de estimación no mayor a 2 centímetros, el investigador debe elegir una muestra de 67

truchas, de las cuales, 34 deben ser del primer estanque; 13 deben ser del segundo y 20 del tercero.

Taller Nº 5 12

Page 13: Resolucion Taller No 5 Estadistica

Ministerio de Educación y JusticiaUniversidad Tecnológica Nacional

Facultad Regional San Rafael

b) ¿Cuántas truchas se debe elegir en la muestra del cultivo y por estanque para estimar la

proporción de truchas que cumple la norma si se desea una confianza de 95% y un error no

mayor a 0.05? Si usamos un diseño MAE con Asignación proporcional

Primero, Identificar la variable en estudio y los parámetros involucrados.

X = truchas que cumplen la norma. En este caso el parámetro de interés es p(x)= proporción de truchas

que cumplen la norma y el parámetro involucrado es ρ̂ el cual estima a P

En este caso, conocemos la proporción estimada de cada estanque:

p̂1= 0.80 p̂2=0.25

p̂3= 0.50Segundo, sabemos que la técnica de muestreo que debemos utilizar es MAE para determinar la

muestra mínima necesaria y estimar la proporción de población.

El problema define una confiabilidad de 95%:

Para 1-α/2= 95% → Z= 1.96

Y un error de estimación no mayor a 0,05.

Y conocemos que el lote completo (la población de estudio) es N= 310 truchas.

Tercero, determinar el tamaño de muestra.

n0=[ Z α¿2

ε ]2

ρ̂(1− ρ̂)

n0= [1.96/0.05]2[ 155310 0.8∗0.2+ 62310 0.25∗0.75+ 93310 0.5∗0.5 ]=295.8032≅ 296 Si

n0/N≤0.05ó si no conocemos el tamaño de la población.

→n 0N= 296/310 = 0.9548 ≥0.05→

n´=n0

1+n0N

= 296

1+296310

= 2961+0.9548

=151.4221≅ 152

n1´ = n

´ 155310

= 152∗155310

≅ 76

n2´ = n

´ 62310

= 152∗62310

=30.4≅ 30

n2´ = n

´ 93310

= 152∗93310

=45.6≅ 46

Taller Nº 5 13

Page 14: Resolucion Taller No 5 Estadistica

Ministerio de Educación y JusticiaUniversidad Tecnológica Nacional

Facultad Regional San Rafael

Para estimar la proporción de truchas que cumplen con la norma de consumo en la población, usando un

diseño MAE con una confianza de 95% y un error de estimación no mayor a 0.05, el investigador debe

elegir al menos 152 truchas; 76 del estanque 1; 30 del estanque 2 y 46 del estanque 3.

Ejercicio Nº 8

El peso de 3000 estudiantes varones de una Universidad está normalmente distribuido con media

68 Kg. y desviación típica 3 Kg. Si se toman 80 muestras de 25 estudiantes cada una:

a. ¿cuáles serán la media y la desviación típica esperadas de la resultante distribución de muestreo de

medias, si el muestreo se hizo con y sin reposición?

Por teorema del límite central, el comportamiento de la distribución de muestreo de medias, tenderá a un

comportamiento normal.

Se cumple entonces que: μ=μx = 68Kg.

Muestreo con reposición:

σ x=σ

√n= 3Kg .√25 = 0,6 Kg.

Muestreo sin reposición:

σ x=σ√n √( N−n

N−1 )= 3Kg .√25 √(3000−253000−1 )= 0,5951 Kg≅ 0 ,6Kg .

b. ¿En cuántas de las muestras se esperaría encontrar que la media estuviera entre 66,8 Kg.y 68,3 Kg.?

Para calcular la cantidad de muestras debemos primero estimar la probabilidad, para ello

estandarizamos, calculando el valor Z para cada valor de media:

Z1=X−μx

σ x = 66,8Kg.−68Kg.

0,6Kg .= -2,0

Z2=X−μx

σ x = 68,3Kg .−68Kg .

0,6Kg .= 0,5

Estimamos el área bajo la curva normal entre z1 y z2

La probabilidad acumulada para z1 = -2 p(z1)=0,022750132

La probabilidad acumulada para z2 =0,5 p(z2)=0,691462461

La probabilidad entre z1 y z2 = 0,691462461 - 0,022750132 = 0,668712329

Calculamos la probabilidad de encontrar que la media estuviera entre 66,8 Kg.y 68,3 Kg., sólo resta

calcular la cantidad de muestras.

Sabemos que en total, las muestras son 80, entonces:

Muestras = 80*p= 80*0,668712329 = 53,49698635 ≅ 54muestras

Se espera encontrar la media entre 66,8Kg y 68,3 Kg, en 54 muestras.

Taller Nº 5 14

Page 15: Resolucion Taller No 5 Estadistica

Ministerio de Educación y JusticiaUniversidad Tecnológica Nacional

Facultad Regional San Rafael

c. ¿Cuál sería el número de muestras esperadas con media menor a 66,4Kg. ?

Para calcular la cantidad de muestras debemos primero estimar la probabilidad, para ello

estandarizamos, calculando el valor Z para este valor de media:

Z=X−μx

σ x = 66,4Kg .−68Kg .

0,6Kg .= -2,67

P (z)= 0,003792562

Sabemos que en total, las muestras son 80, entonces:

Muestras = 80*p= 80*0,003792562= 0,30 ≅ 0 ó1muestras

Se espera encontrar como mucho, una muestra donde la media sea menor a 66,4Kg.

Ejercicio Nº 9

Determinar el tamaño de muestra adecuado para que, con un nivel de confianza del 95%, se

cometa como máximo un error del 5% al estimar la media poblacional de una distribución, si se

sabe que la desviación estándar poblacional es de 0,3.

Identificar, los datos que presenta el enunciado, y los parámetros involucrados.

En este caso se debe suponer que X N ¿) y los parámetros involucrados son dos: μ ;σ2 donde μ es la

media y σ es la desviación estándar de la población.

En este caso se tiene, del enunciado del problema, que μ es desconocida. Sólo se conoce σ=¿ 0,3.

Tercero, sabemos que debemos utilizar (MAS) para determinar la muestra

necesaria para estimar la media de la población:

El problema define una confiabilidad de 95%:

Para 1-α/2= 95% → Z= 1.96

Y un error de estimación de 0,5.

Cuarto, Determinar el tamaño de muestra.

n0=[Z (∝/2)/ε ]2Sx2

n0= [ 1.960,5 ]2

(0,3 )2=¿138,2976 ≅ 139 Si n 0N

≤0.05ò N es desconocida

En este caso no conocemos el tamaño de la población, por lo cual no realizamos el ajuste n´

Para estimar la media en la población, usando un diseño MAS con una confianza de 95% y un

error de estimación del 5%, el tamaño adecuado de la muestra, es de 139 elementos.

Ejercicio Nº 10

Taller Nº 5 15

Page 16: Resolucion Taller No 5 Estadistica

Ministerio de Educación y JusticiaUniversidad Tecnológica Nacional

Facultad Regional San Rafael

Antes de iniciar un proceso ganadero, se desea estimar la población de ganado bovino, para lo

cual se captura una muestra de 300 vacas, se marcan y se regresan al campo. Dos semanas

después se eligen 200 vacas, de las cuales 62 venían marcadas. Estime el total de vacas en el

campo y determine un intervalo de 95% de confianza para dicho parámetro.

Primero: Identificar los parámetros involucrados

En este caso el parámetro a estimar es el número de vacas de la población: N

Para ello se elige una muestra aleatoria de t elementos. De esta forma se tiene que:

p= tNdónde p = es la proporción de marcadas en la población. →

Parámetro :N= tp

Estimador :Se elige una segunda muestra de tamaño n en la cual se encuentran (aleatorio) s

marcadas, luego

p̂= sn

es la proporción estimada de marcadas en la segunda muestra, así un estimador puntual del

tamaño de la población es:

N̂= tp̂=nt

s

Varianza estimada: (en este caso s es aleatoria y n es fija)

σ 2=t 2n (n−s)

s3=¿

Sabemos que:

t= 300

n=200

s= 62

N̂= tp̂=nt

s = 200∗30062

= 967.74 ≅968 vacas

σ 2=t 2n (n−s)

s3=¿

(300)2200 (200−62)623

=¿10422.61086 vacas2

σ=√10422.61086=¿¿ 102.091vacasLa población estimada es de 968 vacas, con una desviación estándar de 102 vacas.

Para estimar el intervalo de confianza, sabemos que:[N̂ -Z_ (α/2) √(σ^2); N̂+Z_(α/2) √(σ^2)][968-1,96* 102,091; 968+1,96* 102,091]Taller Nº 5 16

Page 17: Resolucion Taller No 5 Estadistica

Ministerio de Educación y JusticiaUniversidad Tecnológica Nacional

Facultad Regional San Rafael

[767.901269669756 ;1168.09873033024 ]≅ [768 ;1168 ]

Podemos decir que para un 95% de confianza la población, estará comprendida entre 768 y 1168 vacas.

Ejercicio Nº 11

En una autopista es de interés estimar el número total de vehículos de un determinado tamaño

que por allí circulan en horario pico, para lo cual se selecciona una muestra inicial de 150

vehículos y se marcan. En el mismo mes se controla hasta encontrar 35 vehículos marcados,

cuantificando 100 vehículos para lograr esto. Estime el número total de vehículos que circulan en

la autopista en horario pico y un intervalo de 95% de confianza para dicho total.

Primero: Identificar los parámetros involucrados

En este caso el parámetro a estimar es el número de vehículos de la población: N

Para ello se elige una muestra aleatoria de t elementos. De esta forma se tiene que:

p= tNdónde p = es la proporción de marcados en la población. →

Parámetro :N= tp

Estimador :Se elige una segunda muestra hasta lograr 35 vehículos marcados (s fijo) de tamaño n,

luego

p̂= sn

es la proporción estimada de marcados en la segunda muestra, así un estimador puntual del

tamaño de la población es:

N̂= tp̂=nt

s

Este caso difiere del problema anterior en que Varianza estimada:

σ 2=t 2n (n−s)s2(s+1)

=¿ (En este caso n es aleatoria y s es fijo)

Sabemos que:

t= 150

n=100

s= 35

N̂= tp̂=nt

s = 100∗15035

= 428.57 ≅429 vehículos

σ 2=t 2n (n−s)s2(s+1)

=¿ (150)2100(100−35)

352(35+1)=¿3316.3265 vehículos2

σ=√3316.3265=¿¿ 57.587≅ 58 vehículosTaller Nº 5 17

Page 18: Resolucion Taller No 5 Estadistica

Ministerio de Educación y JusticiaUniversidad Tecnológica Nacional

Facultad Regional San Rafael

La población estimada es de 429 vehículos, con una desviación estándar de 58 vehículos.

Para estimar el intervalo de confianza, sabemos que:[N̂ -Z_ (α/2) √(σ^2); N̂+Z_(α/2) √(σ^2)][429-1,96* 57,587; 429+1,96* 57,587][316.12948 ;541.87052 ]≅ [316 ;542 ]

Podemos decir que para un 95% de confianza la población, estará comprendida entre 316 y 542

vehículos.

Ejercicio Nº 12

Se conoce que el coeficiente intelectual humano se distribuye en forma normal. El promedio del

IQ de la población es 100 y la desviación estándar es igual a 10:

a. Cuál es la probabilidad de encontrar personas con coeficiente intelectual superior a 125?

En este caso, la consigna nos pide estimar la probabilidad, de halar ciertos valores en una población

normal, para ello estandarizamos, calculando el valor Z para 125:

Z1=X−μx

σ x = 125−10010

= 2,5

Estimamos la probabilidad el área bajo la curva normal par valores superiores a 2,5

La probabilidad acumulada para z1 = 2,5 p(z1)= 0,993790335

Entonces 1- p(z1) =1- 0,993790335 = 0,006209665

La probabilidad de hallar personas con un IQ superior a 125 es 0,006209665.

b. ¿Cuál es la probabilidad de encontrar un individuo con coeficiente intelectual entre 105 y 115?

Z1=X−μx

σ x = 105−10010

= 0,5

Z2=X−μx

σ x = 115−10010

= 1,5

La probabilidad acumulada para z1 =0,5 p(z1)=0,691462461

La probabilidad acumulada para z2 =1,5 p(z2)= 0,933192799

La probabilidad entre z1 y z2 = 0,933192799 - 0,691462461= 0,241730337

La probabilidad de encontrar un individuo con IQ entre 105 y 115 es 0,241730337

c. ¿Cuál es la probabilidad de encontrar un individuo con coeficiente intelectual entre 80 y 95?

Z1=X−μx

σ x = 80−10010

= -2

Taller Nº 5 18

Page 19: Resolucion Taller No 5 Estadistica

Ministerio de Educación y JusticiaUniversidad Tecnológica Nacional

Facultad Regional San Rafael

Z2=X−μx

σ x = 95−10010

= -0,5

La probabilidad acumulada para z1 = -2 p(z1)= 0,022750132

La probabilidad acumulada para z2 =-0,5 p(z2)= 0,308537539

La probabilidad entre z1 y z2 = 0,308537539 - 0,022750132= 0,285787407

La probabilidad de encontrar un individuo con IQ entre 80 y 95 es 0,285787407

Ejercicio Nº 13

500 bolillas de rulemán tienen un peso medio de 5.02 g y una desviación típica de 0.3 g. Hallar la

probabilidad de que una muestra al azar de 100 bolillas de ese conjunto, tengan un peso total,

mayor de 510 g.

Primero: Identificar los parámetros y estadísticos involucrados

N= 500

μ=5,02 g

σ=0,3 g

n=100

X= pesototaln

=510g100

=5,1g

Necesitamos hallar la probabilidad para una muestra, entonces, estandarizamos:

Z=X−μx

σ x =

(5,1 g−5,02 g)/0,3g√100 = 2,66

P(z)=p(2,66)= 0,003830381

La probabilidad de encontrar una muestra al azar de 100 bolillas, con un peso total mayor a 510g

es 0,003830381.

Ejercicio Nº 14

Un ingeniero quiere estimar el peso promedio de ciertos envases con fruta. Un estudio anterior de

10 envases, revela que la desviación estándar de sus pesos es de 12,2 Kg. ¿De qué tamaño debe

ser la muestra con el 95% de confianza y un error de estimación máximo de 4 Kg?

Primero: Identificar los parámetros y estadísticos involucrados

N= desconocido

μ=desconocida

σ=12,2Kg

n=10

Taller Nº 5 19

Page 20: Resolucion Taller No 5 Estadistica

Ministerio de Educación y JusticiaUniversidad Tecnológica Nacional

Facultad Regional San Rafael

El problema define una confiabilidad de 95%:

Para 1-α/2= 95% → Z= 1.96

Y un error de estimación de 4 Kg.

n0=[Z (∝/2)/ε ]2Sx2 Recordemos que: ε=

√n→n=(zσ /ε )2

n0= [ 1.964 ]2

(12,2 )2=¿35,736 ≅ 36 Si n 0N

≤0.05ò N es desconocida

En este caso no conocemos el tamaño de la población, por lo cual no realizamos el ajuste n´

Para estimar la media en la población, con una confianza de 95% y un error de estimación de 4Kg,

el tamaño adecuado de la muestra, es de 36 envases.

Taller Nº 5 20