MUESTRALES

22
 Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán Distribuciones Muestrales http://www.cuautitlan.unam.mx La inferencia estadística estudia los métodos para poder obtener información acerca de una población a partir del estudio de una muestra. Sus métodos y procedimientos son inductivos, es decir, generan el conocimiento transitando de lo particular a lo general. ¿Qué se entiende por población? Una población es el conjunto de todos los elementos que estamos estudiando, acerca de los cuales deseamos obtener información. ¿Cómo se puede obtener información acerca de alguna característica de la población? Evaluando la característica en todos y cada uno de los elementos de la población. Por ejemplo, si deseas conocer el promedio de calificaciones de los estudiantes de la licenciatura en Administración en una determinada Facultad, deberás acudir a la Sección Escolar y solicitar los registros de calificaciones de todos y cada uno de los estudiantes inscritos en esta carrera. Con los datos obtenidos es fácil obtener el promedio de todos los estudiantes. ¿Con qué nombre se conoce al procedimiento descrito anteriormente? El estudio de la característica objetivo en todos y cada uno de los elementos de la población, se conoce como Censo. He oído que el censo presenta algunos inconvenientes, ¿cuáles son éstos? El estudio de cada elemento representa un costo. La medición de alguna característica de la población, puede ser desde un proceso muy sencillo hasta uno muy sofisticado. DISTRIBUCIONES MUESTRALES

Transcript of MUESTRALES

Page 1: MUESTRALES

8/15/2019 MUESTRALES

http://slidepdf.com/reader/full/muestrales 1/21

Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán

Distribuciones Muestrales http://www.cuautitlan.unam.mx

La inferencia estadística estudia los métodos para poder obtenerinformación acerca de una población a partir del estudio de unamuestra. Sus métodos y procedimientos son inductivos, es decir,generan el conocimiento transitando de lo particular a lo general.

¿Qué se entiende por población?

Una población es el conjunto de todos los elementos que estamos

estudiando, acerca de los cuales deseamos obtener información.¿Cómo se puede obtener información acerca de algunacaracterística de la población?

Evaluando la característica en todos y cada unode los elementos de la población. Por ejemplo,si deseas conocer el promedio de calificacionesde los estudiantes de la licenciatura enAdministración en una determinada Facultad,deberás acudir a la Sección Escolar y solicitarlos registros de calificaciones de todos y cadauno de los estudiantes inscritos en esta carrera.Con los datos obtenidos es fácil obtener elpromedio de todos los estudiantes.

¿Con qué nombre se conoce al procedimiento descritoanteriormente?

El estudio de la característica objetivo en todos y cada uno de loselementos de la población, se conoce como Censo.

He oído que el censo presenta algunos inconvenientes,¿cuáles son éstos?

El estudio de cada elemento representa un costo. La medición de algunacaracterística de la población, puede ser desde un proceso muy sencillohasta uno muy sofisticado.

DISTRIBUCIONES MUESTRALES

Page 2: MUESTRALES

8/15/2019 MUESTRALES

http://slidepdf.com/reader/full/muestrales 2/21

Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán

Distribuciones Muestrales http://www.cuautitlan.unam.mx

Por ejemplo, medir la estatura de los estudianteses un proceso trivial, en cambio auditar un procesocontable, requiere de una preparaciónespecializada; entonces el querer revisar todos ycada uno de los elementos que conforman eseproceso contable, requerirá contratar tantopersonal capacitado como sea necesario y por lotanto la auditoría resultará muy costosa.

Además, si la población está conformada pormuchos elementos o si el proceso de medida es lento, el censo resultarámuy tardado.

Ahora bien, si el proceso de medida es destructivo, es imposible realizarel censo, ya que cada medición implica la destrucción o la eliminacióndel elemento de la población donde se está midiendo la característica deinterés. Supón que trabajas en el departamento de Calidad de unafábrica de cerillos y que para asegurarte que los cerillos “prenden”,decides realizar un censo, es decir, prender todos y cada uno de loscerillos; al final aunque tu producción haya sido muy buena, ya notienes cerillos que vender.

En resumen, los inconvenientes del censo son: el costo, lo tardado y quees imposible llevarlo a cabo cuando la prueba es destructiva.

Entonces, ¿qué procedimiento alternativo al censo, se puedeutilizar?

El procedimiento alternativo al censo se conoce como muestreo;consiste en seleccionar mediante algún procedimiento, algunoselementos de la población y estudiar en ellos la característica objetivo.Estos elementos seleccionados de la población conforman lo que sedenomina muestra.

A partir del siguiente problema, ¿qué elementos importantespodemos distinguir?

Un editor de un diario a nivel nacional está interesado en conocer laopinión que tienen los lectores, acerca de cómo aborda el periódico lasnoticias sobre la criminalidad en el país.

Page 3: MUESTRALES

8/15/2019 MUESTRALES

http://slidepdf.com/reader/full/muestrales 3/21

Page 4: MUESTRALES

8/15/2019 MUESTRALES

http://slidepdf.com/reader/full/muestrales 4/21

Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán

Distribuciones Muestrales http://www.cuautitlan.unam.mx

¿Cómo se puede seleccionar una muestra aleatoria simple oirrestricta?

El procedimiento consiste en numerar a los elementos de lapoblación y luego por sorteo, ir seleccionando los elementosque conforman la muestra. Es decir, cada elemento tendrá unnúmero y en una urna se depositarán boletos, bolas, canicas,etc. con cada número; se revuelven en la urna o en el medioque las contenga, por ejemplo, la lotería nacional usatambores giratorios, y se van extrayendo tantos boletos,

bolas, canicas, etc. como sean necesarios hasta conformar la muestradeseada. Con el fin de sustituir este procedimiento laborioso, se puedenusar las tablas de números aleatorios.

¿Qué son las tablas de números aleatorios?

Las tablas de números aleatorios son tablas dedígitos generados por computadora. Sualeatoriedad está probada estadísticamente; sondígitos aleatorios porque la probabilidad deocurrencia es la misma para cada uno de ellos.

¿Cómo se utilizan las tablas de númerosaleatorios para seleccionar una muestra?

Primero se debe numerar a los elementos de lapoblación, utilizando el número de dígitos adecuados. Por ejemplo, siquieres obtener una muestra de una población de 135 sucursalesbancarias, para realizar un estudio de la calidad en el servicio, deberásnumerar a las sucursales del 000 al 134.

Enseguida eliges un punto de partida en la tabla; el punto de partida estotalmente arbitrario, es decir, el que tú decidas. Puedes desplazarte encualquier dirección, de arriba hacia abajo, de abajo hacia arriba, de

izquierda a derecha, de derecha a izquierda, en diagonal ascendente yen diagonal descendente, con la única limitación de que una vez queseleccionas una dirección, debes usar ésta. Hoy en día, las calculadorasde bolsillo y software especializado generan números aleatorios.

Siempre he escuchado que hay que obtener una muestra que searepresentativa de la población; ¿las muestras obtenidas mediante unmuestreo aleatorio simple son representativas de la población?

Page 5: MUESTRALES

8/15/2019 MUESTRALES

http://slidepdf.com/reader/full/muestrales 5/21

Page 6: MUESTRALES

8/15/2019 MUESTRALES

http://slidepdf.com/reader/full/muestrales 6/21

Page 7: MUESTRALES

8/15/2019 MUESTRALES

http://slidepdf.com/reader/full/muestrales 7/21

Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán

Distribuciones Muestrales http://www.cuautitlan.unam.mx

Piensas que para otorgar los préstamos, es adecuado seleccionar unamuestra sistemática. Para tal efecto, elaboras una lista alfabética con los

nombres de los 140 empleados, numerados del 1 al 140; el intervalo demuestreo será k=140/10=14; primero seleccionas aleatoriamente unempleado de los 14 primeros, por ejemplo el número 8; enseguidaseleccionas a los 9 empleados restantes cada intervalo de muestreo, esdecir, cada 14 elementos, lo que daría el otorgamiento de los préstamosa los empleados listados con los siguientes números: 8, 22, 36, 50, 64,78, 92, 106, 120 y 134.

¿Cómo se pueden describir las poblaciones y las muestras?

Tanto las poblaciones como las muestras se pueden describir mediantevalores numéricos. Las medidas descriptivas más importantes son lasde tendencia central y variabilidad. Las medidas descriptivas que serefieren a la población se conocen como parámetros y las que serefieren a la muestra como estadísticos. Es muy importante también laforma de la distribución, como una representación descriptiva sobretodo de las poblaciones.

¿Cuál es la diferencia entre un parámetro y un estadístico?

En el ejemplo de la opinión sobre la criminalidad de los lectores deldiario, supón que la encuesta la calificas de 0 a 10 puntos. Si conocierasla opinión de todos los lectores, esdecir, de toda la población, podríascalcular el promedio de la calificación.Nota que si ya tienes las calificacionesde todas las encuestas, y calculas elpromedio una segunda vez, unatercera vez, etc. obtienes el mismoresultado. Luego el valor delpromedio de la población es un valorfijo. A los descriptores de la poblaciónque son valores fijos les llamamosparámetros.

Page 8: MUESTRALES

8/15/2019 MUESTRALES

http://slidepdf.com/reader/full/muestrales 8/21

Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán

Distribuciones Muestrales http://www.cuautitlan.unam.mx

El editor obtuvo una muestra de 100 personas y con las calificaciones delas encuestas puede calcular la media de esta muestra. Ahora bien, eleditor le pide al jefe de redacción seleccionar una segunda muestra de

100 personas, seguramente éstas no serán las mismas personas que lasque el editor seleccionó, luego el promedio de calificaciones serádiferente. Si realizamos muestreo repetitivo, es decir muchas muestrasde tamaño 100, cada muestra generará algunas medias diferentes,otras iguales, pero no tomarán un valor fijo. En contraste, con lasmedidas descriptivas calculadas con los valores de una población, lasmedidas a partir de una muestra son variables y se les conoce comoestadísticos o estimadores.

Los estadísticos son variables aleatorias y por lo tanto tienendistribución de probabilidad.

¿Cómo se puede obtener la distribución de probabilidad de unestadístico?

Si se realiza un muestreo repetitivo y se obtiene la distribución defrecuencias relativas para un estadístico en particular, esta será unabuena aproximación de la distribución de probabilidad del estadístico.

¿A que se conoce como distribución de muestreo o muestral

de un estadístico?Se conoce como distribución de muestreo o muestral de un estadístico,a su distribución de probabilidad

Si nos dan el valor de una media, ¿cómo podemos saber si serefiere a la media de la población o a la media de la muestra?

Convencionalmente se utilizan letras griegas para referirse a losparámetros y letras latinas para los estadísticos.

Medida descriptiva Población MuestraMedia aritmética

VarianzaDesviación estándar

ProporciónTabla 1. Parámetros y Estadísticos

Page 9: MUESTRALES

8/15/2019 MUESTRALES

http://slidepdf.com/reader/full/muestrales 9/21

Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán

Distribuciones Muestrales http://www.cuautitlan.unam.mx

Si suponemos una población que consiste en los números 1,2, 3 y 4, ¿cómo se puede obtener la distribución muestral de

la media?Como se conoce la población, es conveniente describir su distribuciónpara después compararla con la distribución muestral.

En la tabla 2, se muestra cada valor de la población asociado a sucorrespondiente valor de probabilidad. En este caso cada valor 1, 2, 3 y4 ocurren una sola vez, es decir, su probabilidad es igual a 1/4.

i x ( )iP x 1 ¼2 ¼3 ¼4 ¼

( )iP x =∑ 1.0

Tabla 2. Valores de probabilidad para cada valor de la población

En la figura 1, se muestra la gráfica de la distribución de probabilidadpara la población; observa que es una distribución uniforme

Figura 1. Gráfica de distribución de probabilidad para la población

Page 10: MUESTRALES

8/15/2019 MUESTRALES

http://slidepdf.com/reader/full/muestrales 10/21

Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán

Distribuciones Muestrales http://www.cuautitlan.unam.mx

La media de la población es igual a:

y la varianza de la población viene dada por:

y por tanto, su desviación estándar es:

Ahora obtengamos la distribución muestral del estadístico seleccionado,es decir de la media de la muestra . Para obtener la distribuciónmuestral de definamos un tamaño de muestra, por ejemplo, yobtengamos todas las muestras posibles con reposición.

En la tabla3, se resumen las muestras posibles y sus correspondientesmedias, Los números entre paréntesis indican la probabilidad paracada valor de la población y el número subrayado indica la media, decada muestra

1 (0.25) 2 (0.25) 3 (0.25) 4 (0.25)1 (0.25) 1.0 1.5 2.0 2.5

2(0.25) 1.5 2.0 2.5 3.03(0.25) 2.0 2.5 3.0 3.54(0.25) 2.5 3.0 3.5 4.0

Tabla 3. Cada valor de la población asociada a su probabilidad

En la tabla4, se resume el valor de las con sus correspondientesprobabilidades.

Page 11: MUESTRALES

8/15/2019 MUESTRALES

http://slidepdf.com/reader/full/muestrales 11/21

Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán

Distribuciones Muestrales http://www.cuautitlan.unam.mx

1.0 1 0.06251.5 2 0.12502.0 3 0.18752.5 4 0.25003.0 3 0.18753.5 2 0.12504.0 1 0.0625

Tabla 4. Resumen del valor de las medias con sus probabilidades

En la figura 2, se muestra la gráfica de cada valor de y su

correspondiente valor de probabilidad. Observa que la distribuciónmuestral de es normal en contraste con la distribución de la poblaciónque era uniforme.

Figura 2. Grafica de cada valor de y su probabilidad

La media de esta distribución, es decir, la media de las medias, , lacalculamos como sigue:

Page 12: MUESTRALES

8/15/2019 MUESTRALES

http://slidepdf.com/reader/full/muestrales 12/21

Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán

Distribuciones Muestrales http://www.cuautitlan.unam.mx

o bien

Observa que el valor de

La varianza de la distribución de las , se calcula como sigue:

o bien:

Observa que este valor es igual a la varianza de la población divididaentre el tamaño de la muestra

Page 13: MUESTRALES

8/15/2019 MUESTRALES

http://slidepdf.com/reader/full/muestrales 13/21

Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán

Distribuciones Muestrales http://www.cuautitlan.unam.mx

Nota que el tamaño de la muestra es , ya que cada muestra quegeneró una fue de este tamaño. No confundas el tamaño de la

muestra con el número de muestras que en nuestro caso son 16.

La desviación estándar de la distribución muestral de la media, la cualse conoce como error estándar , es igual a:

y es igual .

La distribución muestral de las , obtenida mediante este procedimiento,

se conoce como distribución empírica.

¿Se pueden generalizar los resultados obtenidos en el anteriorejemplo o sólo fue un caso especial?

Si, si se pueden generalizar los resultados del ejemplo anterior; sonconsecuencia del teorema del límite central.

¿Que establece el teorema del límite central?

El enunciado del teorema del límite central es el siguiente:Dada una población con una media finita y una varianza finita, ladistribución muestral de , obtenida a partir de muestras de tamaño

de dicha población, será aproximadamente normal con media yvarianza .

Las consecuencias más importantes de este teorema son las siguientes:

1. Cualquiera que sea la forma de la distribución de la población, la

distribución muestral de se aproxima a una distribución normal,cuando es suficientemente grande.

2. La media de la distribución muestral de será siempre igual a lamedia de la población.

Page 14: MUESTRALES

8/15/2019 MUESTRALES

http://slidepdf.com/reader/full/muestrales 14/21

Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán

Distribuciones Muestrales http://www.cuautitlan.unam.mx

3. La varianza de la distribución de las es igual a , siempre ycuando se realice muestreo con reemplazo de una población finitao con o sin reemplazo de una población infinita.

4. Cuando se muestrea sin reemplazo una población finita Lavarianza de la distribución de las es igual a

5. La varianza de la distribución muestral disminuye cuando el

tamaño de la muestra aumenta y siempre será menor de lavarianza de la población

Se mencionó que la distribución muestral se aproxima a unadistribución normal cuando es suficientemente grande, ¿apartir de que tamaño se considera que una muestra essuficientemente grande?

No existe una respuesta exacta debido a que el tamaño de la muestraque permita que la distribución muestral de , se aproxime a unadistribución normal depende de la condición de no normalidad de lapoblación. Sin embargo, para la mayoría de las situaciones prácticas unamuestra de 30 o más observaciones se considera suficiente. Lo que nose debe de perder de vista es que la aproximación de la distribuciónmuestral de a una normal es mejor si aumenta el tamaño de lamuestra.

¿Sí la población estuviera distribuida normalmente, ladistribución muestral de se aproximaría a una distribuciónnormal con tamaños de muestra menores?

Cuando la población se distribuye normalmente, la distribución muestralde las será exactamente normal sea cual sea el tamaño de la muestra.

Cuando se muestrea una población finita sin reemplazo, se multiplicó ala varianza de la distribución muestral por un factor igual a ¿siemprese tiene que usar este factor o en algunos casos se puede omitir?

Page 15: MUESTRALES

8/15/2019 MUESTRALES

http://slidepdf.com/reader/full/muestrales 15/21

Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán

Distribuciones Muestrales http://www.cuautitlan.unam.mx

Al factor , se le conoce como factor de corrección por población finitay se le puede omitir cuando la población es mucho mayor que lamuestra. Por ejemplo, si el tamaño de la población es de un1,000,000 y el tamaño de la muestra , entonces el factor decorrección es:

En este caso, el factor de corrección por población finita esaproximadamente igual a 1 y se puede omitir sin ningún remordimiento

de conciencia. En general, esta corrección se omite cuando

En general, ¿cómo se obtiene una distribución muestral?

Las distribuciones muestrales pueden construirse empíricamentemediante muestreo de poblaciones finitas y discretas de la siguientemanera: de una población finita se seleccionan aleatoriamente todas lasmuestras posibles de un tamaño determinado; para cada muestra secalcula el estadístico de interés y por último se grafican los distintosvalores que toma el estadístico contra su frecuencia relativa.

¿Se puede elaborar la distribución muestral para la proporciónde éxitos en una muestra?

La distribución muestral para la proporción de éxitos en una muestra segenera a partir de la distribución binomial.

Una población binomial es cualquier conjunto de elementos donde cadauno se puede clasificar como un éxito o un fracaso.

El tamaño de la población, es decir el número de elementos, serepresenta con . En la población hay éxitos y – fracasos y laproporción de éxitos en la población, que se representa con la letra ,es igual a .

Page 16: MUESTRALES

8/15/2019 MUESTRALES

http://slidepdf.com/reader/full/muestrales 16/21

Page 17: MUESTRALES

8/15/2019 MUESTRALES

http://slidepdf.com/reader/full/muestrales 17/21

Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán

Distribuciones Muestrales http://www.cuautitlan.unam.mx

Es decir:

Sí queremos calcular la probabilidad de que losdos estudiantes seleccionados usen el IPOD,tenemos:

Suponiendo independencia:

La selección de las muestras de dos estudiantes se esquematizan en latabla 5; las probabilidades de obtener cada muestra, es decir lasprobabilidades de cada celda, se calculan simplemente multiplicando laprobabilidad del renglón por la probabilidad de la columna

correspondiente.

1 er estudiante seleccionadoNo. deéxitos

0(0.4)

1(0.6)

2 estudianteseleccionado

0 (0.4) 0.16 0.24

1 (0.6) 0.24 0.36

Tabla 5. Selección de muestras de 2 estudiantes

En la tabla 6, se muestran los valores que puede tomar la variable , laproporción de personas que usan el Ipod en la muestra, es deciry la probabilidad asociada con ellos. En la figura 3 se puede observar sugráfica.

Page 18: MUESTRALES

8/15/2019 MUESTRALES

http://slidepdf.com/reader/full/muestrales 18/21

Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán

Distribuciones Muestrales http://www.cuautitlan.unam.mx

0 0/2 = 0 0.161 ½ = 0.5 0.24 + 0.24 = 0.482 2/2 = 1.0 0.36

Tabla 6. Valores de la variable x

Figura 3. Distribución muestral para la variable x

La media de las proporciones en esta distribución se calcula como sigue:

Como se puede observar la media de la distribución muestral de esigual a la proporción poblacional .

La varianza de las proporciones muestrales se calcula como sigue:

Page 19: MUESTRALES

8/15/2019 MUESTRALES

http://slidepdf.com/reader/full/muestrales 19/21

Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán

Distribuciones Muestrales http://www.cuautitlan.unam.mx

La varianza de la distribución muestral , también es igual a:

Si las muestras fueran de tamaño mayor a 2, ¿también se puedeobtener la distribución muestral empíricamente?

Si, veamos el procedimiento para , el cual puede generalizarsepara cualquier tamaño de muestra.

En este caso las posibilidades son: que ninguno de los tres estudiantesentrevistados en cada muestra use el gadget o uno lo use o dos lo useno tres lo usen, es decir:

Entonces la selección de las muestras de tres estudiantes, se

esquematizan en la tabla 7, de la siguiente manera: En las columnasanotamos los resultados obtenidos anteriormente que se muestran enla tabla 8 y que se refieren a las probabilidades para los resultadosposibles en la selección de dos estudiantes, en la figura 4 se muestra lagráfica de la distribución. En los renglones anotamos al tercer estudianteseleccionado que solo puede contestar usa o no usa.

Los 2 primeros estudiantesseleccionados

No deéxitos 0(0.16) 1(0.48) 2(0.36)

3er.estudiante

seleccionado

0 (0.4) 0.064 0.192 0.144

1 (0.6) 0.096 0.288 0.216

Tabla 7. Selección de muestras de 3 estudiantes

Page 20: MUESTRALES

8/15/2019 MUESTRALES

http://slidepdf.com/reader/full/muestrales 20/21

Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán

Distribuciones Muestrales http://www.cuautitlan.unam.mx

Si queremos calcular la probabilidad de que ninguno de los tresestudiantes seleccionados usen el IPOD, tenemos:

Suponiendo independencia:

En general, las probabilidades de las celdas se obtienen simplementemultiplicando la probabilidad del renglón por la probabilidad de lacolumna correspondiente

0 0/3 = 0 0.06241 1/3 = 0.333 0.2882 2/3 = 0.666 0.4323 3/3 = 1 0.216

Tabla 8. Resultados de las probabilidades de x

Figura 4. Gráfica cuando n=3

Page 21: MUESTRALES

8/15/2019 MUESTRALES

http://slidepdf.com/reader/full/muestrales 21/21

Universidad Nacional Autónoma de MéxicoFacultad de Estudios Superiores Cuautitlán

La media de las proporciones en esta distribución sigue siendo:

Observa que nuevamente la media de la distribución muestral de p, esigual a la proporción poblacional .

La varianza de las proporciones muestrales es igual a:

La varianza de la distribución muestral , sigue siendo igual a:

Observa que la varianza de la distribución muestral se redujo de 0.12 a0.08 al aumentar el tamaño de la muestra de