1. Algunas Definiciones bÁsicos Para Dar Comienzo

16

Click here to load reader

Transcript of 1. Algunas Definiciones bÁsicos Para Dar Comienzo

Page 1: 1. Algunas Definiciones bÁsicos Para Dar Comienzo

1. ALGUNAS DEFINICIONES BÁSICOS

Para dar comienzo al módulo virtual relacionado con la distribución de muestreo de la media

aritmética (x ), a continuación se presentan las definiciones básicas que a juicio del tutor son pilar fundamental para abordar el curso.

Población. Es la totalidad de los elementos los cuales contienen las características de interés

Muestra. Es un subconjunto de observaciones que se seleccionan de una población y que tienen las características de interés.

Elemento. Es la unidad por la cual se solicita información o que son medidas. El elemento depende del objetivo que persiga el estudio

Unidad de muestreo. Corresponde al elemento o los elementos disponibles en la población susceptibles de ser seleccionados en alguna etapa del proceso de muestreo.

Unidades de enumeración. También conocidos como conglomerados, se utilizan cuando no es factible muestrear las unidades de enumeración directamente.

Conglomerado. Es un conjunto de unidades que se encuentran físicamente cerca.

Población estadística. Es un conjunto de mediciones sobre todos los elementos del universo resultando en lo que se conoce como poblaciones multivariadas

Marco muestral. Es un listado de todas las unidades de muestreo disponibles para su selección en una etapa del muestreo.

ESTADÍSTICO: es cualquier función de las observaciones de una muestra.

Desde otro punto de vista son valores que describen las características de una muestra, estos valores son variables pues dependen de las fluctuaciones de la muestra. Entre los estadísticos más conocidos se tienen:

la media muestral x

la varianza muestral s2

la desviación estándar muestral s la proporción muestral P.

Estos estadísticos tienen amplio uso en los procesos de muestreo cuando el interés es sacar conclusiones en poblaciones con base en la información de muestras.

PARÁMETRO: Es un valor constante que describe las características propias de una población estadística, Generalmente los parámetros en estadística se denotan con letras griegas como la

media poblacional μ y la desviación estándar poblacional σ .

Page 2: 1. Algunas Definiciones bÁsicos Para Dar Comienzo

UN ESTIMADOR: Es una regla o método que dice como calcular la estimación de un parámetro basándose en la información de una muestra, generalmente se expresa como una fórmula. Por

UNA ESTIMACIÓN: Es un valor particular de un parámetro obtenido de los valores de una muestra.

Para mostrar la relación entre estadístico, parámetro y estimador en los procesos inferenciales se presenta el siguiente cuadro:

Cuadro 1. ESTADÍSTICO PARÁMETRO ESTIMADOR

Media muestral

x̄=

∑i=1

n

X i

n

Media poblacional

μ=∑i=1

N

Xi

N

Media poblacional estimada

μ̂=∑i=1

n

X i

nVarianza muestral

S2=∑i=1

n

(X j−X )2

n−1

Varianza poblacional

σ 2=∑i=1

N

(X j−μ)2

N

Varianza poblacional estimada

σ̂ 2=∑i=1

n

(X j−X )2

n−1Desviación estándar muestral

S=√∑i=1

n

(X i−X )2

n−1

Desviación estándar

σ=√∑i=1

N

(X i−μ )2

N

Desviación estándar poblacional estimada

σ̂=√∑i=1

n

(X i−X )2

n−1

3. CONCEPTOS PRELIMINARES DE MUESTREO

En investigación científica muchas de las veces es imposible hacer un estudio exhaustivo de los elementos de la población o lo que se conoce como un estudio poblacional o censo, para este caso, se hace necesario valerse de las técnicas de muestreo para tomar sólo una parte la cual debe ser representativa de la población de estudio.

En este punto vale aclarar que el objetivo del curso no corresponde a realizar diseños de muestreo para investigación científica sino en conocer la distribución que sigue la media muestral siendo necesario conocer algunos tópicos iniciales de muestreo.

3.1 MUESTREO PROBABILISTICO

Para enmarcarlo en este tipo de muestreo debe cumplir con las siguientes condiciones

Se puede definir el conjunto de muestras posibles Conocer para cada una de las muestras posibles la probabilidad

Page 3: 1. Algunas Definiciones bÁsicos Para Dar Comienzo

El procedimiento seleccionado debe dar a cada elemento de la población una probabilidad diferente de cero

La selección debe ser aleatoria

3.2 MUESTREO NO PROBABILISTICO

Es aquel muestreo que no cumple con las condiciones citadas del muestreo aleatorio. Se vale del conocimiento y la opinión personal para identificar los elementos de la población que se van a incluir en la muestra. Son de este tipo: (Muestreo por conveniencia, por juicios, por prorrateo)

Cuando se hace muestreo probabilístico se tienen 3 casos que son los siguientes

MUESTRAS ORDENADAS CON REPETICIÓN

Si se tiene una población de tamaño N y se quiere tomar una muestra de tamaño n. El número de muestras ordenadas con repetición de N elementos tomados de a n esta dado por:

Nn

N: Número de elementos distintos disponibles en la poblaciónn: Número de elementos escogidos en la muestra

MUESTRAS ORDENADAS SIN REPETICIÓN)

Si se tiene una población de tamaño N y se quiere tomar una muestra de tamaño n. El número de muestras ordenadas sin repetición de N elementos tomados de a n esta dado por:

NPn=

N !(N−n ) ! . Cuando N=n , entonces NPN=N! .

El término NPn se lee N permutado n y se relaciona con el número de permutaciones u ordenaciones que se pueden hacer de N elementos tomados de a n.

El símbolo N !se lee N factorial y esta representado por el producto de los enteros positivos desde N hasta 1.

N !=(N )(N−1)(N−2)(N−3) .. .…(N−N ) Se asume que 0! = 1

Ejemplo: el resultado de cuatro factorial es.

4 !=(4 )(3 )(2)(1)( 0! )4 !=24

MUESTRAS NO ORDENADAS SIN REPETICIÓN

Si se tiene una población de tamaño N y se quiere tomar una muestra de tamaño n. El número de muestras no ordenadas si repetición de N elementos tomados de a n esta dado por:

Page 4: 1. Algunas Definiciones bÁsicos Para Dar Comienzo

NC n=

N !(N−n ) !(n ! )

El término NC n se lee N combinado n y se relaciona con el número de combinaciones o muestras no ordenas sin repetición que se pueden obtener de N elementos de la población tomados de a n.

Visto de otra forma es el número de diferentes agrupaciones de N objetos tomados de a n que pueden ocurrir sin tener en cuenta el orden.

Ilustración: para mostrar de forma simple los resultados para cada uno de los casos mencionados anteriormente se presenta el siguiente ejemplo. Ejemplo 1. Suponga que se tiene el conjunto S=(A, B, C, D) una población de N=4 elementos. Si el interés es tomar una muestra de tamaño 2 de esa población se tienen los siguientes resultados.

a) MUESTRAS ORDENADAS CON REPETICIÓN

Elemento de la población (A, B, C, D)Tamaño de la población N=4 Tamaño de la muestra n = 2Número de muestras posibles ordenadas con repetición

Nn=42

= 16Muestras posibles

AA BA CA DAAB BB CB DBAC BC CC DCAD BD CD DD

b) MUESTRAS ORDENADAS SIN REPETICIÓN

Elemento de la población (A, B, C, D)Tamaño de la población N=4 Tamaño de la muestra que se quiere tomar n = 2

Número de muestras posibles ordenadas sin repetición

Page 5: 1. Algunas Definiciones bÁsicos Para Dar Comienzo

NPn=

N !(N−n ) !=

4 !(4−2 )!

4P2=

4 !( 4−2 )!

=

( 4 )(3)(2 )(1)(2 )(1)

= 12 Muestras posibles

AB BA CA DAAC BC CB DBAD BD CD DC

c) MUESTRAS NO ORDENADAS SIN REPETICIÓN

En la literatura estadística es conocido también como muestreo sin reposición

Elemento de la población (A, B, C, D)Tamaño de la población N=4 Tamaño de la muestra que se quiere tomar n = 2

Número de muestras posibles no ordenadas sin repetición

NC n=

N !(N−n ) !(n ! ) .

NC n=

4 !( 4−2 )! (2! )

=

( 4 )(3)(2 )(1)(2)(1 )(2)(1)

=244

=6

Muestras posibles cuyas parejas se muestran como sigue

AB BCAC BDAD CD

Note que a diferencia del muestreo ordenado sin repetición, si ya fue elegida la muestra AB no puede ser elegida la muestra BA.

Page 6: 1. Algunas Definiciones bÁsicos Para Dar Comienzo

DEDUCCIÓN DEL VALOR ESPERADO DE LA MEDIA MUESTRAL

Si se tiene la variable X de una población de tamaño N cuya media es μ y varianza es σ2

.A

las letras griegas μ y σ 2se les denomina respectivamente media poblacional y varianza

poblacional.

Sea X1 , X2 , X3 . .. .. . ., X n una muestra de n valores de esta población. La media muestral se define mediante

X=X1+X 2+X3+.. . .. .. .+X n

n

Como el valor de la media muestral X esta determinado por los valores de las variables

aleatorias en la muestra, se tiene que X es también una variable aleatoria.

El valor esperado de una media de muestra se calcula como sigue:

E( X )=E [ X 1+X2+X3+ .. .. . .. .+Xnn ]

E( X )=

E (X1)+E (X2)+E (X3 )+. .. .. . ..+E (Xn)n

E( X )=1

nE (X1 )+E (X 2)+E (X3)+ .. .. . .. .+E (X n)

E( X )=

n( μ )n

E( X )=μ

Se espera que la media muestral sea igual a la media poblacional

Page 7: 1. Algunas Definiciones bÁsicos Para Dar Comienzo

DEDUCCIÓN DE LA VARIANZA DE LA MEDIA MUESTRAL

Si se tiene la variable X de una población de tamaño N cuya media es μ y varianza es σ2

. A

las cantidades μ y σ 2se les denomina media poblacional y varianza poblacional,

respectivamente.

Sea X1 , X2 , X3 . .. .. . ., X n una muestra de n valores de esta población. La varianza de la media muestral se define por.

Var (X )=Var [ X1+X2+X3+. .. .. . ..+Xnn ]

Por independencia se puede expresar como

Var (X )= 1

n2 [Var (X1 )+Var (X 2)+Var (X 3)+. . .. .. ..+Var (Xn) ]

Var ( x )=

(σ12+σ2

2+σ32+. . .. ..+σn

2 )

n2

Var (X )=nσ2

n2

Var (X )=σ

2

n

La varianza de la media poblacional es igual a la varianza poblacional dividida en el tamaño de muestra.

Se ha demostrado que E( X )=μ y Var (X )=σ

2

n . En adelante para estar en sintonía con la mayoría de textos de estadística, al referirnos a la

varianza de la media muestral se utilizará la notación σ x

2=σ2

n

Con relación a X su puede concluir que esta centrada alrededor de la media poblacional μ , pero su dispersión se reduce conforme aumenta el tamaño de la muestra.

Page 8: 1. Algunas Definiciones bÁsicos Para Dar Comienzo

ERROR ESTÁNDAR DE LA MEDIA MUESTRAL

Partiendo de muestras en poblaciones infinitas. El error estándar es la raíz cuadrada de la varianza muestral expresado por

σ x=σ

√n

σ x=σ√n √[ N−n

N−1 ]

El término

[ N−nN−1 ]

se llama factor de corrección por finitud

El error estándar de estimación de la media muestral. se puede interpretar como el grado de variabilidad que tiene la media muestral con respecto a la media poblacional. En otras palabras es una medida de la incertidumbre que existe al estimar la media poblacional a partir de la media muestral.

Cuando el muestreo se hace en poblaciones finitas o el muestreo es sin repetición visto anteriormente, la varianza de la media muestral se obtiene mediante la formula

¿Cuándo usar el factor de corrección?

En muestreo se utiliza el factor de corrección si la relación

nN

>0.05

En adelante para no utilizar con el factor de corrección se trabajará sobre poblaciones infinitas

Si la población es infinita o el Muestreo es con repetición

Si la población es finita

Page 9: 1. Algunas Definiciones bÁsicos Para Dar Comienzo

DISTRIBUCIÒN DE LA MEDIA MUESTRAL

Cuando el interés de una investigación es analizar por muestreo una característica cuantitativa,

tal como el peso de un producto, la longitud de una pieza manufacturada, o la estatura de cierta

especie. Es indispensable conocer la distribución de la media de esa muestra.

En general para este proceso se parte de una población de tamaño N con

parámetro μ

y se toma una muestra de tamaño n de donde se puede obtener el

estadístico x

, hay que observar que x

es una variable aleatoria porque resulta de

calcular la media muestral de sólo una de todas las muestras posibles de tamaño

n que pueden resultar.

Este proceso de muestreo se puede esquematizar como se muestra en la siguiente figura.

Población de tamaño N con media

μ = ?

A partir de los datos de la muestra se obtiene el

estadístico xEl valor

x se utiliza

para estimar el valor del

parámetroμ de la población

Se toma una

muestra aleatoria

de n elementos

de esa población

Page 10: 1. Algunas Definiciones bÁsicos Para Dar Comienzo

Como el interés recae en el comportamiento de la variable aleatoria x , su distribución se señala en la siguiente definición:

Si x1 , x2 ,. .. . ., xn es una muestra aleatoria de tamaño n, proveniente de una población

normal con media μ y varianza σ2

. Si x es la media de esa muestra, la distribución de x

es aproximadamente normal con media μ y varianza

σ2

n . ER

De manera equivalente se puede decir que al tomar una muestra grande de una población

normal, la distribución de la media muestral (x i ) sigue una distribución normal y se espera que la media de esa muestra sea igual a la media poblacional lo que se simboliza por

E( x̄ )=μ , y que la varianza muestral sea igual a la varianza poblacional dividida en n, lo

que se simboliza por V ( X̄ )=σ

2

n

TEOREMA DEL LÍMITE CENTRAL

Este es uno de los teoremas más importantes en probabilidad y en general en estadística

Si x es la media de una muestra de tamaño n que se toma de una población normal con

media μ y varianza finita σ2

, entonces la variable

z= x−μσ

√n tiende a la distribución normal estándar a medida que n tiende a infinito

El teorema del límite central es importante en estadística porque permite

Observación: cuando se desconoce la varianza poblacional y se tiene que estimar a partir de

los datos de la muestra como S2=∑

i=1

n ( xi−x )2

n−1 , entonces la estadística

T= x−μs /√n ,

tiene una distribución t de Student con n –1 grado de libertad.

Page 11: 1. Algunas Definiciones bÁsicos Para Dar Comienzo

TALLER 1.

Caso 1. En un estudio para medir preferencias de sabor de cierta marca de jugos, una importante empresa de investigación de mercados seleccionó sistemáticamente una muestra de 400 personas de un centro comercial en un fin de semana. Los encuestados corresponden a personas que compraron algún tipo de producto de esa marca y que accedieron a contestar el un formulario.

Caso 2.

En el hospital regional de una pequeña ciudad se han registrado en los últimos dos meses 18 casos de personas procedentes del sector rural que han sido afectadas por un virus mostrando graves trastornos intestinales lo que ha causado la muerte a un menor de edad. Para averiguar posibles causas la secretaria de salud ordena una investigación contratando con una firma particular su realización, para su ejecución de un total de 250 hogares se diseñó un muestreo aleatorio simple con un tamaño de 80 hogares.

Caso 3

Usted ha sido encargado para realizar en la población de niños menores de 10 años de un sector marginado socialmente un estudio tendiente ha conocer las condiciones de salud oral en que se encuentran. En época de vacaciones escolares planea tomar una muestrea de 85 hogares del sector y realizar la recolección de al información en compañía de un odontólogo.

Caso 4

Una compañía que quiere penetrar en el mercado local esta interesada en conocer los hábitos de compra en artículos de limpieza que tienen los hogares de una ciudad. Considerando que la población tiene hábitos de compra similares, la compañía planea adelantar un estudio por muestreo aleatorio simple indagando a 140 hogares. Caso 5

Con el objeto de conocer características socioeconómicas y motivo de viaje, una aerolínea planea para el presente año hacerle seguimiento a una muestra aleatoria de 60 aviones indagando a la totalidad de viajeros mediante la aplicación de un cuestionario diseñado para cumplir con el objetivo del estudio.

Para cada caso desarrolle los siguientes puntos.

Page 12: 1. Algunas Definiciones bÁsicos Para Dar Comienzo

1. Para cada caso identifique los siguientes puntos:

Población Muestra Unidad elemental Unidad de muestreo Marco muestral

2. Según el objeto de estudio de cada caso, haga un listado de las posibles variables por las cuales se puede indagar y diga a que tipo corresponde cada una y en que escala de medida se pueden obtener.

3. Elabore una encuesta de tal forma que puede recolectar la información sobre las características que mencionó anteriormente.

Teorema del límite central 1. Suponga que una máquina dispensadora de refrescos la cantidad que envasa es una variable aleatoria que tiene distribución normal con media 10 onzas y desviación estándar de 1 onza, si se propone realizar 66 mediciones del líquido dispensado.

a) Exprese el significado de xb) ¿qué distribución tiene x ?c) ¿cuál es error estándar e interprételo?

d) ¿Cual es la probabilidad de quex sea por lo menos 10.3

2. En la fabricación de cojinetes para motores, se sabe que el diámetro promedio es de 5 cm con una desviación estándar de 0,005 cm. El proceso es vigilado en forma periódica mediante la selección aleatoria de 64 cojinetes, midiendo sus correspondientes diámetros. El proceso no se detiene mientras que la media muestral se encuentre entre dos límites especificados, sea de

0,95. Determine el valor de esos límites. ¿Cuál es la distribución de x y con que parámetros?

3. Suponga que el contenido de nicotina de cierta marca de cigarrillos tiene distribución normal con media = 25 miligramos y desviación estándar de = 4 miligramos. Se toma una muestra

de aleatoria de 50 cigarrillos que arroja una media muestral de x̄ = 26 miligramo. Halle la probabilidad de que una muestra de este tamaño arroje una media muestral de la magnitud dada o mayor.

4. Sea x la calificación promedio de grupo de estudiantes seleccionados al azar en cierta

universidad. Se sabe que la distribución de x tiene media 2.5 y desviación estándar de 0.4. Si

se toma una muestra de 36 y se obtiene el valor de x . ¿Cuál es la probabilidad de que

Page 13: 1. Algunas Definiciones bÁsicos Para Dar Comienzo

a) sea menor que 2,4, b) esté en el intervalo (2,4 - 2,7).

5. Un fabricante de bombillas dice que su producto tiene una vida media de duración de 700 horas con una varianza de 14400 horas. El dueño de un taller le compró a dicho fabricante 144 bombillas con la idea de hacer más compras en el futuro si la duración media de la muestra la resulta superior a 680 horas. ¿Qué probabilidad hay de que el dueño del taller no vuelva ha realizar compras de bombillas de esa marca?

6. Los paquetes de cartón que contienen un determinado artículo fabricado por un establecimiento industrial, tienen un peso medio de 300 kg y una varianza de 2500 kg. ¿Cuál es la probabilidad de que 25 paquetes, tomados al azar, y cargados en un camión de distribución del producto, excedan la capacidad del camión que es de 8200 kg?.