Distribución hipergeométrica - Preliminar

20
Distribución hipergeométrica Distribución hipergeométrica Parámetros Dominio Función de probabilidad (fp) Media Moda Varianza Coeficiente de simetría Curtosis

Transcript of Distribución hipergeométrica - Preliminar

Page 1: Distribución hipergeométrica - Preliminar

Distribución hipergeométrica

Distribución hipergeométrica

Parámetros

Dominio

Función de

probabilida

d(fp)

Media

Moda

Varianza

Coeficiente de

simetría

Curtosis

 

Page 2: Distribución hipergeométrica - Preliminar

Función

generadora de

momentos(mgf)

Función

característica

En teoría de la probabilidad la distribución hipergeométrica es una distribución discreta

relacionada con muestreos aleatorios y sin reemplazo. Supóngase que se tiene una población

de N elementos de los cuales, d pertenecen a la categoría A y N-d a la B. La distribución

hipergeométrica mide la probabilidad de obtener x ( ) elementos de la categoría A en

una muestra sin reemplazo de n elementos de la población original.

Propiedades[editar · editar código]

La función de probabilidad de una variable aleatoria con distribución hipergeométrica puede

deducirse a través de razonamientoscombinatorios y es igual a

donde   es el tamaño de población,   es el tamaño de la muestra extraída,   es el número

de elementos en la población original que pertenecen a la categoría deseada y   es el número

de elementos en la muestra que pertenecen a dicha categoría. La notación   hace

referencia al coeficiente binomial, es decir, el número de combinaciones posibles al

seleccionar  elementos de un total  .

El valor esperado de una variable aleatoria X que sigue la distribución hipergeométrica es

y su varianza,

En la fórmula anterior, definiendo

y

se obtiene

Page 3: Distribución hipergeométrica - Preliminar

La distribución hipergeométrica es aplicable a muestreos sin reemplazo y

la binomial a muestreos con reemplazo. En situaciones en las que el

número esperado de repeticiones en el muestreo es presumiblemente

bajo, puede aproximarse la primera por la segunda. Esto es así

cuando N es grande y el tamaño relativo de la muestra extraída, n/N, es

pequeño.

Enlaces externos[editar · editar código]

DISTRIBUCIÓN  HIPERGEOMÉTRICA. Los experimentos que tienen este tipo de distribución tienen las siguientes características:

a)      Al realizar un experimento con este tipo de distribución, se esperan dos tipos de resultados.

b)      Las probabilidades asociadas a cada uno de los resultados no son constantes.

c)      Cada ensayo o repetición del experimento no es independiente de los demás.

d)      El número de repeticiones del experimento (n) es constante. 

 Ejemplo:En una urna o recipiente hay un total de N objetos, entre los cuales hay una cantidad a de objetos que son defectuosos, si se seleccionan de esta urna n objetos al azar, y sin reemplazo, ¿cuál es la probabilidad de obtener x objetos defectuosos? Solución: Luego;  

                                    donde:

Page 4: Distribución hipergeométrica - Preliminar

p(x,n) = probabilidad de obtener x objetos defectuosos de entre n seleccionados 

muestras de n objetos en donde hay x que son defectuosos y n-x buenos 

todas las muestras posibles de seleccionar de n objetos tomadas de entre N objetos en total = espacio muestral  Considerando que en la urna hay un total de 10 objetos, 3 de los cuales son defectuosos, si de seleccionan 4 objetos al azar, ¿cuál es la probabilidad de que 2 sean defectuosos? Solución: N = 10 objetos en totala = 3 objetos defectuososn = 4 objetos seleccionados en muestrax = 2 objetos defectuosos deseados en la muestra

        

 

                   donde: 

                  probabilidad asociada a cada muestra de 4 objetos que se seleccionaron, con lo que se demuestra que las probabilidades no son constantes 

Page 5: Distribución hipergeométrica - Preliminar

                formas o maneras de obtener 2 objetos defectuosos entre los 4 seleccionados = muestras de 4 objetos entre los que 2 son defectuosos  Como se observa en el desarrollo de la solución del problema, la pretensión es demostrar que las probabilidades asociadas a cada uno de los resultados no son constantes. Luego la probabilidad de obtener 2 objetos defectuosos entre los 4 seleccionados al azar sería:  

                                                            

  Ejemplos:1. Para evitar que lo descubran en la aduana, un viajero ha colocado 6

tabletas  de narcótico en una botella que contiene 9 píldoras de vitamina que son similares en apariencia. Si el oficial de la aduana selecciona 3 tabletas aleatoriamente para analizarlas, a) ¿Cuál es la probabilidad de que el viajero sea arrestado por posesión de narcóticos?, b) ¿Cuál es la probabilidad de que no sea arrestado por posesión de narcóticos?.

 Solución:a) N = 9+6 =15 total de tabletasa = 6 tabletas de narcóticon = 3 tabletas seleccionadasx = 0, 1, 2, o 3 tabletas de narcótico = variable que nos indica el número de tabletas de narcótico que se puede encontrar al seleccionar las 3 tabletas p(viajero sea arrestado por posesión de narcóticos) = p(de que entre las 3 tabletas seleccionadas haya 1 o más tabletas de narcótico) 

                                

Page 6: Distribución hipergeométrica - Preliminar

                             

 otra forma de resolver; p(el viajero sea arrestado por posesión de narcóticos) = 1 – p(de que entre las tabletas  seleccionadas no haya una sola de narcótico) 

                                         

                                       b)      p(no sea arrestado por posesión de narcóticos) 

                   

                                                     2. De un lote de 10 proyectiles, 4 se seleccionan al azar y se disparan. Si el lote

contiene 3 proyectiles defectuosos que no explotarán, ¿cuál es la probabilidad de que , a) los 4 exploten?, b) al menos 2 no exploten?

 Solución:a) N = 10 proyectiles en totala = 7 proyectiles que explotann = 4 proyectiles seleccionadosx = 0, 1, 2, 3 o 4 proyectiles que explotan = variable que nos define el número de proyectiles que explotan entre la muestra que se dispara

 

                               

b)  N = 10 proyectiles en totala = 3 proyectiles que no explotann = 4 proyectiles seleccionados

Page 7: Distribución hipergeométrica - Preliminar

x = 0, 1, 2 o 3 proyectiles que no explotan p(al menos 2 no exploten) = p( 2 o más proyectiles no exploten) = p(x = 2 o 3; n=4) = 

                      

 3. a)¿Cuál es la probabilidad de que una mesera se rehúse a servir bebidas

alcohólicas únicamente a dos menores de edad si verifica aleatoriamente solo 5 identificaciones de entre 9 estudiantes, de los cuales 4 no tienen la edad suficiente?, b) ¿Cúal es la probabilidad de que como máximo 2 de las identificaciones pertenezcan a menores de edad?

Solución: a) N = 9  total de estudiantesa = 4 estudiantes menores de edadn = 5 identificaciones seleccionadasx = variable que nos define el número de identificaciones que pertenecen a personas menores de edadx = 0, 1, 2,  3 o 4 identificaciones de personas menores de edad 

                           

    b) N = 9 total de estudiantes    a = 4 estudiantes menores de edad    n = 5 identificaciones seleccionadas    x = variable que nos define el número de identificaciones que pertenecen a personas menores de edad    x = 0, 1, 2,  3 o 4 identificaciones de personas menores de edad                           

  

                                                       

Page 8: Distribución hipergeométrica - Preliminar

DISTRIBUCIÓN HIPERGEOMÉTRICA

(ir a script de la hipergeométrica)    

        Hasta ahora hemos analizado distribuciones que modelizaban situaciones en las que se realizaban pruebas que entrañaban una dicotomía (proceso de Bernouilli) de manera que en cada experiencia la probabilidad de obtener cada uno de los dos posibles resultados se mantenía constante. Si el proceso consistía en una serie de extracciones o selecciones ello implicaba la reposición de cada extracción o selección , o bien la consideración de una población muy grande. Sin embargo si la población es pequeña y las extracciones no se remplazan las probabilidades no se mantendrán constantes . En ese caso las distribuciones anteriores no nos servirán para la modelizar la situación. La distribución hipergeométrica viene a cubrir esta necesidad de modelizar procesos de Bernouilli con probabilidades no constantes (sin reemplazamiento) .

    La distribución hipergeométrica es especialmente útil en todos aquellos casos en los que se extraigan muestras o se realizan experiencias repetidas sin devolución del elemento extraído o sin retornar a la situación experimental inicial.

    Modeliza , de hecho, situaciones en las que se repite un número determinado de veces una prueba dicotómica de manera que con cada sucesivo resultado se ve alterada la probabilidad de obtener en la siguiente prueba uno u otro resultado. Es una distribución .fundamental en el estudio de muestras pequeñas de poblaciones .pequeñas y en el cálculo de probabilidades de, juegos de azar y tiene grandes aplicaciones en el control de calidad en otros procesos experimentales en los que no es posible retornar a la situación de partida.

    La distribución hipergeométrica puede derivarse de un proceso experimental puro o de Bernouilli con las siguientes características:

 El proceso consta de n pruebas , separadas o separables de entre un conjunto de N pruebas posibles.

 Cada una de las pruebas puede dar únicamente dos resultados mutuamente excluyentes: A y no A.

 En la primera prueba las probabilidades son :P(A)= p y P(A)= q ;con p+q=l.

Page 9: Distribución hipergeométrica - Preliminar

Las probabilidades de obtener un resultado A y de obtener un resultado no A varían en las sucesivas pruebas, dependiendo de los resultados anteriores.

 (Derivación de la distribución) . Si estas circunstancias a leatorizamos de forma que la variable aleatoria X sea el número de resultados A obtenidos en n pruebas la distribución de X será una Hipergeométrica de parámetros N,n,p     así    

Un típico caso de aplicación de este modelo es el siguiente :

                            Supongamos la extracción aleatoria de n elementos de un conjunto formado por N elementos totales, de los cuales Np son del tipo A y Nq son del tipo   (p+q=l) .Si realizamos las extracciones sin devolver los elementos extraídos , y llamamos X. al número de elementos del tipo A que extraemos en n extracciones X seguirá una distribución hipergeométrica de parámetros N , n , p

Función de cuantía.

  La función de cuantía de una distribución Hipergeométrica hará corresponder a cada valor de la variable X (x = 0,1,2, . . . n) la probabilidad del suceso "obtener x resultados del tipo A ", y (n-x) resultados del tipo no A en las n pruebas realizadas de entre las N posibles.

Veamos :

                                      Hay un total de   formas distintas de obtener

x resultados del tipo A y n-x del tipo   , si partimos de una población formada por Np elementos del tipo A y Nq elementos del tipo 

                  Por otro lado si realizamos n pruebas o extracciones hay un total de

                                                  posibles muestras ( grupos de n elementos)

aplicando la regla de Laplace tendríamos

Page 10: Distribución hipergeométrica - Preliminar

                                

que para valores de X comprendidos entre el conjunto de enteros 0,1,…. .n será la expresión de la función de cuantía de una distribución , Hipergeométrica de parámetros N,n,p .

Media y varianza.

    Considerando que una variable hipergeométrica de parámetros N, n, p puede considerarse generada por la reiteración de un proceso dicotómico n veces en el que las n dicotomías NO son independientes ; podemos considerar que una variable hipergeométrica es la suma de n variables dicotómicas NO independientes.

    Es bien sabido que la media de la suma de variables aleatorias (sean éstas independientes o no) es la suma de las medias y por tanto la media de una distribución hipergeométrica será , como en el caso de la binomial : 

En cambio si las variables sumando no son independientes la varianza de la variable suma no será la suma de las varianzas.

    Si se evalúa el valor de la varianza para nuestro caso se obtiene que la varianza de una distribución hipergeométrica de parámetros N,n,p es : si   

                                                

para demostración de esta expresión véase Wilks S. ,Mathematical Statistics,1962

    Esta forma resulta ser la expresión de la varianza de una binomial (n, p) afectada por un coeficiente corrector [N-n/N-1] , llamado coeficiente de exhaustividad o Factor Corrector de Poblaciones Finitas (F.C.P.F.) y que da cuenta del efecto que produce la no reposición de los elementos extraídos en el muestreo.

    Este coeficiente es tanto más pequeño cuanto mayor es el tamaño muestral (número de pruebas de n ) y puede comprobarse como tiende a aproximarse a 1

Page 11: Distribución hipergeométrica - Preliminar

cuando el tamaño de la población N es muy grande . Este último hecho nos confirma lo ya comentado sobre la irrelevancia de la reposición o no cuando se realizan extracciones sucesivas sobre una población muy grande. Con una población muy grande se cual fuere el tamaño de n , el factor corrector sería uno lo que convertiría , en cierto modo a la hipergeométrica en una binomial (ver D. Binomial) . Así

    Límite de la distribución hipergeométrica cuando N tiende a infinito.

    Hemos visto como la media de la distribución hipergeométrica [H{N,n,p)], tomaba siempre el mismo valor que la media de una distribución binomial [B{n,p)] también hemos comentado que si el valor del parámetro N crecía hasta aproximarse a infinito el coeficiente de exhaustividad tendía a ser 1, y, por lo tanto, la varianza de la hipergeométrica se aproximaba a la de la binomial : puede probarse asimismo , cómo la función de cuantía de una distribución hipergeométrica tiende a aproximarse a la función de cuantía de una distribución binomial cuando 

 

 

Puede comprobarse en la representación gráfica de una hipergeométrica con N =100000 como ésta ,es idéntica a la de una binomial con los mismos parámetros restantes n y p , que utilizamos al hablar de la binomial

 

 

 

Moda de la distribución hipergeométrica

Page 12: Distribución hipergeométrica - Preliminar

    De manera análoga a como se obtenía la moda en la distribución binomial es fácil obtener la expresión de ésta para la distribución hipergeométrica. De manera que su expresión X0 sería la del valor o valores enteros que verificasen.

                                                 

Distribución Hipergeométrica

Notación:

Definición

Muchas veces en la práctica es difícil realizar pruebas con reposición ó

reemplazamiento. Por ejemplo, si en el control de calidad se pierde el elemento

que se prueba, pues no se puede hacer reposición directamente. Se plantéa

entonces la prueba sin reposición, donde los elementos de la muestra se toman

todos a la vez y no individualmente ó donde el elemento seleccionado no se

reintegra al experimento ó a la muestra nuevamente.

La diferencia mas simple con la binomial es la forma de aplicar el muestreo. En

efecto, en:

: Muestreo con reemplazamiento e independencia de pruebas ó ensayos.

: Muestreo sin reemplazamiento y sin independeencia entre

pruebas ó ensayos.

Sus aplicaciones estan en areas con uso considerable de muestreo de aceptación,

pruebas electronicas y de aseguramiento de la calidad, fabricación de piezas, etc.

Definición

En la distribución Hipergeométrica   cantidad de resultados éxitos en una

muestra aleatoria (sin reposición) de tamaño  , tomada de una población de

Page 13: Distribución hipergeométrica - Preliminar

tamaño   y de la cual   satisface una caracteristica ó propiedad (éxito) antes

del muestreo y   no la satisface (fracaso).

Criterios ó propiedades que la caracterizan. 

1. La población   del conjunto de unidades ó elementos es de orden fínito, de

los cuales una parte:  "son éxitos", y otra parte:   son "fracasos".2. Cada elemento puede ser caracterizado como éxito ó fracaso.

3. Se obtiene una muestra aleatoria de   elementos todos a la vez (sin reemplazamiento) y no de forma independiente. No son pruebas repetidas.

4. El tamaño de la muestra aleatoria   es grande relativamente en

comparación con el tamaño de la población. Generalmente: 

5. Se busca la probabilidad de   número de éxitos a partir de los   

resultados ó elementos y  fracasos a partir de los   elementos asi

clasificados, al obtener una muestra aleatoria de tamaño 

Supongamos un lote de   productos de los cuales:

Obtenemos muestra de   productos, todos a la vez. Interesa entonces la

probabilidad de sacar   productos defectuosos (Exito), o sea: 

Planteado así el (E.A.) Podemos hacer el siguiente raciocinio:

De una población de   elementos se pueden extraer muestras de tamño   

de   formas diferentes (distintas muestras de tamaño  ). Al extraer muestras

de tamaño   productos, el número de formas de obtener   productos defectuosos

de   de ellos será:   y entonces   sera el número de formas de

obtener   productos no defectuosos entre   de ellos.

Como es el mismo evento compuesto, entonces el número de formas de

seleccionar   productos defectuosos esta ligado con el número de formas de

obtener   productos no defectuosos. Luego el total de formas posibles sera:

Combinando los casos

Page 14: Distribución hipergeométrica - Preliminar

 

Los parámetros de la distribución Hipergeométrica son entonces:

 Tamaño de población.

 Número de elementos de   con una caracteristica ó propiedad específica

(éxitos).

 Tamaño de muestra aleatoria extraida.

Nota: Algunos tratadistas simbolizan esta distribución con: 

 Características de la Distribución Hipergeométrica. 

En la practica, si  , no se aplica el   pues su valor tendera a

cero 

La función de distribución acumulativa quedará definida entonces por:

Pueden ser calculos tediosos ó laborosos cuando   es grande. Por ello hay quienes

aplican la forma simplificada ó de recurrencia:

Ejemplo

En una empresa industrial diariamente se producen 90 unidades de unidad

metalmecánica, de las cuales generalmente 5 salen defectuosas. Se examina en

Page 15: Distribución hipergeométrica - Preliminar

un dia cualquiera una muestra de 5 unidades. Hallar la probabilidad de   unidades

defectuosas.

para 

que resolviendo permite definir la tabla de distribución de probabilidad:

Si representamos gráficamente la tabla resultante, tenemos:

Calculamos el valor de sus principales medidas características:

Media:  =

Que simplificadamente:

Varianza: 

ó tambien.

y que aún de forma mas simplificada:

Page 16: Distribución hipergeométrica - Preliminar

Sesgo: Hacia la derecha ó positivo como se vé graficamente. Además,

aqui:   pues   y   pues