ESTADISTICA ADMINISTRATIVA 1

download ESTADISTICA ADMINISTRATIVA 1

of 107

Transcript of ESTADISTICA ADMINISTRATIVA 1

UNIDAD 1

UNIDAD 1

DISTRIBUCIONES DE FRECUENCIA

1.1 CONCEPTO DE ESTADSTICA Y SU CLASIFICACION

Qu es la estadstica?

Cuando coloquialmente se habla de estadstica, se suele pensar en una relacin de datos numricos presentada de forma ordenada y sistemtica. Esta idea es la consecuencia del concepto popular que existe sobre el trmino y que cada vez est ms extendido debido a la influencia de nuestro entorno, ya que hoy da es casi imposible que cualquier medio de difusin, peridico, radio, televisin, etc, no nos aborde diariamente con cualquier tipo de informacin estadstica sobre accidentes de trfico, ndices de crecimiento de poblacin, turismo, tendencias polticas, etc.

Slo cuando nos adentramos en un mundo ms especfico como es el campo de la investigacin de las Ciencias Sociales: Medicina, Biologa, Psicologa, ... empezamos a percibir que la Estadstica no slo es algo ms, sino que se convierte en la nica herramienta que, hoy por hoy, permite dar luz y obtener resultados, y por tanto beneficios, en cualquier tipo de estudio, cuyos movimientos y relaciones, por su variabilidad intrnseca, no puedan ser abordadas desde la perspectiva de las leyes deterministas. Podramos, desde un punto de vista ms amplio, definir la estadstica como la ciencia que estudia cmo debe emplearse la informacin y cmo dar una gua de accin en situaciones prcticas que entraan incertidumbre.

La Estadstica se ocupa de los mtodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y analizar los datos, siempre y cuando la variabilidad e incertidumbre sea una causa intrnseca de los mismos; as como de realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones y en su caso formular predicciones.

Podramos por tanto clasificar la Estadstica en descriptiva, cuando los resultados del anlisis no pretenden ir ms all del conjunto de datos, e inferencial cuando el objetivo del estudio es derivar las conclusiones obtenidas a un conjunto de datos ms amplio.

Clasificacin de la Estadstica

EstadsticaCiencia que recoge y organiza datos de forma sistemtica. Datos numricos sistemticamente recolectados y organizados.

Estadstica descriptivaOrganizacin de los datos en tablas y grficas. Se encarga de establecer los parmetros que definen una poblacin.

Estadstica matemticaComparacin de medidas calculadas mediante distribuciones de probabilidades:

Estadstica no paramtricaPruebas estadsticas aplicadas cuando se supone que los datos "no" se distribuyen normalmente.

Estadstica paramtricaPruebas estadsticas aplicadas cuando se supone que los datos se distribuyen normalmente.

1.2 RECOPILACION DE DATOS

Recopilacin de datos: Deber dirigirse al registro de aquellos hechos que permitan conocer y analizar lo que realmente sucede en la unidad o tema que se investiga. Esto consiste en la recoleccin, sntesis, organizacin y comprensin de los datos que se requieren. Se conocen dos tipos de fuentes:

Primarias: que contienen informacin original no abreviada ni traducida.

Secundarias: obras de referencia que auxilian al proceso de investigacin.Se conoce otra divisin que se conforma por las siguientes fuentes

Documentales

De campo.FICHAS BIBLIOGRFICAS, DE TRABAJO Y HEMEROGRFICASLas fuentes de recoleccin de datos son todos los registros de aquellos hechos que permitan conocer y analizar lo que realmente sucede en el tema que se investiga.Concluida la parte preparatoria de la investigacin se inicia la fase de recopilacin de datos.Para recabar la informacin existente sobre el tema, el investigador se auxilia de instrumentos como las fichas de trabajo; hay diversos tipos de fichas de trabajo como:Fichas de trabajo para fuentes documentales, fichas de trabajo de una revista, fichas de trabajo de un peridico, para investigacin de campo, para observacin, fichas bibliogrficas y hemerogrficas.ENCUESTA, CUESTIONARIO Y ENTREVISTA

*Entrevista: esta herramienta consiste bsicamente en reunirse una o varias personas y cuestionarlas en forma adecuada para obtener informacin.

*Cuestionario: estn constituidos por series de preguntas escritas, predefinidas, secuenciadas y separadas por captulos o temtica especfica.

*Encuesta: la recoleccin de informacin se hace a travs de formularios, los cuales tienen aplicacin en aquellos problemas que se pueden investigar por mtodos de observacin, anlisis de fuentes documentales y dems sistemas de conocimiento.ANLISIS E INTERPRETACIN DE INFORMACINLa interpretacin de los resultados de la indagacin lleva inmediatamente a la solucin.El anlisis del instrumento de recoleccin de informacin de campo (encuesta), fue utilizando el anlisis individual de preguntas que se realiza con base en los porcentajes que alcanzan las distintas respuestas de cada pregunta.Para llevar a cabo este tipo de anlisis se diseo una forma donde se tabulan las respuestas en base a la cantidad de personas que contestaron cada respuesta y el porcentaje que representa del total de la muestra.REDACCIN Y PRESENTACIN DEL INFORMEEl objetivo del informe es presentar a los lectores el proceso que se realiz para presentar una solucin al problema planteado, para lo cual es necesario hacer la presentacin del problema, los mtodos empleados para su estudio, los resultados obtenidos, las conclusiones a las que se llegaron y las recomendaciones en base a estas.Con respecto a la estructura del informe, sta es sencilla y sigue fielmente los pasos fundamentales del diseo de la investigacin, ya que el informe debe ser la respuesta a lo planteado por el diseo de investigacin.1.3 DISTRIBUCION DE FRECUENCIA

Cuando la informacin que se tiene es un gran volumen, resulta muy conveniente ordenar y agrupar los datos para manejarlos de acuerdo a la distribucin de frecuencias la cual consiste en agrupar los datos en clases o categoras que estarn definidas por un lmite mnimo y uno mximo de variacin, mostrando en cada clase el nmero de elementos que contiene o sea la frecuencia.

1.3.1 HISTOGRAMAS, POLGONOS DE FRECUENCIA, OJIVA

Representacin GrficaEl patrn de variacin de los datos puede apreciarse mejor representando grficamente la informacin contenida en el cuadro.

Generalmente los grficos empleados para representar distribuciones de frecuencias son : los polgonos de frecuencias, grficos de barras, histogramas, ojivas y grficos de bastones

HistogramaSon grficos construidos de barras verticales sin separaciones entre s.

Para construir un histograma, se define una escala horizontal apropiada y en ella se marcan los lmites reales de todas las clases de la distribucin que se quiere representar. La escala no necesita comenzar en cero, pero si un intervalo de clase antes del lmite inferior de la clase ms baja.

Las frecuencias se representan en la escala vertical, la cual si debe comenzar en cero, no tener cortes o interrupciones y ser lo suficientemente amplia para incluir la mayor de las frecuencias.

Definidas las escalas, se procede a trazar el grfico como en el ejemplo.

Polgono de frecuenciasEl polgono consiste en marcar sobre cada clase un punto, tomando como occisa el punto medio de la clase y como ordenada la frecuencia. Esos puntos se unen luego con secciones de rectas y la figura resultante es el polgono.

Las OjivasEstas son en realidad polgonos que utilizan las frecuencias acumuladas con la salvedad de que las ordenadas no se levanten sobre el punto medio de la clase, sino sobre el lmite inferior o superior segn se haya acumulado (ascendente o descendente). Esto se hace porque debido al procedimiento de acumulacin, la frecuencia "menos", para un cierta clase, incluye todas las frecuencias menores que el lmite superior de esa clase; y la acumulada "mas de", todas las frecuencias mayores que el lmite inferior de la clase.

1.4 MEDIDAS DE TENDENCIA CENTRAL PARA UN CONJUNTO DE DATOS Y DATOS AGRUPADOS

Los fenmenos biolgicos no suelen ser constantes, por lo que ser necesario que junto a una medida que indique el valor alrededor del cual se agrupan los datos, se asocie una medida que haga referencia a la variabilidad que refleje dicha fluctuacin.

En este sentido pueden examinarse varias caractersticas, siendo las ms comunes:

La tendencia central de los datos;

La dispersin o variacin con respecto a este centro;

Los datos que ocupan ciertas posiciones.

La simetra de los datos.

La forma en la que los datos se agrupan.

Figura: Medidas representativas de un conjunto de datos estadsticos

A lo largo de este captulo, y siguiendo este orden, iremos estudiando los estadsticos que nos van a orientar sobre cada uno de estos niveles de informacin: valores alrededor de los cuales se agrupa la muestra, la mayor o menor fluctuacin alrededor de esos valores, nos interesaremos en ciertos valores que marcan posiciones caractersticas de una distribucin de frecuencias as como su simetra y su forma.

1.4.1 MEDIA, MEDIA PONDERADA

La media aritmtica de una variable estadstica es la suma de todos sus posibles valores, ponderada por las frecuencias de los mismos. Es decir, si la tabla de valores de una variable X es

Xnifi

x1n1f1

.........

xknkfk

la media es el valor que podemos escribir de las siguientes formas equivalentes:

Si los datos no estn ordenados en una tabla, entonces

La media tiene las siguientes caractersticas:

Es el centro de gravedad de la distribucin y es nica para cada distribucin.

Cuando aparecen valores extremos y poco significativos (demasiado grandes o demasiado pequeos), la media puede dejar de ser representativa.

No tiene sentido en el caso de una variable cualitativa ni cuando existen datos agrupados con algn intervalo no acotado.

Para variables agrupadas, los xi sern las marcas declase de cada intervalo.

Adems, la media cumple las siguientes propiedades:

Si se suma una constante a todos los valores, la media aumenta en dicha constante.

Si se multiplican todos los valores de la variable por una constante, la media queda multiplicada por dicha constante.

Observacin

Hemos supuesto implcitamente en la definicin de media que tratbamos con una variable X discreta. Si la variable es continua tendremos que cambiar los valores de xi por las marcas de clase correspondientes. En general, la media aritmtica obtenida a partir de las marcas de clase ci, diferir de la media obtenida con los valores reales, xi. Es decir, habr una perdida de precisin que ser tanto mayor cuanto mayor sea la diferencia entre los valores reales y las marcas de clase, o sea, cuanto mayores sean las longitudes ai, de los intervalos.

Proposicin

La suma de las diferencias de la variable con respecto a la media es nula, es decir,

Demostracin

Basta desarrollar la sumatoria para obtener

Este resultado nos indica que el error cometido al aproximar un valor cualquiera de la variable, por ejemplo x1, mediante el valor central , es compensado por los dems errores:

Si los errores se consideran con signo positivo, en este caso no pueden compensarse. Esto ocurre si tomamos como medida de error alguna de las siguientes:

que son cantidades estrictamente positivas si algn .

Ejemplo

Obtener las desviaciones con respecto a la media en la siguiente distribucin y comprobar que su suma es cero.

li-1 - lini

0 - 101

10 - 202

20 - 304

30 - 403

Solucin:

li-1 - linixixi ni

0 - 10155-19-19

10 - 2021530-9-18

20 - 30425100+1+4

30 - 40335105+11+33

n=10

La media aritmtica es:

Como se puede comprobar sumando los elementos de la ltima columna,

Medias generalizadas

En funcin del tipo de problema varias generalizaciones de la media pueden ser consideradas. He aqu algunas de ellas aplicadas a unas observaciones x1, ..., xn:

La media geomtrica

, es la media de los logaritmos de los valores de la variable:

Luego

Si los datos estn agrupados en una tabla, entonces se tiene:

La media armnica

, se define como el recproco de la media aritmtica de los recprocos, es decir,

Por tanto,

La media cuadrtica

, es la raz cuadrada de la media aritmtica de los cuadrados:

1.4.2 MEDINAConsideramos una variable discreta X cuyas observaciones en una tabla estadstica han sido ordenadas de menor a mayor. Llamaremos mediana, Medal primer valor de la variable que deja por debajo de s al de las observaciones. Por tanto, si n es el nmero de observaciones, la mediana corresponder a la observacin [n/2]+1, donde representamos por la parte entera de un nmero.

Figura: Clculo geomtrico de la mediana

En el caso de variables continuas, las clases vienen dadas por intervalos, y aqu la frmula de la mediana se complica un poco ms (pero no demasiado): Sea (li-1,li] el intervalo donde hemos encontrado que por debajo estn el de las observaciones. Entonces se obtiene la mediana a partir de las frecuencias absolutas acumuladas, mediante interpolacin lineal (teorema de Thales).

Observacin

La relacin Corresponde a definir para cada posible observacin, , su frecuencia relativa acumulada, F(x), por interpolacin lineal entre los valores F(lj-1) = Fj-1 y F(lj) = Fj de forma que

De este modo, Med es el punto donde . Esto equivale a decir que la mediana divide al histograma en dos partes de reas iguales a .

Observacin

Entre las propiedades de la mediana, vamos a destacar las siguientes:

Como medida descriptiva, tiene la ventaja de no estar afectada por las observaciones extremas, ya que no depende de los valores que toma la variable, sino del orden de las mismas. Por ello es adecuado su uso en distribuciones asimtricas.

Es de clculo rpido y de interpretacin sencilla.

A diferencia de la media, la mediana de una variable discreta es siempre un valor de la variable que estudiamos (ej. La mediana de una variable nmero de hijos toma siempre valores enteros).

Si una poblacin est formada por 2 subpoblaciones de medianas Med1 y Med2, slo se puede afirmar que la mediana, Med, de la poblacin est comprendida entre Med1 y Med2

El mayor defecto de la mediana es que tiene unas propiedades matemticas complicadas, lo que hace que sea muy difcil de utilizar en inferencia estadstica.

Es funcin de los intervalos escogidos.

Puede ser calculada aunque el intervalo inferior o el superior no tenga lmites.

La suma de las diferencias de los valores absolutos de n puntuaciones respecto a su mediana es menor o igual que cualquier otro valor. Este es el equivalente al teorema de Knig (proposicin 2.1) con respecto a la media, pero donde se considera como medida de dispersin a:

Ejemplo

Sea X una variable discreta que ha presentado sobre una muestra las modalidades

Si cambiamos la ltima observacin por otra anormalmente grande, esto no afecta a la mediana, pero si a la media:

En este caso la media no es un posible valor de la variable (discreta), y se ha visto muy afectada por la observacin extrema. Este no ha sido el caso para la mediana.

Ejemplo

Obtener la media aritmtica y la mediana en la distribucin adjunta. Determinar grficamente cul de los dos promedios es ms significativo.

li-1 - lini

0 - 1060

10 - 2080

20 - 3030

30 - 10020

100 - 50010

Solucin:

li-1 - liniaixixi niNi

0 - 10601053006060

10 - 208010151.20014080

20 - 3030102575017030

30 - 1002070651.3001902,9

100 - 500104003003.0002000,25

n=200

La media aritmtica es:

La primera frecuencia absoluta acumulada que supera el valor n/2=100 es Ni=140. Por ello el intervalo mediano es [10;20). As:

Para ver la representatividad de ambos promedios, realizamos el histograma de la figura 2.3, y observamos que dada la forma de la distribucin, la mediana es ms representativa que la media.

Figura: Para esta distribucin de frecuencias es ms representativo usar como estadstico de tendencia central la mediana que la media.

1.4.3 MODA

La moda se suele definir como el valor ms frecuente. En el caso de una variable no agrupada, es el valor de la variable que ms se repite. En el caso de una variable agrupada por intervalos de igual amplitud se busca el intervalo de mayor frecuencia (intervalo o clase modal) y se aproxima la moda por el valor obtenido al aplicar la frmula

donde:

Li-1 es el lmite inferior del intervalo modal.

ni es la frecuencia absoluta del intervalo modal.

ni-1 es la frecuencia absoluta del intervalo anterior al intervalo modal.

ni+1 es la frecuencia absoluta del intervalo posterior al intervalo modal.

ci es la amplitud del intervalo.

La moda cumple que

Puede ser que exista ms de una moda. En dicho caso, se dice que la distribucin es bimodal, trimodal, ..., segn el nmero de valores que presentan la mayor frecuencia absoluta.

La moda es menos representativa que la media, a excepcin de las distribuciones con datos cualitativos.

Si los intervalos no tienen la misma amplitud, se busca el intervalo de mayor densidad de frecuencia (que es el cociente entre la frecuencia absoluta y la amplitud del intervalo: ) y se calcula con la frmula anterior.

Llamaremos moda a cualquier mximo relativo de la distribucin de frecuencias, es decir, cualquier valor de la variable que posea una frecuencia mayor que su anterior y su posterior.

Figura: Clculo geomtrico de la moda

En el caso de variables continuas es ms correcto hablar de intervalos modales. Una vez que este intervalo, (li-1, li], se ha obtenido, se utiliza la siguiente frmula para calcular la moda, que est motivada en la figura 2.4:

Observacin

De la moda destacamos las siguientes propiedades:

Es muy fcil de calcular.

Puede no ser nica.

Es funcin de los intervalos elegidos a travs de su amplitud, nmero y lmites de los mismos.

Aunque el primero o el ltimo de los intervalos no posean extremos inferior o superior respectivamente, la moda puede ser calculada.

1.4.4 RELACION ENTRE MEDIA, MEDIANA Y MODA

En el caso de distribuciones unimodales, la mediana est con frecuencia comprendida entre la media y la moda (incluso ms cerca de la media).

En distribuciones que presentan cierta inclinacin, es ms aconsejable el uso de la mediana. Sin embargo en estudios relacionados con propsitos estadsticos y de inferencia suele ser ms apta la media.

Veamos un ejemplo de clculo de estas tres magnitudes.

Ejemplo

Consideramos una tabla estadstica relativa a una variable continua, de la que nos dan los intervalos, las marcas de clase ci, y las frecuencias absolutas, ni.

Intervaloscini

0 -- 212

2 -- 431

4 -- 654

6 -- 873

8 - 1092

Para calcular la media podemos aadir una columna con las cantidades . La suma de los trminos de esa columna dividida por n=12 es la media:

IntervalosciniNi

0 -- 21222

2 -- 43133

4 -- 654720

6 -- 8731021

8 - 10921218

1264

La mediana es el valor de la variable que deja por debajo de s a la mitad de las n observaciones, es decir 6. Construimos la tabla de las frecuencias absolutas acumuladas, Ni, y vemos que eso ocurre en la modalidad tercera, es decir,

Para el clculo de la , lo primero es encontrar los intervalos modales, buscando los mximos relativos en la columna de las frecuencias absolutas, ni. Vemos que hay dos modas, correspondientes a las modalidades i=1, i=3. En el primer intervalo modal, (l0,1]=(0,2], la moda se calcula como

El segundo intervalo modal es (l2,l3]=(4;6], siendo la moda el punto perteneciente al mismo que se obtiene como:

En este caso, como se ve en la figura 2.5, la moda no toma un valor nico, sino el conjunto

1.5 MEDIDAS DE DISPERSIN PARA UN CONJUNTO DE DATOS Y DATOS AGRUPADOS

Imagina que tenemos 3 conjuntos de personas y nos dicen que en todos los casos, la media del peso es 55. Significa esto que los tres conjuntos de datos son iguales o similares? Conseguimos los datos originales y nos encontramos con que las observaciones son las siguientes:

Grupo 1:55 55 55 55 55 55 55

Grupo 2:47 51 54 55 56 59 63

Grupo 3:39 47 53 55 57 63 71

vemos que, aunque la media es la misma, los conjuntos de datos son muy diferentes. Fjate si hacemos el diagrama de tallo y hojas lo que obtenemos

5

5

5

5

5

5

5

3

4

5

6

7

9

6

5

4

7

1

3

3

4

5

6

7

7

5

9

7

1

3

1

3

4

5

6

7

Entonces cmo podemos detectar esas diferencias entre los conjuntos de datos? Parece que las medidas de centralizacin no nos proporcionan informacin suficiente en muchas situaciones, as que debemos encontrar alguna otra cantidad que nos diga cmo de lejos estn los datos entre ellos y de la media, es decir, nos surje la necesidad de medir la dispersin de los datos. Lo primero que vemos es que en el primer caso todos los datos son iguales, en el segundo hay ms diferencia entre el mayor y el menor, y en el tercero ms an que en el segundo. Exactamente tenemos que

55-55=0

63-47=16

71-39=32

A esta cantidad la llamamos rango de los datos. Sin embargo, aunque es muy fcil de calcular, no se usa demasiado, porque si hay un slo valor muy grande o muy pequeo, el rango vara mucho, as que no siempre es una medida til. Cmo podramos encontrar un nmero que nos d una aproximacin de la distancia de los datos a la media? Pues podemos calcular todas las diferencias (en valor absoluto) entre las observaciones y la media y luego calcular la media de esas diferencias. A esta cantidad la llamamos desviacin media. Calculemos la desviacin media del grupo 2 de datos, tenemos

Sin embargo, habitualmente se usa otra medida de la variabilidad, que responde a la media de los cuadrados de las desviaciones de los datos respecto a la media, as conseguimos que las desviaciones mayores influyan ms que las pequeas. Pero vamos a ver la definicin rigurosa de todos estos conceptos.

1.5.1 RANGO

Rango: mide la amplitud de los valores de la muestra y se calcula por diferencia entre el valor ms elevado y el valor ms bajo.

1.5.2 DESVIACION MEDIA

1.5.3 VARIANZA

Varianza: Mide la distancia existente entre los valores de la serie y la media. Se calcula como sumatoria de las diferencias al cuadrado entre cada valor y la media, multiplicadas por el nmero de veces que se ha repetido cada valor. El sumatorio obtenido se divide por el tamao de la muestra.

La varianza siempre ser mayor que cero. Mientras ms se aproxima a cero, ms concentrados estn los valores de la serie alrededor de la media. Por el contrario, mientras mayor sea la varianza, ms dispersos estn.

1.5.4 DESVIACION ESTANADAR

1.6 COEFICIENTE DE VARIACIN

1.7 COEFICIENTE DE ASIMETRA DE PEARSON

Diremos que una distribucin es simtrica cuando su mediana, su moda y su media aritmtica coincidan. Claramente las distribuciones de los ejemplos de los niveles de colinesterasa y del n de hijos no son por tanto, simtricas.

Diremos que una distribucin es asimtrica a la derecha si las frecuencias (absolutas o relativas) descienden ms lentamente por la derecha que por la izquierda.

Si las frecuencias descienden ms lentamente por la izquierda que por la derecha diremos que la distribucin es asimtrica a la izquierda.

Existen varias medidas de la asimetra de una distribucin de frecuencias. Aqu estudiaremos dos de ellas.

a. Coeficiente de Asimetra de Pearson

Se define como:

siendo cero cuando la distribucin es simtrica, positivo cuando existe asimetra a la derecha y negativo cuando existe asimetra a la izquierda.

En el ejemplo del nmero de hijos Ap es igual a

indicando una ligera asimetra a la izquierda en la distribucin de frecuencias correspondiente.

De la misma manera, para el ejemplo de los niveles de colinesterasa tambin se observa una ligera asimetra a la izquierda, al ser

De la definicin se observa que este coeficiente solo se podr utilizar cuando la distribucin sea unimodal. La otra medida de asimetra que veremos no presenta este inconveniente

UNIDAD 2

INTREODUCCION A LA PROBABILIDAD Y VALOR ESPERADO

2.1 INTRODUCCION A LA PROBABILIDAD

En la sociedad francesa de 1650 el juego era un entretenimiento corriente, sin demasiadas restricciones legales. En este entretenimiento estn las races de la teora de la probabilidad , pues cada vez se introducido juegos mas complicados que dejaron de sentir la necesidad de un mtodo para calcularla probabilidad de ganar en cada juego.

La probabilidad se obtiene dividiendo el nmero de casos favorables entre el nmero de los casos posibles, por tanto la probabilidad de obtener oros al extraer al azar una carta de una baraja es 10/40 = 1/4 y se admitan que al repetir la fraccin 400 veces, devolviendo la carta a la baraja tras cada extraccin, sera muy poco usual que la frecuencia relativa de los oros obtenidos estuviesen alejadas de 1/4.

Un jugador apasionado, el caballero De Mr, encontr un desacuerdo entre las frecuencias relativas de la veces que ganaba - valores observados realmente - y el valor de la correspondiente probabilidad de ganar que el mismo haba calculado.

Consult esta discrepancia en Pars con el famoso matemtico y filsofo Pascal, quien se interes por los problemas que le propona De Mr y comenz una correspondencia epistolar sobre cuestiones probabilsticas con otros matemticos amigos, sobre todo con Fermat. Esta correspondencia puede considerarse el origen de la teora de probabilidades.

Pronto Pascal y Fermat probaron el desacuerdo de De Mr se deba a que era errneo el calculo de probabilidad que haba hecho, ya que De Mr se haba equivocado al considerar como equiprobables casos que no le eran, y slo cuando los casos posibles son equiprobables tiene sentido aplicar la definicin dada de probabilidad.

El desarrollo de la teora de probabilidades tiene otro punto de referencia en 1713, en que se publica la obra "Ars conjectandi" (El arte de la Conjetura) de J. Bernoulli, donde estudia la distribucin binominal y su clebre teora que da para esta distribucin la expresin matemtica de la propiedad de estabilidad de las frecuencias relativas.

Otro hito es la segunda edicin de la obra "The Doctrine of Chances" (La doctrina de las probabilidades) aparecidas en 1738 y debida al hugonote francs De Moivre, que por motivos religiosos huy de Francia refugindose en Inglaterra, donde vivi de la resolucin de problemas de juegos de azar. En la obra sealada aparecen las primeras indicaciones sobre las distribucin normal de probabilidades.

En 1812 Laplace publica su famosa "Theore Analytique des probabilits", que contiene una exposicin completa y sistemtica de la teora matemtica de los juegos de azar, adems de una gran cantidad de aplicaciones de la teora de la probabilidad a muchas cuestiones cientficas y prcticas.

Tras la obra de Laplace se extendieron las aplicaciones de su obra otras ramas de la Ciencia durante el siglo XIX, y as, Gauss y Laplace independientemente aplicaron la teora de la probabilidad al anlisis de los errores de medida en las observaciones fsicas y astronmicas, Maxwell, Boltzmann y Gibbs aplicaron la probabilidad en su obra "Mecnica Estadstica", que ha sido fundamental en distintas partes de la Fsica moderna. Ya durante nuestro siglo las aplicaciones de la teora de la probabilidad se han extendido por los ms variados campos, como gentica, economa, psicologa...

Tambin, y pese al xito de las aplicaciones, se oyeron voces crticas a la definicin clsica de probabilidad, que exiga "a priori" saber, o suponer, que todos los casos posibles eran igualmente favorables. Adems en ciertos casos era imposible aplicar la definicin clsica de probabilidad, como puede suceder al intentar calcular la probabilidad de que una chincheta caiga con la punta hacia arriba, o de que un hombre de 30 aos muera el prximo ao.

Si bien la matemtica cambi profundamente de forma entre las dos guerras mundiales, tambin es cierto que buena parte de la matemtica que sigui a la Segunda Guerra Mundial consista en el comienzo de algo radicalmente nuevo que anunciaba una nueva era. La teora de conjuntos y la teora de la medida han ido invadiendo a lo largo del siglo XX una parte cada vez ms extensa de la matemtica, pero pocas de sus ramas se han visto afectadas tan profundamente por esta tendencia como la teora de probabilidades, a la que Borel haba dedicado ya en 1909 sus "Elments de la thorie des probabilits".

El primer ao del nuevo siglo se anunciaba ya propicio para las aplicaciones de la teora de probabilidades tanto a la fisica como a la gentica, puesto que en 1901 publicaba Glbbs su obra Elementary Principles in Statistical Mechanics, y el mismo ao fue fundada la revista Biometrika por Karl Pearson (1857-1936). Francis Galton (1822-1911) fue muy precoz y un estadstico nato que estudi los fenmenos de regresin; en 1900 Pearson en la universidad de Londres populariz el criterio de la chi-cuadrado. Uno de los ttulos de Poincar haba sido el de "profesor de clculo de probabilidades", lo que indicaba un inters creciente por el tema.

En Rusia se inici el estudio de las cadenas de sucesos eslabonados, especialmente en 1906-1907, por obra de Andrei Andreyevich Markov (o Markoff, 1856-1922), discpulo de Tchebycheff y coeditor de las Oeuvres (2 vols., 1899-1904) de su maestro. En la teora cintica de los gases y en muchos fenmenos sociales y biolgicos, la probabilidad de un suceso depende frecuentemente de los resultados anteriores, y especialmente desde mediados de este siglo las cadenas de Markov de probabilidades eslabonadas se han estudiado muy detalladamente. En su bsqueda de una fundamentacin matemtica para la teora de probabilidades en expansin, los estadsticos encontraron a mano las herramientas necesarias, y hoy no es posible ya dar una exposicin rigurosa de la teora de probabilidades sin utilizar los conceptos de funcin medible y de las teoras de integracin modernas.

En Rusia mismo, por ejemplo, Andrel Nicolaevich Kolmogoroff hizo importantes progresos en la teora de procesos de Markov (1931) y dio solucin a una parte del sexto problema de Hilbert, en el que se peda una fundamentacin axiomtico de la teora de probabilidades, utilizando la medida de Lebesgue.

El anlisis clsico se haba ocupado principalmente de funciones continuas, mientras que los problemas de probabilidades generalmente se refieren a casos discretos. La teora de la medida y las sucesivas extensiones del concepto de integral se adaptaban perfectamente a conseguir una asociacin ms estrecha entre el anlisis y la teora de probabilidades, especialmente a partir de mediados del siglo, cuando Laurent Schwartz (1915- ), de la universidad de Pars, generaliz el concepto de diferenciacin mediante su teora de distribuciones (1950-1951).

2.1.1 DEFINICION Y EXPRESIN

Probabilidad, rama de las matemticas que se ocupa de medir o determinar cuantitativamente la posibilidad de que ocurra un determinado suceso. La probabilidad est basada en el estudio de la combinatoria y es fundamento necesario de la estadstica.

La probabilidad de un resultado se representa con un nmero entre 0 y 1, ambos inclusive. La probabilidad 0 indica que el resultado no ocurrir nunca, y la probabilidad 1, que el resultado ocurrir siempre.

El clculo matemtico de probabilidades se basa en situaciones tericas en las cuales puede configurarse un espacio muestral cuyos sucesos elementales tengan todos la misma probabilidad. Por ejemplo, al lanzar un dado ideal, la probabilidad de cada una de las caras es 1/6. Al lanzar dos dados, la probabilidad de cada uno de los resultados es 1/36.

En estos casos, la probabilidad de un suceso cualquiera S, se calcula mediante la regla de Laplace:

P[S] = nmero de sucesos elementales de S / nmero total de sucesos elementales

La expresin anterior se suele expresar del siguiente modo:

P[S] = nmero de casos favorables a S / nmero de casos posibles

La aplicacin de la regla de Laplace en casos elementales es muy sencilla. Por ejemplo, en la experiencia de lanzar un dado:

P[{2, 3, 4, 5}] = 4/6

pues {2, 3, 4, 5} tiene 4 sucesos elementales y la experiencia admita, en total, seis posibilidades.

Sin embargo, la aplicacin de esta regla en experimentos ms complejos requiere el uso de la combinatoria. Por ejemplo, al extraer tres cartas de una baraja y ver la probabilidad de que las tres sean trboles, el nmero total de sucesos elementales es C523 = (525150)/(321) = 22.100. Los casos favorables son C133= (131211)/(321) = 286. Por tanto, la probabilidad pedida es:

P[TRES TRBOLES] = 286/22.100 = 143/11.050

La resolucin de este tipo de problemas se simplifica notablemente si consideramos sacar tres naipes como una experiencia compuesta por tres experiencias simples: sacar un naipe y despus otro y despus otro.

2.2 EVENTOS MUTUAMENTE EXCLUYENTES Y NO EXCLUYENTES

Cuando se realiza un experimento, que es cualquier proceso que produce un resultado o una observacin, se van a obtener un conjunto de valores. A este conjunto de valores que puede tomar una variable se le denomina espacio muestral.

Por ejemplo: Si se tiene un dado cualquiera, el espacio muestral (EM) es EM={1,2,3,4,5,6}.

Si existen ms de una variable, el espacio muestral est formado por las combinaciones de valores de cada una de las variables.

Si tomamos un subconjunto cualquiera del espacio muestral tenemos lo que se denomina un evento, y si ste consta de un solo elemento entonces es un evento elemental.

Como se puede uno imaginar, existen eventos que siempre, no importa el nmero de experimentos o su situacin, ocurren, y en cambio existen otros que nunca ocurren. Los que siempre ocurren son los eventos seguros, y los que nunca son los eventos imposibles.

Sin embargo, no todos los resultados son al azar, pues si un experimento es cualquier proceso entonces los resultados pueden tomar cualquier tipo de valor. Por esta razn, se define como experimento aleatorio al proceso en el que se pueden predecir con certeza la ocurrencia de sus eventos, con excepcin del seguro o del imposible. Hay que hacer la observacin que esta definicin habla en trminos generales y no especficamente sobre algn experimento en particular.

A aqulla variable que est asociada a un experimento de este tipo se le denomina variable aleatoria.

En cambio, a un experimento no aleatorio se le denomina experimento determinstico.

Cuando hablamos de varios eventos dentro del mismo experimento se pueden dar varios casos.

Si dos o ms eventos no pueden ocurrir simultneamente, se llaman eventos mutuamente excluyentes, es decir, que la interseccin de ambos eventos es vaca.

Por otro lado, en ocasiones un evento o ms eventos dependen de otro evento previo, es decir, un evento A ocurre dado que ocurri un evento B. Si existe este tipo de relacin entre eventos se dice que son eventos dependientes o condicionados (el evento A depende del evento B, o el resultado del evento A est condicionado al resultado del evento B). Por otro lado, si no existe tal relacin entre eventos se dice que son eventos independientes. Los criterios de dependencia o de independencia se definirn ms adelante, en trminos de probabilidad condicional.

2.3 REGLAS DE ADICION

Principio de adicin :

Supongamos que un evento A se puede realizar de "m" maneras y otro evento B se puede realizar de "n" maneras diferentes, adems, no es posible que ambos eventos se realicen juntos (A B = ), entonces el evento A o el evento B se realizarn de ( m + n) maneras.

Ejemplo 1:

Un repuesto de automvil se venden en 6 tiendas en la Victoria o en 8 tiendas de Brea.De cuntas formas se puede adquirir el repuesto?

Solucin :

Por el principio de adicin:

Victoria Brea

6 formas + 8 formas = 14 formas

Ejemplo 2:

Se desea cruzar un ro, para ello se dispone de 3 botes, 2 lanchas y 1 deslizador. De cuantas formas se puede cruzar el ro utilizando los medios de transporte sealados?

Solucin :

Aplicando el principio de adicin se tiene:

Bote , lancha , deslizador

3 2 1

# maneras = 3 + 2 + 1 = 6

2.4 EVENTOS INDEPENDIENTES , DEPEDIENTES , PROBABILIDAD CONDICIONAL

Eventos independientes: dos eventos A y B son independientes sis la ocurrencia o no ocurrencia afecta la probabilidad asignada a la ocurrencia del otro.

Algunas veces es sencillo determinar la independencia por ejemplo los dos eventos considerados se refieren a ensayos no relacionados tales como el lanzamiento de dos monedas de diferente denominacin en consecuencia los resultados con ambas monedas son independientes. La falta de independencia o sea la dependencia es demostrada por la siguiente ilustracin considrese el experimento donde se lanzan dos dados y se observa los dos eventos la suma es igual a 10 y nmero doble que se establece P(10)=3/36=1/12, P(doble)=6/36=1/6 la ocurrencia de 10 afecta la probabilidad de doble? Considrese esta pregunta de la manera siguiente: a ocurrido una suma igual a 10 debe de ser uno de los resultados siguientes [(4,6),(5,5),(6,4)] una de estas tres posibilidades es nmero doble.

En consecuencia debe concluirse que "P" (doble sabiendo que ha ocurrido un diez), escrita

P(doble/10), es igual a 1/3 ya que un tercio es distinta a la probabilidad de un doble puede concluirse que el evento 10 afecta la probabilidad de un nmero doble as un doble y 10 son eventos dependientes. El smbolo P(A/B)=P(B/A)=PB.

Considrese la probabilidad condicional. Tmese, por ejemplo, el experimento donde se lanza un dado: S=[1,2,3,4,5,6] en este experimento pueden definirse dos eventos como A ="ocurre un 4", y B="ocurre un nmero par". Entonces P(A)=1/6, el evento A se satisface

exactamente por uno de los seis mustrales igualmente probables en S. La probabilidad condicional de A dado B, P(A/B), se encuentra de manera similar, pero S ya no es este caso el espacio muestral. Esto puede verse de la manera siguiente: se lanza un dado sin que se pueda ver, aunque recibe la informacin de que el nmero obtenido sea par, es decir que ha ocurrido el evento B. Esta es la condicin dada, conocindola a uno se la pide asignar la probabilidad del evento "ocurre un 4". Slo haqy tres posibilidades en el nuevo espacio muestral (reducido), [2,4,6]. Cada uno de los tres resultados es igualmente probable: en consecuencia P(A B)=1/3.

2.5 REGLAS DE MULTIPLICACIN

Regla de la multiplicacin CASO GENERAL

Sean A y B dos eventos definidos en el espacio muestral S. Entonces :

P(A y B)=P(A).P(B/A)

o bien

P(A y B)=P(B).P(A/B)

Si los eventos A y B son independientes, el caso general de la regla de la multiplicacin (la frmula anterior).

Regla de la multiplicacin CASO ESPECIAL

Sean A y B dos eventos definidos en el espacio muestral S. Si A y B son eventos independientes entonces:

P(A y B)=P(A).P(B)

Esta frmula puede ser generalizada. Si A,B,C;...;g son eventos independientes, entonces:

P(A y B y C y ... y G)=P(A).P(B).P(C)...P(G=Hay algunos problemas, o parte de algunos problemas en los que la respuesta tiene que ver con multiplicar probabilidades.

Veamos un ejemplo. El producto que nos surte el proveedor A tiene un 5% de probabilidad de estar defectuoso, mientras que el que nos surte el proveedor B tiene un 15% de probabilidad de estar defectuoso. Debido al empaque, es imposible distinguir entre el producto del proveedor A y el del B. En el almacn hay 100 unidades del producto y vamos a seleccionar una al azar. Sabiendo que 40% de las unidades nos las surti A y el resto B, qu probabilidad hay de que la unidad seleccionada sea defectuosa?

Para calcular la probabilidad, es conveniente ver que lo que estamos haciendo tiene dos etapas que se van a cubrir de manera secuencial:

Primero se escoge una unidad que puede ser del proveedor A o del B.

Una vez escogida la unidad sta puede ser defectuosa o n.

Obtener una unidad defectuosa se puede hacer por cualquiera de estos dos caminos:

En la primera etapa escogemos un producto del proveedor A y en la segunda etapa resulta defectuoso.

Primero escogemos del B y luego resulta defectuoso.

Esta particin del problema se ve mejor en lo que se llama un diagrama de rbol. Detalles en el pizarrn.

La probabilidad de obtener un producto defectuoso es la suma de las probabilidades de los dos eventos sealados.

Para calcular la probabilidad del primer evento necesitamos combinar las probabilidades de ambas etapas: P(proveedor A) = 0.40 y P(defect.|provedor A) = 0.05. La manera correcta de combinarlas es multiplicndolas. Ahora vamos a ver por qu; de los cien productos, 40 son del proveedor A y de ellos el 5% es defectuoso. Esto nos da 2 artculos, del total de 100, que son defectuosos y surtidos por el proveedor A.

De la misma manera, la probabilidad de la segunda posibilidad es: P(proveedor B) = 0.60 multiplicada por P(defect.|proveedor B) = 0.15 lo cual nos da 9%.

La probabilidad que necesitbamos: P(defect.) = 0.02 + 0.09 = 0.11

En la solucin de este problema usamos la regla de que para calcular la probabilidad de un evento que se hace en dos etapas hay que multiplicar la probabilidad de la primera etapa por la condicional de la segunda etapa dado el resultado de la primera.

Otro ejemplo es el siguiente; una mecangrafa muy eficiente tiene una probabilidad de 0.01 de producir algn error por cada pgina que escribe y cada pgina es independiente. Si nos escribe un documento de 3 pginas, que probabilidad hay de que no tenga ningn error. Aqu nuestro resultado involucra 3 etapas (no nada ms dos): 1a., 2a. y 3a. pginas. La probabilidad de un documento perfecto es:

P(1a.bien)P(2a.bien|1a.bien)P(3a.bien|1a.y2a.bien)

y, por la independencia de la pginas, las 3 probabilidades son iguales a 0.99. Esto da 0.97.

Cuando los eventos en sucesin, son independientes, el clculo de la probabilidad se simplifica!

2.6 DIAGRAMA DEL ARBOL

Diagramas de rbol

Representa grficamente la regla de la multiplicacin. De un punto a la izquierda salen n1 rectas de 1ra generacin. De cada una de estas ramas salen n2 de 2da generacin y asi sucesivamente. La regla de la multiplicacin muestra el numero total de ramas que tiene el rbol.

En los problemas de probabilidad y en especial en los de probabilidad condicionada, resulta interesante y prctico organizar la informacin en una tabla de contingencia o en un diagrama de rbol.

Las tablas de contingencia y los diagramas de rbol estn ntimamente relacionados, dado uno de ellos podemos construir el otro. Unas veces, los datos del problema permiten construir fcilmente uno de ellos y a partir de l podemos construir el otro, que nos ayudar en la resolucin del problema.

Conversin de una tabla en diagrama de rbol

Las tablas de contingencia estn referidas a dos caractersticas que presentan cada una dos o ms sucesos.

A TOTAL

B P( A B ) P(

INCLUDEPICTURE "http://thales.cica.es/rd/Recursos/rd98/Matematicas/28/i2p2-interseccion.gif" \* MERGEFORMATINET B ) P( B )

P( A ) P(

INCLUDEPICTURE "http://thales.cica.es/rd/Recursos/rd98/Matematicas/28/i2p2-interseccion.gif" \* MERGEFORMATINET

INCLUDEPICTURE "http://thales.cica.es/rd/Recursos/rd98/Matematicas/28/icontrariodeb.gif" \* MERGEFORMATINET ) P( )

TOTAL P( A ) P( ) 1

En el caso de los sucesos A, , B y , expresados en frecuencias absolutas, relativas o probabilidades la tabla, adopta la forma adjunta.

Dicha tabla adopta la forma del diagrama de rbol del dibujo. En ste, a cada uno de los sucesos A y se les ha asociado los sucesos B y .

Sobre las ramas del diagrama de rbol se han anotado las probabilidades condicionadas correspondientes, deducidas de las relaciones anlogas a:

2.7 COMBINACIONES Y PERMUTACIONES

Combinaciones

Es una seleccin de r objetos de n dados sin atender a la ordenacin de los mismos. Es decir, es la obtencin de subcojuntos, de r elementos cada uno, a partir de un conjunto inicial de n elementos. La denotaremos con Cnr, nCr .

Por ejemplo: Si tomamos el mismo conjunto A={a,b,c,d}, cuntos subconjuntos de 2 elementos cada uno se pueden obtener?

Hacindolos se obtienen: {a,b}, {a,c}, {a,d}, {b,c}, {b,d}, {c,d}. Son seis los subconjuntos.

En general, si de n objetos dados se hacen combinaciones de r objetos cada una, el nmero de combinaciones obtenidas son:

Cnr = nCr = o, que es lo mismo,

Cnr = nCr = En Excel la funcin COMBINAT(n,r) calcula las combinaciones de n objetos tomando r de ellos.

Es cada uno de los diferentes arreglos que se pueden hacer con parte o todos los elementos de un conjunto dado sin considerar el orden en su ubicacin

El nmero de combinaciones de "n" elementos diferentes tomados de "k" en "k" , con k n ,est dada por:

Ejemplo 1:

Si disponemos de 5 puntos no colineales ,cul es el mximo nmero de tringulos que se podrn formar?

Solucin :

Para dibujar un tringulo solo es necesario 3 puntos en el plano, luego se escogern 3 puntos (k = 3) de un total de 8 puntos (n = 5). Adems no importa el orden, ya que el triangulo ABC es igual al CBA; por lo tanto se trata de una combinacin.

Para ver el grfico seleccione la opcin Bajar trabajo del men superior

Ejemplo 2:

Una seora tiene 3 frutas : manzana, fresa y pia. Cuntos sabores diferentes de jugo podr preparar con estas frutas ?

Para ver el grfico seleccione la opcin Bajar trabajo del men superior

Fresa (F) , Pia (P) , Manzana (M)

Solucin:

Mtodo 1 : (en forma grfica)

Cuando se escoge una fruta de las tres, los sabores son 3: F, P ,M

Cuando se escoge 2 de las tres frutas, los sabores son 3: FP, FM, PM

Cuando se escoge las 3 frutas los sabores son 1: FPM

Total de sabores diferentes : 3 + 3 + 1 = 7

Mtodo 2 : (Empleando combinaciones)

Se puede escoger una fruta de las tres 2 frutas de las tres las tres frutas de las tres, adems en este caso no importa el orden; por lo tanto usamos el principio de adicin aplicado a la combinacin:

# maneras diferentes =

# maneras diferentes =Total de sabores diferentes : 3 + 3 + 1 = 7

Ejemplo 3:

Se desea formar un comit de 7 seleccionando 4 fsicos y 3 matemticos de un grupo de 8 fsicos y 6 matemticos.De cuantas maneras podr seleccionarse?

Solucin:

1Seleccionamos 4 fsicos entre 8 en formas

INCLUDEPICTURE "http://www.monografias.com/trabajos13/analisco/Image721.gif" \* MERGEFORMATINET

2o Seleccionamos 3 matemticos entre 6 en

Aplico el principio de multiplicacin

x = 70 x 20 = 1400

Permutacin

Es un arreglo de todos o parte de un conjunto de objetos considerando el orden en su ubicacin; cuando en el arreglo solo entran parte de los elementos del conjunto se llama variacin . Es importante resaltar que el orden es una caracterstica importante en la permutacin, cuando variamos el orden de los elementos se dice que permutamos dichos elementos.

Ejemplo :

Determinar los diferentes arreglos o permutaciones que se pueden hacer con las letras a, b y c tomadas de dos en dos

Solucin :

Mtodo 1:

Sea el conjunto : {a, b, c} , entonces los arreglos pueden ser: ab, ba. ac, ca, bc, cb

Nmero de arreglos = 6

Mtodo 2: (principio de multiplicacin)

Para ver el grfico seleccione la opcin Bajar trabajo del men superior

# arreglos = 3 x 2 = 6

Teorema 1: (Permutacin lineal con elementos diferentes)

"El nmero de permutaciones de "n" objetos diferentes, tomados en grupos de k elementos (siendo k n) y denotado por , estar dado por:

Para ver el grfico seleccione la opcin Bajar trabajo del men superior

; donde: n, k N y 0 k n

Estas permutaciones son llamados lineales , porque los objetos son ordenados en una lnea recta de referencia

Ejemplo:

En una carrera de 400metros participan 12 atletas. De cuantas formas distintas podrn ser premiados los tres primeros lugares con medalla de oro , plata y bronce?

Solucin :

Mtodo 1 : Empleando el principio de multiplicacin

Oro Plata Bronce

Para ver el grfico seleccione la opcin Bajar trabajo del men superior

10 x 9 x 8

# maneras = 720

Mtodo 2: (usando la frmula de permutacin lineal)

Se busca las diferentes ternas (k = 3) que se pueden formar con los 10 atletas (n = 10)

Para ver el grfico seleccione la opcin Bajar trabajo del men superior

Teorema 2: (Permutacin lineal con elementos repetidos)

El nmero de permutaciones (P) distintas de "n" elementos tomados de "n" en "n" en donde hay un primer grupo de n1 objetos iguales entre si; n2 objetos iguales entre si de un segundo tipo y as sucesivamente hasta nk objetos iguales entre si de un ltimo tipo, entonces:

Ejemplo :

De cuntas maneras distintas se podrn ordenar las siguientes figuras?

Para ver el grfico seleccione la opcin Bajar trabajo del men superior

Solucin:

Como entran todos los elementos del conjunto y estos se repiten, se trata de una permutacin con repeticin, donde n1 = 3 (tres crculos), n2 = 2 (dos cuadrados) , n3 = 1 (un tringulo), n4 = 1( un rombo), luego:

= Permutacin Circular

Son agrupaciones donde no hay primero ni ltimo elemento, por hallarse todos en una lnea cerrada. Para hallar el nmero de permutaciones circulares que se pueden formar con "n" objetos distintos de un conjunto, hay que considerar fija la posicin de un elemento, los n 1 restantes podrn cambiar de lugar de (n 1)! Formas diferentes tomando todas las posiciones sobre la circunferencia relativa al primer punto.

El nmero de permutaciones circulares ser:

Ejemplo1 :

De cuntas formas diferentes puede sentarse al rededor de una mesa circular un padre y sus 5 hijos?

Solucin :

Se trata de una permutacin circular : Ejemplo 2:

De cuntas maneras diferentes se podrn ubicar las cifras del 1 al 7 en la siguiente figura?

Para ver el grfico seleccione la opcin Bajar trabajo del men superior

Solucin :

Este problema se puede resolver como la conjuncin de dos eventos: primero ubico una cifra en el centro (7 posibilidades) y segundo las otras 6 cifras, las cuales por ordenarse en una circunferencia se podrn permutar de (6 1 )! Formas , por lo tanto:

# de maneras = 7 x 5! = 7 x 120 = 840

2.8 ANALISIS COMBINATORIO

En ocasiones el trabajo de enumerar los posibles sucesos que ocurren en una situacin dada se convierte en algo difcil de lograr o, simplemente, tedioso. El anlisis combinatorio, o clculo combinatorio, permite enumerar tales casos o sucesos y as obtener la probabilidad de eventos ms complejos.

En el caso de que existan ms de un suceso a observar, habra que contar el nmero de veces que pueden ocurrir todos los sucesos que se desean observar, para ello se utiliza el principio fundamental de conteo:

Si un suceso se puede presentar de n1 formas, y otro se puede presentar de n2 formas, entonces el nmero de formas en que ambos sucesos pueden presentarse en ese orden es de n1n2.

En otras palabras, basta multiplicar el nmero de formas en que se pueden presentar cada uno de los sucesos a observar.

Este principio nos remite automticamente al factorial de un nmero natural, que se puede pensar como una funcin con dominio los nmeros naturales junto con el cero y codominio los nmeros naturales. El factorial de un nmero n, denotado n!, se define como:

Ahora, n es muy grande el proceso de clculo se vuelve tedioso y muy cargado, incluso para una computadora, por lo que se utiliza la aproximacin de Stirling a n!:

donde e2.71828..., que es la base de los logaritmos neperianos.

En Excel existe la funcin FACT(n) que calcula el factorial de un nmero entero no negativo n.

En el anlisis combinatorio se definen las permutaciones, con o sin repeticin, y las combinaciones.

2.9 TEOREMA DE BAYES

En el ao 1763, dos aos despus de la muerte de Thomas Bayes (1702-1761), se public una memoria en la que aparece, por vez primera, la determinacin de la probabilidad de las causas a partir de los efectos que han podido ser observados. El clculo de dichas probabilidades recibe el nombre de teorema de Bayes.

Teorema de Bayes

Sea A1, A2, ...,An un sistema completo de sucesos, tales que la probabilidad de cada uno de ellos es distinta de cero, y sea B un suceso cualquier del que se conocen las probabilidades condicionales P(B/Ai). entonces la probabilidad P(Ai/B) viene dada por la expresin:

En los problemas relacionados con la probabilidad, y en particular con la probabilidad condicionada, as como con la probabilidad total y el teorema de Bayes, es aconsejable que, con la informacin del problema, construyas una tabla de contingencia o un diagrama de rbol.

El Teorema de Bayes viene a seguir el proceso inverso al que hemos visto en el Teorema de la probabilidad total:Teorema de la probabilidad total: a partir de las probabilidades del suceso A (probabilidad de que llueva o de que haga buen tiempo) deducimos la probabilidad del suceso B (que ocurra un accidente).

Teorema de Bayes: a partir de que ha ocurrido el suceso B (ha ocurrido un accidente) deducimos las probabilidades del suceso A (estaba lloviendo o haca buen tiempo?).La frmula del Teorema de Bayes es:

Tratar de explicar estar frmula con palabras es un galimatas, as que vamos a intentar explicarla con un ejemplo. De todos modos, antes de entrar en el ejercicio, recordar que este teorema tambin exige que el suceso A forme un sistema completo.

Ejercicio 1: El parte meteorolgico ha anunciado tres posibilidades para el fin de semana:a) Que llueva: probabilidad del 50%.b) Que nieve: probabilidad del 30%c) Que haya niebla: probabilidad del 20%.Segn estos posibles estados meteorolgicos, la posibilidad de que ocurra un accidente es la siguiente:a) Si llueve: probabilidad de accidente del 10%.b) Si nieva: probabilidad de accidente del 20%c) Si hay niebla: probabilidad de accidente del 5%.Resulta que efectivamente ocurre un accidente y como no estabamos en la ciudad no sabemos que tiempo hizo (nev, llovo o hubo niebla). El teorema de Bayes nos permite calcular estas probabilidades:

Las probabilidades que manejamos antes de conocer que ha ocurrido un accidente se denominan "probabilidades a priori" (lluvia con el 60%, nieve con el 30% y niebla con el 10%).Una vez que incorporamos la informacin de que ha ocurrido un accidente, las probabilidades del suceso A cambian: son probabilidades condicionadas P (A/B), que se denominan "probabilidades a posteriori".Vamos a aplicar la frmula:

a) Probabilidad de que estuviera lloviendo:

La probabilidad de que efectivamente estuviera lloviendo el da del accidente (probabilidad a posteriori) es del 71,4%.b) Probabilidad de que estuviera nevando:

La probabilidad de que estuviera nevando es del 21,4%.c) Probabilidad de que hubiera niebla:

La probabilidad de que hubiera niebla es del 7,1%.2.10 VALOR ESPERADO O ESPERANZA MATEMTICA

Sea X una v.a. discreta. Se denomina esperanza matemtica de X o valor esperado, y se denota bien o bien , a la cantidad que se expresa como:

donde es el conjunto numerable de ndices de los valores que puede tomar la variable (por ejemplo para un nmero finito de valores de la v.a. o bien para una cantidad infinita numerable de los mismos.

Si X es una v.a. continua, se define su esperanza a partir de la funcin de densidad como sigue:

Observacin

Recordamos que si

y por tanto tiene sentido calcular su esperanza matemtica:

Por las analogas existente entre la definicin de media aritmtica y esperanza matemtica, las propiedades de linealidad de la primera se trasladan a la segunda, como es inmediato comprobar:

UNIDAD 3

TIPOS DE DISTRIBUCIONES VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS

3.1 BINOMIAL

Se dice que una v.a. X sigue una ley binomial de parmetros n y p, , si es la suma de n v.a. independientes de Bernouilli con el mismo parmetro, p:

Esta definicin puede interpretarse en el siguiente sentido: Supongamos que realizamos n pruebas de Bernouilli, Xi, donde en todas ellas, la probabilidad de xito es la misma (p), y queremos calcular el nmero de xitos, X, obtenidos el el total de las n pruebas. Su ley de probabilidad es 6.1 .3.11 PROPIEDADES: MEDIA, VARIANZA Y DESVIACIN ESTANDAR

Supongamos que un experimento aleatorio tiene las siguientes caractersticas:

En cada prueba del experimento slo son posibles dos resultados: el suceso A (xito) y su contrario (fracaso).

El resultado obtenido en cada prueba es independiente de los resultados obtenidos anteriormente.

La probabilidad del suceso A es constante, la representamos por p, y no vara de una prueba a otra. La probabilidad de es 1- p y la representamos por q .

El experimento consta de un nmero n de pruebas.

Todo experimento que tenga estas caractersticas diremos que sigue el modelo de la distribucin Binomial. A la variable X que expresa el nmero de xitos obtenidos en cada prueba del experimento, la llamaremos variable aleatoria binomial.

La variable binomial es una variable aleatoria discreta, slo puede tomar los valores 0, 1, 2, 3, 4, ..., n suponiendo que se han realizado n pruebas. Como hay que considerar todas las maneras posibles de obtener k-xitos y (n-k) fracasos debemos calcular stas por combinaciones (nmero combinatorio n sobre k).

La distribucin Binomial se suele representar por B(n,p) siendo n y p los parmetros de dicha distribucin.

Funcin de Probabilidad de la v.a. Binomial

Funcin de probabilidad de la distribucin Binomial o tambin denominada funcin de la distribucin de Bernoulli (para n=1). Verificndose: 0 p 1

Como el clculo de estas probabilidades puede resultar algo tedioso se han construido tablas para algunos valores de n y p que nos facilitan el trabajo.

Parmetros de la Distribucin Binomial

Funcin de Distribucin de la v.a. Binomial

siendo k el mayor nmero entero menor o igual a xi.

Esta funcin de distribucin proporciona, para cada nmero real xi, la probabilidad de que la variable X tome valores menores o iguales que xi.

El clculo de las F(x) = p( X x) puede resultar laborioso, por ello se han construido tablas para algunos valores de n y p que nos facilitan el trabajo.

Sea X una variable aleatoria discreta correspondiente a una distribucin binomial.

Por tanto, su funcin de distribucin es

El modo ms simple de calcular la funcin afirma que la funcin caracterstica de la suma de variables independientes es el producto de las funciones caractersticas de estas:

Los principales momentos de X los calculamos ms fcilmente a partir de (prop. pgina 5) que de su propia definicin:

Ejemplo

Un mdico aplica un Tes. a 10 alumnos de un colegio para detectar una enfermedad cuya incidencia sobre una poblacin de nios es del . La sensibilidad del test es del y la especificidad del . Cual es la probabilidad de que exactamente a cuatro personas le de un resultado positivo? Si en la muestra hay cuatro personas a las que el test le da positivo, cul es la probabilidad de que entre estas, exactamente dos estn sanas? Calcular la probabilidad de que el test suministre un resultado incorrecto para dos personas. Calcular la probabilidad de que el resultado sea correcto para ms de 7 personas.

Solucin:

Los datos de que disponemos son:

donde E, T+, y T- tienen el sentido que es obvio. Si queremos saber a cuantas personas el test le dar un resultado positivo, tendremos que calcular , para lo que podemos usar el teorema de la probabilidad total (estar enfermo y no estarlo forman una coleccin exhaustiva y excluyente de sucesos):

Sea X1 la v.a. que contabiliza el nmero de resultados positivos. Es claro que llamando , se tiene que X sigue una distribucin binomial

Por ello la probabilidad de que a cuatro personas le de el resultado del test positivo es:

Si queremos calcular a cuantas personas les dar el test un resultado positivo aunque en realidad estn sanas, hemos de calcular previamente , o sea, el ndice predictivo de falsos positivos:

Es importante observar este resultado. Antes de hacer los clculos no era previsible que si a una persona el test le da positivo, en realidad tiene una probabilidad aproximadamente del de estar sana. Sea X2 la variable aleatoria que contabiliza al nmero de personas al que el test le da positivo, pero que estn sanas en realidad. Entonces

y

Por ltimo vamos a calcular la probabilidad p3 de que el test de un resultado errneo, que es:

La variable aleatoria que contabiliza el nmero de resultados errneos del test es

Como la probabilidad de que el test sea correcto para ms de siete personas, es la de que sea incorrecto para menos de 3, se tiene

3.1.2 GRAFICA

Figura: Funcin de probabilidad de una variable binomial cundo n es pequeo.

Figura: Funcin de probabilidad de una variable binomial cuando n es grande.

3.2 POISSON

La Distribucin de Poisson se llama as en honor a Simen Dennis Poisson (1781-1840), francs que desarroll esta distribucin basndose en estudios efectuados en la ltima parte de su vida. La distribucin de Poisson se emplea para describir varios procesos, entre otros la distribucin de las llamadas telefnicas que llagan a un conmutador, la demanda (necesidades) de servicios en una institucin asistencial por parte de los pacientes, los arribos de los camiones y automviles a la caseta de cobro y el nmero de accidentes en un cruce. Los ejemplos citados tienen un elemento en comn, pueden ser descritos por una variable aleatoria discreta que asume valores enteros (0,1,2,3,4,5 y as sucesivamente).3.2.1 PROPIEDADES: MEDIA, VARIANZA Y DESVIACIN ESTANDAR

El nmero de enfermos que llegan a un consultorio en cierto intervalo de tiempo ser de 0,1,2,3,4,5 o algn otro nmero entero. De manera anloga, si se cuenta el nmero de automviles que llegan a una caseta de cobro durante un periodo de diez minutos, el nmero ser entero.Caractersticas de los procesos que producen una distribucin de la probabilidad de Poisson.

El nmero de vehculos que pasan por una caseta de cobro en las horas de mayor trfico sirve como ejemplo para mostrar las caractersticas de una distribucin de probabilidad de Poisson. El promedio (media) de los arribos de vehculos por hora de gran trfico puede estimarse a partir de los datos anteriores del trfico. Si dividimos las horas de gran trfico en periodos (intervalos) de un segundo cada uno, encontraremos que los siguientes enunciados son verdaderos:

a) La probabilidad de que exactamente un vehculo llegue por segundo a una caseta individual es un nmero muy pequeo y es constante para que cada intervalo de un segundo.

b) La probabilidad de que dos o ms vehculos lleguen en un intervalo de un segundo es tan reducida que podemos asignarle un valor cero.

c) El nmero de vehculos que llegan en determinado intervalo de un segundo es independiente del momento en que el intervalo de un segundo ocurre durante la hora de gran trfico.

d) El nmero de llegadas en cualquier intervalo de un segundo no depende del nmero de arribos de cualquier otro intervalo de un segundo.

Ahora bien, podemos generalizar partiendo de las cuatro condiciones que hemos descrito en este ejemplo, si estas condiciones se cumplen nos apoyaremos en una distribucin de probabilidad de Poisson para describirlos. Clculo de probabilidades mediante la distribucin de Poisson. La distribucin de Poisson, segn hemos sealado, se refiere a ciertos procesos que pueden ser descritos con una variable aleatoria discreta. La letra X suele representar esa variable y puede adems asumir valores enteros (0,1,2,3 etc..) . Utilizamos la letra X mayscula para representar la variable aleatoria y la x minscula para designar un valor especfico que puede asumir la X mayscula. La probabilidad de exactamente x ocurrencias en una distribucin de Poisson se calcula mediante la frmula: P(x) = ( x * e-( / x!( x = Lambda(nmero medio de ocurrencias por intervalo de tiempo) elevada a la potencia x. e-( = e= 2.71828 elevado a la potencia de lambda negativa. x! = x factorial. Ejemplo :Supngase que estamos investigando la seguridad de un crucero muy peligroso. Los archivos de la polica indican una media de cinco accidentes por mes en l. El nmero de accidentes est distribuido conforme a la distribucin de Poisson, y la divisin de seguridad en carreteras quiere calcular la probabilidad de exactamente 0,1,2,3 y 4 accidentes en un mes determinado. Aplicando la frmula anterior: P(0) = (5)0 (e-5) /0! = 0.00674P(1) = (5)1 (e-5) /1! = 0.03370P(2) = (5)2 (e-5) /2! = 0.08425P(3) = (5)3 (e-5) /3! = 0.14042P(4) = (5)4 (e-5) /4! = 0.17552 Para saber cual es la probabilidad en 3 o menos, sumaremos las probabilidades de 0,1,2,3 lo que ser igual a :

P(0) = 0.00674P(1) = 0.03370P(2) = 0.08425P(3) = 0.14042P(3 o menos) = 0.26511Dado que la probabilidad de que haya 3 o menos accidentes es de 0.26511 entonces la probabilidad de que ocurran ms de tres debe ser = 1 0.26511 = 0.73489. La distribucin de Poisson como una aproximacin a la distribucin binomial. Algunas veces, si se desea evitar el tedioso trabajo de calcular las distribuciones binomiales, se puede usar a cambio la de Poisson, pero debe cumplir con ciertas condiciones como : n=>20p=30) para poblaciones cualesquiera. Es decir es el error tpico, o error estndar de la media.Cmo usamos esto en nuestro problema de estimacin?

1 problema: No hay tablas para cualquier normal, slo para la normal =0 y =1 (la llamada z); pero haciendo la transformacin (llamada tipificacin)

una normal de media y desviacin se transforma en una z.Llamando z al valor de una variable normal tipificada que deja a su derecha un rea bajo la curva de , es decir, que la probabilidad que la variable sea mayor que ese valor es (estos son los valores que ofrece la tabla de la normal)

podremos construir intervalos de la forma

para los que la probabilidad es 1 - .

Teniendo en cuenta la simetra de la normal y manipulando algebracamente

que tambin se puede escribir

o, haciendo nfasis en que es el error estndar de la media,

Recurdese que la probabilidad de que est en este intervalo es 1 - . A un intervalo de este tipo se le denomina intervalo de confianza con un nivel de confianza del 100(1 - )%, o nivel de significacin de 100%. El nivel de confianza habitual es el 95%, en cuyo caso =0,05 y z /2=1,96. Al valor se le denomina estimacin puntual y se dice que es un estimador de .Ejemplo: Si de una poblacin normal con varianza 4 se extrae una muestra aleatoria de tamao 20 en la que se calcula se puede decir que tiene una probabilidad de 0,95 de estar comprendida en el intervalo

que sera el intervalo de confianza al 95% para En general esto es poco til, en los casos en que no se conoce tampoco suele conocerse 2; en el caso ms realista de 2 desconocida los intervalos de confianza se construyen con la t de Student (otra fdp continua para la que hay tablas) en lugar de la z.

o, haciendo nfasis en que es el error estndar estimado de la media,

Este manera de construir los intervalos de confianza slo es vlido si la variable es normal. Cuando n es grande (>30) se puede sustituir t por z sin mucho error.4.2.2 DISTRIBUCION MUESTRAL DE LA DIFERENCIA ENTRE DOS MEDIAS CON

DESVIACIN ESTANDAR CONOCIDAD Y DESCONOCIDA

Distribucin Muestral de Diferencia de Medias

Suponga que se tienen dos poblaciones distintas, la primera con media 1 y desviacin estndar 1, y la segunda con media 2 y desviacin estndar 2. Ms an, se elige una muestra aleatoria de tamao n1 de la primera poblacin y una muestra independiente aleatoria de tamao n2 de la segunda poblacin; se calcula la media muestral para cada muestra y la diferencia entre dichas medias. La coleccin de todas esas diferencias se llama distribucin muestral de las diferencias entre medias o la distribucin muestral del estadstico

La distribucin es aproximadamente normal para n130 y n230. Si las poblaciones son normales, entonces la distribucin muestral de medias es normal sin importar los tamaos de las muestras.

Ejemplo:

En un estudio para comparar los pesos promedio de nios y nias de sexto grado en una escuela primaria se usar una muestra aleatoria de 20 nios y otra de 25 nias. Se sabe que tanto para nios como para nias los pesos siguen una distribucin normal. El promedio de los pesos de todos los nios de sexto grado de esa escuela es de 100 libras y su desviacin estndar es de 14.142, mientras que el promedio de los pesos de todas las nias del sexto grado de esa escuela es de 85 libras y su desviacin estndar es de 12.247 libras. Si representa el promedio de los pesos de 20 nios y es el promedio de los pesos de una muestra de 25 nias, encuentre la probabilidad de que el promedio de los pesos de los 20 nios sea al menos 20 libras ms grande que el de las 25 nias.

Solucin:

Datos:

1 = 100 libras

2 = 85 libras

1 = 14.142 libras

2 = 12.247 libras

n1 = 20 nios n2 = 25 nias

Por lo tanto, la probabilidad de que el promedio de los pesos de la muestra de nios sea al menos 20 libras ms grande que el de la muestra de las nias es 0.1056.

Ejemplo:

Uno de los principales fabricantes de televisores compra los tubos de rayos catdicos a dos compaas. Los tubos de la compaa A tienen una vida media de 7.2 aos con una desviacin estndar de 0.8 aos, mientras que los de la B tienen una vida media de 6.7 aos con una desviacin estndar de 0.7. Determine la probabilidad de que una muestra aleatoria de 34 tubos de la compaa A tenga una vida promedio de al menos un ao ms que la de una muestra aleatoria de 40 tubos de la compaa B.

Solucin:

Datos:

A = 7.2 aos

B = 6.7 aos

A = 0.8 aos

B = 0.7 aos

nA = 34 tubos

nB = 40 tubos

Ejemplo:

Se prueba el rendimiento en km/L de 2 tipos de gasolina, encontrndose una desviacin estndar de 1.23km/L para la primera gasolina y una desviacin estndar de 1.37km/L para la segunda gasolina; se prueba la primera gasolina en 35 autos y la segunda en 42 autos.

a. Cul es la probabilidad de que la primera gasolina de un rendimiento promedio mayor de 0.45km/L que la segunda gasolina?

b. Cul es la probabilidad de que la diferencia en rendimientos promedio se encuentre entre 0.65 y 0.83km/L a favor de la gasolina 1?.

Solucin:

En este ejercicio no se cuenta con los parmetros de las medias en ninguna de las dos poblaciones, por lo que se supondrn que son iguales.

Datos:

1 = 1.23 Km/Lto

2 = 1.37 Km/Lto

n1 = 35 autos n2 = 42 autos

La probabilidad de que la diferencia en rendimientos promedio en las muestras se encuentre entre 0.65 y 0.83 Km/Lto a favor de la gasolina 1 es de 0.0117.

4.2.3 DISTRIBUCION MUESTRAL DE LA PROPORCION

Distribucin muestral de Proporciones

Existen ocasiones en las cuales no estamos interesados en la media de la muestra, sino que queremos investigar la proporcin de artculos defectuosos o la proporcin de alumnos reprobados en la muestra. La distribucin muestral de proporciones es la adecuada para dar respuesta a estas situaciones. Esta distribucin se genera de igual manera que la distribucin muestral de medias, a excepcin de que al extraer las muestras de la poblacin se calcula el estadstico proporcin (p=x/n en donde "x" es el nmero de xitos u observaciones de inters y "n" el tamao de la muestra) en lugar del estadsitico media.

Una poblacin binomial est estrechamente relacionada con la distribucin muestral de proporciones; una poblacin binomial es una coleccin de xitos y fracasos, mientras que una distribucin muestral de proporciones contiene las posibilidades o proporciones de todos los nmeros posibles de xitos en un experimento binomial, y como consecuencia de esta relacin, las afirmaciones probabilsticas referentes a la proporcin muestral pueden evaluarse usando la aproximacin normal a la binomial, siempre que np5 y n(1-p) 5. Cualquier evento se puede convertir en una proporcin si se divide el nmero obtenido entre el nmero de intentos.

Generacin de la Distribucin Muestral de Proporciones

Suponga que se cuenta con un lote de 12 piezas, el cual tiene 4 artculos defectuosos. Se van a seleccionar 5 artculos al azar de ese lote sin reemplazo. Genere la distribucin muestral de proporciones para el nmero de piezas defectuosas.

Como se puede observar en este ejercicio la Proporcin de artculos defectuosos de esta poblacin es 4/12=1/3. Por lo que podemos decir que el 33% de las piezas de este lote estn defectuosas.

El nmero posible de muestras de tamao 5 a extraer de una poblacin de 12 elementos es 12C5=792, las cuales se pueden desglosar de la siguiente manera:

Artculos BuenosArtculos MalosProporcin de artculos defectuoso Nmero de maneras en las que se puede obtener la muestra

144/5=0.88C1*4C4=8

233/5=0.68C2*4C3=112

322/5=0.48C3*4C2=336

411/5=0.28C4*4C1=280

500/5=08C5*4C0=56

Total792

Para calcular la media de la distribucin muestral de proporciones se tendra que hacer la sumatoria de la frecuencia por el valor de la proporcin muestral y dividirla entre el nmero total de muestras.

Como podemos observar la media de la distribucin muestral de proporciones es igual a la Proporcin de la poblacin.

p = P

Tambin se puede calcular la desviacin estndar de la distribucin muestral de proporciones:

La varianza de la distribucin binomial es 2= npq, por lo que la varianza de la distribucin muestral de proporciones es 2p =(Pq)/n. Si se sustituten los valores en esta frmula tenemos que , este valor no coincide con el de 0.1681, ya que nos falta agregar el factor de correccin para una poblacin finita y un muestreo sin reemplazo:

La frmula que se utilizar para el clculo de probabilidad en una distribucin muestral de proporciones est basada en la aproximacin de la distribucin normal a la binomial . Esta frmula nos servir para calcular la probabilidad del comportamiento de la proporcin en la muestra.

Ejemplo:

Se ha determinado que 60% de los estudiantes de una universidad grande fuman cigarrillos. Se toma una muestra aleatoria de 800 estudiantes. Calcule la probabilidad de que la proporcin de la muestra de la gente que fuma cigarrillos sea menor que 0.55.

Solucin:

Este ejercicio se puede solucionar por dos mtodos. El primero puede ser con la aproximacin de la distribucin normal a la binomial y el segundo utilizando la frmula de la distribucin muestral de proporciones.

Aproximacin de la distribucin normal a la binomial:

Datos:

n=800 estudiantes

p=0.60

x= (.55)(800) = 440 estudiantes

p(x 440) = ?

Media= np= (800)(0.60)= 480

p(x 440) = 0.0017. Este valor significa que existe una probabilidad del 0.17% de que al extraer una muestra de 800 estudiantes, menos de 440 fuman cigarrillos.

Distribucin Muestral de Proporciones

Datos:

n=800 estudiantes

P=0.60

p= 0.55

p(p 0.55) = ?

4.2.4 DISTRIBUCION MUESTRAL DE LA DIFERENCIA DE DOS PROPORCIONES

Distribucin Muestral de Diferencia de Proporciones

Muchas aplicaciones involucran poblaciones de datos cualitativos que deben compararse utilizando proporciones o porcentajes. A continuacin se citan algunos ejemplos:

Educacin.- Es mayor la proporcin de los estudiantes que aprueban matemticas que las de los que aprueban ingls?

Medicina.- Es menor el porcentaje de los usuarios del medicamento A que presentan una reaccin adversa que el de los usuarios del frmaco B que tambin presentan una reaccin de ese tipo?

Administracin.- Hay diferencia entre los porcentajes de hombres y mujeres en posiciones gerenciales.

Ingeniera.- Existe diferencia entre la proporcin de artculos defectuosos que genera la mquina A a los que genera la mquina B?

Cuando el muestreo procede de dos poblaciones binomiales y se trabaja con dos proporciones muestrales, la distribucin muestral de diferencia de proporciones es aproximadamente normal para tamaos de muestra grande (n1p15, n1q15,n2p25 y n2q25). Entonces p1 y p2 tienen distribuciones muestrales aproximadamente normales, as que su diferencia p1-p2 tambin tiene una distribucin muestral aproximadamente normal.

Ejemplo:

Los hombres y mujeres adultos radicados en una ciudad grande del norte difieren en sus opiniones sobre la promulgacin de la pena de muerte para personas culpables de asesinato. Se cree que el 12% de los hombres adultos estn a favor de la pena de muerte, mientras que slo 10% de las mujeres adultas lo estn. Si se pregunta a dos muestras aleatorias de 100 hombres y 100 mujeres su opinin sobre la promulgacin de la pena de muerte, determine la probabilidad de que el porcentaje de hombres a favor sea al menos 3% mayor que el de las mujeres.

Solucin:

Datos:

PH = 0.12

PM = 0.10

nH = 100

nM = 100

p(pH-pM 0.03) = ?

Se recuerda que se est incluyendo el factor de correccin de 0.5 por ser una distribucin binomial y se est utilizando la distribucin normal.

Se concluye que la probabilidad de que el porcentaje de hombres a favor de la pena de muerte, al menos 3% mayor que el de mujeres es de 0.4562.

Ejemplo:

Una encuesta del Boston College const de 320 trabajadores de Michigan que fueron despedidos entre 1979 y 1984, encontr que 20% haban estado sin trabajo durante por lo menos dos aos. Supngase que tuviera que seleccionar otra muestra aleatoria de 320 trabajadores de entre todos los empleados despedidos entre 1979 y 1984. Cul sera la probabilidad de que su porcentaje muestral de trabajadores sin empleo durante por lo menos dos aos, difiera del porcentaje obtenido en la encuesta de Boston College, en 5% o ms?

Solucin:

En este ejercicio se cuenta nicamente con una poblacin, de la cual se estn extrayendo dos muestras y se quiere saber la probabilidad de la diferencia de los porcentajes en esas dos muestras, por lo que se debe de utilizar la distribucin muestral de proporciones con P1= P2, ya que es una misma poblacin.

Otra de las situaciones con la cual nos topamos es que desconocemos la proporcin de trabajadores despedidos entre 1979 y 1984 que estuvieron desempleados por un perodo de por lo menos dos aos, slo se conoce la p1= 0.20 ya que al tomar una muestra de 320 trabajadores se observ esa proporcin.

En la frmula de la distribucin muestral de proporciones para el clculo de probabilidad se necesita saber las proporciones de las poblaciones, las cuales en este ejercicio las desconocemos, por lo que se utilizar el valor de 0.20 como una estimacin puntual de P. En el siguiente tema se abordar el tema de estimacin estadstica y se comprender el porque estamos utilizando de esa manera el dato.

Tambin debe de comprenderse la pregunta que nos hace este problema, cul sera la probabilidad de que su porcentaje muestral de trabajadores sin empleo durante por lo menos dos aos, difiera del porcentaje obtenido en la encuesta de Boston College, en 5% o ms?, la palabra difiera quiere decir que puede existir una diferencia a favor de la muestra uno, o a favor de la muestra dos, por lo que se tendrn que calcular dos reas en la distribucin y al final sumarlas.

Datos:

p1 = 0.20

n1 = 320 trabajadores

n2 = 320 trabajadores

P1 = P2

La probabilidad de que su proporcion muestral de trabajadores sin empleo durante por lo menos dos aos, difiera del porcentaje obtenido en la encuesta de Boston College, en 0.05 o ms es de 0.1260.

Ejemplo:

Se sabe que 3 de cada 6 productos fabricados por la mquina 1 son defectuosos y que 2 de cada 5 objetos fabricados por la mquina 2 son defectuosos; se toman muestras de 120 objetos de cada mquina:

a. cul es la probabilidad de que la proporcin de artculos defectuosos de la mquina 2 rebase a la mquina 1 en por lo menos 0.10?

b. cul es la probabilidad de que la proporcin de artculos defectuosos de la mquina 1 rebase a la mquina 2 en por lo menos 0.15?

Solucin:

Datos:

P1 = 3/6 = 0.5

P2 = 2/5 = 0.4

n1 = 120 objetos

n2 = 120 objetos

a. p(p2-p10.10) = ?

Otra manera de hacer este ejercicio es poner P1-P2:

La probabilidad de que exista una diferencia de proporciones de artculos defectuosos de por lo menos 10% a favor de la mquina 2 es de 0.0011.

b. p(p1-p2 0.15)=?

La probabilidad de que exista una diferencia de proporciones de artculos defectuosos de por lo menos 15% a favor de la mquina 1 es de 0.2357.

4.3 TEOREMA DEL LMITE CENTRALPara muestras grandes, se puede obtener una aproximacin cercana de la distribucin muestral de la media con una distribucin normal.

Teniendo en cuenta que ya sabemos la media y desviacin tpica de la distribucin muestral, podemos decir que:

x = y

para muestras aleatorias infinitas con media y desviacin tpica y n grande, entonces:

es un valor de una variable N(0,1)

Este teorema es muy importante, puesto que justifica el uso de los mtodos de la curva normal en una gran cantidad de problemas. se utiliza para poblaciones infinitas y para poblaciones finitas cuando n a pesar de ser grande representa una porcin muy pequea de la poblacin.

Es difcil sealar con precisin qu tan grande debe ser n de modo que podamos aplicar el Teorema Central del lmite, pero a no ser que la distribucin sea muy Inusual, por lo general se considera que n =30 es lo suficientemente alto.

Veamos el mismo ejemplo anterior aplicando el Teorema Central del Lmite.

La probabilidad se obtiene por medio del rea marcada de la zona gris, especficamente por medio del rea de la N(0,1) entre:

lo que consultando en las tablas da una probabilidad de 0,9544. As sustituimos la afirmacin de que la probabilidad es como mnimo 0,75 por una aseveracin ms firme de que la probabilidad es aproximadamente de 0,95 ( de que la muestra aleatoria de tamao n=64 de la poblacin de referencia difiera de la de la poblacin menos de 5 unidades)

Tambin se puede usar el teorema Central del lmite para poblaciones finitas, pero una descripcin precisa de las situaciones en que se puede hacer esto, sera ms bien complicada. El uso apropiado ms comn es en el caso en que n es grande y n/N es pequea. Este es el caso de la mayora de las encuestas polticas.

4.4. TIPOS DE ESTIMACIN Y SUS CARACTERSTICAS

ESTIMACION

El objetivo principal de la estadstica inferencial es la estimacin, esto es que mediante el estudio de una muestra de una poblacin se quiere generalizar las conclusiones al total de la misma. Como vimos en la seccin anterior, los estadsticos varan mucho dentro de sus distribuciones mustrales, y mientras menor sea el error estndar de un estadstico, ms cercanos sern unos de otros sus valores.

Existen dos tipos de estimaciones para parmetros; puntuales y por intervalo. Una estimacin puntual es un nico valor estadstico y se usa para estimar un parmetro. El estadstico usado se denomina estimador.

Una estimacin por intervalo es un rango, generalmente de ancho finito, que se espera que contenga el parmetro.

Estimacin Puntual

La inferencia estadstica est casi siempre concentrada en obtener algn tipo de conclusin acerca de uno o ms parmetros (caractersticas poblacionales). Para hacerlo, se requiere que un investigador obtenga datos muestrales de cada una de las poblaciones en estudio. Entonces, las conclusiones pueden estar basadas en los valores calculados de varias cantidades muestrales . Po ejemplo, representamos con (parmetro) el verdadero promedio de resistencia a la ruptura de conexiones de alambres utilizados para unir obleas de semiconductores. Podra tomarse una muestra aleatoria de 10 conexiones para determinar la resistencia a la ruptura de cada una, y la media muestral de la resistencia a la ruptura se poda emplear para sacar una conclusin acerca del valor de . De forma similar, si es la varianza de la distribucin de resistencia a la ruptura, el valor de la varianza muestral s2 se podra utilizar pra inferir algo acerca de .

Cuando se analizan conceptos generales y mtodos de inferencia es conveniente tener un smbolo genrico para el parmetro de inters. Se utilizar la letra griega para este propsito. El objetivo de la estimacin puntual es seleccionar slo un nmero, basados en datos de la muestra, que represente el valor ms razonable de .

Una muestra aleatoria de 3 bateras para calculadora podra presentar duraciones observadas en horas de x1=5.0, x2=6.4 y x3=5.9. El valor calculado de la duracin media muestral es = 5.77, y es razonable considerar 5.77 como el valor ms adecuado de .

Una estimacin puntual de un parmetro es un slo nmero que se puede considerar como el valor ms razonable de . La estimacin puntual se obtiene al seleccionar una estadstica apropiada y calcular su valor a partir de datos de la muestra dada. La estadstica seleccionada se llama estimador puntual de .

El smbolo (theta sombrero) suele utilizarse para representar el estimador de y la estimacin puntual resultante de una muestra dada. Entonces se lee como "el estimador puntual de es la media muestral ". El enunciado "la estimacin puntual de es 5.77" se puede escribir en forma abreviada .

Ejemplo:

En el futuro habr cada vez ms inters en desarrollar aleaciones de Mg de bajo costo, para varios procesos de fundicin. En consecuencia, es importante contar con mtodos prcticos para determinar varias propiedades mecnicas de esas aleaciones. Examine la siguiente muestra de mediciones del mdulo de elasticidad obtenidos de un proceso de fundicin a presin:

44.2 43.9 44.7 44.2 44.0 43.8 44.6 43.1

Suponga que esas observaciones son el resultado de una muestra aleatoria. Se desea estimar la varianza poblacional . Un estimador natural es la varianza muestral:

En el mejor de los casos, se encontrar un estimador para el cualsiempre. Sin embargo, es una funcin de las Xi muestrales, por lo que en s misma una variable aleatoria.

Entonces el estimador preciso sera uno que produzca slo pequeas diferencias de estimacin, de modo que los valores estimados se acerquen al valor verdadero.

Propiedades de un Buen Estimador

Insesgado.- Se dice que un estimador puntual es un estimador insesgado de si , para todo valor posible de . En otras palabras, un estimador insesgado es aquel para el cual la media de la distribucin muestral es el parmetro estimado. Si se usa la media muestral para estimar la media poblacional , se sabe que la , por lo tanto la media es un estimador insesgado.

Eficiente o con varianza mnima.- Suponga que 1 y 2 son dos estimadores insesgados de . Entonces, aun cuando la distribucin de cada estimador est centrada en el valor verdadero de , las dispersiones de las distribuciones alrededor del valor verdadero pueden ser diferentes.

Entre todos los estimadores de que son insesgados, seleccione al que tenga varianza mnima. El resultante recibe el nombre de estimador insesgado con varianza mnima (MVUE, minimum variance unbiased estimator) de .

En otras palabras, la eficiencia se refiere al tamao de error estndar de la estadstica. Si comparamos dos estaisticas de una muestra del mismo tamao y tratamos de decidir cual de ellas es un estimador mas eficiente, escogeramos la estadstica que tuviera el menor error estndar, o la menor desviacin estndar de la distribucin de muestreo.

Tiene sentido pensar que un estimador con un error estndar menor tendr una mayor oportunidad de producir una estimacin mas cercana al parmetro de poblacin que se esta considerando.

Como se puede observar las dos distribuciones tienen un mismo valor en el parmetro slo que la distribucin muestral de medias tiene una menor varianza, por lo que la media se convierte en un estimador eficiente e insesgado.

Coherencia.- Una estadstica es un estimador coherente de un parmetro de poblacin, si al aumentar el tamao de la muestra se tiene casi la certeza de que el valor de la estadstica se aproxima bastante al valor del parmetro de la poblacin. Si un estimador es coherente se vuelve mas confiable si tenemos tamaos de muestras mas grandes.

Suficiencia.- Un estimador es suficiente si utiliza una cantidad de la informacin contenida de la muestra que ningn otro estimador podra extraer informacin adicional de la muestra sobre el parmetro de la poblacin que se esta estimando.

Es decir se pretende que al extraer la muestra el estadstico calculado contenga toda la informacin de esa muestra. Por ejemplo, cuando se calcula la