Probabilidad · teoría frecuencial de la probabilidad. Esta teoría expresa que, si se repite un...

29
Probabilidad De acuerdo a lo comentado en la unidad 1, la Inferencia Estadística comprende los métodos que permiten extrapolar los resultados de una muestra aleatoria hacia la población de la cual fue extraída. Cuando se observa solo una muestra, aun cuando la misma sea adecuadamente representativa de la población por cuanto reproduce sus características esenciales, el intento de extraer conclusiones acerca de la población se realiza, no en un marco de certeza sino de incertidumbre cuantificable. La Teoría de Probabilidad, rama de la matemática que modela fenómenos aleatorios, cuantifica esa incertidumbre en el proceso de estimación de parámetros, permitiendo hacer afirmaciones en cuanto a precisión y confiabilidad de los resultados. También permite probar hipótesis en relación con los parámetros, fijando la magnitud del error que puede cometerse al tomar la decisión y constituye la base teórica de métodos estadísticos tales como Regresión, Análisis de Varianza, Control de Calidad, etc. Si bien dichas metodologías, tanto la estimación de parámetros como la prueba de hipótesis las estudiaremos en las últimas unidades de nuestra materia, a partir de este tema introduciremos los conceptos fundamentales y el lenguaje básico de Probabilidad. En las explicaciones que se desarrollan en este capítulo se vislumbrara de qué manera la Teoría de Probabilidad es en la actualidad la base de la mayor parte de las decisiones que adoptan en el ámbito de las Ciencias Naturales. Fenómenos aleatorios y fenómenos determinísticos En cualquier campo de la ciencia (física, biología, ingeniería, economía, etc.) se necesitan describir, modelar y predecir fenómenos del mundo real, para lo cual se construyen modelos matemáticos. Cuando se quiere elaborar un modelo matemático para explicar hechos reales, se distinguen dos tipos de fenómenos o experimentos: Fenómeno determinístico: es aquel fenómeno o experimento cuyo resultado conocemos de antemano o podemos calcular con certeza, o sea que se trataría de situaciones en las que se trabaja con certidumbre completa. Pensemos en los siguientes ejemplos: a) Arrojamos un vaso de vidrio desde el 5° piso de un edificio. El resultado es: el vaso se rompe. b) Colocamos a 100° C una pava con agua. El resultado es: el agua hierve.

Transcript of Probabilidad · teoría frecuencial de la probabilidad. Esta teoría expresa que, si se repite un...

Page 1: Probabilidad · teoría frecuencial de la probabilidad. Esta teoría expresa que, si se repite un experimento aleatorio un número bastante grande de veces, la probabilidad de un

Probabilidad

De acuerdo a lo comentado en la unidad 1, la Inferencia Estadística comprende los

métodos que permiten extrapolar los resultados de una muestra aleatoria hacia la

población de la cual fue extraída. Cuando se observa solo una muestra, aun cuando la

misma sea adecuadamente representativa de la población por cuanto reproduce sus

características esenciales, el intento de extraer conclusiones acerca de la población se

realiza, no en un marco de certeza sino de incertidumbre cuantificable.

La Teoría de Probabilidad, rama de la matemática que modela fenómenos aleatorios,

cuantifica esa incertidumbre en el proceso de estimación de parámetros, permitiendo

hacer afirmaciones en cuanto a precisión y confiabilidad de los resultados. También

permite probar hipótesis en relación con los parámetros, fijando la magnitud del error que

puede cometerse al tomar la decisión y constituye la base teórica de métodos estadísticos

tales como Regresión, Análisis de Varianza, Control de Calidad, etc. Si bien dichas

metodologías, tanto la estimación de parámetros como la prueba de hipótesis las

estudiaremos en las últimas unidades de nuestra materia, a partir de este tema

introduciremos los conceptos fundamentales y el lenguaje básico de Probabilidad.

En las explicaciones que se desarrollan en este capítulo se vislumbrara de qué manera la

Teoría de Probabilidad es en la actualidad la base de la mayor parte de las decisiones que

adoptan en el ámbito de las Ciencias Naturales.

Fenómenos aleatorios y fenómenos determinísticos

En cualquier campo de la ciencia (física, biología, ingeniería, economía, etc.) se necesitan

describir, modelar y predecir fenómenos del mundo real, para lo cual se construyen

modelos matemáticos. Cuando se quiere elaborar un modelo matemático para explicar

hechos reales, se distinguen dos tipos de fenómenos o experimentos:

Fenómeno determinístico: es aquel fenómeno o experimento cuyo resultado conocemos

de antemano o podemos calcular con certeza, o sea que se trataría de situaciones en las

que se trabaja con certidumbre completa. Pensemos en los siguientes ejemplos:

a) Arrojamos un vaso de vidrio desde el 5° piso de un edificio. El resultado es: el vaso se

rompe.

b) Colocamos a 100° C una pava con agua. El resultado es: el agua hierve.

Page 2: Probabilidad · teoría frecuencial de la probabilidad. Esta teoría expresa que, si se repite un experimento aleatorio un número bastante grande de veces, la probabilidad de un

c) Colocamos un capital de $ 8.000 a una tasa de interés mensual del 1,8%. El resultado

es: al cabo de 1 mes el monto final será $ 8.144

Fenómeno aleatorio: es aquel fenómeno o experimento que, repetido bajo las mismas

condiciones, puede arrojar resultados diferentes y no es posible predecir con certeza cuál

de ellos ha de darse; es decir, estamos frente a fenómenos cuyo resultado es incierto.

Ejemplos de este tipo de fenómenos serían:

a) Lanzar un dado y observar el número que aparece en su cara superior.

b) Lanzar una moneda 3 veces y observar la salida de cara o sello.

c) Seleccionar al azar una familia de la ciudad y registrar su ingreso mensual.

d) Seleccionar al azar un elector y determinar su candidato favorito.

e) Observar una casilla de peaje y computar la cantidad de vehículos que pasan por hora.

Como podemos ver, en todos los ejemplos anteriores no es posible predecir con certeza

el resultado que observaremos. A modo de resumen, los experimentos aleatorios reúnen

las siguientes características:

• Consideramos únicamente aquellos experimentos que sean concebibles bajo

condiciones semejantes. Cada vez que realizamos el acto tenemos una prueba.

• Aunque no podemos indicar cuál será el resultado particular de una prueba, podemos

describir el conjunto de todos los resultados posibles del experimento.

• Cuando el experimento se repite una gran cantidad de veces, los resultados presentan

regularidad estadística. En otras palabras, la frecuencia relativa de aparición de los

resultados, se aproxima a un valor fijo constante al aumentar el número de pruebas.

La realidad casi nunca es totalmente predecible, por lo que la mayoría de las situaciones

a las que nos enfrentamos tienen resultados imprevistos y nos llevan a trabajar bajo

incertidumbre. Pero podemos predecir el resultado particular que se producirá y medir el

riesgo asociado a esta predicción, es decir determinar qué posibilidades hay de que dicho

resultado no sea el que se produce realmente como fruto del experimento.

Conceptos básicos de probabilidad

Page 3: Probabilidad · teoría frecuencial de la probabilidad. Esta teoría expresa que, si se repite un experimento aleatorio un número bastante grande de veces, la probabilidad de un

La Teoría de Probabilidad utiliza la Teoría de Conjuntos para definir muchos de sus

conceptos básicos.

Recordemos que en los fenómenos o experimentos aleatorios, si bien no sabemos el

resultado que ocurrirá en una prueba individual, sí podemos describir todos los posibles

resultados del mismo.

El conjunto formado por todos los resultados posibles de un experimento aleatorio es

llamado espacio muestral y lo representaremos con la letra Ω.

Cada uno de los resultados elementales e indivisibles del experimento, llamados puntos

muestrales, se denota por ω. La cardinalidad de Ω es la cantidad de puntos muestrales y

se denota #Ω. Suponiendo que la experiencia arroja s resultados:

Ω = { ωi} i = 1,2,…,s #Ω = s

Consideremos el siguiente ejemplo:

Ejemplo 1

En el experimento de tirar una moneda una vez, sólo hay dos resultados posibles:

Ω = {c,s}

Si se realizan dos tiradas, el espacio muestral es un conjunto formado por cuatro duplas

ordenadas. Cada dupla indica el orden en el que aparecieron los lados de la moneda:

Ω = {(cc),(cs),(sc),(ss)} #Ω = 22=4

Si se realizan tres tiradas, se obtendrán ocho ternas ordenadas:

Ω = {(ccc),(ccs),(csc),(css),(scc),(scs),(ssc),(sss)} #Ω = 23=8

Como se advierte, el espacio muestral representa el conjunto de todos los resultados de la

experiencia. Si la moneda se arrojara 5 veces, el mismo estará conformado por 25 puntos

muestrales [#Ω = 32]; por ejemplo, uno de esos puntos sería la secuencia (cccss) que

indica que en las primeras tres tiradas aparecieron caras y en las restantes sellos.

Los espacios muestrales se pueden clasificar en discretos o continuos.

Page 4: Probabilidad · teoría frecuencial de la probabilidad. Esta teoría expresa que, si se repite un experimento aleatorio un número bastante grande de veces, la probabilidad de un

En los discretos, los resultados pueden ser enumerados, por lo que estarán en

correspondencia con los números enteros. A su vez, se pueden clasificar en finitos o

infinitos. En los espacios muestrales continuos, en cambio, los resultados no pueden ser

enumerados, es decir son infinitos no numerables; por lo que estará conformado por un

intervalo de números reales.

A continuación tenemos ejemplos de espacios muestrales y su respectiva clasificación:

a) Lanzar un dado y observar el número que aparece en su cara superior.

Ω = {1, 2, 3, 4, 5, 6}

Clasificación: Discreto (finito numerable).

b) b) Seleccionar al azar una familia de la ciudad y registrar su ingreso mensual.

Ω = {I / I ≥ 0}

Clasificación: Continuo

c) Seleccionar al azar un elector y determinar su candidato favorito.

Ω = {candidato A, candidato B,..., candidato N}

Clasificación: Discreto (finito numerable)

d) Observar una casilla de peaje y computar la cantidad de vehículos que pasan por hora.

Ω = {0, 1, 2,........}

Clasificación: Discreto (infinito numerable).

Llamamos evento a cada subconjunto de resultados de un experimento aleatorio.

Lo designaremos con letras mayúsculas y tiene asociado una medida de probabilidad.

Page 5: Probabilidad · teoría frecuencial de la probabilidad. Esta teoría expresa que, si se repite un experimento aleatorio un número bastante grande de veces, la probabilidad de un

Se trata de un concepto fundamental ya que es el que tiene asociado de manera directa la

noción de probabilidad. Los eventos son simples o elementales cuando están constituidos

por un solo elemento de Ω y se refieren a un punto muestral; mientras que son compuestos

cuando se definen como la combinación de dos o más resultados del experimento

aleatorio.

Diremos que un evento ocurrió si al realizar el experimento se presenta cualquiera de los

puntos muestrales que lo componen.

Retomando el ejemplo de la tirada de una moneda dos veces, en el que se observa cara o

sello, determinamos que había cuatro resultados posibles, pero podemos definir muchos

eventos simples y compuestos a partir de esos resultados.

Por ejemplo:

A = {aparecen 2 caras} = {(cc)}

Es un evento simple

B = {aparece sólo 1 cara} = {(cs), (sc)}

Es un evento compuesto

C = {aparece el mismo resultado en ambas tiradas} = {(cc),(ss)}

Es un evento compuesto

D = {aparece cara o sello en cualquiera de las dos tiradas}

D = {(cc),(cs),(sc),(ss)} = Ω es un evento compuesto

E = {no aparece cara ni sello} = φ

Es un evento que no posee ningún elemento

Page 6: Probabilidad · teoría frecuencial de la probabilidad. Esta teoría expresa que, si se repite un experimento aleatorio un número bastante grande de veces, la probabilidad de un

Los sucesos D y E son casos particulares de eventos, el primero se denomina evento cierto

o seguro ya que seguramente sucede, mientras que el segundo se denomina evento

imposible (conjunto vacío) ya que no puede suceder.

Los eventos A y B se denominan mutuamente excluyentes, porque la ocurrencia de

cualquiera de ellos elimina la ocurrencia del otro; es decir, sólo uno de ellos puede ocurrir.

En notación: A ∩ B = φ

Los eventos B y C se denominan colectivamente exhaustivos, ya que entre ellos forman

el espacio muestral. En notación: B ∪ C = Ω

Enfoques para asignar probabilidades

Si bien no conocemos con exactitud la definición de probabilidad, podríamos decir que

una idea intuitiva indicaría que se trata de un número entre 0 y 1 (aunque con frecuencia

se la exprese en porcentajes) que mide la posibilidad de que ocurra un suceso, siendo 0

cuando estamos seguros de que no va a ocurrir y 1 cuando estamos seguros de que sí va

a ocurrir.

Entre estos valores extremos, existe una gama de valores que deberíamos asignar cuando

estamos frente a situaciones de incertidumbre respecto del resultado que va a ocurrir.

A fin de resolver estas situaciones, vamos a introducirnos en los distintos enfoques o

métodos desarrollados para calcular la probabilidad de un evento particular. La medición

de probabilidad surgió con el enfoque clásico, exclusivamente aplicado a los juegos de

azar. Dada las limitaciones que tiene este enfoque, con posterioridad se desarrolló el

frecuentista.

Teorías de la probabilidad

Hasta aquí hemos visto el concepto de probabilidad y sus principales elementos. Ahora

veremos las reglas de cálculo de la probabilidad para los distintos eventos que conforman

un espacio muestral. Estas reglas se agrupan en las denominadas teorías o enfoques de la

probabilidad.

Teoría clásica o “a priori”

La probabilidad de que ocurra un evento A, se calcula como la cantidad de casos

Page 7: Probabilidad · teoría frecuencial de la probabilidad. Esta teoría expresa que, si se repite un experimento aleatorio un número bastante grande de veces, la probabilidad de un

favorables a dicho evento, sobre el total de resultados igualmente posibles.

Esta teoría hace mención a una importante condición: que los eventos sean igualmente

posible. Esto quiere decir que todos los resultados del experimento tienen la misma

probabilidad de ocurrencia, como por ejemplo, cada cara de un dado equilibrado.

En símbolos:

𝑃(𝐴) =𝑐𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠

𝑐𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑖𝑔𝑢𝑎𝑙𝑚𝑒𝑛𝑡𝑒 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠

Supongamos, por ejemplo, que la experiencia consiste en extraer una carta de un mazo

de 52 cartas. Esta experiencia consta de 52 resultados posibles. Si se define a un evento

como la extracción de un as, éste tendrá 4 resultados favorables ya que en el mazo hay

4 ases.

Por lo tanto

𝑃(𝑒𝑥𝑡𝑟𝑎𝑒𝑟 𝑢𝑛 𝑎𝑠) =4

52=

1

13

Esta probabilidad de puede expresar como la fracción 1/13, como decimal 0,08 o bien en

porcentaje 8%.

Teoría frecuencial o “a posteriori”

Hay situaciones en las cuales no se puede aplicar la noción de un número definido de

casos igualmente probables.

Por ejemplo, si una moneda no es perfecta, la probabilidad de obtener cara al lanzarla, no

es 1/2, debido a que los dos resultados posibles no son igualmente probables.

En estos casos, se puede aplicar la teoría de probabilidad, conocida con el nombre de

teoría frecuencial de la probabilidad.

Esta teoría expresa que, si se repite un experimento aleatorio un número bastante grande

de veces, la probabilidad de un evento en particular puede asimilarse a la frecuencia

relativa.

En otras palabras, la ley de comportamiento de los fenómenos aleatorios surge de la

distribución de frecuencias con que se presentan.

Page 8: Probabilidad · teoría frecuencial de la probabilidad. Esta teoría expresa que, si se repite un experimento aleatorio un número bastante grande de veces, la probabilidad de un

Este enfoque del cálculo de la probabilidad, a partir del concepto de frecuencia relativa,

es el más ligado a los hechos de la vida cotidiana y a la aplicación práctica de la

estadística.

Supongamos que realizamos el experimento de tirar una moneda al aire un número n

muy grande de veces.

Cada resultado individual del experimento será impredecible puesto que la obtención

de cara o cruz depende estrictamente del azar.

Es lógico pensar que, si tiramos la moneda un número "n" de veces, donde n = 100, a

pesar del comportamiento irregular de los resultados individuales, los resultados

promedios o globales mostrarán una sorprendente regularidad.

Al finalizar el experimento, podremos cuantificar la probabilidad del evento que consiste

en la caída de la moneda mostrando la faz "cara". Ese valor estará dado por el cociente

entre, la cantidad de veces que la moneda cayó en esa posición y la cantidad "n" de

veces que se la arrojó.

Como ya hemos visto , el número de veces que se presenta un evento es la

frecuencia absoluta fi y la frecuencia relativa fr = fi/n representa la proporción de veces

que se presenta un evento en particular, en las n repeticiones del experimento.

La experiencia indica que la frecuencia relativa tiende a estabilizarse para grandes valores

de n.

Es decir, podemos establecer una ley de comportamiento de los fenómenos aleatorios a

través de muchas repeticiones del experimento.

Cantidad de lanzamientos

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1

0 20 40 60 80 100

Cantidad de lanzamientos

Page 9: Probabilidad · teoría frecuencial de la probabilidad. Esta teoría expresa que, si se repite un experimento aleatorio un número bastante grande de veces, la probabilidad de un

Gráfico 1: Proporción de caras en una simulación de 100 lanzamientos de una moneda

La frecuencia relativa h(A) varía ampliamente para valores pequeños de n. Pero, al

aumentar el número n de repeticiones del experimento, la proporción de "caras" se va

estabilizando alrededor de un cierto valor límite o ideal muy próximo a 1/2.

Al repetir muchas veces un mismo experimento en condiciones uniformes, la estabilidad

de las frecuencias relativas se presenta de manera casi permanente.

Podemos asociar un número P(A) a cada evento A surgido por medio de la realización

de un experimento aleatorio , de manera tal que la frecuencia relativa de A, fr(A), será

aproximadamente igual a P(A) si se considera una larga serie de repeticiones del

experimento.

Diremos que P(A) es la probabilidad del evento A en el experimento. No debemos olvidar

aquí, que la frecuencia relativa y la probabilidad, al vincularse, establecen una relación

entre una situación de experimentación real (frecuencia realmente observada) y un

modelo conceptual o ideal (frecuencia teórica o esperada).

Por eso, esta asimilación de la probabilidad a las frecuencias relativas sólo es posible ante

experimentos que se puede repetir indefinidamente. Y aun así, siempre cabrá la duda

respecto de la magnitud que debe tener n para que esta aproximación se produzca.

𝑃(𝐴) ≅𝑓𝑟(𝐴)

𝑛

A continuación se describe un ejemplo donde se aplica la teoría frecuencial.

El departamento de alumnado de una determinada escuela tiene registrado los datos de

los tutores de los alumnos y los clasificó según su ocupación en empleados públicos,

privados o desocupados. Se confeccionó entonces la siguiente tabla:

Tipo de ocupación Frecuencia absoluta Frecuencia relativa

Empleado público 123 0,506

Empleado privado 102 0,420

Desocupado 18 0,074

Total 243 1

De esta tabla se desprende por ejemplo que la probabilidad de que un alumno tenga su

padre desempleado es:

P(Desocupado) = 18

243= 0,074

Page 10: Probabilidad · teoría frecuencial de la probabilidad. Esta teoría expresa que, si se repite un experimento aleatorio un número bastante grande de veces, la probabilidad de un

Teoría axiomática

A diferencia de la teoría clásica y la frecuencial, la axiomática no provee una regla de

cálculo, sino que establece tres axiomas que toda probabilidad debe cumplir.

Un axioma es una proposición o afirmación que es tan evidente que no necesita ser

demostrada.

Axioma 1: La probabilidad de un evento A es siempre no negativa

𝑃(𝐴) ≥ 0

Axioma 2: La probabilidad del espacio muestral es 1

𝑃() = 1

Axioma 3: Si A y B son dos eventos mutuamente excluyentes, entonces la probabilidad

de la unión de estos eventos es igual a la suma de las probabilidades de cada uno de ellos

𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵)

Dos eventos son mutuamente excluyentes cuando la aparición de uno de ellos excluye

la aparición del otro, en otros términos decimos que no se pueden producir al mismo

tiempo.

Este es el momento de realizar algunas aclaraciones con respecto a las operaciones entre

eventos. Esto se desprende del álgebra de conjuntos, tema que en matemática se desarrolla

en el primer año de la formación superior.

El espacio muestral es el conjunto universal, el que contiene todos los eventos posibles.

A su vez cada evento puede ser un subconjunto de . Los eventos son elementales si no

se pueden dividir en eventos más simples.

Consideremos el ejemplo de arrojar un dado y lo representaremos gráficamente

Cada número es un evento elemental, puesto que no puede estar formado por otros

eventos más sencillos. Por ejemplo un evento A podría ser que salga el número 4,

1 5 6

4 2

3

Page 11: Probabilidad · teoría frecuencial de la probabilidad. Esta teoría expresa que, si se repite un experimento aleatorio un número bastante grande de veces, la probabilidad de un

entonces A = “obtener 4”. También podemos definir el evento B como el hecho de obtener

un número par, entonces B = {2; 4; 6}, aquí vemos que B está formado por otros eventos

más sencillos, entonces B es un evento no elemental o evento compuesto.

Definamos ahora el evento C de la siguiente manera: C = “obtener un número menor que

5”, entonces C = {1; 2; 3; 4}

Aquí podemos definir algunas operaciones entre conjuntos y en consecuencia, entre

eventos.

La región sombreada está formada por la intersección de B y C, es decir los elementos

que son pares y menores a 5 al mismo tiempo, este nuevo evento formado el resultado de

la operación intersección y que se simboliza con ∩.

𝐵 ∩ 𝐶 = {2; 4}

Page 12: Probabilidad · teoría frecuencial de la probabilidad. Esta teoría expresa que, si se repite un experimento aleatorio un número bastante grande de veces, la probabilidad de un

La unión entre B y C está formada por todos los elementos que pertenecen a B, a C o bien

a ambos. La unión se simboliza con ∪.

𝐵 ∪ 𝐶 = {1 ; 2; 3; 4 ; 6}

Cuando dos eventos no tienen intersección se dice que son mutuamente excluyentes o

incompatibles, por ejemplo, el evento D = “obtener un número impar” y el evento B ya

definido son mutuamente excluyentes. Esto se simboliza así

𝐵 ∩ 𝐷 = ∅

Donde ∅ es el símbolo que representa al conjunto vacío.

La probabilidad del tipo P(A∩B) se llama probabilidad conjunta.

El complemento de un evento E, es el conjunto de todos los resultados no favorables a E

y se simboliza E̅.

De los axiomas mencionados se desprenden algunas consecuencias.

Page 13: Probabilidad · teoría frecuencial de la probabilidad. Esta teoría expresa que, si se repite un experimento aleatorio un número bastante grande de veces, la probabilidad de un

Consecuencias de los axiomas

(a) La probabilidad de un evento está comprendida entre 0 y 1, siendo 0 la

probabilidad del evento imposible y 1 la probabilidad del evento cierto o seguro.

0 ≤ 𝑃(𝐴) ≤ 1

(b) La probabilidad del complemento de un evento es:

𝑃(�̅�) = 1 − 𝑃(𝐴)

(c) La probabilidad de la unión de dos eventos no mutuamente excluyentes es:

𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵)

(d) La probabilidad del evento imposible es cero

𝑃(∅) = 0

Independencia de eventos

Decimos que dos eventos son independientes si la ocurrencia de uno de ellos no modifica

la probabilidad de aparición del otro; es decir que su ocurrencia no produce efecto en la

probabilidad simple del otro. Caso contrario los eventos son dependientes.

Para ilustrar la independencia de eventos, veamos el siguiente ejemplo.

Supongamos que tiramos dos monedas al aire, el resultado de una de ellas (cara o sello)

no está afectado por el resultado de la otra (cara o sello); decimos entonces que el

resultado de la segunda moneda no depende del resultado de la primera.

Si estamos frente a dos eventos independientes A y B, la probabilidad de que ocurran A

y B se obtiene multiplicando las probabilidades simples de cada uno de ellos. Esto se

conoce como Regla Especial de Multiplicación.

En fórmulas se expresa: P(A ∩ B) = P(A).P(B)

Page 14: Probabilidad · teoría frecuencial de la probabilidad. Esta teoría expresa que, si se repite un experimento aleatorio un número bastante grande de veces, la probabilidad de un

En el ejemplo anterior de la moneda ¿cuál es la probabilidad de que en ambas tiradas el

resultado sea cara?

P (cara y cara) = P(cara) . P(cara) = 0,50 . 0,50 = 0,25

Si estamos frente a eventos independientes, ¿podemos calcular una probabilidad

condicional?

Si relacionamos las fórmulas de probabilidad condicional y probabilidad conjunta de

eventos independientes tenemos que:

Es decir, la probabilidad del evento A no varía ante la aparición del evento B (su

probabilidad condicional es igual a su probabilidad simple), por lo que podríamos

expresar la independencia de eventos de la siguiente manera:

Si P(A/B) = P(A) entonces A y B son eventos independientes

Veamos un ejemplo para ilustrar lo que acabamos de expresar. Supongamos que en un

lote de 100 productos hay 8 que son defectuosos. Si seleccionamos un producto al azar la

probabilidad de que sea defectuoso es 8/100.

Si seleccionamos otro más, la probabilidad de que el segundo también lo sea (si

reponemos el primero de ellos al lote) será 8/100 por lo que la probabilidad simple de

defectuoso no cambió en esta segunda extracción. Esto lleva a concluir que la

probabilidad de que ambos sean defectuosos es:

𝑃(𝐷1 ∩ 𝐷2) = 𝑃(𝐷1). 𝑃(𝐷2/𝐷1) = 8

100∙

8

100= 0,0064

Si no reponemos el primer producto antes de seleccionar el segundo (Muestreo sin

reemplazo), la probabilidad es:

𝑃(𝐷1 ∩ 𝐷2) = 𝑃(𝐷1). 𝑃(𝐷2/𝐷1) = 8

100∙

7

99= 0,0056

Page 15: Probabilidad · teoría frecuencial de la probabilidad. Esta teoría expresa que, si se repite un experimento aleatorio un número bastante grande de veces, la probabilidad de un

En relación al ejemplo que trabajamos en la sección anterior ¿podemos decir que el sexo

es probabilísticamente independiente del lugar de procedencia? .Utilizando los datos de

la Tabla de Contingencia, tenemos que:

𝑃(𝑉 ∩ 𝐶) = 182/492 = 8

100∙

7

99= 0,0056

Tabla de contingencia

Si contamos con la información de los alumnos de que cursan Estadística clasificados

según sexo y procedencia, podríamos confeccionar una tabla de doble entrada, o tabla de

contingencia, como la que sigue:

Procedencia

Sexo Formosa Otra provincia Total

Varón 182 65 247

Mujer 290 55 345

Total 472 120 592

Si seleccionamos al alzar un alumno de Estadística , ¿cuál será la probabilidad de los

siguientes eventos?

V = {alumno varón}

C = {alumno que procede de Formosa}

En este ejemplo no corresponde utilizar el enfoque clásico para calcular probabilidades

porque los resultados no son igualmente probables, utilizando el enfoque frecuentista,

esas probabilidades son:

P (V) = 247/592 = 0,417 P (F) = 472/592 = 0,797

Estas probabilidades se denominan simples o marginales porque se obtienen de los

márgenes de la tabla de contingencia.

Page 16: Probabilidad · teoría frecuencial de la probabilidad. Esta teoría expresa que, si se repite un experimento aleatorio un número bastante grande de veces, la probabilidad de un

También esta tabla nos sirve para explorar los diferentes tipos de probabilidades, por

ejemplo la probabilidad condicional

P( el alumno sea varón sabiendo que proviene de Formosa)

𝑃(𝑉|𝐹) =𝑃(𝑉 ∩ 𝐹)

𝑃(𝐹)=

182592472592

=182

472= 0,3856

Podemos también verificar si dos eventos son independientes, por ejemplo ¿son

independientes los eventos Formosa y Varón?

𝑃(𝑉|𝐹) = 0,3856

𝑃(𝑉) = 247

592= 0,4172

Luego P(V|F) ≠ P(F), por los tantos, los eventos no son independientes.

Variable aleatoria

Tanto en la vida cotidiana como en el campo científico estamos habituados a observar

fenómenos aleatorios cuyos resultados se expresan mediante números; por ejemplo el

monto de las importaciones de las empresas locales, el número de personas en la cola de

un banco, la velocidad de conexión a la red, etc. Incluso en problemas de naturaleza

puramente cualitativa es muy frecuente recurrir a la codificación numérica. En situaciones

tales como el diagnóstico de un paciente “sano” o “enfermo”, preguntas del tipo ¿estudias

o trabajas?, etc., las respuestas son usualmente codificadas con 0 y 1. En general, cada

resultado de un experimento se puede asociar con un número si se especifica una regla de

asociación. Esta regla de asociación se llama variable aleatoria.

Así, al asociar números a los elementos del espacio muestral se define la variable

aleatoria, pudiendo distinguirse entre variables aleatorias discretas y continuas.

En esta Unidad definiremos la función de probabilidad y de distribución de una variable

aleatoria, y las propiedades que deben cumplir. Detallaremos las medidas estadísticas más

Page 17: Probabilidad · teoría frecuencial de la probabilidad. Esta teoría expresa que, si se repite un experimento aleatorio un número bastante grande de veces, la probabilidad de un

importantes que se emplean en la descripción de los modelos de probabilidad y las

propiedades que verifican cada una de ellas, vinculando muchos conceptos con los

desarrollados en la Unidad 3. Para estudiar las propiedades básicas de las variables

aleatorias discretas, se aplicarán herramientas discretas como suma y resta, mientras que

en el estudio de las variables aleatorias continuas se requerirá de integrales y derivadas.

Estos conceptos serán desarrollados en forma general y servirán como base para el estudio

de los temas de la próxima Unidad, donde abordaremos más detalladamente algunas

distribuciones de probabilidad de variables que responden a determinados experimentos

aleatorios.

Concepto

En la Unidad anterior, a partir de fenómenos aleatorios hemos definido un espacio de

probabilidad E el cual está formado por el conjunto W de resultados posibles a los que

denominamos eventos, F el álgebra de conjuntos y/o familia de eventos y una

probabilidad asociada a cada resultado del conjunto W y por consiguiente del conjunto F.

El conjunto W puede ser finito, infinito numerable o infinito no numerable y sus

elementos, a los que denominamos eventos simples, pueden ser números o no.

Consideremos para introducirnos en el tema el siguiente ejemplo: se extraen tres artículos

producidos por una máquina para observar su calidad. El espacio muestral es:

Ω ={BBB, BBD,BDB,DBB,BDD,DBD,DDB,DDD}

Donde B= el artículo no es defectuoso y D= el artículo es defectuoso. Si se está interesado

en conocer el número de artículos defectuosos en este experimento, necesitamos definir

una variable X = cantidad de artículos con defectos, que puede asumir los valores 0, 1, 2

y 3, como podemos observar en la siguiente imagen.

Page 18: Probabilidad · teoría frecuencial de la probabilidad. Esta teoría expresa que, si se repite un experimento aleatorio un número bastante grande de veces, la probabilidad de un

Sabiendo que en un lote de 15 artículos se encontraron 3 defectuosos y que el muestreo

se realiza con reemplazo, podemos calcular las probabilidades asociadas a cada valor de

X.

Así, la probabilidad de seleccionar un artículo defectuoso será:

• P(D) = 3/15 = 0,20 de lo que se deduce que P(B) = 0,80

La probabilidad para cada valor de X puede obtenerse como:

• P(BBB)=P(X=0)= 0,80.0,80.0,80 = 0,512

• P(BBD) U P(BDB) U P(DBB) = P(X=1) =(0,80.0,80.0,20) + (0,80.0,20.0,80) +

(0,20.0,80.0,80) = 0,384

• P(BDD) U P(DDB) U P(DBD) = P(X=2) =(0,80.0,20.0,20) + (0,20.0,20.0,80) +

(0,20.0,80.0,20) = 0,096

• P(DDD) = P(X=3) = 0,20.0,20.0,20 = 0,008

Hemos definido entonces, a partir de los elementos del espacio muestral Ω, un nuevo

conjunto X con probabilidad igual a 1 y cada elemento de X tiene una probabilidad mayor

o igual a cero.

Dada la variable X y las probabilidades de sus elementos, se puede definir su función de

probabilidad en la siguiente tabla.

Page 19: Probabilidad · teoría frecuencial de la probabilidad. Esta teoría expresa que, si se repite un experimento aleatorio un número bastante grande de veces, la probabilidad de un

Tabla 1 - Función de probabilidad

x p (x)

0 0,512

1 0,384

2 0,096

3 0,008

1,000

En la Tabla 1, cada valor particular de la variable X tiene un valor de probabilidad

asociado y la suma de estas probabilidades, para todos los valores que puede asumir la

variable, es igual a 1. Por lo tanto, X es una variable aleatoria.

Entonces, una variable aleatoria es una función que asigna a cada elemento de un espacio

muestral un número real. Las probabilidades del espacio muestral son transferidas a los

números reales definidos.

Una variable aleatoria X es una función real definida sobre el espacio muestral

X: Ω → R

Tal que [X < x] es un evento aleatorio para todo x que pertenece a los reales.

Acumulando los valores de probabilidad, se obtiene la función de probabilidad acumulada

o función de distribución, donde cada valor representa la probabilidad que una variable

aleatoria asuma valores iguales o menores a un valor determinado.

Para nuestro ejemplo, la función de distribución a la que simbolizaremos F(X), se muestra

en la Tabla 2.

Tabla 2 - Función de distribución

x F(x)

0 0,512

1 0,896

2 0,992

3 1

Page 20: Probabilidad · teoría frecuencial de la probabilidad. Esta teoría expresa que, si se repite un experimento aleatorio un número bastante grande de veces, la probabilidad de un

Leyendo la tabla, podríamos calcular por ejemplo, la probabilidad de encontrar dos

artículos defectuosos o menos que sería P(X < 2) = F(2) = 0,992.

La función de distribución F(X) de una variable aleatoria X, se define como una función

que asigna a cada valor del conjunto de los números reales un número real entre cero y

uno inclusive. F(X) es igual a la probabilidad de que X asuma un valor menor o igual a

un valor particular x.

F(X) = P(X ≤ x)

En el ejemplo desarrollado, la variable aleatoria es discreta ya que el espacio muestral a

partir del cual se define es finito, lo mismo ocurriría si fuese infinito numerable.

Analizaremos ahora en detalle este tipo de variables.

Variable aleatoria discreta

Una variable aleatoria es discreta cuando el número de valores que puede asumir es

contable (ya sea finito o infinito).

La función de probabilidad en este caso es denominada función de cuantía e indica una

probabilidad para cada valor posible de la variable aleatoria.

P(x) = P( X = x)

De esta manera, si xi es un valor posible de X, entonces p(xi) >0. Si no lo es, p(xi) = 0.

Como vimos en el ejemplo, la variable aleatoria “número de artículos defectuosos” tiene

cuatro valores posibles y la suma de las probabilidades es igual a 1. Generalizando, si la

variable asume k valores distintos, se cumple que

la suma de las probabilidades es igual a 1:

Por lo tanto, las propiedades de la función de cuantía son:

Page 21: Probabilidad · teoría frecuencial de la probabilidad. Esta teoría expresa que, si se repite un experimento aleatorio un número bastante grande de veces, la probabilidad de un

Función de Distribución

A partir de la función de cuantía es posible encontrar la función de acumulación o función

de distribución:

Si se desea calcular la probabilidad del evento a < x < b:

Con lo desarrollado hasta ahora podemos determinar las condiciones que debe cumplir la

función de acumulación.

Propiedades de la función de acumulación:

1. F(x) > 0

2. El valor de la función de acumulación para el mayor valor de la variable

es uno.

F(xk )=1

3. El valor de la función de acumulación para el menor valor de la variable es cero.

1 F(x1 ) = 0

4. La función de acumulación es creciente, a un valor mayor de la variable mayor es la

probabilidad acumulada.

F(x+h) > F(x) ∀h > 0 y entero.

Podemos graficar en general estas funciones, utilizando los gráficos estudiados en la

Unidad 2. Para la función de cuantía utilizaremos un gráfico de bastones, y para la función

de distribución el diagrama escalonado en el que la función de acumulación se incrementa

por saltos o escalones para cada una de los valores posibles de X.

Page 22: Probabilidad · teoría frecuencial de la probabilidad. Esta teoría expresa que, si se repite un experimento aleatorio un número bastante grande de veces, la probabilidad de un

Estas funciones son siempre escalonadas, puesto que la función de distribución solamente

se incrementa en un conjunto enumerable de puntos.

A continuación le presentamos ejemplos de aplicación, que le ayudarán a comprender los

conceptos presentados.

Ejemplo 1: Suponga que en una librería, durante la primera semana de un mes, se observa

si la siguiente persona que compra una computadora adquiere una notebook o un modelo

de escritorio.

Sea

Si 20% de los compradores durante esa semana eligen una notebook, ¿cuál sería la

función de probabilidad para Y?

La función de probabilidad sería:

Y P(y)

0 0,80

1 0,20

En forma equivalente:

Variable aleatoria continua

El tipo de variable que toma cualquier valor dentro de un intervalo se denomina continua.

Se asocia con espacios muestrales infinitos no numerables, permitiendo asignar a cada

valor un punto único en un intervalo de números reales. Por ejemplo, si se elige al azar

un compuesto químico y se determina su pH (X), entonces X es una variable aleatoria

continua. Si se sabe más acerca del compuesto elegido para el análisis, entonces el

conjunto de valores posibles podría ser un subintervalo de [0, 14], por ejemplo 5,5 < x 6,

5, pero X aún es continua.

En el caso de una variable aleatoria discreta, definimos su función de probabilidad

asignando una probabilidad positiva a cada uno de los posibles valores que puede asumir

Page 23: Probabilidad · teoría frecuencial de la probabilidad. Esta teoría expresa que, si se repite un experimento aleatorio un número bastante grande de veces, la probabilidad de un

la variable, asegurándonos que la suma de las probabilidades asignadas sea igual a 1. Pero

en la distribución de probabilidad de una variable continua, es matemáticamente

imposible asignar probabilidades diferentes de cero a todos los puntos de un intervalo real

(recordemos que entre dos números reales hay infinitos números reales), y satisfacer la

condición que la suma de las probabilidades de los distintos valores sea igual a 1.

Por lo que la distribución de probabilidad de una variable aleatoria continua se debe

describir de una manera diferente

Ejemplo: Recordando lo estudiado al analizar las distribuciones de frecuencia por

intervalo, podemos interpretar la frecuencia relativa de cada intervalo como su

probabilidad. La distribución de frecuencia observada de la variable gastos (en pesos)

realizados en un mes con tarjeta de crédito, para una muestra de compradores, es la

siguiente:

Si seleccionamos un comprador al azar, la probabilidad que haya gastado entre $272 y

$522,75 es 0,02. La probabilidad de un valor exacto es cero, ya que la frecuencia de

aparición de un valor particular, por ejemplo, un gasto exactamente igual a $1520,50 será

prácticamente cero. Por lo tanto, para este tipo de variables, sólo vamos a calcular

probabilidades en un intervalo.

Recordemos que estas distribuciones se grafican utilizando el histograma y el polígono

de frecuencias, tal como se muestra en la parte a de la figura siguiente para el ejemplo

planteado.

Page 24: Probabilidad · teoría frecuencial de la probabilidad. Esta teoría expresa que, si se repite un experimento aleatorio un número bastante grande de veces, la probabilidad de un

La frecuencia relativa de cada intervalo está representada por la superficie del rectángulo

correspondiente y el área total del gráfico es igual a 1. El polígono de frecuencias nos

permite suavizar el gráfico, y observar mejor el comportamiento de la variable. Si

tomamos muchas observaciones y hacemos los intervalos cada vez más pequeños, como

en la anterior (b), el histograma tiende a una curva suave (igual al polígono de frecuencias)

que denominaremos función de densidad y simbolizaremos como f (x) . Dicha función se

muestra en la siguiente:

Definición:

Se dice que X es una variable aleatoria continua si existe una función, llamada función

de densidad de X, que satisface las siguientes condiciones:

1) f (x) ≥ 0 para todo x

Page 25: Probabilidad · teoría frecuencial de la probabilidad. Esta teoría expresa que, si se repite un experimento aleatorio un número bastante grande de veces, la probabilidad de un

Esta condición exige que la función asuma sólo valores positivos o nulos.

2) ∫ 𝑓(𝑥)𝑑𝑥 = 1∝

−∝

Los límites de integración (−∞,∞) denotan el menor y el mayor valor que asume la

variable, respectivamente, de manera que, integrando para todo el recorrido de la variable,

si se trata de una función de densidad, el resultado debe ser siempre igual a 1.

La función de densidad f(x) no da probabilidades sino que indica el valor de las ordenadas

que forman una curva. Las probabilidades corresponden al área formada entre valores de

la variable limitada por la curva que corresponde a la función de densidad. Por esta razón

la condición 2 indica el área total bajo la curva (recordemos que la integral definida indica

el área bajo la curva que corresponde a la función que integramos), la que tiene que ser

igual a 1 para que sea función de densidad. Cuando esta condición no se cumple, existe

la posibilidad, en muchos casos, de transformar la función de manera conveniente para

obtener una nueva función que satisface dicha propiedad.

De esta manera conociendo la función de densidad f(x), por integración se puede calcular

cualquier probabilidad. Por ejemplo la probabilidad, de que la variable x sea mayor que

a y menor que b cuando se conoce f(x), se obtiene calculando el área entre a y b, lo que

se expresa como:

Recordemos que cuando se trata de variables continuas, la integral definida puede o no

incluir los extremos del intervalo y el resultado será el mismo. Es decir que:

En el ejemplo planteado podemos conocer la probabilidad de que los gastos con tarjeta

de crédito se encuentren entre $250 y $500. Si conociéramos la función de densidad de la

curva de la Figura 5 la probabilidad podría calcularse como:

La función de distribución es la que proporciona la probabilidad acumulada para los

diferentes valores de la variable. Para las variables continuas, será el área bajo la curva

Page 26: Probabilidad · teoría frecuencial de la probabilidad. Esta teoría expresa que, si se repite un experimento aleatorio un número bastante grande de veces, la probabilidad de un

de la función de densidad a la izquierda de un valor particular x, o sea acumulada desde

el menor valor hasta un valor determinado de la variable. Simbólicamente

Función de distribución

El área hacia la izquierda será cada vez mayor a medida que aumenta elvalor de la

variable, por lo que la función de acumulación es una función monótona creciente, su

gráfica es una línea (similar a la Ojiva estudiada en el Unidad II), donde cada punto de la

misma representa el área bajo la función de densidad hasta un punto x. Gráficamente se

puede representar la función de acumulación como se muestra en la figura siguiente.

Hemos visto que, conocida la función de densidad f(x), integrando la misma hasta un

valor genérico cualquiera de la variable obtenemos la función de distribución F(x). Por

otro lado, conocida la función de distribución F(x), derivando la misma respecto a la

variable se obtiene la función de densidad f(x), en símbolos:

Como F(x)es una función no decreciente, la derivada f (x) nunca será negativa, además

se sabe que F(∞) =1 y por esto ∫ 𝑓(𝑥)𝑑𝑥 = 1∞

−∞

Ahora, estamos en condiciones de expresar las propiedades de la función de acumulación

que son las siguientes:

1. F(x) > 0

Page 27: Probabilidad · teoría frecuencial de la probabilidad. Esta teoría expresa que, si se repite un experimento aleatorio un número bastante grande de veces, la probabilidad de un

2. El límite de la función de acumulación para el más alto valor de la variable tiende a

uno.

lim𝑥→∞

𝐹(𝑥) = 1

3. El límite de la función de acumulación para el menor valor de la variable tiende a cero.

lim𝑥→−∞

𝐹(𝑥) = 0

4. La función de acumulación es monótona creciente, a un valor mayor de la variable

mayor es la probabilidad acumulada.

F(x+h) > F(x) ∀h > 0

Podemos calcular la probabilidad en un intervalo utilizando la función de acumulación

de la siguiente manera:

Esperanza y varianza de una variable aleatoria

Esperanza Matemática

El cálculo de la Esperanza matemática es similar al de la media aritmética, aunque el

concepto que representa es ligeramente distinto. Cuando tenemos un conjunto de valores

observados de una variable, calculamos como medida de posición la media aritmética.

Cuando, en cambio, trabajamos con una variable aleatoria consideramos los posibles

valores de la misma dentro de un experimento, por lo que los valores son observables y

el promedio será calculado a priori. Es por ello que, en ese caso, hablamos de un promedio

esperado.

La Esperanza matemática es el valor promedio que se presentará si el experimento se

repite muchas veces. Se puede pensar como un centro de gravedad en la distribución de

frecuencias, el cual se mueve hacia un lado u otro dependiendo del peso de las

probabilidades. Si las probabilidades son mayores para los primeros valores de la variable

entre ellos estará el valor esperado, y por el contrario si las probabilidades son mayores

para los últimos valores de la variable allí se encontrará la esperanza matemática.

El cálculo de la Esperanza difiere según la variable aleatoria sea discreta o continua, por

lo que analizaremos cada caso por separado.

Page 28: Probabilidad · teoría frecuencial de la probabilidad. Esta teoría expresa que, si se repite un experimento aleatorio un número bastante grande de veces, la probabilidad de un

Para una variable aleatoria discreta X con una distribución de probabilidad P(X), el valor

esperado, que se simboliza por E(X) o también por μ, se calcula como:

el sumatorio está referido a todos los valores de la variable aleatoria X.

Analizaremos ahora cómo se determina la esperanza para una variable continua x con

función de densidad f(x). La suma para todos los valores de la variable se obtiene

integrando sobre todo el recorrido de x.

Propiedades de la Esperanza

Las Propiedades de la Esperanza son las mismas que se analizaron para la media

aritmética.

1) La Esperanza de una constante c es la constante. Esto es así porque si la variable sólo

asume un único valor, el mismo tendrá probabilidad 1.

2) La Esperanza de una constante más una variable es la constante más la

3) La Esperanza de una constante por una variable es la constante por la Esperanza de la

variable

4) La Esperanza de la suma de dos variables aleatorias es igual a la suma de sus

esperanzas. Siempre que las variables se encuentren expresadas en la misma unidad de

medida.

5) La Esperanza del producto de dos variables aleatorias independientes es igual al

producto de sus esperanzas.

Varianza y desviación estándar

Si comparamos la esperanza matemática con un centro de gravedad, podemos

preguntarnos cuán atraídos están los valores de la variable a este valor. Hemos visto que

la medida que nos indica la concentración de los datos alrededor de la media es la

Page 29: Probabilidad · teoría frecuencial de la probabilidad. Esta teoría expresa que, si se repite un experimento aleatorio un número bastante grande de veces, la probabilidad de un

varianza, que se calcula como el promedio de las distancias al cuadrado de los valores de

la variable.

La varianza permite medir la dispersión de los datos alrededor de la esperanza

matemática. Se define como la esperanza de los desvíos al cuadrado de los valores de la

variable respecto a la esperanza matemática.

Resumen de la unidad