Experimento aleatorio · 2020. 3. 24. · PROBABILIDAD Experimento aleatorio Si agitamos un dado...

15
1 PROBABILIDAD Experimento aleatorio Si agitamos un dado dentro de un cubilete, lo arrojamos sobre una mesa y registramos qué cara queda hacia arriba obtendremos uno de seis resultados posibles. Si repetimos esta acción, puede ocurrir que obtengamos un resultado diferente del primero. En ese caso, no podremos explicar la diferencia como el efecto de aplicar procedimientos distintos porque en ambas oportunidades habremos hecho lo mismo. El procedimiento que consiste en agitar el dado dentro de un cubilete, arrojarlo sobre la mesa y registrar qué cara queda hacia arriba es un experimento aleatorio, un procedimiento que puede producir diferentes resultados cada vez que se ejecute. Definiciones: Un experimento es una acción o procedimiento preestablecido que produce un resultado que se registra. Un experimento aleatorio es aquel que no necesariamente produce el mismo resultado cada vez que se lo lleva a cabo. No todo experimento es aleatorio. Por ejemplo, el experimento que consiste en calentar agua pura en un ambiente con presión controlada de exactamente 1 atm y registrar su temperatura cuando comienza a hervir puede producir un sólo resultado (100ºC). Por eso, este procedimiento no es un experimento aleatorio. Todo experimento aleatorio tiene su base en procesos físicos que ocurren en algún sistema material o dispositivo experimental. En el experimento del dado, el dispositivo experimental está formado por un cubilete, un dado y una mesa, y el proceso físico necesario es generado deliberadamente cuando agitamos el cubilete. En otros experimentos, estos procesos físicos ocurren naturalmente. Por ejemplo, si dejamos que una planta heterocigota para un gen que controla el color de las flores se autofecunde, cultivamos las semillas que produce y registramos la distribución de frecuencias de diferentes colores de flores entre las plantas hijas, obtendremos uno de muchos resultados posibles. Esto se debe a que los granos de polen se dispersan y alcanzan los estigmas de las flores como resultado de procesos similares a la agitación de un dado dentro del cubilete. Azar e incertidumbre Cuando un experimento es aleatorio, existe la posibilidad de que produzca diferentes resultados sin que haya diferencias en el procedimiento. Esta característica del comportamiento del dispositivo experimental se llama azar. Su existencia en los sistemas macroscópicos se explica por los accidentes o casualidades, esto es, por encuentros entre procesos con causas independientes. Una multitud de accidentes como los que ocurren cuando se agita un dado o cuando se dispersa el polen provoca la variabilidad azarosa en los resultados de muchos experimentos aleatorios. El azar es esencial en la inferencia estadística porque es la base de la generación de datos apropiados. Como un experimento aleatorio puede dar diferentes resultados, tenemos incertidumbre acerca de qué resultado producirá la próxima vez que se ejecute. Sin embargo, lo que distingue a un experimento aleatorio no es el carácter incierto sino el carácter azaroso de sus resultados. Mientras el azar es una propiedad objetiva del comportamiento de un sistema material, la incertidumbre es el estado de conciencia que alguien experimenta en relación con algo que ignora total o parcialmente, se trate o no del resultado que dará un experimento aleatorio. La incertidumbre varía entre personas que tienen diferente información o diferente capacidad para interpretarla. El azar provoca incertidumbre pero la incertidumbre no es privativa del azar. Por ejemplo, tenemos incertidumbre acerca del número que saldrá la próxima vez que tiremos el dado porque se trata de un experimento aleatorio (con resultados azarosos). En cambio, si tenemos incertidumbre acerca de la edad que tiene hoy la profesora de estadística es porque nos falta información sobre su fecha de nacimiento.

Transcript of Experimento aleatorio · 2020. 3. 24. · PROBABILIDAD Experimento aleatorio Si agitamos un dado...

Page 1: Experimento aleatorio · 2020. 3. 24. · PROBABILIDAD Experimento aleatorio Si agitamos un dado dentro de un cubilete, lo arrojamos sobre una mesa y registramos qué cara queda hacia

1

PROBABILIDAD

Experimento aleatorio Si agitamos un dado dentro de un cubilete, lo arrojamos sobre una mesa y registramos qué cara queda hacia arriba obtendremos uno de seis resultados posibles. Si repetimos esta acción, puede ocurrir que obtengamos un resultado diferente del primero. En ese caso, no podremos explicar la diferencia como el efecto de aplicar procedimientos distintos porque en ambas oportunidades habremos hecho lo mismo. El procedimiento que consiste en agitar el dado dentro de un cubilete, arrojarlo sobre la mesa y registrar qué cara queda hacia arriba es un experimento aleatorio, un procedimiento que puede producir diferentes resultados cada vez que se ejecute.

Definiciones:

Un experimento es una acción o procedimiento preestablecido que produce un resultado que se registra.

Un experimento aleatorio es aquel que no necesariamente produce el mismo resultado cada vez que se lo lleva a cabo.

No todo experimento es aleatorio. Por ejemplo, el experimento que consiste en calentar agua pura en un ambiente con presión controlada de exactamente 1 atm y registrar su temperatura cuando comienza a hervir puede producir un sólo resultado (100ºC). Por eso, este procedimiento no es un experimento aleatorio. Todo experimento aleatorio tiene su base en procesos físicos que ocurren en algún sistema material o dispositivo experimental. En el experimento del dado, el dispositivo experimental está formado por un cubilete, un dado y una mesa, y el proceso físico necesario es generado deliberadamente cuando agitamos el cubilete. En otros experimentos, estos procesos físicos ocurren naturalmente. Por ejemplo, si dejamos que una planta heterocigota para un gen que controla el color de las flores se autofecunde, cultivamos las semillas que produce y registramos la distribución de frecuencias de diferentes colores de flores entre las plantas hijas, obtendremos uno de muchos resultados posibles. Esto se debe a que los granos de polen se dispersan y alcanzan los estigmas de las flores como resultado de procesos similares a la agitación de un dado dentro del cubilete.

Azar e incertidumbre

Cuando un experimento es aleatorio, existe la posibilidad de que produzca diferentes resultados sin que haya diferencias en el procedimiento. Esta característica del comportamiento del dispositivo experimental se llama azar. Su existencia en los sistemas macroscópicos se explica por los accidentes o casualidades, esto es, por encuentros entre procesos con causas independientes. Una multitud de accidentes como los que ocurren cuando se agita un dado o cuando se dispersa el polen provoca la variabilidad azarosa en los resultados de muchos experimentos aleatorios. El azar es esencial en la inferencia estadística porque es la base de la generación de datos apropiados.

Como un experimento aleatorio puede dar diferentes resultados, tenemos incertidumbre acerca de qué resultado producirá la próxima vez que se ejecute. Sin embargo, lo que distingue a un experimento aleatorio no es el carácter incierto sino el carácter azaroso de sus resultados. Mientras el azar es una propiedad objetiva del comportamiento de un sistema material, la incertidumbre es el estado de conciencia que alguien experimenta en relación con algo que ignora total o parcialmente, se trate o no del resultado que dará un experimento aleatorio. La incertidumbre varía entre personas que tienen diferente información o diferente capacidad para interpretarla.

El azar provoca incertidumbre pero la incertidumbre no es privativa del azar. Por ejemplo, tenemos incertidumbre acerca del número que saldrá la próxima vez que tiremos el dado porque se trata de un experimento aleatorio (con resultados azarosos). En cambio, si tenemos incertidumbre acerca de la edad que tiene hoy la profesora de estadística es porque nos falta información sobre su fecha de nacimiento.

Page 2: Experimento aleatorio · 2020. 3. 24. · PROBABILIDAD Experimento aleatorio Si agitamos un dado dentro de un cubilete, lo arrojamos sobre una mesa y registramos qué cara queda hacia

2

Espacio muestral y eventos

El conjunto de todos los resultados elementales que puede producir un experimento aleatorio se denomina espacio muestral. Por ejemplo, el espacio muestral del experimento del dado es el conjunto S = {1, 2, 3, 4, 5, 6}. Se denomina evento simple a cualquier subconjunto de S que contenga un solo resultado y evento compuesto a cualquiera que contenga más de uno. Por ejemplo, en S podemos reconocer los eventos compuestos A = {1, 3, 5}, “que salga un número impar”, B = {2, 4, 6}, “que salga un número par”, o C = {1, 2, 3}, “que salga número menor que 4” (Figura 2.1).

Figura 2.1. Representación en un diagrama de Venn del espacio muestral del experimento aleatorio que consiste en agitar un dado en un cubilete, arrojarlo sobre una mesa y registrar qué cara queda hacia arriba. Los resultados elementales son 1, 2, 3, 4, 5 y 6. Dentro del espacio muestral S podemos definir, por ejemplo, los eventos compuestos A, número impar, B, número par y C, número menor que 4. Los eventos A y B son mutuamente excluyentes y complementarios. Los eventos A y C no son mutuamente excluyentes, tampoco lo son los eventos B y C.

Unión e intersección entre eventos Todo evento compuesto constituye la unión de otros eventos. Por ejemplo, el evento “que no salga el 5” es {1, 2, 3, 4, 6} = 𝐵 ∪ 𝐶, la unión del evento B con el evento C (Figura 2.1). El evento 𝐵 ∪ 𝐶 ocurre si ocurre el evento B o el evento C.

Algunos eventos constituyen la intersección de otros eventos. El evento “que salga el 2” es {2} =𝐵 ∩ 𝐶, la intersección entre los eventos B y C (Figura 2.1). El evento 𝐵 ∩ 𝐶 ocurre sólo si ocurren conjuntamente los eventos B y C.

Eventos mutuamente excluyentes, partición, eventos

complementarios Dos o más eventos son mutuamente excluyentes (o incompatibles) si no pueden ocurrir como resultado de una misma ejecución del experimento aleatorio. Por ejemplo, los eventos A y B son mutuamente excluyentes pero los eventos B y C no lo son. Si se agita y tira un dado una vez no puede salir un número que sea impar y también par, pero sí puede salir un número que sea par y también menor que cuatro (el 2). En particular, todos los eventos simples son siempre mutuamente excluyentes. Por ejemplo, si se agita y tira el dado una vez es imposible que salga el 1 y también el 3. La intersección entre eventos mutuamente

excluyentes es siempre el conjunto vacío, por ejemplo A ∩ B= ∅ (Figura 2.1). Una partición del espacio muestral consiste en dos o más eventos mutuamente excluyentes cuya unión es igual a S.

Dos eventos son complementarios si definen una partición (son mutuamente excluyentes y su unión es igual al espacio muestral). Por ejemplo, los eventos A y B son complementarios porque A ∩ B= ∅

y A ∪ B= S (Figura 2.1). Dado un evento cualquiera E, denotaremos a su evento complementario como Ec, por ejemplo B = Ac.

Experimento aleatorio y realización Como vimos, un experimento aleatorio es un procedimiento que puede producir diferentes resultados. Sin embargo, esta posibilidad sólo existe mientras el experimento no ha sido ejecutado. Una vez que el experimento ha sido ejecutado, el resultado que se obtiene queda fijo y no cabe la posibilidad de que sea otro. Un resultado producido en una ejecución del experimento aleatorio se denomina una realización de dicho experimento. Un triste ejemplo de la diferencia entre un experimento aleatorio y su realización es el que me tocó vivir luego de un sorteo del Gordo de Navidad. Poco antes había comprado un billete con el número 16.354, decididamente uno de los posibles resultados del sorteo. Mi número pertenecía al espacio

Page 3: Experimento aleatorio · 2020. 3. 24. · PROBABILIDAD Experimento aleatorio Si agitamos un dado dentro de un cubilete, lo arrojamos sobre una mesa y registramos qué cara queda hacia

3

muestral del experimento aleatorio que se realizaría y yo me ilusionaba con ganar el Gordo. Cuando salió el 66.190, debí abandonar mi ilusión definitivamente. Podía tirar mi billete a la basura. El 66.190 es la realización de aquel experimento y como tal es fija e irrevocable.

Muestreo aleatorio Consideremos el caso de un equipo de ingenieros agrónomos y licenciados en ciencias ambientales que se propone estimar las frecuencias relativas de establecimientos con modalidades de explotación ganadera, agrícola-ganadera, agrícola y otra en un área rural que contiene un total de 2719 establecimientos. Para realizar esta inferencia estadística, elegirán al azar (esto es por sorteo p.ej. con un bolillero) 100 establecimientos y registrarán cuál de las cuatro modalidades de explotación se lleva a cabo en cada uno. Este procedimiento se denomina muestreo aleatorio. En este caso, con el muestreo los profesionales generarán datos de las frecuencias relativas de diferentes modalidades entre los 100 establecimientos que servirán como estimaciones de las correspondientes frecuencias en los 2719 establecimientos del área.

En este muestreo aleatorio, el conjunto de los 2719 establecimientos constituye la población de referencia, cada uno de los establecimientos es una unidad muestral, el subconjunto de la población

formado por los 100 establecimientos a elegir al azar es una muestra aleatoria, el número n  100 de establecimientos a elegir es el tamaño de la muestra y la modalidad de explotación es la variable de interés. Como los establecimientos serán elegidos por sorteo y no todos los establecimientos del distrito tienen igual modalidad de explotación, será posible registrar diferentes modalidades en cada establecimiento a elegir. Es decir que la obtención de la información correspondiente a cada unidad muestral es un experimento aleatorio. En este caso, el espacio muestral del experimento aleatorio es S = {exclusivamente ganadera, agrícola-ganadera, exclusivamente agrícola, otra}. A su vez, la serie de 100 selecciones aleatorias necesaria para completar la muestra aleatoria constituye un experimento aleatorio en sí mismo ya que puede dar diferentes resultados que son las diferentes secuencias de modalidades de explotación que pueden registrarse cuando se ejecute.

Probabilidad Como vimos, todo experimento aleatorio ocurre en algún dispositivo experimental, un sistema material que, cada vez que se acciona, produce uno de los resultados pertenecientes al espacio muestral del experimento. Ese dispositivo tiene cierto potencial o disposición para producir cada uno de los diferentes eventos que se pueden definir dentro de dicho espacio. Llamaremos probabilidad de un evento particular al potencial o disposición que el dispositivo experimental tiene para producirlo. Esta es la acepción realista de la palabra probabilidad; alude a una propiedad física de un sistema material. Por ejemplo, si decimos que la probabilidad de que salga un número menor que cuatro en el experimento del dado es mayor que la probabilidad de que salga un número mayor que cuatro, afirmamos que el dispositivo experimental formado por el cubilete, el dado y la mesa tiene mayor potencial para producir el evento C = {1, 2, 3} que el evento D = {5, 6}. Esta afirmación podrá ser cierta o falsa según a qué cubilete, dado y mesa se refiera. En el contexto de la inferencia estadística, cada vez que usemos la palabra probabilidad nos referiremos estrictamente a su acepción realista.

Probabilidad en el lenguaje vulgar y probabilidad en inferencia estadística

Es importante distinguir el estrecho significado que la palabra probabilidad tiene en inferencia estadística de su laxo significado en el lenguaje vulgar. En el lenguaje vulgar la palabra probabilidad se asocia con nuestra incertidumbre, provenga ésta del azar o simplemente de nuestra falta de información o comprensión. Por ejemplo, si decimos que probablemente llueva, nos referimos al comportamiento azaroso de la atmósfera, pero si decimos que probablemente haya llovido, manifestamos nuestra falta de información acerca de si llovió o no. Esta doble acepción de la palabra probabilidad es admisible en el lenguaje vulgar porque resulta comprensible, pero no lo es en el contexto de la inferencia estadística que presentamos aquí, en el cual sólo es válida la acepción realista que vincula probabilidad estrictamente con azar.

Page 4: Experimento aleatorio · 2020. 3. 24. · PROBABILIDAD Experimento aleatorio Si agitamos un dado dentro de un cubilete, lo arrojamos sobre una mesa y registramos qué cara queda hacia

4

Probabilidad y frecuencia relativa Según la acepción realista de la palabra, la probabilidad del evento C designa una propiedad física real del dispositivo experimental formado por el cubilete, el dado y la mesa; se trata de un potencial que este dispositivo experimental tiene aun cuando no es accionado. Cuando el dispositivo experimental es accionado muchas veces ese potencial se manifiesta como la frecuencia relativa con que ocurre en evento C. Si un evento C es más probable que un evento D, el evento C debe ocurrir más frecuentemente que el evento D en una serie suficientemente larga de repeticiones del experimento aleatorio. Por eso, la medida de la probabilidad de un evento debe cumplir reglas consistentes con las propiedades de las frecuencias relativas. Estas reglas son estipuladas por la definición axiomática de probabilidad.

Definición axiomática de probabilidad Consideremos espacio muestral S de un experimento aleatorio. Definimos aquí la probabilidad como una función P que asocia un número real a cada evento incluido en el espacio muestral S y que satisface los siguientes axiomas o proposiciones que damos por ciertas sin demostración:

Axioma I

Para cualquier evento A incluido en S,

𝑃[𝐴] ≥ 0 (2.1)

Axioma II

La probabilidad de que ocurra el evento S es,

𝑃[𝑆] = 1 (2.2)

Axioma III

Si A, B, C, … son eventos mutuamente excluyentes incluidos en S, entonces la probabilidad de que ocurra alguno de ellos, esto es la probabilidad de su unión, es,

𝑃[𝐴 ∪ 𝐵 ∪ 𝐶 ∪ … ] = 𝑃[𝐴] + 𝑃[𝐵] + 𝑃[𝐶] + ⋯ (2.3)

Propiedades derivadas

Propiedad I

Si A es un evento incluido en S, la probabilidad de su evento complemento Ac es,

𝑃[𝐴𝑐] = 1 − 𝑃[𝐴] (2.4)

Consecuencia de la definición de evento complementario y los Axiomas II y III (ver Figura 2.1).

Propiedad II

La probabilidad del evento conjunto vacío es 0.

𝑃[∅] = 0 (2.5)

Consecuencia de Axioma II y la Propiedad I.

Propiedad III

Si A y C son dos eventos cualesquiera incluidos en S, la probabilidad de que ocurra uno o el otro, es decir la probabilidad de su unión, es,

𝑃[𝐴 ∪ 𝐶] = 𝑃[𝐴] + 𝑃[𝐶] − 𝑃[𝐴 ∩ 𝐶] (2.6)

Consecuencia del Axioma III (ver Figura 2.1).

Asignación de valores de probabilidad Dado que la probabilidad de un evento se manifiesta como la frecuencia relativa con que éste ocurre, cuando el experimento aleatorio que lo produce se repite muchas veces, el valor que asignamos a su probabilidad es el de dicha frecuencia relativa. Sin embargo, dependiendo de las características del

Page 5: Experimento aleatorio · 2020. 3. 24. · PROBABILIDAD Experimento aleatorio Si agitamos un dado dentro de un cubilete, lo arrojamos sobre una mesa y registramos qué cara queda hacia

5

experimento aleatorio, se pueden usar dos criterios para asignar los valores a las probabilidades de diferentes eventos.

Resultados elementales equiprobables

Existen experimentos aleatorios para los cuales asignar igual probabilidad a todos los resultados elementales constituye un criterio razonable. Por ejemplo, en el experimento del dado, si se agita bien el cubilete y el dado está balanceado, es razonable asignar igual probabilidad a los seis resultados elementales posibles. En ese caso, asignaremos probabilidad de 1/6 a cada evento simple correspondiente (por Axiomas II y III).

Si el espacio muestral S de un experimento aleatorio abarca un número finito k de resultados elementales de modo que S = {Q1, Q2, …, Qk} y los k resultados son igualmente probables, entonces el valor que asignamos a la probabilidad de cada resultado Qi es,

𝑃[𝑄𝑖] =1

𝑘 , para todo 𝑖 = 1, … , 𝑘 (2.7)

En consecuencia, cuando es razonable asignar igual probabilidad a todos los resultados elementales, la probabilidad de un evento A incluido en S se calcula como el cociente entre h, el número de resultados elementales que pertenecen a dicho evento, y k, el total de resultados elementales en S (por Axioma III).

𝑃[𝐴] =ℎ

𝑘 (2.8)

Por ejemplo, en el experimento del dado balanceado, es razonable asignar al evento D = {5, 6}, “que salga un número mayor que 4”, la probabilidad,

𝑃[𝐷] =2

6

Este criterio para asignar probabilidades es muy importante para la inferencia estadística porque se vincula con el muestreo aleatorio. Por ejemplo, para obtener la muestra aleatoria de 100 establecimientos de la población de referencia formada por los 2719 establecimientos de un área rural, se utiliza un dispositivo (p.ej. un bolillero bien construido) que razonablemente justifica asignar igual probabilidad a que cualquiera de los 2719 establecimientos de la población de referencia resulte sorteado. Por esa razón, si definimos al evento compuesto G como la selección de un establecimiento que realiza ganadería, se justifica asignar a P[G] el valor de la frecuencia relativa de establecimientos que realizan ganadería, es decir de aquellos con modalidades exclusivamente ganadera y agrícola-ganadera en la población de referencia.

Resultados elementales con diferente probabilidad

A diferencia del dado bien balanceado y del bolillero bien construido, existen dispositivos experimentales que evidentemente tienen diferente potencial para producir los distintos resultados. Por ejemplo, si dejamos caer una tostada untada con mermelada y registramos qué cara queda hacia el piso realizamos un experimento aleatorio a cuyo espacio muestral pertenecen dos resultados elementales cuyas probabilidades son muy diferentes… como muchos hemos lamentado alguna vez.

Dado que la probabilidad de un resultado cualquiera debe manifestarse como su frecuencia relativa en muchas repeticiones del experimento aleatorio, la aproximación realista a la medida de la probabilidad de un resultado Q es el valor en el cual se estabiliza la frecuencia relativa de Q cuando el experimento aleatorio se repite un número suficiente de veces.

Si el resultado Q perteneciente al espacio muestral S de un experimento aleatorio, el valor que asignamos a la probabilidad de Q es,

𝑃[𝑄] =𝑚

𝑛 (2.9)

donde m es la frecuencia absoluta de Q en n repeticiones del experimento, y n es suficiente como para que el cociente m / n se estabilice razonablemente.

Este criterio tiene precedencia sobre la ecuación 2.8. Por ejemplo, si la frecuencia relativa con que sale el 2 en muchas repeticiones del experimento del dado se aparta notablemente de 1/6, concluimos que el dado no está balanceado y por eso no corresponde usar la fórmula 2.8. El valor que asignamos entonces a la probabilidad de dicho resultado no es 1/6 sino el de la frecuencia relativa observada, como estipula la

Page 6: Experimento aleatorio · 2020. 3. 24. · PROBABILIDAD Experimento aleatorio Si agitamos un dado dentro de un cubilete, lo arrojamos sobre una mesa y registramos qué cara queda hacia

6

fórmula 2.9. Además, como la probabilidad de un evento E es la suma de las probabilidades de los resultados elementales que contiene (Axioma III), el valor que asignamos a la probabilidad de E es aquel en el cual se estabiliza su frecuencia relativa en una serie suficientemente larga de ejecuciones del experimento.

Este criterio es el que da significado a cualquier afirmación particular sobre la probabilidad de un evento. Por ejemplo, si se dice que la probabilidad de que el Glifosato mate una planta de una maleza es 0,97, es correcto interpretar que se afirma que el Glifosato tiene un potencial para matar las plantas de esa maleza que se manifestará como una frecuencia relativa de plantas muertas cercana a 0,97 cuando se aplique a muchas plantas. De modo similar, si se afirma que la probabilidad de que la aplicación de Glifosato en un lote agrícola de una cuenca contribuya a la contaminación del curso de agua es de 0,66, es correcto interpretar que se afirma que si se aplica Glifosato en un número suficiente de lotes de la cuenca, la frecuencia relativa de aplicaciones que contribuirán a la contaminación del curso de agua se aproximará a 0,66. Además, esta interpretación es la que corresponde a los riesgos de error que se controlan en la inferencia estadística. Por ejemplo, supongamos que para investigar la estructura del paisaje de un área rural se usará un procedimiento de inferencia estadística que preestablece que la probabilidad de cometer un error peor que ± 0,1 en la estimación de la proporción de establecimientos ganaderos es de 0,05. En ese caso, es correcto interpretar que, si ese procedimiento se repitiera un número suficiente de veces, la frecuencia relativa de estimaciones que se apartaran en más que 0,1 de la verdadera proporción de establecimientos ganaderos entre los 2719 establecimientos del distrito debería ser 0,05 (5%).

Probabilidad conjunta Los profesionales que investigan la estructura del paisaje en un área rural elegirán establecimientos al azar (por sorteo) y registrarán su modalidad de explotación. En cada establecimiento elegido, obtendrán dos piezas separadas de información: ¿se realiza ganadería? y ¿se realiza agricultura? Con las respuestas a estas dos preguntas, clasificarán cada establecimiento en una de las cuatro modalidades que constituyen los resultados elementales pertenecientes al espacio muestral S = {exclusivamente ganadera, agrícola-ganadera, exclusivamente agrícola, otra}. En este espacio muestral, cada respuesta posible a una de las preguntas determina un evento compuesto y el evento simple que contiene cada resultado elemental es la intersección (ocurrencia conjunta) de dos eventos compuestos. Por ejemplo, el evento {agrícola-ganadera} es la intersección de los eventos A “se realiza agricultura” y G “se realiza ganadería” (Figura 2.2).

Figura 2.2. Espacio muestral del experimento aleatorio que consiste en elegir al azar un establecimiento dentro de un área rural y registrar su modalidad de explotación. S, espacio muestral; G, evento compuesto “se realiza ganadería”; A, evento compuesto “se realiza agricultura”, Gc y Ac son los correspondientes complementos.

En este caso, resulta útil escribir el espacio muestral mediante una tabla de doble entrada (Cuadro 2.1). En la celdas de cada margen aparecen los eventos mutuamente excluyentes de dos particiones diferentes del espacio del espacio muestral y en las celdas interiores aparecen los eventos que constituyen sus correspondientes intersecciones (que en este ejemplo corresponden a eventos simples).

Page 7: Experimento aleatorio · 2020. 3. 24. · PROBABILIDAD Experimento aleatorio Si agitamos un dado dentro de un cubilete, lo arrojamos sobre una mesa y registramos qué cara queda hacia

7

Figura 2.1. Tabla de doble entrada para representar particiones útiles del espacio muestral del experimento aleatorio que consiste en elegir al azar un establecimiento en un área rural y registrar su modalidad de explotación en una.

Agricultura

Sí No

Ganadería Sí agrícola-ganadera

exclusivamente ganadera

G = se realiza ganadería

No exclusivamente

agrícola otra

Gc =no se realiza ganadería

A = se realiza agricultura Ac = no se realiza

agricultura S

La probabilidad de la intersección entre dos (o más) eventos se llama probabilidad conjunta porque constituye la probabilidad de que dichos eventos ocurran conjuntamente en una realización del experimento aleatorio. Por ejemplo, la probabilidad de cada evento simple correspondiente a uno de los resultados elementales representados en la tabla de la Cuadro 2.1 es una probabilidad conjunta.

Definición:

Sean los eventos A, B, C,… incluidos en el espacio muestral S, llamamos probabilidad conjunta de A, B, C,… a la probabilidad del evento definido como su intersección.

𝑃[𝐴 ∩ 𝐵 ∩ 𝐶 ∩ … ] (2.10)

La tabla de doble entrada se puede usar para presentar la distribución de frecuencias observadas o las probabilidades. Por ejemplo, las probabilidades correspondientes al experimento aleatorio de sortear un establecimiento de un área rural y registrar su modalidad de explotación podrían ser las que se muestran en la Cuadro 2.2.

Cuadro 2.2. Tabla de doble entrada con la distribución de probabilidad en el espacio muestral del experimento aleatorio que consiste en elegir al azar un establecimiento en un área rural y registrar su modalidad de explotación en una.

Agricultura

Sí No

Ganadería Sí 0,24 0,33 0,57

No 0,42 0,01 0,43

0,66 0,34 1,00

En la tabla leemos que la probabilidad conjunta de los eventos A, “se realiza agricultura” y G, “se realiza ganadería”, el evento simple “agrícola-ganadera” es 0,24 (Cuadro 2.2). Usando la fórmula 2.10 escribimos,

𝑃[𝐴 ∩ 𝐺] = 0,24

También leemos que la probabilidad del evento compuesto “se realiza ganadería” (se realice o no agricultura) es 0,57. Esta probabilidad es igual a la suma de las probabilidades de los eventos simples mutuamente excluyentes que incluye,

𝑃[𝐺] = 𝑃[𝐴 ∩ 𝐺] + 𝑃[𝐴𝑐 ∩ 𝐺]

= 0,24 + 0,33

= 0,57

Notemos además que la suma de todas las probabilidades conjuntas es 𝑃[𝑆] = 1.

Probabilidad condicional

El potencial de un dispositivo experimental para producir un evento B puede variar según el experimento produzca o no un evento A. Por ejemplo, si el dispositivo experimental está formado por un árbol y su entorno, la probabilidad de que una semilla de dicho árbol llegue a germinar puede variar según ésta caiga cerca o lejos del árbol. En ese caso, diríamos que la probabilidad de que una semilla germine (evento B)

Page 8: Experimento aleatorio · 2020. 3. 24. · PROBABILIDAD Experimento aleatorio Si agitamos un dado dentro de un cubilete, lo arrojamos sobre una mesa y registramos qué cara queda hacia

8

bajo la condición de que caiga cerca del árbol (evento A) es diferente de la probabilidad de que germine bajo la condición de que caiga lejos del árbol (evento Ac). Cada una de estas probabilidades es una probabilidad condicional. Para denotar la probabilidad del evento aleatorio B condicional a la ocurrencia del evento aleatorio A, escribiremos 𝑃[𝐵|𝐴] y lo leeremos “probabilidad de B si ocurre A” o más brevemente “probabilidad de B dado A”.

La probabilidad de B dado A es un potencial del dispositivo experimental que se manifiesta como

la frecuencia relativa con que ocurre el evento B entre muchas repeticiones del experimento aleatorio en

las que ocurre el evento A. Esta frecuencia relativa se puede calcular como el cociente entre las frecuencias

relativas del evento A ∩ B y del evento A, es decir como el valor que asignamos a la probabilidad conjunta

de A y B dividido por el valor que asignamos a la probabilidad de A. Por eso,

Si A y B son dos eventos aleatorios incluidos en el espacio muestral S y P[A] > 0, entonces la probabilidad de B dado A se calcula como,

𝑃[𝐵|𝐴] =𝑃[𝐴 ∩ 𝐵]

𝑃[𝐴] (2.11)

Es decir que la probabilidad condicional se calcula como el cociente entre la probabilidad conjunta de los dos eventos y la probabilidad del evento impuesto como condición.

Es importante notar que, si en lugar 𝑃[𝐵|𝐴] nos interesa 𝑃[𝐴|𝐵], debemos calcular,

𝑃[𝐴|𝐵] =𝑃[𝐴 ∩ 𝐵]

𝑃[𝐵]

Notar que la diferencia entre 𝑃[𝐵|𝐴] y 𝑃[𝐴|𝐵] está en el denominador del cociente que, en cada caso, es la probabilidad

del evento impuesto como condición.

La fórmula 2.11 implica que la probabilidad conjunta de dos eventos aleatorios A y B se puede escribir como,

𝑃[𝐴 ∩ 𝐵] = 𝑃[𝐴] ∙ 𝑃[𝐵|𝐴] (2.12)

En la investigación sobre la estructura del paisaje de un área rural, una pregunta importante que los profesionales se formulan de antemano es cuánto vale la probabilidad condicional de sortear un establecimiento que realiza ganadería dado que realiza agricultura. A partir de las probabilidades que figuran en la tabla del Cuadro 2.2, calculamos el valor de esta probabilidad condicional como,

𝑃[𝐺|𝐴] =𝑃[𝐴 ∩ 𝐺]

𝑃[𝐴]=

0,24

0,66= 0,36

Como el sorteo se realizará con un dispositivo que asegura igual probabilidad de seleccionar cualquier establecimiento del distrito, los profesionales entienden que el valor de esta probabilidad condicional coincide con el de la frecuencia relativa de establecimientos que realizan ganadería entre aquellos que realizan agricultura dentro del área.

Notemos que, en este caso, la probabilidad condicional de sortear un establecimiento que realiza ganadería dado que realiza agricultura es menor que la probabilidad sortear un establecimiento que realiza ganadería sin imponer ninguna condición,

P[𝐺] = 0,57.

Es decir que, en este caso, la probabilidad de sortear un establecimiento que realiza ganadería dado que también realiza agricultura es menor que la probabilidad de sortear un establecimiento que realiza ganadería, realice o no agricultura. Esta diferencia cobrará especial significado en la próxima sección referida a la independencia estadística.

Ley de probabilidad total y regla de Bayes

La noción de probabilidad condicional es la base de dos reglas conocidas que tienen cierta utilidad para el cálculo de probabilidades.

Dados los eventos aleatorios A y B pertenecientes al espacio muestral S de un experimento aleatorio, se cumple que:

𝑃[𝐵] = 𝑃[𝐴] ∙ 𝑃[𝐵|𝐴] + 𝑃[𝐴𝑐] ∙ 𝑃[𝐵|𝐴𝑐] (2.13)

Page 9: Experimento aleatorio · 2020. 3. 24. · PROBABILIDAD Experimento aleatorio Si agitamos un dado dentro de un cubilete, lo arrojamos sobre una mesa y registramos qué cara queda hacia

9

Esta igualdad, consecuencia de Axioma III y la ecuación 2.12, se conoce con el nombre de ley de probabilidad total. Además,

𝑃[𝐴|𝐵] =𝑃[𝐴] ∙ 𝑃[𝐵|𝐴]

𝑃[𝐵] (2.14)

Esta igualdad, consecuencia de las ecuaciones 2.11 y 2.12, se conoce como regla de Bayes.

Independencia estadística Si el valor de la probabilidad de que una semilla germine difiere según ésta caiga cerca o lejos del árbol progenitor, se hace evidente cierta forma de dependencia entre el evento B, “que la semilla germine” y el evento A, “que caiga cerca del árbol”. En ese caso, diremos que, por alguna razón, la probabilidad de que una semilla germine depende de dónde ésta caiga. Si en cambio la probabilidad de que una semilla germine (evento B) tiene igual valor caiga ésta cerca (evento A) o lejos (evento Ac) del árbol progenitor decimos que los eventos B y A son estadísticamente independientes.

Definición:

Los eventos aleatorios A y B incluidos en el espacio muestral S son estadísticamente independientes si se cumple que,

𝑃[𝐵|𝐴] = 𝑃[𝐵|𝐴𝑐] (2.15)

Es decir que los eventos A y B son estadísticamente independientes si la probabilidad de B dado A es igual a la probabilidad de B dado el evento complementario de A.

Si los eventos A y B son estadísticamente independientes, también lo son los eventos Ac y B, A y Bc y Ac y Bc.

Si A y B son eventos estadísticamente independientes: (1) la probabilidad de B dado A es igual a la probabilidad de B y (2) la probabilidad conjunta de A y B es igual al producto de sus probabilidades.

La independencia estadística entre dos eventos tiene dos consecuencias que permiten reconocerla. La primera es que si dos eventos A y B son estadísticamente independientes, entonces la probabilidad condicional del evento B dado A tiene igual valor que la probabilidad de B,

𝑃[𝐵|𝐴] = 𝑃[𝐵] (2.16)

La segunda consecuencia es que, si dos eventos A y B son estadísticamente independientes, entonces la probabilidad de que ocurran conjuntamente tiene igual valor que el producto de sus probabilidades,

𝑃[𝐴 ∩ 𝐵] = 𝑃[𝐴] ∙ 𝑃[𝐵] (2.17)

Las probabilidades que aparecen en la tabla del Cuadro 2.2 implican que en en el área rural en cuestión, el valor de la probabilidad condicional de sortear un establecimiento que realiza ganadería dado que realiza agricultura es, como ya vimos,

𝑃[𝐺|𝐴] =𝑃[𝐴 ∩ 𝐺]

𝑃[𝐴]=

0,24

0,66= 0,36

mientras el valor de la probabilidad condicional de sortear un establecimiento que realiza ganadería dado que no realiza agricultura es mucho mayor.

𝑃[𝐺|𝐴𝑐] =𝑃[𝐴𝑐 ∩ 𝐺]

𝑃[𝐴𝑐]=

0,33

0,34= 0,97

Es decir que, según la definición 2.15, los eventos G, “realiza ganadería”, y A, “realiza agricultura” no son estadísticamente independientes en este caso.

Page 10: Experimento aleatorio · 2020. 3. 24. · PROBABILIDAD Experimento aleatorio Si agitamos un dado dentro de un cubilete, lo arrojamos sobre una mesa y registramos qué cara queda hacia

10

La dependencia estadística entre estos eventos se pone también en evidencia cuando se

comprueba que el valor de 𝑃[𝐺|𝐴] no es igual que el de 𝑃[𝐺], la probabilidad de sortear un establecimiento que realiza ganadería realice o no agricultura (ecuación 2.16). Como ya calculamos,

𝑃[𝐺|𝐴] = 0,36 ≠ 0,57 = 𝑃[𝐺]

La tercera manera de establecer que G y A no son estadísticamente independientes es comparar su probabilidad conjunta con el producto de sus probabilidades (ecuación 2.17),

𝑃[𝐴 ∩ 𝐺] = 0,24

𝑃[𝐴]. 𝑃[𝐺] = 0,66 ∙ 0.57 = 0,38

y comprobar que 𝑃[𝐴 ∩ 𝐺] ≠ 𝑃[𝐴] ∙ 𝑃[𝐺]. En el capítulo 7 veremos que esta comparación es la que se usa en inferencia estadística para producir generalizaciones acerca de la posible falta de independencia entre dos eventos.

Dependencia estadística y causalidad En el área rural de nuestro ejemplo, la probabilidad de sortear un establecimiento rural donde se realice ganadería es mucho mayor bajo la condición de que no realice agricultura que bajo la condición de que realice agricultura. Esto podría deberse a que la introducción de la agricultura en muchos establecimientos causara la exclusión de la ganadería. Sin embargo, la falta de independencia estadística no alcanza para demostrar tal conexión causal porque admite otras explicaciones razonables. Por ejemplo, si en área hubiera establecimientos con tierras aptas para la ganadería pero no para la agricultura, la frecuencia relativa de establecimientos que realizan ganadería sería mayor entre los que no realizan agricultura que entre los que realizan agricultura. Esto se reflejaría en una mayor probabilidad de sortear un establecimiento que realiza ganadería bajo la condición de que no realice agricultura que bajo la condición de que sí realice agricultura.

En diversos ecosistemas se ha comprobado que, para muchas especies de árboles, la probabilidad de que una semilla germine es mayor si cae lejos que si cae cerca del árbol progenitor. En ocasiones, esta falta de independencia estadística puede deberse a que las semillas que caen cerca del árbol progenitor están más expuestas a hongos patógenos que las que caen lejos. En este caso, existe una conexión causal entre el evento “que la semilla caiga cerca del árbol” y el evento “que la semilla no germine”. Sin embargo, la misma diferencia entre probabilidades condicionales podría deberse a que las semillas con mayor capacidad para germinar (p. ej. más grandes) fueran también las más atractivas para los animales que las transportan lejos del árbol progenitor. Estos ejemplos demuestran que la sola observación de falta de independencia estadística entre dos eventos no alcanza para demostrar que exista entre ellos una conexión causal.

Guía de Lectura 1. ¿Qué es un experimento aleatorio? ¿Cuál es su característica distintiva?

2. ¿A qué nos referimos cuando decimos azar?

3. ¿Qué es la incertidumbre y qué relación guarda con el azar?

4. ¿A qué se llama espacio muestral y a qué se llama evento?

5. ¿Qué es un evento simple y qué es un evento compuesto?

6. ¿Qué son eventos mutuamente excluyentes? ¿Cuál es la intersección entre dos eventos mutuamente

excluyentes?

7. ¿En qué consiste una partición de un espacio muestral S?

8. ¿Qué son eventos complementarios? ¿Cuál es la intersección y cuál es la unión entre dos eventos

complementarios?

9. ¿A qué llamamos realización de un experimento aleatorio? ¿Qué propiedad tiene?

10. ¿Qué experimento aleatorio está involucrado en la obtención de una muestra aleatoria? ¿Qué es

población de referencia? ¿Qué es espacio muestral de ese experimento?

11. ¿Cuál es la acepción realista de la palabra probabilidad que se aplica en la inferencia estadística?

Page 11: Experimento aleatorio · 2020. 3. 24. · PROBABILIDAD Experimento aleatorio Si agitamos un dado dentro de un cubilete, lo arrojamos sobre una mesa y registramos qué cara queda hacia

11

12. ¿Qué diferencia existe entre la acepción realista de la palabra probabilidad y su significado en el

lenguaje vulgar?

13. ¿Qué relación guarda la probabilidad con la frecuencia relativa?

14. ¿Cuál es la definición axiomática de la probabilidad? ¿Cuáles son los tres axiomas que incluye?

15. ¿Cuánto vale la probabilidad del evento complementario de cualquier evento A?

16. ¿Cuánto vale la probabilidad del evento conjunto vacío?

17. ¿Cuánto vale la probabilidad de la unión de dos eventos cualesquiera?

18. ¿Qué alternativas existen para asignar valores de probabilidad? ¿Cuál tiene precedencia?

19. ¿Qué aplicación tiene en inferencia estadística la asignación de valores de probabilidad sobre la base

de resultados con igual probabilidad? ¿Cómo se asegura que sea correcto aplicar esta aproximación?

20. ¿Qué papel cumple en inferencia estadística la asignación de valores de probabilidad a partir de

frecuencias relativas en un número suficiente de repeticiones del experimento aleatorio?

21. ¿A qué se denomina probabilidad conjunta?

22. ¿A qué se denomina probabilidad condicional? ¿Cómo se denota? ¿Cómo se calcula?

23. ¿Qué establecen la Ley de Probabilidad Total y la Regla de Bayes?

24. ¿Cómo definimos la independencia estadística entre dos eventos aleatorios?

25. ¿Cómo se puede reconocer la independencia estadística entre dos eventos a partir de sus

probabilidades y de su probabilidad conjunta?

26. ¿Por qué la falta de independencia estadística no es prueba suficiente de conexión causal?

Ejercicios

2.1 Las monedas de 25 centavos tienen de un lado la imagen del cabildo de Buenos Aires (“cara”) y

del otro el número que indica su valor (“ceca”). Todas son de igual tamaño y peso pero algunas son doradas

y otras plateadas. Imaginemos el procedimiento que consiste en arrojar dos monedas de 25 centavos, una

dorada y otra plateada, y registrar qué lado de cada una queda hacia arriba.

a. ¿Por qué el procedimiento descripto es un experimento aleatorio? ¿Cuál es el dispositivo experimental

y cómo se lo acciona?

b. ¿Qué resultados elementales pertenecen al espacio muestral de este experimento aleatorio?

Representar este espacio muestral con un diagrama de Venn.

c. Sobre el diagrama de Venn, señalar un evento compuesto, indicar qué resultados elementales

pertenecen al mismo y cuál es su evento complementario.

d. Señalar el evento “que la moneda dorada quede con “cara” hacia arriba”. ¿Se trata de un evento simple

o compuesto? ¿Por qué?

e. Señalar el evento “no quedan las dos monedas con “cara” hacia arriba”. ¿Se trata de un evento simple

o compuesto? ¿Por qué?

f. Señalar el evento “una de las monedas queda con “cara” hacia arriba y la otra no”. ¿Se trata de un

evento simple o compuesto? ¿Por qué?

g. Señalar dos eventos que no sean mutuamente excluyentes y el evento que constituye su intersección.

2.2 Consideremos nuevamente el experimento aleatorio que consiste en arrojar hacia arriba dos

monedas de 25 centavos, una dorada y otra plateada, y registrar qué lado de cada una queda hacia arriba.

Aceptemos que este experimento se realiza bajo condiciones que permiten asignar igual valor de

probabilidad a todos los resultados elementales que puede producir.

a. Construir una tabla de doble entrada a partir de los valores de las probabilidades de los resultados

elementales.

b. ¿Cuánto vale la probabilidad de que la moneda dorada quede con “cara” hacia arriba?

c. ¿Cuánto vale la probabilidad conjunta de que las dos monedas queden con “cara” hacia arriba?

d. ¿Cuánto vale la probabilidad condicional de que la moneda dorada quede con “cara” hacia arriba si la

moneda plateada también queda con “cara” hacia arriba?

Page 12: Experimento aleatorio · 2020. 3. 24. · PROBABILIDAD Experimento aleatorio Si agitamos un dado dentro de un cubilete, lo arrojamos sobre una mesa y registramos qué cara queda hacia

12

e. Comparar los valores de las probabilidades calculadas en los puntos b y d. ¿Qué indica la

comparación?

f. ¿Cuánto vale la probabilidad de que una de las monedas quede con “cara” y la otra con “ceca” hacia

arriba?

2.3 En una investigación sobre la diversificación de la producción agrícola en el distrito de Tiacalín,

un estudiante graduado de la Facultad de Agronomía decide obtener una muestra aleatoria de 50

establecimientos rurales con superficies entre 25 y 500 ha y registrar qué cultivos realizaron en el último

verano. Para ello, numerará los 2198 establecimientos del distrito cuya superficie está en el rango estipulado

y elegirá por sorteo 50 para incluir en la muestra. Luego, pedirá a cada productor que complete una encuesta

en la que deberá consignar cuáles de las siguientes especies fueron cultivadas en su establecimiento en el

último verano: soja, girasol, maíz, sorgo, otro.

a. ¿Cuál es la población de referencia, cuáles son las unidades muestrales y cuál es la muestra?

b. ¿Por qué es correcto decir que el procedimiento que consiste en elegir al azar un establecimiento de la

población de referencia y registrar cuáles cultivos de la lista fueron realizados allí en el último verano

es un experimento aleatorio?

c. Detallar las 32 listas de cultivos estivales que se pueden consignar en cada establecimiento. Se trata

de los resultados que contiene el espacio muestral del experimento aleatorio.

d. ¿Qué resultados pertenecen a los siguientes eventos compuestos?

“en el establecimiento se cultivó soja”

“en el establecimiento se cultivó maíz y girasol”

“en el establecimiento se realizaron exactamente dos cultivos estivales diferentes”

“en el establecimiento se realizaron al menos dos cultivos estivales diferentes”

“en el establecimiento se realizaron más de dos cultivos estivales diferentes”

“en el establecimiento se realizaron menos de cuatro cultivos estivales diferentes”

e. ¿Cuál es el evento complementario del evento “en el establecimiento se realizó más de un cultivo

estival”? ¿Qué eventos simples lo integran?

f. ¿Con qué propiedad de la población de referencia coincide el valor de la probabilidad de que un

establecimiento a elegir al azar haya cultivado soja en el último verano?

g. ¿Con qué propiedad de la población de referencia coincide el valor de la probabilidad de que un

establecimiento elegir al azar haya cultivado al menos dos cultivos estivales diferentes en el último

verano?

2.4 Una vez obtenida una muestra aleatoria de 50 establecimientos agropecuarios con superficies entre

25 y 500 ha en un área rural, el estudiante graduado encontró que en todos ellos se había realizado al menos

un cultivo estival, que en 38 de ellos se había cultivado soja y que en 16 la soja era el único cultivo estival.

Además, en 8 de los 12 establecimientos donde no se había cultivado soja se habían cultivado dos o más

especies estivales diferentes.

a. Construir una tabla de doble entrada (llamada tabla de contingencia) con las frecuencias absolutas de

establecimientos de la muestra que habían y que no habían cultivado soja y que habían cultivado una

y más de una especie estival.

b. A partir de la tabla construida en a, confeccionar otra que muestre las correspondientes frecuencias

relativas en la muestra.

Suponiendo que la información de la muestra reflejara fielmente las frecuencias relativas de

establecimientos que han cultivado o no cultivado soja y que han realizado uno o más cultivos estivales en

la población de referencia:

c. ¿Cuál sería la probabilidad de que un establecimiento a elegir al azar de la población de referencia

haya cultivado soja en el último verano? ¿Qué posición ocupa el valor de esta probabilidad en la tabla

construida en b?

d. ¿Cuál sería la probabilidad de que un establecimiento a elegir al azar de la población de referencia

haya cultivado solamente soja en el último verano? ¿Se trata de una probabilidad conjunta o

condicional?

e. ¿Cuál sería la probabilidad de que un establecimiento a elegir al azar de la población de referencia

haya realizado un sólo cultivo estival si ha cultivado soja? ¿Se trata de una probabilidad conjunta o

condicional?

Page 13: Experimento aleatorio · 2020. 3. 24. · PROBABILIDAD Experimento aleatorio Si agitamos un dado dentro de un cubilete, lo arrojamos sobre una mesa y registramos qué cara queda hacia

13

f. ¿Los eventos “se ha cultivado soja” y “se ha realizado un único cultivo” serían estadísticamente

independientes? ¿Qué interpretaciones admite la respuesta a esa pregunta?

2.5 En una investigación sobre la regeneración de la palmera yatay (Butia yatay) en el Parque Nacional

El Palmar se marcaron 200 plántulas de palmera elegidas al azar en un área de 4 ha de sabana de palmeras.

Entre las plántulas marcadas, 120 estaban ubicadas bajo la copa de una palmera adulta (a menos de 4 metros

de su base) y 80 estaban ubicadas a más de 4 m de la palmera adulta más cercana. Al cabo de un año, se

comprobó que habían muerto 40 de las plántulas ubicadas bajo la copa de una palmera adulta y 20 de las

restantes. Definamos ahora el experimento aleatorio que consiste en elegir por sorteo una de las 200

plántulas y registrar si estaba o no bajo la copa de una palmera adulta y si sobrevivió o no.

a. ¿Qué resultados perteneces al espacio muestral de este experimento aleatorio?

b. Señalar dos eventos mutuamente excluyentes en dicho espacio muestral. ¿Cuál es la probabilidad de

cada uno? ¿Cuál es la probabilidad de que ocurra uno o el otro?

c. Señalar dos eventos que no sean mutuamente excluyentes. ¿Cuál es la probabilidad de cada uno? ¿Cuál

es su probabilidad conjunta?

d. ¿Cuál es la probabilidad de que la plántula a elegir al azar resulte ser una que estaba bajo la copa de

una palmera adulta?

e. ¿Cuál es la probabilidad que la plántula a elegir al azar haya sobrevivido?

f. ¿Cuál es la probabilidad que la plántula a elegir al azar haya sobrevivido, si estaba a más de 4 m de

distancia de la palmera adulta más cercana?

Suponiendo que las probabilidades calculadas a partir de estas 200 plántulas constituyen buenas

aproximaciones a las probabilidades que tienen las plántulas de Butia yatay del Parque Nacional El Palmar

de establecerse y de sobrevivir a diferentes distancias de las palmeras adultas

g. ¿La supervivencia de las plántulas de Butia yatay es estadísticamente independiente de su ubicación

respecto de las palmeras adultas? Justificar la respuesta usando probabilidades condicionales y discutir

su interpretación.

2.6 Se prepara un dispositivo experimental con dos bolilleros bien construidos y una cantidad de

bolillas blancas o rojas, todas esféricas, de igual diámetro, peso y rugosidad. En el primer bolillero se

colocan 96 bolillas blancas y 32 rojas y en el segundo 8 blancas y 56 rojas. Ambos bolilleros girarán

cerrados durante 1 minuto para mezclar bien las bolillas y luego girarán una vez más para sacar una bolilla

de cada uno. Llamaremos A al evento que ocurre cuando “del primer bolillero sale una bolilla roja” y B al

que ocurre cuando “del segundo bolillero sale una bolilla roja”. El dispositivo y el procedimiento descriptos

permiten razonablemente aceptar que los eventos A y B son estadísticamente independientes.

a. ¿Cuál es el evento 𝐴𝑐? ¿Cuál es el valor de su probabilidad?

b. ¿Cuál es el evento 𝐴 ∩ 𝐴𝑐? ¿Cuál es su probabilidad?

c. ¿Cuál es el evento 𝐴 ∪ 𝐴𝑐? ¿Cuál es su probabilidad?

d. ¿A qué intersección corresponde el evento “de ambos bolilleros sale una bolilla roja”? ¿Cuál es su

probabilidad?

e. ¿Cuál es el evento 𝐴𝑐 ∩ 𝐵? ¿Cuál es su probabilidad?

f. ¿A qué intersección corresponde el evento “del primer bolillero sale una bolilla roja y del segundo sale

una bolilla blanca”? ¿Cuál es su probabilidad?

g. ¿A qué unión de eventos corresponde el evento “de un bolillero sale una bolilla blanca y del otro una

bolilla roja? ¿Cuál es su probabilidad?

h. ¿Cuál es el evento (𝐴 ∪ 𝐵)𝑐? ¿Cuál es su probabilidad?

2.7 En un bosque subtropical, la probabilidad de que un árbol cualquiera sea derribado por una

tormenta muy fuerte (velocidad del viento >150km /h) es de 0,75 si está colonizado por lianas que agregan

peso y volumen a su copa y de 0,30 si está libre de lianas. Además, la probabilidad de que un árbol a tomar

al azar de este bosque esté colonizado por lianas es de 0,40.

a. ¿Cuánto vale la probabilidad de que un árbol a tomar al azar de este bosque esté colonizado por lianas

y además sea derribado por una tormenta fuerte? ¿Se trata de una probabilidad conjunta o condicional?

b. ¿Cuánto vale la probabilidad de que un árbol a tomar al azar de este bosque sea derribado por una

tormenta fuerte?

Page 14: Experimento aleatorio · 2020. 3. 24. · PROBABILIDAD Experimento aleatorio Si agitamos un dado dentro de un cubilete, lo arrojamos sobre una mesa y registramos qué cara queda hacia

14

c. ¿Cómo se interpretan los valores calculados en los ítems a y b en términos del criterio presentado en

la ecuación 2.9?

d. ¿La caída de un árbol de este bosque por acción una tormenta fuerte es estadísticamente independiente

de la presencia de lianas en su copa? Justificar la respuesta con un cálculo apropiado y discutir su

interpretación.

2.8 Consideremos un árbol cuyas semillas caen todas bajo su copa. Estas semillas tienen una

probabilidad de morir por acción de organismos patógenos o depredadores igual a 0,6, una probabilidad de

ser enterradas y germinar in situ igual a 0,1 y una probabilidad de ser transportadas por animales a sitios

alejados del árbol igual a 0,3. Si llegan a los sitios alejados, las semillas tienen una probabilidad igual a 0,4

de ser enterradas y germinar.

a. ¿Cuánto vale la probabilidad de que una semilla de este árbol a tomar al azar no sea transportada a un

sitio alejado del mismo?

b. ¿Cuánto vale la probabilidad de que una semilla de este árbol a tomar al azar germine en un sitio

alejado del mismo? ¿y en un sitio ubicado bajo la copa del árbol?

c. ¿Cuánto vale la probabilidad de que una semilla de este árbol a tomar al azar llegue a germinar? ¿Cómo

se interpreta este valor en términos del criterio presentado en la ecuación 2.9?

d. ¿Cuánto vale la probabilidad de que entre dos semillas de este árbol a tomar al azar ambas lleguen a

germinar?

e. ¿Cuánto vale la probabilidad de que entre dos semillas de este árbol a tomar al azar la primera llegue

a germinar y la segunda no?

f. ¿Cuánto vale la probabilidad de que entre dos semillas de este árbol a tomar al azar una cualquiera de

las dos llegue a germinar y otra no?

g. ¿Cuánto vale la probabilidad de que entre tres semillas de este árbol a tomar al azar una cualquiera

llegue a germinar y dos no? ¿Cómo se interpreta este valor en términos del criterio presentado en la

ecuación 2.9?

2.9 En un censo rural realizado en 2010 en el distrito de Tiacalín se registró la superficie de tierra y la

forma de gestión de cada establecimiento. Con esta información se clasificaron todos los establecimientos

en tres categorías de superficie (<50 ha, 50 a 500 ha y ≥500 ha) y en tres modelos de gestión (explotación

directa por el propietario, explotación mediante contratos anuales de siembra y arrendamiento por más de

3 años). Las frecuencias relativas encontradas de cada clase de establecimiento son las que se presentan en

la siguiente tabla de doble entrada.

Frecuencias relativas de establecimientos rurales clasificados por superficie y modelo de gestión en el distrito

de Tiacalín (Censo rural 2010).

Superficie

<50 ha 50 -500 ha ≥500 ha

Gestión

Propietario 0,04 0,29 0,07 0,40

Contrato anual 0,13 0,27 0,02 0,42

Arrendamiento 0,01 0,14 0,03 0,18

0,18 0,70 0,12 1,00

Con el propósito de evaluar los posibles cambios recientes en la distribución de los establecimientos del

distrito entre estas clases de superficie y modelo de gestión, un ingeniero agrónomo obtendrá una muestra

aleatoria de establecimientos del distrito y registrará la superficie de tierra y la forma de gestión de cada

establecimiento a elegir al azar.

Si cuando el ingeniero obtenga la muestra las frecuencias relativas de establecimientos en diferentes clases

de superficie y modelo de gestión son iguales a las registradas en 2010:

a. ¿Cuánto vale la probabilidad de que un establecimiento a elegir al azar sea gestionado directamente

por el propietario?

b. ¿Cuánto vale la probabilidad de que un establecimiento a elegir al azar tenga una superficie ≥500 ha

y <50 ha?

Page 15: Experimento aleatorio · 2020. 3. 24. · PROBABILIDAD Experimento aleatorio Si agitamos un dado dentro de un cubilete, lo arrojamos sobre una mesa y registramos qué cara queda hacia

15

c. ¿Cuánto vale la probabilidad de que un establecimiento a elegir al azar tenga una superficie <50 ha si

es <500ha?

d. ¿Cuánto vale la probabilidad de que un establecimiento a elegir al azar tenga una superficie <50 ha y

sea gestionado directamente por el propietario?

e. ¿El evento “el establecimiento tiene una superficie <50 ha” es estadísticamente independiente del

evento “el establecimiento es gestionado directamente por el propietario? Justificar con un cálculo

apropiado e interpretar en términos de las frecuencias relativas de diferentes clases de establecimiento

en el distrito.

f. ¿Cuánto vale la probabilidad de que un establecimiento a elegir al azar tenga una superficie ≥50 ha y

sea gestionado mediante contratos anuales de siembra?

g. ¿Cuánto vale la probabilidad de que un establecimiento a elegir al azar sea gestionado mediante

contratos anuales de siembra si tiene una superficie ≥50 ha?

h. ¿El evento “el establecimiento tiene una superficie ≥50 ha” es estadísticamente independiente del

evento “el establecimiento es gestionado mediante contratos anuales de siembra”? Justificar con un

cálculo apropiado e interpretar en términos de las frecuencias relativas de diferentes clases de

establecimiento en el distrito.

2.10 Muchas malezas de los lotes agrícolas provienen de semillas enterradas en el suelo antes de la

siembra del cultivo. En el suelo, las semillas vivas pueden encontrarse en dos estados fisiológicos,

“despiertas”, si germinan cuando la temperatura y la humedad son apropiadas, o “dormidas” si no germinan

a menos que reciban algún estímulo específico como luz o frio. Para analizar la infestación con la maleza

Commelina erecta L. en un lote agrícola del distrito de Tiacalín, una investigadora tomó una muestra

aleatoria de 2000 semillas y las clasificó según su estado fisiológico y la profundidad a la que estaban

enterradas. Llamaremos A al evento “una semilla de Commelina erecta L. tomada al azar de este lote está

despierta” y B al evento “una semilla tomada al azar de Commelina erecta L. de este lote está a una

profundidad < 2cm”.

a. Identificar la población de referencia, las unidades muestrales y las variables de interés.

Entre las 2000 semillas de la muestra, la investigadora encontró 1739 semillas a menos de 2 cm de

profundidad, entre las cuales 1165 estaban despiertas. Además encontró 89 semillas despiertas enterradas

a profundidad ≥ 2 cm. A partir de esta información:

b. ¿Qué valor corresponde asignar a la probabilidad de que una semilla de Commelina erecta L. a tomar

al azar de este lote agrícola esté enterrada a menos de 2 cm de profundidad?

c. ¿Qué valor corresponde asignar a la probabilidad de que una semilla de Commelina erecta L. a tomar

al azar de este lote agrícola esté despierta?

d. ¿Qué valor corresponde asignar a la probabilidad condicional de que una semilla de Commelina erecta

L. a tomar al azar de este lote agrícola esté despierta si está enterrada a una profundidad ≥ 2cm?

e. A partir de los resultados obtenidos en b, c y d, utilizar la Regla de Bayes para asignar el valor a la

probabilidad condicional de que una semilla de Commelina erecta L. a tomar al azar de este lote

agrícola esté enterrada a una profundidad ≥ 2cm si está despierta. Comprobar que el valor obtenido

coincide con el cociente

𝑃[𝐴 ∩ 𝐵𝑐]

𝑃[𝐴]

f. ¿Cuál es el evento 𝐴𝑐 ∪ 𝐵𝑐?

g. ¿Qué valor corresponde asignar a 𝑃[𝐴𝑐 ∪ 𝐵𝑐]?

h. Si el estado fisiológico y la profundidad en el suelo de una semilla de Commelina erecta L. a tomar al

azar de este lote agrícola fuesen estadísticamente independientes, ¿cuál sería el valor de la probabilidad

de que una semilla de Commelina erecta L. a tomar al azar de este lote estuviera enterrada a menos de

2 cm de profundidad y además esté despierta?

i. Comparar las respuestas a los ítems g y h. ¿Qué indica el resultado de esta comparación?