Estadistica I 2

126
ESTADISTICA DESCRIPTIVA RELACIONES ENTRE VARIABLES, Bolilla 8 : Ajustamiento no lineal 1. Aplicaciones en el campo de la Teoría Económica. En una alta proporción de las investigaciones que se realizan referentes a la relación entre dos variables, los correspondientes diagramas de dispersión demuestran que esas relaciones no responden a una forma lineal sino que los puntos observados muestran relaciones claramente no lineales. Así ocurre en varias ramas científicas, como la física, la biología, la química, etc. En la economía esta circunstancia también es común, y eso puede verse en los casos de las funciones de demanda, de oferta o de productividad. En los gráficos siguientes se muestran dos diagramas de dispersión con puntos que provienen de datos empíricos, a través de los cuales se descubre que las dos variables bajo estudio tienen una dependencia estadística claramente no lineal. GRAFICO Nº 1 - DEPENDENCIA ESTADISTICA NO LINEAL Eso significa que, en esos casos, un ajuste lineal es poco apropiado, y que corresponde aplicar algún procedimiento que permita encontrar aquella función no lineal que sea adecuada para explicar, de la mejor forma posible, la forma de relación entre las dos variables consideradas. 2. Presentación de los diferentes casos: Algunos de los procedimientos que permiten encontrar funciones no lineales se presentan en el cuadro siguiente: Caso Nombre Forma de la Función Método de trabajo A Parabóli co (cuadrát ico) Se aplica el método de Gauss

description

estadistica

Transcript of Estadistica I 2

Page 1: Estadistica I 2

ESTADISTICA DESCRIPTIVA RELACIONES ENTRE VARIABLES,

Bolilla 8 : Ajustamiento no lineal

1. Aplicaciones en el campo de la Teoría Económica.

En una alta proporción de las investigaciones que se realizan referentes a la relación entre dos variables, los correspondientes diagramas de dispersión demuestran que esas relaciones no responden a una forma lineal sino que los puntos observados muestran relaciones claramente no lineales. Así ocurre en varias ramas científicas, como la física, la biología, la química, etc. En la economía esta circunstancia también es común, y eso puede verse en los casos de las funciones de demanda, de oferta o de productividad.

En los gráficos siguientes se muestran dos diagramas de dispersión con puntos que provienen de datos empíricos, a través de los cuales se descubre que las dos variables bajo estudio tienen una dependencia estadística claramente no lineal.

GRAFICO Nº 1 - DEPENDENCIA ESTADISTICA NO LINEAL

Eso significa que, en esos casos, un ajuste lineal es poco apropiado, y que corresponde aplicar algún procedimiento que permita encontrar aquella función no lineal que sea adecuada para explicar, de la mejor forma posible, la forma de relación entre las dos variables consideradas.

2. Presentación de los diferentes casos:

Algunos de los procedimientos que permiten encontrar funciones no lineales se presentan en el cuadro siguiente:

Caso Nombre Forma de la Función Método de trabajoA Parabólico

(cuadrático) Se aplica el método de Gauss

B Exponencial Se aplica una linealización

c Potencial Se aplica una linealización

D Logarítmico Se aplica una linealización

a) Caso parabólico: La función que se utiliza en el ajustamiento parabólico, según lo indicado en el cuadro precedente, tiene la expresión

en la cual los parámetros a calcular son a, b y c. Para encontrar sus fórmulas de cálculo se aplica el método de los mínimos cuadrados de Gauss ya utilizado en el caso del ajustamiento lineal; en el que se minimiza una función igual

Page 2: Estadistica I 2

a la suma de los desvíos al cuadrado entre los puntos empíricos y la función parabólica propiamente dicha, es

decir .

Siguiendo similar metodología, se obtienen las siguientes tres ecuaciones normales de Gauss:

cuya solución permite encontrar el valor numérico de los parámetros y construir la función parabólica que permitirá efectuar el ajuste. Gráficamente, el correspondiente diagrama de dispersión tiene la forma que se muestra más abajo:

GRAFICO Nº 2 - CASO PARABOLICO

Como ya se mencionó, los parámetros a, b y c constituyen las incógnitas del sistema de ecuaciones normales indicado más arriba, y la solución del sistema permite encontrar los valores de los tres. Para ello es conveniente construir un diagrama de cálculos como el que sigue con el que se pueden calcular aquellos parámetros:

Xi Yi Xi2 Xi

3 Xi4 Yi Xi Yi Xi

2

X1 Y1 X12 X1

3 X14 Y1 X1 Y1 X1

2

X2 Y2 X22 X2

3 X24 Y2 X2 Y2 X2

2

Xn Yn Xn2 Xn

3 Xn4 Yn Xn Yn Xn

2

... … … … ... ... …

Si los datos de la serie a estudiar se refieren a momentos del tiempo (años, meses, días) y entre esos momentos existe equidistancia, es decir que la diferencia entre dos momentos adyacentes es constante, para calcular de una manera más rápida y sencilla el valor de los parámetros de la función parabólica se aplica el siguiente procedimiento:

Se reemplazan los diferentes momentos del tiempo por una variable natural (denominada así porque está conformada por los números naturales a partir del uno) simbolizada por Xi, asignando el valor 1 al primer momento del tiempo, el valor dos al segundo, y así sucesivamente.

Se calcula la media de la nueva variable natural Xi.

Se transforma la variable natural Xi en una nueva variable xi mediante el uso de la variable centrada . De ese modo convierte a la función parabólica en una función expresada en xi que tiene

la siguiente fórmula: . Los parámetros a’, b’ y c’ aparecen para prevenir las

posibles diferencias que pueden presentarse con los parámetros originales a, b y c, como consecuencia de la transformación de variables aplicada.

Page 3: Estadistica I 2

Si todos los pasos previos se han cumplido adecuadamente, la variable xi resultante deberá cumplir con las siguientes propiedades fundamentales:

y (*)

Realizados los pasos indicados, el conjunto original de pares de datos de la forma (Xi ; Yi) quedará convertido en un nuevo conjunto de pares de la forma (xi ; Yi). Ahora bien, si a ese nuevo conjunto de pares de datos se le aplicara el procedimiento de los mínimos cuadrados de Gauss entonces las ecuaciones normales quedarían expresadas como

En esta nueva versión de las ecuaciones normales, se observará que hay términos que se anulan porque cumplen una de las dos condiciones indicadas precedentemente con (*). A partir de estas expresiones se pueden obtener los parámetros de la función parabólica del siguiente modo:

- de la segunda ecuación normal se despeja b´:

- con las dos ecuaciones normales restantes se construye un sistema de ecuaciones lineales con dos incógnitas a’ y c’ que se calculan resolviendo las siguientes expresiones:

La siguiente tabla muestra el diagrama que se requiere para concretar los cálculos requeridos por las fórmulas:

Xi Yi xi xi2 xi

4 Yi xi Yi xi2

X1 Y1 X1 x12 x1

4 Y1 x1 Y1 x12

X2 Y2 X2 x22 x2

4 Y2 x2 Y2 x22

... ... ... ... ... ... ...Xn Yn xn xn

2 xn4 Yn xn Yn xn

2

Al igual que en el caso del Ajustamiento lineal (ver Método abreviado en las páginas 62/63), las consecuencias de la conversión de la variable Xi en una variable centrada xi son fundamentalmente gráficas, porque lo que produce esa conversión es un corrimiento de los puntos empíricos hacia la izquierda (o del eje de las ordenadas hacia la derecha) que sólo modifica el valor del parámetro a. Si bien en el Método abreviado del Ajustamiento lineal se obtiene el verdadero valor del parámetro a partiendo del parámetro a', en el procedimiento aplicado en el método parabólico eso no resulta necesario. Esto es así en tanto se tome en cuenta que todos los cálculos que se vayan a

Page 4: Estadistica I 2

realizar para obtener valores estimados con la función parabólica, deben efectuarse con los valores de la variable centrada xi. El siguiente ejemplo permitirá aplicar el método abreviado de la función parabólica en un caso concreto y efectuar las estimaciones en las condiciones indicadas en los párrafos anteriores, con los momentos de tiempo equidistantes entre sí.

Ejemplo: La siguiente es una serie de datos referida a la población de la provincia del Chaco al final de cada período decenal. Ajustar mediante la función parabólica y estimar la población para el año 2.000.

Años Población(miles)

Variable natural

Variablecentrada

xi2 xi

4 Yi xi Yi xi2

Xi xi

1.950 490 1 -2 4 16 -980 1.960 495,51.960 540 2 -1 1 1 -540 540 522,71.970 570 3 0 0 0 0 0 588,41.980 700 4 1 1 1 700 700 692,71.990 835 5 2 4 16 1.670 3.340 835,6

3135 15 0 10 34 850 6.540

Los cálculos para obtener los parámetros se presentan a continuación:

Por consiguiente .

La estimación para el año 2.000 se efectúa convirtiendo, en primer lugar; ese dato en el valor de la variable natural Xi correspondiente, y luego transformándola en un valor de la variable centrada xi. Como para el año 2.000, Xi

= 6, a ese valor le corresponde un valor de xi = 3 (que se obtiene restando al valor de Xi el valor de la media , que en este caso es 3). Por consiguiente

Como puede verse en el ejemplo, no es necesario modificar el valor de los parámetros obtenidos si se utiliza la variable transformada xi para realizar los cálculos de las estimaciones.

El gráfico Nº 3 muestra el diagrama de dispersión correspondiente, en el cual el eje de las ordenadas aparece en dos posiciones diferentes: una, en su posición original, y otra corrido hacia la derecha, coincidiendo su ubicación con el valor de la variable centrada xi = 0. Muestra, además, el trazado de la curva parabólica encontrada.

Page 5: Estadistica I 2

b) Caso exponencial: La función que se utiliza en este método tiene la expresión

en la cual se verifica que la variable Xi forma parte del exponente.

Gráficamente, la función exponencial se aplica cuando los puntos del diagrama de dispersión tienen un aspecto similar a los siguientes (obsérvese la diferencia según el signo de ).

GRAFICO Nº 3 - CASOS EXPONENCIALES

Los parámetros y se calculan efectuando un proceso previo de rectificación de la función. Para ello se aplica logaritmación natural a la expresión de la función indicada, lo cual permite obtener

Como ln.e = 1, queda

Si en esta última igualdad se reemplazan sus términos del siguiente modo

ln. Yi = yi

ln = a

= b

Xi = xi

Page 6: Estadistica I 2

se obtiene una función lineal de la forma (en la cual debemos aclarar que xi e yi no son las variables que fueran utilizadas en el método abreviado de cálculo del ajustamiento lineal).

Los parámetros a y b de esta última función lineal, pueden ser calculados mediante las fórmulas deducidas en el Ajustamiento lineal, es decir que

y que

El diagrama que se requiere para realizar los cálculos destinados a obtener los valores según las fórmulas precedentes, es el siguiente:

Xi = xi Yi yi = ln Yi xi yi xi2

X1 = x1 Y1 y1 = ln Y1 x1 y1 X12

X2 = x2 Y2 y2 = ln Y2 x2 y2 x22

... ... ... ... ...Xn = xn Yn yn = ln Yn xn yn xn

2

-

Una vez calculados los valores de los parámetros a y b, y recordando cómo se efectuaron las transformaciones de a en y de b en , se pueden obtener los verdaderos parámetros y, de la función exponencial haciendo

= anti In. a

= b

Ejemplo: Un empresario calcula el costo medio de producción de un artículo y obtiene los datos que se observan en la siguiente tabla. Ajustar el costo en función del número de productos elaborados. Estimar el costo medio si la producción fuera de 20 unidades.

Nº deproductos

Costomedio

yi =In Yi xi yi xi2

Xi = xi Yi

1 1000 6,9078 6,9078 1 558 2 500 6,2146 12,4292 4 443 3 250 5,5215 16,5645 9 352 5 140 4,9416 24,708 25 22210 60 4,0943 40,943 100 7015 30 3,4012 51,018 225 2236 - 31,081 152,705 364

Page 7: Estadistica I 2

= anti In. 6,555 = 702,83

= -0,23

Estimación para Xi = 20:

Una conclusión que se obtiene a partir de los resultados obtenidos, en especial en cuanto al diagrama de dispersión y al trazado de la curva obtenida, es que en este ejemplo el ajuste no resulta apropiado porque las diferencias entre los puntos empíricos y la función son bastante importantes.

c) Caso potencial: En este método la función que se utiliza tiene la expresión

en la cual se observa que la variable Xi es la base de una potencia.

Los parámetros de la función potencial, y , pueden calcularse aplicando un proceso de logaritmación similar al utilizado en el caso del método exponencial, haciendo

En esta última expresión se efectúa el siguiente reemplazo:

ln. Yi = yi

ln = a

= b

ln. Xi = xi

Page 8: Estadistica I 2

de modo que la expresión puede ser escrita como (aclarando que tanto xi como yi no son las variables utilizadas en el método abreviado de cálculo del ajustamiento lineal). Ahora, los parámetros a y b se pueden obtener aplicando las fórmulas deducidas oportunamente a partir del procedimiento de los mínimos cuadrados de Gauss, es decir que

y que

Conviene aplicar el caso potencial cuando el diagrama de dispersión presenta un formato como el siguiente, teniendo presente que las diferencias entre el gráfico de la derecha y el de la izquierda se debe al signo que puede adoptar el parámetro .

GRAFICO Nº 4 - CASOS POTENCIALES

Finalmente, se construye un diagrama como el siguiente

Xi Yi xi = ln Yi yi = ln Yi yi xi xi2

X1 Y1 X1 = ln Y1 y1 = ln Y1 y1 x1 x12

X2 Y2 X2 = ln Y2 y2 = ln Y2 y2 x2 x22

... ... ... ... ... ...Xn Yn xn = ln Yn yn = ln Yn yn xn xn

2

- -

con el cual se calculan a y b. Teniendo presente cuáles fueron las transformaciones efectuadas originalmente, los verdaderos parámetros y de la función potencial se obtienen haciendo = anti ln. a y = b.

Ejemplo: Se aplicará el método potencial al problema del costo medio de producción de un artículo que fuera ajustado anteriormente por el método exponencial. Se solicita estimar el costo medio para un número de productos igual a 20.

Más abajo se presenta el gráfico que permite mostrar el diagrama de dispersión y la función calculada.

Nº deproductos

Costomedio

xi = ln.Xi yi = ln. Yi xi yi xi2

Xi Yi

Page 9: Estadistica I 2

1 1.000 0 6,9078 0 0 1.086 2 500 0,6931 6,2146 4,3073 0,4804 444 3 250 1,0986 5,5215 6,0659 1,2069 263 5 140 1,6094 4,9416 7,9530 2,5902 13610 60 2,3026 4,0943 9,4275 5,3020 5615 30 2,7081 3,4012 9,2108 7,3338 33- - 8,4118 31,081 36,9645 16,9133

= antí ln .6,99 = 1085,72

= - 1,291

Estimación para Xi = 20:

Observando en el gráfico tanto los valores estimados como el trazado de la función se ve que, en este problema, el ajustamiento con la función potencial es más adecuado que el ajustamiento con la función exponencial.

Por otro lado se puede enunciar una conclusión respecto de la comparación entre los dos métodos, exponencial y potencial, que se aplican en el caso de diagramas de dispersión muy semejantes: el método potencial crece (o decrece) mucho más rápidamente que el método exponencial para valores crecientes de la variable Xi.

d) Caso logarítmico: Este procedimiento de ajustamiento no lineal se aplica cuando el diagrama de dispersión presenta los puntos con un recorrido similar al del gráfico siguiente.

Un ejemplo práctico apropiado para aplicar un ajustamiento mediante este procedimiento, es el de la productividad, ya que tiene una forma similar al del gráfico precedente, y la función indicada para ese ajustamiento no lineal es, precisamente, la logarítmica, cuya expresión funcional es

El método logarítmico resulta una aplicación del tema “Caso inverso” desarrollado en el punto 4 de la Unidad 7- Teoría del Ajustamiento, en el que aparecía la posibilidad de encontrar una recta de ajustamiento Xi que oportunamente fuera llamada “recta reflejo”. En este caso, teniendo presente que la función logarítmica es inversa de

Page 10: Estadistica I 2

la exponencial, la logarítmica también puede pensarse como una exponencial del tipo , porque si en esta

última igualdad aplicamos logaritmos, obtendremos In. Xi = Yi ln. e = Yi (recordando que ln. e = 1). Es decir que la expresión exponencial resulta ser inversa a la logarítmica Yi = In. Xi.

GRAFICO Nº 5 - CASO LOGARITMICO

Si ahora construimos una función exponencial e incluimos en ella un par de parámetros y , obtendremos una exponencial (a la que llamaremos exponencial completa). Siguiendo con el procedimiento indicado,

aplicamos en ella logaritmos y obtenemos ln. Xi = In. + Yi ln.e = ln. + Yi .

Con un reemplazo de términos similar al realizado en el método exponencial (ver en este mismo fascículo, página 81), y recordando que simbolizamos los parámetros del caso inverso con a2 y b2, hacemos

ln. Xi = xi

ln = a2

= b2

Yi = yi

y vamos a obtener la ecuación de la recta en la cual es posible calcular los parámetros a2 y b2 mediante las fórmulas deducidas por el método de los mínimos cuadrados de Gauss, es decir que

y que

valores con los cuales se puede construir la función logarítmica completa, para lo cual se despeja la variable yi en la

expresión obteniéndose , lo que en definitiva, recordando las transformaciones efectuadas

anteriormente, resulta igual a

que puede calcularse sin inconvenientes ya que se conocen los todos los valores intervinientes.

El resultado es una expresión funcional cuya gráfica sigue el movimiento logarítmico.

Ejemplo: Una empresa posee sucursales de diferente tamaño. Al tomar datos respecto de la productividad en esas sucursales obtiene el siguiente cuadro.

Page 11: Estadistica I 2

N" deempleados

Productividad xi = ln. Xi xi yi yi2

Xi Yi = yi

10 10 2,30258 23,026 100 15,8 30 70 3,40119 238,083 4.900 57,7 60 90 4,09434 368,491 8.100 84,1100 100 4,60517 460,517 10.000 103,6150 110 5,01063 551,169 12.100 119,0

380 19,41391 1641,286 35.200

Ajustar la productividad en función del número de empleados y estimar cuál sería la productividad en una sucursal con 50 empleados.

Los parámetros se calculan haciendo

Estimación para Xi = 50:

Calidad del ajustamiento no lineal:

Cuando se desarrolló el tema Ajustamiento Lineal se mencionó la existencia de un coeficiente r denominado de correlación lineal, que permite medir el grado de relación lineal entre las variables involucradas en cualquier estudio de esa naturaleza que se lleve a cabo.

Para los casos de Ajustamiento no Lineal la teoría no suministra coeficiente alguno que permita medir su calidad, ya que el coeficiente r, como se indicó, sólo mide la de un ajustamiento lineal. Esto significa que cuando un investigador calcula una función no lineal para aplicar en un caso de ajustamiento, debe necesariamente:

a) verificar visualmente, en el diagrama de dispersión correspondiente, si la relación que existe entre la función trazada y los puntos empíricos, es buena. En caso contrario, podrá optar, eventualmente, por alguna función cuyo trazado responda mejor a la dispersión que presentan los puntos.

Page 12: Estadistica I 2

b) utilizar el coeficiente de correlación lineal r para medir la calidad del ajustamiento de la función rectificada, aprovechando los cuadros construidos según el diagrama de cálculos propuesto en cada caso.

c) aplicar la fórmula sugerida por algunos autores, utilizada cuando se utilizan métodos de ajustamiento lineal y estimación diferentes del de mínimos cuadrados, que tiene la siguiente expresión:

Deberá tomar en consideración que, en ese caso, - R2 < +1.

Lo indicado previamente se confirma aún más cuando se verifica que, en un alto porcentaje de ocasiones, a pesar de que los puntos del diagrama tienen una dispersión no lineal, el cálculo del coeficiente de correlación arroja un resultado muy cercano a la unidad. Sin embargo, la observación de los puntos del diagrama muestran, con bastante claridad, que el ajuste más apropiado en esos casos es el no lineal, y que un ajuste lineal puede conducir a la obtención de estimaciones sumamente sesgadas.

ESTADISTICA DESCRIPTIVA RELACIONES ENTRE VARIABLES,

Bolilla 9 : Análisis de series de tiempo y pronostico de negocios

1. Concepto y aplicaciones

Concepto: ¿Qué es una serie?. Es un conjunto de cosas relacionadas entre si y que se suceden unas a otras.

Page 13: Estadistica I 2

En matemáticas se considera serie al conjunto sucesivo, generalmente finito, de términos derivados unos de otros, según una norma determinada y también su suma.

En estadísticas se define serie a un conjunto de valores estadísticos observados, tales como datos de producción o ventas, obtenidos de la medida de una variable en un grupo, que pude ser una población o su muestra, o de operaciones estadísticas, ordenadas secuencialmente de periodos de tiempo. Dentro de las series estadísticas tenemos la serie de tiempo, objeto de nuestro estudio que se define como “Serie estadística formada por un conjunto de valores obtenidos de observaciones, referentes al mismo fenómeno, realizadas en una sucesión de momentos de tiempo, normalmente a intervalos iguales.

Aplicaciones: Tanto en la administración de empresas, como en los campos macroeconómicos o social, se plantea el problema de la toma de decisiones, es decir, la elección de una opción entre diversas alternativas. El problema que enfrenta el decisor es elegir aquella, alternativa que tenga mayor utilidad para alcanzar el objetivo deseado, que se halla situado en el futuro.

Por ejemplo, el gobierno debe ser capaz de predecir cuestiones como el desempleo, la inflación, la producción industrial y los ingresos por impuestos provenientes de personas físicas y jurídicas, con el fin de formular sus políticas; el departamento de comercialización de una empresa grande que vende productos al menudeo debe ser capaz de predecir la demanda de los productos, los ingresos por ventas, las preferencias de los consumidores, el inventario, etc. Para estas y otras cuestiones recurre a técnicas de predicción (pronostico)

O sea que con las técnicas de predicción se trata de hacer pronósticos los más acertados posibles sobre sucesos que todavía no han tenido lugar.

Existen dos planteamientos para la predicción:

Cualitativa : generalmente se la emplea cuando no existen datos históricos, como por ejemplo: “El departamento de comercialización desea predecir las ventas de un producto nuevo”.

Cuantitativa : generalmente se la emplea, cuando se hace uso de datos históricos. El objetivo es extraer toda la información posible contenida en los datos, y en la base al patron de conducta seguida en el pasado, hacer conjeturas (opiniones basadas en probabilidades) sobre el futuro. En este ultimo se encuentran las series temporales.

2. Movimientos característicos de la serie de tiempo:

En el siguiente cuadro vemos la clasificación de los movimientos, sus características, los factores que influyen en los datos de series de tiempo y su duración.

Clasificación de los movimientos

Característica Definición Razón de influencia Duración

Tendencia Sistemático Patrón de movimientos general o persistente, ascendente o descendente, a largo plazo

Debida a cambios en tecnología, habitantes, riqueza, costo valores

Varios años

Page 14: Estadistica I 2

Estacional Sistemático Fluctuaciones periódicas bastante regulares que ocurren dentro de cada periodo de 12 meses, año tras año

Debida a condiciones del clima, costumbres sociales, costumbres religiosas

Dentro de 12 meses (para datos mensuales)

Cíclica Sistemático Oscilaciones o movimientos ascendentes y descendentes repetidos que pasan por cuatro fases: de cúspide (prosperidad), a contracción (recesión), luego hasta un valle (depresión), a expansión (recuperación o crecimiento)

Debida a interaccionesde numerosas combinaciones de factores que influyen en la economía

Por lo general de 2 a 10 años, con intensidad diferente para un ciclo completo.

Irregular o aleatoria No sistemático Las fluctuaciones erráticas o “residuales” en una serie de tiempo, que existen después de tomar en cuenta los efectos sistemáticos: tendencia, estacionalidad y cíclicos.

Debida a variaciones aleatorias en los datos ó debidas a fuerzas mayores como huelgas, huracanes, inundaciones, asesinatos políticos, etc.

Corta duración y no repetitivo.

El modelo multiplicativo clásico de las series de tiempo

Hasta este momento hemos mencionado que existen tres o cuatro factores componentes, respectivamente, que influyen en una serie de tiempo económica o de negocios. Esto se resumen en el cuadro precedente. El modelo multiplicativo de las series clásico de series temporales establece que cualquier valor observado en una serie de tiempo es el producto de los factores de influencia; esto es, cuando los factores se obtienen anualmente, una observación Yi registrada en el año i puede expresarse como

en la que, en el año i,

Ti = valor del componente de tendencia

Ci = valor del componente cíclico

Ii = valor del componente irregular

Por otra parte, cuando los datos se obtienen de manera trimestral o mensual, una observación Yi registrada en el periodo i puede estar dada como

Page 15: Estadistica I 2

en la que, en el periodo i, Ti, Ci, e Ii son los valores de los componentes de tendencia, cíclico e irregular, respectivamente, y Si es el valor del componente estacional.

El primer paso de un análisis de series de tiempo consiste en graficar los datos y observar sus tendencias a través del tiempo. Primero debemos determinar si parece haber un movimiento a largo plazo hacia arriba o hacia abajo en la serie (es decir, una tendencia) o si la serie parece oscilar alrededor de una línea horizontal, a través del tiempo. Si este último parece ser el caso (esto, es no existe un movimiento a largo plazo hacia arriba o hacia abajo), entonces debe emplearse el método de promedios móviles o el de suavizado exponencial, para suavizar la serie y proporcionarnos una impresión global a largo plazo. Por otro lado si en realidad se encuentra presente una tendencia, se puede considerar una variedad de métodos de predicción de series temporales, cuando se trata de datos anuales.

3. Análisis de los componentes: obtención de los componentes.

Análisis de series de tiempo: Consiste en una descripción, generalmente matemática, de los movimientos que la componen. Se realiza para detectar patrones de cambio en la información estadística durante intervalos regulares de tiempo, proyectarlos para obtener una estimación sobre el futuro.

En consecuencia, el análisis de series de tiempo nos ayuda a tener una visión estimada del futuro.

La suposición básica fundamental en el análisis de las series de tiempo es que los factores que han influido en el pasado y en el presente en los patrones de la actividad económica continuaran haciéndolo mas o menos en la misma forma en el futuro. Por tanto, los objetivos principales del análisis de las series de tiempo es aislar los factores influyentes para fines de predicción (pronósticos), así como la planeación o control por parte de los administradores.

Análisis de los componentes:

Para analizar los movimientos o componentes de una serie de tiempo, hay que estimar cada uno de ellos.

a) Tendencia: para estimarla existen los siguientes métodos:

Mano alzada: consiste en ajustar una recta o curva de tendencia mediante la simple observación del gráfico (“a pulso”) Tiene el inconveniente de depender en gran parte del criterio del investigador.

Movimientos medios: es una sucesión de medidas aritméticas. Mediante ellos, de orden apropiados, pueden eliminarse los movimientos cíclicos, estaciónales o irregulares, quedando solamente el movimiento de tendencia.

Un Inconveniente de este método es que los datos del principio y final de la serie se pierden. Otro inconveniente es que se pueden originar cielos u otros movimientos que no tenían los datos originales (ver pag. 71).

Semimedidas: consiste en agrupar los datos en dos partes iguales y mediar los datos obteniéndose dos puntos y luego los valores de tendencia, pudiéndose determinar estos sin necesidad de un gráfico. Solo se aplica en caso de tendencia lineal.

Mínimos cuadrados: se calcula la recta de los mismos cuadrados y mediante ella se puede establecer la tendencia.

b) Estacionalidad : para determinar el factor estacional se debe estimar como varían los datos de la serie a lo largo de un año (por lo tanto los datos tiene que ser mensuales, bimestrales, trimestrales o cuatrimestrales)

Estimaciones de las variaciones estaciónales. Índice estacional: Para determinar el factor estacional, se debe estimar como varían los datos en la serie de un tiempo a otro, a lo largo de un año característico. Para ello se utiliza el índice estacional que muestra los valores relativos a lo largo de un año. Su promedio tiene que ser del 100%. Hay varios métodos para determinarlos:

1) Método del porcentaje medio: en este método los datos de cada periodo (mensual, bimestral, trimestral o cuatrimestral) se expresa como porcentaje de la media anual. Luego los porcentajes de los

Page 16: Estadistica I 2

periodos que se corresponden en los diferentes años son entonces promediados mediante su media o mediana. El promedio de los índices obtenidos deber ser 100%, si no se ajusta.

2) Método del porcentaje de tendencia o razón de tendencia: en este método los datos de cada periodo se expresan como porcentajes de los valores de tendencia. Una adecuada media de los porcentajes para, los períodos correspondientes a el índice buscado. Su promedio debe ser igual al 100%.

3) Método del porcentaje del movimiento medio o razón del movimiento medio : se determina a el valor relativo con cada dato original con respecto a un movimiento medio que debe ser impar para hacer mas sencillos los cálculos. Luego se extrae la media o mediana (esta se emplea cuando hay valores extremos) de los períodos semejantes de cada año. El promedio de los índices obtenidos debe ser igual a 100%.

4) Método de los enlaces relativos : este modo se llama así porque se calcula el porcentaje del dato de un periodo con relación al anterior. Luego se toma una media adecuada para los periodos correspondientes. Los resultados se ajustan haciendo enero igual a 100 y los demás se ajustan haciendo relativos en cadena. Se obtiene un segundo valor de enero haciendo la relación entre diciembre obtenido y el valor original de enero obtenido al promediar. El incremento superior a 100 se resta proporcionalmente a cada mes desde diciembre hacia febrero. Los índices obtenidos deben tener promedio igual a 100.

Desestacinalización de los datos: los datos desestacionalizados se obtiene dividiendo los datos originales por los índices estaciónales calculados conforme a algunos de los métodos vistos.

c) Ciclos : Estimación de las variaciones cíclicas. Índices cíclicos: Después de eliminarse la tendencia de los datos originales, efectuada luego la desestacionalización nos queda en la serie solo variaciones cíclicas e irregulares. Las irregulares se eliminan con un apropiado movimiento medio. Si aparece una periodicidad (o aproximadamente periódica) de ciclos, pueden construirse índices cíclicos de una manera análoga a como se obtuvieron los estaciónales.

d) Aleatoriedad: Estimación de las variaciones irregulares o aleatorias: La estimación de las variaciones irregulares o aleatorias se logra ajustando los datos originales a los Valores de tendencia, variaciones estaciónales y cíclicas. En la practica se encuentra que los movimientos irregulares tienden a ser de pequeña magnitud y que a menudo tienden a distribuirse normalmente, es decir, desviaciones pequeñas aparecen con gran frecuencia, desviaciones grandes aparecen con poca frecuencia.

4. Eliminación de los componentes: pronósticos.

Estimación y pronósticos. Pronósticos en base a tendencia y estacionalidad: estos pronósticos se realizan para cortos plazos. Primero se calcula la tendencia y luego se ajusta por la estacionalidad.

Los pronósticos que se basan en los componentes de tendencia o estacional de una serie de tiempo se consideran sólo como el punto inicial de los pronósticos económicos. Una razón de esto es la necesidad de considerar el efecto probable del componente cíclico durante el periodo pronosticado, en tanto que una segunda razón es la importancia de identificar los factores causales específicos que han influido sobre las variables de la serie de tiempo.

Para los pronósticos a corto plazo, con frecuencia se supone que el efecto del componente cíclico es igual que el que se ha dado en los valores recientes de la serie de tiempo. Sin embargo, para periodos más prolongados, o aún para periodos breves de inestabilidad económica, resulta importante identificar los puntos cíclicos de cambio de la economía nacional. Por supuesto, las variaciones cíclicas asociadas con un producto determinado pueden o no coincidir con el ciclo general de negocios. Por ejemplo: Históricamente, las ventas de automóviles han coincidido en forma estrecha con el ciclo general de negocios de la economía nacional. Por otro lado, las ventas de refacciones para automóviles tienden a ser contracíclicas con respecto al ciclo general de los negocios.

Se han identificado diversas series de tiempo que, históricamente han resultado ser indicadores de surgimientos y recesiones cíclicas con respecto al ciclo global de los negocios. Un grupo de estos, a los que se

Page 17: Estadistica I 2

denomina indicadores líder, por lo general llegan a los puntos cíclicos de cambio antes del cambio correspondiente en la actividad económica general. Los indicadores líder incluyen medidas como la tasa de desempleo en manufactura, el valor de los pedidos nuevos en las industrias de bienes duraderos, y un índice de precios y cotizaciones del mercado bursátil. Un segundo grupo, al que se denomina indicadores coincidentes, son series de tiempo que por lo general han tenido puntos de cambio que coinciden con el ciclo general de los negocios. Los indicadores coincidentes incluyen medidas como la tasa de desempleo y el índice de producción industrial. El tercer grupo, al que se denomina indicadores rezagados, son las series de tiempo para las cuales las cumbres y los vales generalmente se retasan con respecto al ciclo general de los negocios. Los indicadores rezagados incluyen medidas como la manufactura y los inventarios comerciales, y las tasas preferenciales promedio que indican los bancos.

Además de considerar el efecto de las fluctuaciones cíclicas y de pronosticar esas fluctuaciones, también deben estudiarse las variables causales especificas que históricamente han influido sobre los valores de la serie de tiempo.

El análisis de regresión y de correlación lineal son particularmente aplicables a estudios como la relación entre la estrategia del precio y el volumen de ventas. Aparte de los análisis históricos, otras áreas que requieren atención son las posibles implicaciones de productos nuevos y los cambios en el ambiente del mercado.

Pronósticos cíclicos e indicadores de negocios: para períodos prolongados o breves de gran inestabilidad económica, se deben analizar los ciclos si se pueden proyectar y así realizar pronósticos.

El factor componente de una serie de tiempo que se estudia más a menudo es la tendencia. Principalmente, estudiamos la tendencia con fines de predicción; esto es, podemos desear estudiar la tendencia directamente como una ayuda para realizar proyecciones de predicción a largo y mediano plazos. En segundo lugar, podemos desear estudiar la tendencia con el objeto de aislar y luego eliminar sus efectos sobre el modelo de una serie de tiempo, como una guía hacia la predicción a corto plazo (un año o menos) de las condiciones generales del ciclo de negocios, como sabemos el primer paso de un análisis de series de tiempo consiste en graficar los datos y observar sus tendencias a través del tiempo, para obtener alguna impresión visual o sentimiento a cerca de los movimientos generales a largo plazo, para eso construimos un diagrama en el cual los datos observados (variable dependiente) son graficados en el eje vertical y los periodos (variable independiente) en el eje horizontal. Si parece que se puede ajustar adecuadamente una línea recta a los datos, entonces los dos métodos más ampliamente utilizados de ajuste de tendencias son el método de mínimos cuadrados y el método de suavizado exponencial doble. Si los datos de la serie de tiempo señalan la presencia de un movimiento a largo plazo hacia abajo o hacia arriba, los dos métodos más ampliamente utilizados de ajuste de tendencia son el método de mínimos cuadrados y el método de suavizado exponencial triple.

INFERENCIA ESTADISTICA CONCEPTOS PRELIMINARES

Bolilla 10 – Teoría elemental de la probabilidad

1. Antecedentes históricos.

Page 18: Estadistica I 2

La Teoría de la Probabilidad fue inicialmente creada y desarrollada por el matemático francés Blas Pascal, quien en 1.654, a raíz de consultas que le había planteado un integrante de la nobleza, en un intercambio epistolar con Fermat, se dedicó a resolver los problemas de probabilidades relacionadas con los juegos de azar, muy de moda en las sociedades europeas de aquellos tiempos.

Así surgió la primera definición de probabilidad, que hoy llamamos Definición clásica. Con posterioridad, otros matemáticos de los siglos XVII y XVIII se ocuparon de ampliar los límites del conocimiento en el tema Teoría de la Probabilidad. Entre los investigadores más reconocidos se encuentran el propio Fermat, Bernoulli, Gauss, Laplace y Poisson.

Con la Revolución Francesa la Teoría de la Probabilidad sufrió un deterioro importante, debido fundamentalmente a que, habiendo surgido a partir de intereses no demasiado bien vistos de la nobleza, fue considerado un producto casi despreciable por parte los científicos e investigadores matemáticos de la época. Eso fue así hasta mediados del siglo XIX, cuando su estudio y análisis vuelven a recibir un fuerte impulso, de modo que a comienzos del siglo XX ya se la considera una herramienta trascendente para ser aplicada en varias ramas del campo científico.

Hoy en día no existe investigación alguna, en cualquier terreno, que no la considere y la aplique, y se ha incorporado con naturalidad a los procesos analíticos de la física, la química, la medicina y, por supuesto, la economía.

2. Definiciones de probabilidad: clásica, frecuencial o estadística, axiomática y subjetiva.

Definición clásica: Suponga la existencia de un experimento aleatorio E que puede dar lugar a la aparición de un suceso A, que puede presentarse de h formas diferentes, todas que le favorecen, en un total de n formas posibles de ocurrencia del experimento, se define a la probabilidad del suceso A como la relación entre el número de casos favorables h y el número de casos posibles n. Es decir que

Ejemplos: 1) Si se sabe que una moneda tiene dos lados, a los que llamaremos convencionalmente “cara” (C) y “cruz” (X), en el experimento aleatorio “arrojar la moneda al aire”, ¿cuál es la probabilidad de obtener una cara?: si el número de los casos favorables al lado cara es igual a uno y el total de lados posibles de aparecer son iguales a dos,

la.

2) Un dado tiene seis caras, luego la probabilidad de obtener un as en una tirada es

Para indicar el resultado de una probabilidad en esta etapa del estudio, utilizaremos las formas fraccionarías respetando, de esa manera, el fundamento básico de la definición de Pascal, aunque no existe ningún inconveniente para convertir la forma fraccionaria en una forma decimal.

Si bien el concepto de experimento aleatorio es, en principio, ambiguo, al recordar que la definición pascaliana se originó en el estudio de los juegos de azar, puede decirse que un experimento aleatorio tanto puede ser una de las repeticiones de algún juego de azar como cualquier otra cosa que, no siendo precisamente un juego, esté sujeta a las reglas del azar, de modo que el resultado que se puede presentar en sus realizaciones se encuentra sujeto a las condiciones de incertidumbre propias de la aleatoriedad.

Se citan a continuación ciertos ejemplos que pueden considerarse experimentos aleatorios porque cumplen con esas condiciones, acompañando en cada caso posibles resultados de la variable aleatoria a la cual dan origen:

La definición del sexo de un bebé en el momento de la concepción: varón o mujer

Page 19: Estadistica I 2

La ingesta de un medicamento para combatir una infección: efectivo o no efectivo

La asistencia de alumnos a las clases de Estadística: asistieron 20, 25, 32, etc.

El ingreso de clientes en un comercio determinado: ingresaron o no ingresaron

La suscripción de depósitos a plazo fijo en una sucursal bancaria: suscribieron $ 100.000, $ 200.000 (o cualquier otra cifra)

La venta de un bien en el mercado: se vendieron todas las unidades o ninguna

La forma de pago de un cliente en un supermercado: en efectivo, con tarjeta o con cheque.

Como se ve, los experimentos citados dan lugar, a la ocurrencia de sucesos cuyos resultados (dados sólo a modo de ejemplo) constituyen valores de una variable aleatoria.

Volviendo a la fórmula de la definición clásica, analicemos ahora en particular los dos elementos que la componen y veremos que:

n siempre debe ser mayor o igual a 1: en efecto, con un número de casos posibles nulo (n = 0) no habría realización del experimento.

h siempre variará entre 0 y n (0 h n): en efecto, es siempre posible plantear la alternativa de, como mínimo, un número nulo de casos favorables y, como máximo, un número de casos favorables que no puede superar al de casos posibles n.

Por consiguiente:

Si h = 0 = P(A) = 0 A se denomina suceso imposible.

Si h = n P(A) = 1 A se denomina suceso seguro (o cierto).

Luego se concluye que : la probabilidad de un suceso A es un número real que varía entre cero y uno.

Definición frecuencial o estadística de probabilidad : Para el cálculo de probabilidades mediante la aplicación de la definición clásica se requiere conocer, indudablemente, cuáles son los valores correspondientes tanto a los casos favorables como a los casos posibles. Sin embargo, a menudo ocurre que alguno de estos datos, o ambos, resultan o completamente desconocidos o muy difíciles de conocer. Así ocurriría, por ejemplo, en el caso de plantearse algunos de los siguientes interrogantes:

a) ¿cuál es la probabilidad de que llueva mañana?

b) ¿cuál es la probabilidad de que el equipo de fútbol A le gane al equipo de fútbol B?

c) ¿cuál es la probabilidad de que se apruebe un examen de Estadística?

d) ¿cuál es la probabilidad de que un cliente abone su cuenta con tarjeta de crédito?

La existencia de estas alternativas permite pensar que, cuando los valores requeridos para aplicar la relación pascaliana son desconocidos, resulta necesario definir a la probabilidad de otra manera, o sea, como la probabilidad de existo en la definición pascaliana se definía como el total de casos favorables sobre el total de casos posibles, cuando no se conocen estos datos la relación de probabilidad debe basarse en datos observados empíricamente.

Para encontrar un procedimiento adecuado, pensemos en el siguiente ejemplo: una bolsita contiene un conjunto de bolillas de colores. No se conoce cuál es la cantidad total de bolillas ni cuántas hay por cada color. Tal como se mencionó en el párrafo anterior, el desconocimiento respecto de esos datos vuelve impracticable el cálculo de

Page 20: Estadistica I 2

las probabilidades mediante la definición clásica. Imaginemos ahora el siguiente experimento: extraeremos bolillas de la bolsita mencionada más arriba, en forma sucesiva, de a una y con reposición, observando, en cada extracción, si se presenta un color determinado y particular. La cantidad de bolillas que extraeremos, que convendremos en simbolizar con ni, puede ser determinada a voluntad por quien realiza el experimento, pero podemos suponer que se hará una cantidad de extracciones lo suficientemente numerosa como para que ni pueda imaginarse tendiendo a infinito. Esto es sólo posible si, insistimos, el experimento se realiza con reposición, ya que de esa manera generamos una población infinita de extracciones.

La experiencia así realizada permite construir una tabla en la cual se podrán volcar los siguientes datos:

a) en la primera columna, simbolizada con ni, el número que corresponde a cada una de las extracciones que se vayan realizando, partiendo de uno y hasta finalizar en n.

b) en la segunda columna, simbolizada con fi, el número de bolillas de un determinado color que vayan apareciendo, de modo que si en una extracción en particular se presenta el color deseado, fi aumenta en una unidad, mientras que si no se presenta el color deseado, fi mantiene el valor anterior (fi es la “frecuencia de aparición”).

c) en la tercera columna, el resultado de efectuar la relación entre los valores de fi y de ni, es decir fi/ni, denominada relación frecuencial o estadística.

Así planteado el experimento, imaginemos a modo de ejemplo que en la primera extracción se presenta el color deseado; en la segunda extracción no se presenta el color deseado y en la tercera extracción vuelve a presentarse el color deseado, lo cual da como resultado la siguiente tabla:

No de extracciones(ni)

Frecuenciade aparición(fi)

Relaciónfrecuencial(fi/ni)

1 1 1/1 = 12 1 1/2= 0,53 2 2/3=0,66... ... ...N fi fi/ni

Podemos representar estos resultados mediante un gráfico de coordenadas, en el cual en el eje de las abscisas se indica el número de extracciones, y en el eje de las ordenadas, el valor de la relación frecuencial.

A medida que aumentamos el número de extracciones ni ampliamos el gráfico precedente, lo cual da como resultado que el trazo de la poligonal manifieste variaciones que son cada vez menos notorias, hasta el punto tal que ese trazado se acercará al verdadero valor de la probabilidad del suceso motivo del experimento, a medida que ni . Esto quiere decir que la probabilidad de un suceso cualquiera A es el límite de la relación frecuencial fi/ni

cuando ni tiende a infinito.

Page 21: Estadistica I 2

Simbólicamente,

debiéndose entender el concepto de límite en el sentido de convergencia. Es decir que la relación frecuencial converge al valor de la probabilidad del suceso A cuando el número de realizaciones del experimento crece indefinidamente.

Ejemplo:

¿Cuál es la probabilidad de que llueva el 21 de septiembre de este año?

Recordando que para calcular esta probabilidad no puede aplicarse la definición clásica, una solución posible para contestar la pregunta es consultar en los diarios locales de los últimos años (la cantidad de años puede ser definida por el investigador y establecida, por ejemplo en 10, 20, 30 o más años, ya sea según su propio deseo o la disponibilidad del archivo periodístico) qué ocurrió en cada 21 de septiembre. Si en el lapso de 20 años, en ocho de ellos llovió el día 21 de septiembre, la probabilidad de que llueva en esa fecha puede calcularse haciendo

Definición axiomática de probabilidad: La definición axiomática de probabilidad surgió en la década del 30 como consecuencia del aporte de un grupo de matemáticos, quienes opinaban que el concepto de probabilidad no debía estar asociada ni con juegos de azar ni con experiencias estadísticas previas, ya que constituía de por sí un tema con entidad propia y particular. De esa manera, formularon la siguiente serie de tres axiomas a partir de los cuales enunciaron la definición de probabilidad:

1) la probabilidad de un suceso es un número real, mayor o igual que cero. Es decir que P(A) 0.

2) la probabilidad de un, sistema completo de sucesos es igual a uno. Si S = A1 o A2 o A3 o...o An, la P(S) = 1

3) si dos sucesos A y B son mutuamente excluyentes la P(A o B) = P(A) + P(B)

A partir de las verdades indiscutibles de estos axiomas se deducen todas las reglas del campo teórico de la probabilidad.

Probabilidad subjetiva: Mientras que en las tres definiciones anteriores la probabilidad de un evento favorable se calculo en forma objetiva, ya sea con una probabilidad previa o con datos empíricos, la probabilidad subjetiva se refiere a la probabilidad de la ocurrencia de un acontecimiento según una persona determinada. Esta probabilidad puede ser muy diferente a la probabilidad subjetiva asignada por otra persona porque entre estos dos individuos uno puede ser más optimista o más pesimista con respecto a un fenómeno que el otro y contar con conocimientos previos acerca del tema y juicios de valores diferentes o similares, en fin la asignación de probabilidades a diversos eventos suele estar basada en la experiencia previa, opinión personal del individuo y el análisis de una situación particular y es muy difícil aunque no imposible que dos sujetos diferentes coincidan. Por ejemplo, el inventor de un nuevo juguete puede asignar una probabilidad, muy diferente a la probabilidad de éxito del juguete, que el presidente de la compañía que piensa comercializar el juguete.

3. Definición de sucesos excluyentes y compatibles.

Sucesos opuestos: Indiquemos con el símbolo al suceso o conjunto de sucesos que no son el suceso A. En el ejemplo de la moneda, si A es el suceso “cara”, será el suceso “cruz”; en un dado de seis caras, si A es el suceso as, el suceso estará conformado por el conjunto de resultados correspondientes a las otras cinco caras. En esas condiciones, si de los n casos posibles h favorecen al suceso A, los restantes (n - h) sucesos favorecerán al suceso . Por consiguiente la

Page 22: Estadistica I 2

.

Si ahora sumamos las probabilidades de los sucesos A y , obtenemos:

, con lo cual se concluye que:

Si la suma de las probabilidades de dos sucesos que provienen de un mismo experimento da un resultado igual a la unidad, los sucesos se denominan opuestos.

Ejemplo: Los sucesos C y X en la tirada de una moneda son opuestos. Luego la P(C) + P(X) = 1, lo cual demuestra adicionalmente que la aparición de cara o de cruz en una sola tirada de una moneda constituye un suceso seguro o, lo que es lo mismo, ambos sucesos conforman un sistema completo (ya que no existe otra solución posible para el experimento). También es opuesto el suceso as con respecto a los otros cinco resultados posibles en la tirada de un dado.

Sucesos excluyentes y sucesos compatibles: En una sola realización de un experimento aleatorio dos sucesos A y B son mutuamente excluyentes cuando no se pueden presentar simultáneamente, dicho en otras palabras la ocurrencia de uno implica la no ocurrencia de los otros. En caso contrario esos sucesos son compatibles.

Ejemplos:

1) Sucesos cara o cruz en una tirada de una moneda son excluyentes.

2) Suceso sexo del bebé que va a nacer: varón o mujer son excluyentes.

3) Un archivo contiene facturas de compras de diferentes importes, correspondientes a varias empresas proveedoras. El siguiente cuadro muestra cómo se clasifican esas facturas:

CUADRO - CANTIDAD DE FACTURAS DE COMPRAS

Empresaproveedora

< $ 1.000 $ 1.000 y mas

Total

A 4 1 5B - 3 3C 2 - 2Total 6 4 10

Un auditor elige aleatoriamente una sola factura. En ese caso los sucesos:

a) factura del “proveedor A” o del “proveedor B” son excluyentes.

b) factura “de < $ 1.000” o “de $ 1.000 y más” (>1.000) son excluyentes.

c) factura del “proveedor A” o “de < $ 1.000” son compatibles (se presentan simultáneamente).

d) factura del “proveedor B” o “de $ 1.000 y más” son compatibles.

e) factura del “proveedor C” o “de $ 1.000 y más” son excluyentes (no se presentan simultáneamente)

Nota importante: Todos los sucesos opuestos son excluyentes, pero no todos los sucesos excluyentes son opuestos.

Page 23: Estadistica I 2

Ocurrencia conjunta de sucesos: En una sola realización de un experimento aleatorio se denomina ocurrencia conjunta de dos sucesos A y B, a su aparición simultánea. La ocurrencia conjunta se simboliza (A y B), también denominada como suceso intersección.

Debe quedar claro a partir de esta definición, que en una sola realización de un experimento la aparición simultánea de dos sucesos A y B no es posible si ellos son excluyentes.

Ejemplos:

1) en una sola tirada de una moneda, como los sucesos C y X son excluyentes, su ocurrencia conjunta nunca puede presentarse. Luego, en ese caso, la P(C y X) = 0.

2) en el experimento nacimiento de un bebé, los sucesos Varón (P) y Mujer (M) son excluyentes, de modo que su ocurrencia conjunta nunca puede suceder. Por consiguiente en un solo nacimiento, la P(V y M) = 0.

3) en el experimento selección de una factura por parte de un auditor, los sucesos factura del “proveedor A” y factura del “proveedor B” son sucesos excluyentes, de modo que su ocurrencia conjunta no puede presentarse.

4) en cambio los sucesos factura del “proveedor A” o “de menos de $ 1.000” son compatibles, así que puede presentarse su ocurrencia conjunta. En ese caso la probabilidad se obtiene dividiendo sus casos favorables, dados por el número de facturas que figura en el casillero intersección de la columna “< $ 1.000” con la fila “proveedor A” (y que encierra el valor 4), con los casos posibles, que son el número total de facturas,

igual a 10. De esa forma P(A y < 1000) =

4. Regla de la adicción: diferentes casos:

En una sola realización de un experimento aleatorio, la probabilidad de ocurrencia de un suceso A, o de un suceso B, o de ambos simultáneamente, se resuelve mediante la suma de las probabilidades de ambos y la posterior resta de la probabilidad de su ocurrencia conjunta, es decir que

P(A o B) = P(A) + P(B) - P(A y B)

Por lo indicado en el anterior punto d), esta fórmula es particularmente aplicable al caso de sucesos compatibles, ya que si A y B fueran excluyentes, visto que la P(A y B) = 0, la regla de la adición queda reducida a

P(A o B) = P(A) + P(B)

Ejemplos:

1) Se arroja una moneda. Hallar la probabilidad de obtener los resultados cara (C) o cruz (X). Sabiendo que

los dos sucesos nombrados son excluyentes, la solución es .

2) Un auditor selecciona una de las facturas de compra archivadas en la empresa (ver el cuadro con los datos de la página 113). Calcular las probabilidades que la factura seleccionada sea:

a) del “proveedor A” o del “proveedor B”: como ambos sucesos son excluyentes, la probabilidad requerida es

b) “de - $ 1.000” o “de $ 1.000 y más”: son sucesos excluyentes

Page 24: Estadistica I 2

lo cual es completamente lógico porque al igual que en el caso del ejemplo 1 precedente, los sucesos requeridos conforman un sistema completo.

c) del “proveedor A” o “de - $ 1.000”: son compatibles

b) del “proveedor B” o “de $ 1.000 y más”: son compatibles

c) del “proveedor C” o “de $ 1.000 y más”: son excluyentes

5. Definición de sucesos independientes y condicionales:

Sucesos independientes: Llamamos sucesos independientes a aquellos donde la ocurrencia de uno no afecta la ocurrencia del otro.

Cuando para dos sucesos cualesquiera son independientes la probabilidad de A dado B la P(A/B) = P(A), ambos sucesos son independientes. En ese caso también ocurre que P(B/A) = P(B), y a partir de estas dos últimas igualdades, se verifica que, si A y B son independientes

Como podemos ver, los conceptos de independencia y condicionalidad también se aplican en la siguiente circunstancia: en dos (o más) realizaciones de un experimento aleatorio dos sucesos A y B son independientes cuando la ocurrencia de uno de ellos en cualquier realización no afecta a la ocurrencia del otro en las restantes. En caso contrario, los sucesos son condicionales.

Ejemplos:

1) Al arrojar dos veces (o más) una moneda, el resultado de cada experimento no depende de lo ocurrido en el experimento anterior, así como tampoco influye en el resultado del experimento siguiente. Luego, al arrojar dos veces (o más) una moneda se generan sucesos independientes.

2) Si un supermercado admite pagos en efectivo, con tarjeta o con cheques, y dos (o más) clientes se encuentran uno a continuación del otro en la cola de una de las cajas, el suceso forma de pago que elija el primero es independiente del suceso forma de pago que elija el segundo (o los siguientes).

3) En el supermercado del ejemplo anterior, el suceso forma de pago elegida por un cliente que se presenta en una de las cajas es independiente del suceso forma de pago que elijan otros clientes que se presentan simultáneamente en otras cajas.

4) Si un auditor elige dos facturas de compras que se encuentran en el archivo de la empresa (vea cuadro de la página 113), los sucesos elección de facturas son independientes si la elección del auditor es con reposición, es decir, si repone la primera factura al archivo previo a la elección de la segunda.

5) En cambio, si el auditor no repone la primera factura seleccionada, los sucesos elección de facturas se consideran condicionales, porque la no reposición de la primera factura afecta el universo de resultados posibles para cuando deba elegir la segunda.

6) Si el auditor debe seleccionar dos facturas y las retira simultáneamente, se considera que ha generado dos sucesos condicionales, porque al retirar las dos al mismo tiempo, cada una afecta a su compañera de elección.

Page 25: Estadistica I 2

Sucesos condicionales: se denomina condicional a aquel suceso A cuya presentación se encuentra asociada a la hipótesis de ocurrencia de otro suceso particular B.

Simbólicamente los sucesos condicionales se simbolizan mediante la expresión (A/B), que se lee el suceso A condicionado a la hipótesis que haya ocurrido B, o el suceso A dada la ocurrencia de B, o simplemente, el suceso A dado B.

Ejemplos:

1) En el archivo de facturas (ya utilizado en los ejemplos previos), del total de facturas disponibles, se elige una factura del “proveedor A” y se desea conocer cuál es la probabilidad de que ella sea de un importe “de 1000 pesos y más”, es decir que se desea conocer la probabilidad de una factura “de 1000 pesos y más” condicionado a que ya se ha sabido que ella pertenece al “proveedor A”. Simbólicamente esto

se indica como la

Para resolver esta probabilidad, se verifica que de un total de 5 facturas pertenecientes al “proveedor A”, sólo una es favorable al suceso “de $ 1000 y más”. Es decir que, en este cálculo, los casos favorables son todas las facturas que corresponden a la ocurrencia conjunta de los sucesos “de 1000 $ y más” y “proveedor A”, mientras que los casos posibles están constituidos por el total de facturas pertenecientes al suceso “proveedor A”. Por consiguiente, la probabilidad buscada es:

Luego, la probabilidad de un suceso B condicionado a la previa ocurrencia de un suceso particular A, se calcula dividiendo la cantidad de casos favorables a la ocurrencia conjunta de los sucesos A y B por la cantidad de casos posibles de ocurrencia del suceso A. Ese cálculo también puede efectuarse dividiendo la probabilidad de la ocurrencia conjunta por la probabilidad del sucesor condicionante (en este caso, el suceso A), es decir que

lo cual, desde el punto de vista teórico, se expresa del siguiente modo:

a partir de lo cual, mediante un pasaje de términos, se verifica que

del mismo modo que

2) Si ahora se eligiera una factura “< $ 1000”, ¿cuál es la probabilidad de que ella sea del “proveedor C”? Se trata de una probabilidad condicional de que el suceso sea del “proveedor C” habiéndose verificado previamente que es de un importe “< a $ 1.000”

El concepto de sucesos condicionales también se aplica en la siguiente circunstancia: en dos (o más) realizaciones de un experimento aleatorio dos sucesos A y B son condicionales cuando la ocurrencia de uno de

Page 26: Estadistica I 2

ellos en cualquier realización está afectada por la ocurrencia del otro en las restantes. Como el ejemplo de la extracción de facturas sin reposición.

6. Regla de la multiplicación para casos definidos:

En dos (o más) realizaciones de un experimento, la probabilidad de ocurrencia de un suceso A en primer lugar (simbolizado con Al) y de un suceso B en segundo lugar (simbolizado con B2), ambos independientes entre sí, se obtiene aplicando la fórmula de la ocurrencia conjunta para sucesos independientes

Si los sucesos A y B fueran condicionales, la fórmula se modifica por la aparición de la probabilidad condicional (ya presentada precedentemente), simbolizada como P(B/A) de modo que:

Ejemplos:

0) Se arroja una moneda dos veces. Hallar la probabilidad de obtener el suceso cara en la primera tirada y el suceso cruz en la segunda. Los sucesos son independientes

1) En un supermercado, la probabilidad de que un cliente pague en efectivo (E) es 6/15, con tarjeta de crédito (T) es 7/15 y con cheques (C) es 2/15. Hallar la probabilidad de que dos clientes sucesivos que pagan sus cuentas lo hagan:

a) el primero en efectivo y el segundo con tarjeta de crédito. Ya se ha indicado que se trata de sucesos independientes

b) los dos clientes en efectivo:

2) Del archivo de la empresa, un auditor elige dos facturas con reposición. Hallar la probabilidad de que las facturas sean:

a) la primera del “proveedor A” y la segunda del “proveedor B”. Los sucesos son independientes

b) las dos facturas sean de un importe de “$ 1.000 y más”:

3) Ahora el auditor selecciona dos facturas sin reponer la primera elegida. Hallar la probabilidad de que las facturas sean:

Page 27: Estadistica I 2

a) la primera del “proveedor A” y la segunda del “proveedor B”. Los sucesos son condicionales

b) las dos facturas sean de un importe “de $ 1.000 y más”:

En los cuatro ejemplos precedentes la regla de la multiplicación se aplicó considerando que los sucesos ocurrían con un orden estricto de presentación (primero el suceso A y segundo el suceso B, por ejemplo). Sin embargo, cuando se efectúa el cálculo de una probabilidad, suele no reclamarse un orden de presentación en los sucesos, de modo que, en ese caso, la regla de la multiplicación debe contemplar todas las situaciones posibles de presentación. Eso significa considerar que puede presentarse tanto primero A y luego B, como el caso simétrico, primero B y luego A. Es decir que la regla de la multiplicación debe formularse de la siguiente manera: en dos (o más) realizaciones de un experimento, la probabilidad de ocurrencia del suceso A y del suceso B se obtiene aplicando la siguiente fórmula, válida para el caso en que los sucesos sean independientes:

Si los sucesos A y B fueran condicionales, ya se ha indicado que la fórmula deberá incluir la probabilidad condicional, de modo que en ese caso

-

con lo cual se comprueba que los símbolos lógico matemáticos o e y que aparecen en la fórmula se reemplazan sencillamente por las operaciones aritméticas suma y producto, respectivamente.

Ejemplos:

1) Se arroja dos veces una moneda. Hallar la probabilidad de obtener los sucesos cara y cruz.

2) En un supermercado las probabilidades de que un cliente pague en efectivo, con tarjeta de crédito o con cheque son, respectivamente, 6/15; 7/15 y 2/15. Hallar la probabilidad de que dos clientes que van a pagar:

a) uno pague en efectivo y otro con tarjeta de crédito:

b) los dos paguen en efectivo. En este caso sólo existe una forma de presentación dada por E1 y E2:

3) Si un auditor selecciona dos facturas sin reposición,

a) ¿cuál es la probabilidad de elegir una factura del “proveedor A” y otra del “proveedor B”?

Page 28: Estadistica I 2

En este caso no se pide orden de aparición y los sucesos son condicionales

b) ¿cuál es la probabilidad de elegir dos facturas “de $ 1000 y más”?

Obsérvese que el resultado no cambia respecto del ejemplo 4-b) (ver en la página 117), ya que existe una sola manera de ocurrencia para la presentación de un mismo suceso en dos realizaciones de un experimento, ya sea que se pida o que no se pida orden de aparición.

Conclusión: De todo lo explicado precedentemente se puede extraer la siguiente conclusión: si la realización repetida de un experimento genera sucesos independientes, sus probabilidades se mantendrán constantes a lo largo de toda la serie de realizaciones. Si, en cambio, los sucesos generados en un experimento resultan condicionales, sus probabilidades variarán de realización en realización.

7. Distribuciones de probabilidad: casos discretos y continuos. Conceptos y definiciones

Definición: La distribución de probabilidad está constituida por el conjunto de todos los valores de la variable aleatoria xi (x1, x2,,..., xN), asociados con sus correspondientes probabilidades pi (p1, p1,..., pN), tales que debe cumplirse la siguiente condición, a la que se denomina condición de cierre: que la suma de las probabilidades a lo

largo del campo de variación de la variable aleatoria sea igual a la unidad. Es decir que la .

Por consiguiente, la Distribución de Probabilidad constituye un sistema completo de sucesos.

Características de las distribuciones de probabilidad: Las características generales de las distribuciones de probabilidad difieren según el tipo de variable aleatoria, discreta o continua, que se encuentre bajo estudio.

a) Si la variable aleatoria es discreta:

1) Ella puede tomar solamente algunos valores dentro de un intervalo definido.

2) Las probabilidades se representan con los símbolos pi o p(x).

3) En un punto cualquiera de la variable xi la probabilidad tiene sentido y puede valer, o pi o cero, según ese punto coincida o no con algún valor específico de la variable. Si xi fuera igual a xu, la P(xi = xu) = pu

mientras que la P(xi xu) = 0 (para i entre 1 y N).

4) El gráfico de la distribución de probabilidad se denomina gráfico de bastones, por la particular forma que adopta la probabilidad al afectar sólo a determinados puntos del eje de la variable aleatoria xi.

Page 29: Estadistica I 2

5) Las probabilidades se calculan mediante la aplicación tanto de las conocidas reglas provenientes de la teoría clásica de probabilidad como de fórmulas específicas, cuya deducción está reservada a los siguientes capítulos.

6) La condición de cierre se verifica realizando la .

7) La distribución de probabilidad en el caso de una variable aleatoria discreta se denomina genéricamente función de probabilidad.

b) Si la variable aleatoria es continua:

1) Ella puede tomar cualquier valor en un determinado campo de variación.

2) La probabilidad se representa con los símbolos fi o f(x).

3) En un punto la probabilidad no tiene sentido. Sólo tiene sentido en un intervalo particular de la variable aleatoria xi, por más pequeño que éste sea. Es decir que, simbólicamente, podemos indicar a la probabilidad con la expresión P(x1 xi x2)= A, así como que P(xi = x2) = No tiene sentido.

4) En el gráfico, la distribución de probabilidad se ve como una función continua f(x), y la probabilidad en sí misma, denominada A, se representa como un área entre los puntos x1 y x2.

5) La probabilidad se obtiene calculando la integral, según el criterio de Riemann, de la función f(x), entre los puntos x1 y x2. Es decir que

P(x1 xi x2)=

6) La condición de cierre se verifica efectuando la integral de la función en todo el campo de variación

de la variable aleatoria, es decir

Page 30: Estadistica I 2

7) La denominación genérica de la distribución de probabilidad en el caso continuo es la de función de densidad debido a que se considera que las probabilidades adquieren densidad, es decir que se “adensan”, convirtiéndose en áreas.

Las características de las distribuciones de probabilidad se pueden observar con mayor claridad en el siguiente cuadro resumen:

CARACTERISTICAS DE LAS DISTRIBUCIONES DE PROBABILIDAD

Tipo de variable Discreta ContinuaSimbología de laProbabilidad

pi o p(x) fi o f(x)

Concepto deProbabilidad

En un punto En un intervalo(en un punto no tiene sentido)

Valor de la probabilidad

Vale pi (bastón)o cero

Vale A(área)

Gráfico De bastones De áreasCálculo de la Probabilidad

P(xi = xu .) = pu

P(xi: xu) = 0P(x1 xi x2)=

Condiciónde cierre

Denominación genérica Función de probabilidad

Función de Densidad

Funciones de distribución acumulada:

Se denomina función de distribución acumulada F(xu) (o más sencillamente función de distribución), a la probabilidad de que la variable aleatoria xi sea menor o igual que un valor particular xu. Es decir a la probabilidad de ocurrencia de xi unidos a la probabilidad de ocurrencia de todas las variables mayores xi y menores o iguales que xu, cuando se trata de variable continua es el área comprendida o acotada en el intervalo [xi , xu]

Luego : F(xu) = P(xi xu)

En el caso discreto, la función de distribución se obtiene sumando sucesivamente las probabilidades correspondientes a los valores de la variable aleatoria, a partir del primer valor y hasta el u-ésimo. Por lo tanto, la

F(xu) = P(xi xu) =

En el caso continuo, la función de distribución se obtiene integrando la expresión de la función de densidad entre los valores menos infinito y xu es decir

F(xu) = P(xi xu) =

Para una mejor comprensión del tema, se incluyen a continuación las representaciones gráficas de los casos discreto y continuo, con comentarios anexos para cada caso. Para mayor claridad, ambas representaciones se construirán relacionando entre sí a las funciones de probabilidad y de densidad, respectivamente, con las funciones de distribución correspondientes. De esa manera se podrá verificar que, en términos generales, los gráficos de las distribuciones acumuladas nos muestran funciones monótonas no decrecientes, continuas a la derecha y discontinuas a la izquierda.

Page 31: Estadistica I 2

Punto Probabilidad Acumulada Punto Probabilidad Acumulada

xi = x1 P(xi x1 .) = p1 xi = x1 P(xi x1 .) =A1

xi = x2 P(xi x2 .) = p1 + p2 xi = x2 P(xi x2 .) =A1 + A2

xi = x3 P(xi x3 .) = p1 + p2 + p3 xi = x3 P(xi x3 .) =A1 + A2 + A3

xi= x4 P(xi x4 .) = p1 + p2 + p3 + p4 = 1 xi= x4 P(xi x3 .) =A1 + A2 + A3 + A4

La función de distribución acumulada en el caso discreto está representada por la línea gruesa de color gris, que tiene su inicio en el punto - y se desarrolla a nivel cero, es decir, al nivel del eje de las abscisas, hasta encontrar el primer punto de la variable xi (en este caso el punto x1) que tiene una probabilidad pi (en este caso pi). En ese punto pega un salto y adquiere el nivel p1 hasta encontrar otro valor de la variable xi

en el que vuelve a pegar otro salto, generándose así la gráfica ya indicada, cuyo valor máximo será igual a la unidad.

La función de distribución acumulada en el caso continuo, está representada por la línea continua gris. En un punto particular seleccionado xi, la probabilidad acumulada entre - y x1 está dada por el área Al, cuyo valor se representa como una ordenada en el gráfico de la función acumulada. Para los siguientes puntos xi

se van marcando, en forma similar, las ordenadas que les corresponden para, finalmente, uniendo sus puntos extremos superiores, conseguir el trazo de la función de distribución, que se hace asintótica al valor uno.

Ejemplos:

Page 32: Estadistica I 2

1)

a) Construir la distribución de probabilidad de la variable aleatoria resultado que se obtiene al arrojar un dado.

b) Obtener la función de distribución acumulada.

c) Graficar la distribución de probabilidad.

Resultado(Variable)xi

Probabilidadpi

Función de distribuciónFi

1 1/6 1/62 1/6 2/63 1/6 3/64 1/6 4/65 1/6 5/66_ 1/6 6/6=1

2) Obtener la distribución de probabilidad de la, variable aleatoria “suma que se obtiene al arrojar dos dados, y la función de distribución acumulada. Graficar.

Resultadoxi

Probabilidadpi

Func. de dist.Fi

2 1/36 1/36 3 2/36 3/36 4 3/36 6/36 5 4/36 10/36 6 5/36 15/36 7 6/36 21/36 8 5/36 26/36 9 4/36 30/3610 3/36 33/3611 2/36 35/3612 1/36 36/36=1

GRÁFICO

Page 33: Estadistica I 2

8. Esperanza matemática de la variable aleatoria.

a) Definición : La esperanza matemática de la variable aleatoria, que se define de una manera técnica, es decir, mediante su fórmula de cálculo, se obtiene efectuando la sumatoria de los productos de los valores de la variable por su respectiva probabilidad, siempre que se cumpla la condición de cierre.

La expresión de la fórmula de la esperanza matemática se presenta más abajo, según se trate de una variable aleatoria discreta o continua:

CASO DISCRETO CASO CONTINUO

(si se cumple ) (si se cumple

)

Conceptualmente hablando, la esperanza matemática es la media aritmética de la variable aleatoria en términos teóricos o ideales. Se diferencia de la media aritmética desarrollada en los capítulos precedentes, en que ésta última es empírica y real. Por eso puede efectuarse una distinción entre ambas diciendo que la esperanza matemática se asimila a una media poblacional, por lo que puede escribirse E(x) = x, mientras que es una media muestral.

Otra forma adecuada de denominar a la esperanza matemática, es señalarla con la expresión número más probable de veces que ocurra el fenómeno esperado en un número grande de realizaciones del experimento aleatorio, lo cual, en algunos casos, suele resultar más sencillo y comprensible.

Es la apuesta justa, tal que en un número grande de jugadas no se pierda ni se gane o se pierda en igual medida de lo que se gane.

b) Propiedades de la Esperanza matemática: Las propiedades de la Esperanza matemática se enuncian con facilidad si se recuerdan las propiedades ya estudiadas de la media aritmética. Fundamentalmente, las propiedades más importantes son las siguientes:

1) La esperanza matemática de la suma de una constante más una variable es igual a la constante más la esperanza de la variable.

E(a + xi) = a + E(xi)

2) La esperanza matemática del producto de una constante por una variable es igual a la constante por la esperanza de la variable.

E(axi) = a E(xi)

3) La esperanza matemática de la suma de dos variables es igual a la suma de sus respectivas esperanzas matemáticas.

E(xi + yi) = E(xi) + E(yi)

Page 34: Estadistica I 2

9. Varianza y desvió estándar de la variable aleatoria.

La variancia de la variable aleatoria constituye un concepto similar al de la variancia estudiada en el tema Distribuciones de Frecuencias, ya que se trata de una medida de dispersión cuya fórmula, a similitud de aquélla, es

Recordando que la variancia puede calcularse mediante una fórmula de trabajo, se presenta a continuación en su versión para el caso discreto:

Finalmente, así como la esperanza matemática se considera similar a la media poblacional, la variancia de la variable aleatoria se considera conceptualmente una variancia poblacional, y como tal se simboliza del siguiente modo:

V(x) = x2

pudiéndose obtener el desvío estándar mediante la aplicación de la raíz cuadrada en las expresiones indicadas precedentemente, es decir

DS(x) = = x

Ejemplos:

1) Calcular la esperanza matemática, la variancia y el desvío estándar en la distribución de probabilidad de la variable aleatoria “resultado que se obtiene al arrojar un dado” (a partir del ejercicio 1, ver páginas 122).

xi pi xi pi xi2 pi

1 1/6 1/6 1/62 1/6 2/6 4/63 1/6 3/6 9/64 1/6 4/6 16/65 1/6 5/6 25/66 1/6 6/6=1 36/6

21/6 = 3,5 91/6

2) Calcular la esperanza matemática, la variancia y el desvío estándar en la distribución de probabilidad “resultado que se obtiene al arrojar dos dados” ( a partir del ejercicio 2, ver página 123).

xi pi xi pi xi2 pi

Page 35: Estadistica I 2

2 1/36 2/36 4/36 3 2/36 6/36 18/36 4 3/36 12/36 48/36 5 4/36 20/36 100/36 6 5/36 30/36 180/36 7 6/36 42/36 294/36 8 5/36 40/36 320/36 9 4/36 36/36 324/3610 3/36 30/36 300/3611 2/36 22/36 242/3612 1/36 12/36 144/36

252/36 = 7 1974/36

3) Un alumno se presenta a un examen. De las quince bolillas del programa, él conoce 5 de ellas como para obtener una calificación igual a 10 puntos; 4, como para obtener una calificación de 6 puntos; 3, como para obtener una calificación de 4 puntos, y de las tres bolillas restantes no conoce nada. Si el profesor le hace preguntas de todas las bolillas y el examen se aprueba, con una calificación de 6, ¿le conviene presentarse al examen?

Variable: Calificaciónxi

Probabilidadpi

xi pi

10 5/15 50/15 6 4/15 24/15 4 3/15 12/15 1 3/15 3/15

15/15 = 1 89/15

Conclusión: no le conviene presentarse porque el puntaje esperado es menor que la nota necesaria para aprobar.

4) Una empresa tiene registros de sus ventas mensuales correspondientes tanto a épocas en las que realizaba publicidad como a épocas en las que no la realizaba. Partiendo de esos datos y considerando que el beneficio sobre los importes vendidos por la empresa pueden estimarse en un 30 % ¿cuál debería ser el costo máximo de la campaña publicitaria para no tener pérdidas, en función de la diferencia esperada de ventas que puede conseguir?

Ventas sin publicidad Ventas con publicidadVenta ($) pi xi pi Venta ($) pi xi pi

10.000 0,45 4.500 15.000 0,40 6.00020.000 0,30 6.000 25.000 0,30 7.50030.000 0,15 4.500 35.000 0,20 7.000

Page 36: Estadistica I 2

40.000 0,10 4.000 50.000 0,10 5.0001,00 $19.000 1,00 $25.500

La diferencia esperada es: E(y) - E(x) = 25.300-19.000= 6.500

El beneficio esperado estimado sobre esa diferencia será: ($6500) (30%) = $1.950

Conclusión: la campana publicitaria debería tener un costo menor o igual a $ 1.950.

CUADRO SINOPTICO SOBRE TEORIA ELEMENTAL DE LA PROBABILIDAD

Colaboración de la Profesora María de los Arcos Martínez

Page 37: Estadistica I 2

INFERENCIA ESTADÍSTICA

Bolilla 11 – Distribuciones de probabilidad discretas y continuas

INTRODUCCION : En el punto 7 del capítulo Teoría elemental de la probabilidad se definieron y desarrollaron en forma genérica los principales conceptos del tema Distribuciones de Probabilidad, aclarándose la diferencia existente entre las funciones de probabilidad y las funciones de densidad. Este capítulo tratará acerca de algunos ejemplos de este tipo de Distribuciones de probabilidad, tanto discretas como continuas. Las distribuciones se caracterizan por establecer la probabilidad de ocurrencia de la variable aleatoria en una serie de pruebas repetidas.

1. Distribución Binomial: deducción de su formula. Esperanza y varianza.

a) Condiciones para su aplicación : La Distribución Binomial, fue estudiada originalmente por el matemático Bernoulli por lo cual también se la conoce también como la Distribución o Fórmula de Bernoulli, surge a partir de las siguientes condiciones:

1) Se trata de una distribución para variable discreta

2) Se realiza un experimento aleatorio que sólo puede generar resultados dicotómicas, lo cual quiere decir que sólo puede dar lugar a la ocurrencia de dos sucesos posibles: el suceso A (favorable) o su opuesto (favorable).

3) El experimento aleatorio se realiza n veces manteniendo la independencia (sucesos independientes) entre las distintas realizaciones.

4) En cualquier realización del experimento la probabilidad de A es igual a p, o sea es constante y, por consiguiente, la probabilidad de es (1 - p) = q. Como por la tercera condición las probabilidades p y q se mantienen constantes, entonces: P(A) = p y P(A) = 1 - p = q.

Objetivo: En las condiciones indicadas precedentemente, se desea calcular cuál es la probabilidad de que, en las n realizaciones del experimento, se presente x veces el suceso A.

b) Deducción de la fórmula de la Distribución Binomial:

Si el experimento aleatorio se realiza n veces en las condiciones indicadas precedentemente, y en x ocasiones debe presentarse el suceso A, es evidente que en las restantes (n - x) ocasiones se presentará el suceso opuesto . A un conjunto de esas n realizaciones del experimento lo denominaremos secuencia. La secuencia i-ésima se simbolizará con Si.

Supongamos ahora que la primera secuencia (S1) sea aquella en la que, realizados los n experimentos, se presentan, en primer lugar, los x sucesos A y, a continuación, los (n - x) sucesos . Por consiguiente, esa secuencia S1

será:

Page 38: Estadistica I 2

S1 = A1 y A2 y ... y Ax y y ... y

Sí en la igualdad precedente se aplica el concepto de probabilidad, tendremos que:

P(S1)= P(A1 y A2 y ... y Ax y y ... y )

Como las n realizaciones del experimento son independientes, el cálculo de esa probabilidad se resuelve mediante la aplicación de la regla de la multiplicación para ese tipo de sucesos, lo que da como resultado lo siguiente:

P(S1)= P(Al) P(A2) ... P(Ax) P( ) ... P( ) = (recordando que la P(A) = p y la P( ) =q)

que resulta ser la probabilidad de la secuencia S1.

Cualquier otra secuencia Si (para i 1) estará también compuesta por x sucesos A y (n - x) sucesos A pero con un orden diferente de aparición. Por ejemplo, denominemos con S2 a la secuencia que modifica la posición de los sucesos Ax y , de modo que la nueva secuencia tendrá la siguiente disposición:

S2 =A1 y A2 y ... y y y ... y

Mediante un procedimiento similar al aplicado en el caso de la S1, la probabilidad de esa secuencia será:

P(S2)= P(Al y A2 y ... y y y ... y ) =

= P (A1) P (A2) ... P( ) P( ) ... P( ) =

= p p … p q … q = px qn – x (1)

La expresión final de la probabilidad de la secuencia S2 contiene, como puede verse si se la estudia con cierto cuidado, x factores iguales a p y (n - x) factores iguales a q, lo que en definitiva da como resultado px qn - x, igual al de la probabilidad hallada para el caso de la secuencia 1. Lo que esto quiere decir es que la probabilidad de cualquier secuencia Si es igual a px qn – x porque todas tienen igual composición.

Ya se ha mencionado que cualquier secuencia Si está, compuesta por x repeticiones del suceso A y (n - x) repeticiones del suceso , y que existen varias secuencias posibles (de las cuales la S1 y la S2 son sólo un par de ejemplos). Ahora indicaremos con j al total de secuencias posibles diferentes entes entre sí, y veremos que la presentación de una secuencia cualquiera de esas j excluye a las restantes. Es decir que las j secuencias posibles Si son excluyentes entre sí.

Por consiguiente, la probabilidad buscada puede enunciarse del siguiente modo: P(en n realizaciones se presente x veces A)= P(S1 o S2 o ... o Sj) = P(S1) + P (S2) + ... + P(Sj) = recordando por (1) que cada secuencia tiene igual probabilidad de ocurrir, por la aplicación de la regla de la adición para sucesos excluyentes

(2)

Queda ahora por definir cuál es el valor de j, para lo cual recordaremos que ese valor se obtiene calculando las permutaciones con repetición de n elementos, entre los cuales hay un conjunto de x repetidos y un conjunto de (n - x) repetidos, que se resuelve mediante la fórmula de las combinaciones simples de n elementos tomadas de a x, es decir que

Page 39: Estadistica I 2

Por consiguiente, la fórmula final de la probabilidad binomial se obtiene reemplazando adecuadamente en (2) y obteniendo

P(en n realizaciones se presente x veces A)=

Ejemplos:

1) Se arrojan al aire tres monedas. Hallar la probabilidad de que se presenten dos caras.

Como se cumplen las condiciones exigidas para la aplicación del esquema binomial, ya que las realizaciones del experimento son independientes, el cálculo de la probabilidad deseada se realiza determinando los siguientes valores:

n: Número de realizaciones del experimento = 3

x: Número de presentaciones del suceso A (cara) = 1/2 y

p: Probabilidad del suceso A = 1/2

q: Probabilidad del suceso = 1/2

Luego: P(en 3 tiradas aparezcan 2 caras) =

2) La probabilidad de que un cliente que se encuentra en una cola del supermercado abone en efectivo es igual 2/5. Hallar la probabilidad de que si en la cola hay cuatro clientes.

a) dos de ellos abonen en efectivo.

b) entre uno y tres clientes abonen en efectivo.

c) al menos uno de los clientes abone en efectivo.

Como se considera que cada cliente decide su forma de pago de manera independiente, las soluciones son:

a) P(de 4 clientes 2 abonen en efectivo) =

b) P(de 4 clientes entre 1 y 3 abonen en efectivo.) =

c) P(al menos 1 cliente le pague en efectivo)

= 1 - P(ningún cliente pague en efectivo) = 1 -

c) Condición de cierre en la Distribución Binomial:

Page 40: Estadistica I 2

Recordemos que la condición de cierre es aquélla que establece que la . Por consiguiente, el cumplimiento de esa condición, en el caso de la Distribución Binomial, se demuestra sumando las probabilidades a lo

largo de todo el campo de variación de la variable, es decir, haciendo

Si en esta última expresión se desarrolla la sumatoria entre 0 y n, se obtiene = (p + q)n según la

fórmula de Newton para el desarrollo del binomio. Pero de acuerdo con las condiciones de la Distribución Binomial, como (p + q) = 1, también será (p + q)n = 1, de modo que queda demostrada la condición de cierre en esta Distribución.

Asimismo queda en evidencia que el nombre binomial proviene del hecho que cada término del binomio desarrollado precedentemente da como resultado la probabilidad para los diferentes valores de la variable aleatoria x.

Comprobación empírica: Verificar el cumplimiento de la condición de cierre en el caso de la distribución binomial del ejemplo 1 precedente (ver página 130).

Nº de caras (x)

Probabilidadp(x)

Resultado numérico

0P(x = 0) =

1/8

1P(x = 1) =

3/8

2P(x = 2) =

3/8

3P(x = 3) =

1/8

d) Parámetros de la Distribución Binomial - Esperanza matemática:

Según se ha explicado oportunamente, la Esperanza Matemática se calcula a partir de la fórmula teórica . En el caso de la Distribución Binomial, debe utilizarse la expresión matemática que le corresponde

por lo que, en ese caso

. Al desarrollar la sumatoria, como el valor inicial de x es el cero, tenemos

Haciendo ahora n! = n (n-1)!; x! = x (x-1)! y verificando que (n - x) = [(n - 1)-(x - 1)], podemos escribir

en la cual simplificamos x en numerador y denominador y consideramos tanto a n como a p constantes respecto de la sumatoria, por lo cual extraemos ambos elementos, pero en ese caso la sumatoria ahora deberá tener como límite superior el valor (n - 1) en lugar del valor n. De lo contrario podríamos estar en presencia de un número combinatorio

de cálculo imposible.

Por eso hacemos

Page 41: Estadistica I 2

Reemplazando los elementos intervinientes de la siguiente forma:

ya que la sumatoria que aparece en el último término es igual a la unidad por la condición de cierre de la distribución binomial. Con lo cual se ha demostrado que en la distribución binomial

E(x) = n p

Ejemplos:

1) Se arrojan cuatro monedas. Encontrar

a) la distribución de probabilidad del “número de caras que pueden presentarse”.

b) Hallar la esperanza matemática de la variable aleatoria, es decir, el número esperado de caras que pueden aparecer cuando se arroja cuatro monedas.

a) En el siguiente cuadro se presenta la Distribución de probabilidad requerida.

Nº de caras (x)

Probabilidadp(x)

Resultado numérico

xi pi

0P(x = 0) =

1/16 0

1P(x = 1) =

4/16 4/16

2P(x = 2) =

6/16 12/16

3P(x = 3) =

4/16 12/16

4P(x = 4) =

1/16 4/16

b) En la cuarta columna del cuadro precedente se efectuó el producto xi pi, valores con cuya sumatoria se obtiene la esperanza matemática. Sin embargo, según la demostración teórica realizada en el punto d) (ver página 131), en este caso la esperanza también puede calcularse efectuando el producto n p . Como n = 4 y p = 1/2, se verifica que, efectivamente

e) Parámetros de la Distribución Binomial - Variancia:

Recordando que la variancia de la variable aleatoria se obtiene mediante la fórmula de trabajo

, en el caso de la distribución binomial la escribiremos como:

Page 42: Estadistica I 2

en la cual, haciendo x2 = x (x - 1) + x quedará = .

Si distribuimos los términos del corchete quedará convertido en

Ahora verificamos que la segunda de las sumatorias es la esperanza matemática de la Distribución Binomial (n p) y que la primera de las sumatorias se puede desarrollar tomando para la variable x los valores 0 y 1, con lo que se puede escribir del siguiente modo:

comprobando que los dos primeros sumandos encerrados en el corchete son iguales a cero, de modo que resultará

Sabiendo que n! = n (n-1) (n-2)!, que x! = x (x-1) (x-2)!, que px, =p2 px – 2 y que (n - x) = (n - 2) - (x - 2), ahora hacemos

Simplificando los términos x (x - 1) del numerador y denominador y tomando en consideración que tanto n (n - 1) como p2 son constantes y que como tales pueden ser extraídos de la sumatoria, tendremos que

expresión ésta en la que observamos que la sumatoria varía hasta (n - 2) debido a que se han extraído de la sumatoria los términos n y (n - 1).

A continuación se transformarán los elementos que intervienen, del siguiente modo:

en la cual la sumatoria es igual a la unidad por ser el desarrollo de la condición de cierre. Por lo tanto

= n (n – 1) p2 + n p – (n p)2 = n2 p2 - n p2 + n p - n2 p2 = - n p2 + n p = n p - n p2 = n p (1 – p) = n p q

Page 43: Estadistica I 2

Conclusión: en la Distribución Binomial la variancia es

V(x) = n p q

y el desvío estándar es

Ejemplo:

1) Calcular la variancia y el desvío estándar en la distribución de probabilidad de la variable aleatoria “número de caras que pueden presentarse al arrojar cuatro monedas”. Al aplicar las fórmulas de cálculo correspondientes a la distribución binomial, se obtiene

2) La probabilidad que un cliente que está por abonar su compra en un supermercado lo haga en efectivo es igual a 2/5. Sin en una cola hay cuatro clientes:

a) Construir la distribución de probabilidad de la variable aleatoria “número de clientes que abonan en efectivo”.

b) Calcular el número esperado de clientes que abonan en efectivo.

c) Calcular la variancia y el desvío estándar.

a)

Nº de clientes (x)

Probabilidadp(x)

Resultado numérico

0P(x = 0) =

81/625

1P(x = 1) =

216/625

2P(x = 2) =

216/625

3P(x = 3) =

96/625

4P(x = 4) =

16/625

Page 44: Estadistica I 2

b) personas pagaran sus compras en efectivo

c)

2. Distribución de Poisson: deducción de su formula. Esperanza y varianza.

a) Condiciones para su aplicación : Algunas de las condiciones requeridas para aplicar la Distribución de Poisson son similares a las exigidas para aplicar la Distribución Binomial:

1. En cada una de las realizaciones del experimento aleatorio se presentan resultados dicotómicos.

2. El experimento aleatorio se realiza n veces en condiciones de independencia.

3. cada uno de los posibles resultados tiene probabilidades constantes a lo largo de las realizaciones del experimento.

4. Las n realizaciones del experimento crecen notoriamente, lo cual equivale a decir que n .

5. La probabilidad p del suceso A es notoriamente pequeña, es decir que p 0 y n p 5. Esta condición en particular determina que se denomine a esta distribución la Distribución de los sucesos raros, considerando que la probabilidad del suceso A es muy pequeña.

6. Las realizaciones del experimento se cumplen en un intervalo de tiempo continuo y no, como en el caso de la binomial, en momentos fijos o determinados.

b) Deducción de la fórmula de la Distribución de Poisson:

El análisis de las condiciones requeridas para la aplicación de la Distribución de Poisson demuestran que en principio no existen, salvo el caso de las dos últimas, diferencias sustanciales con las exigidas para la aplicación de la Distribución Binomial. Pero cuando aparecen precisamente las dos últimas condiciones, la aplicación de la fórmula Binomial se vuelve sumamente laboriosa - lo cual se verifica tan solo si se piensa en calcular el número combinatorio

n para n -y los resultados que se obtienen son sumamente imprecisos.

A raíz de esta circunstancia es que Poisson obtuvo la expresión de la fórmula que lleva su nombre, haciendo en primer lugar las siguientes transformaciones:

n p = (letra griega denominada lambda)

luego, q = 1 – p = 1-

A partir de lo anterior, aplicando el límite de la Distribución Binomial cuando n , se tiene

Page 45: Estadistica I 2

Ahora puede verificarse que al desarrollar en el numerador (n)! y en el denominador (n - x)! se pueden simplificar los términos (n- x) (n –x)... 2.1 presentes en ambos desarrollos, con lo cual en el numerador quedará una expresión compuesta por el producto de x términos desde n hasta (n – x + 1), términos que además, pueden ser divididos por los x términos correspondientes a nx, es decir que la expresión anterior puede ser presentada de la siguiente manera:

dividiendo cada uno de los x términos del numerador por los x términos iguales a n del denominador

expresión ésta en la cual, al aplicar límite para n, los términos encerrados entre paréntesis desde el primero hasta

se igualan a la unidad, mientras que está compuesto por factores constantes, de modo que podemos

escribir

donde

que resulta ser la fórmula de la Distribución de Poisson.

Ejemplo: 1) La probabilidad de que en el lapso de un día en una sucursal bancaria un cheque sea devuelto sin fondos es 0,02. Suponiendo que en esa sucursal se presenten 450 cheques diariamente. ¿Cuál es la probabilidad de que en esa sucursal

a) ... sean devueltos 5 cheques sin fondos por día?

b) ... al menos un cheque sea devuelto sin fondos?

a) = n p = (450) (0,02) = 9

P(5 cheques devueltos)

Page 46: Estadistica I 2

b) P(al menos 1 cheque devuelto) 1 - P(0 cheques devueltos) = 1

c) Condición de cierre:

Para demostrar que se cumple la condición de cierre, a la fórmula de la Distribución de Poisson se le aplica sumatoria en todo el campo de variación de la variable:

sabiendo que e- es un valor constante y desarrollando la sumatoria

d) Parámetros de la Distribución de Poisson - Esperanza matemática:

Extrayendo constante fuera de la sumatoria y simplificando las x del numerador y del denominador, se consigue la siguiente expresión, en la cual la sumatoria ahora se extenderá entre 1 e infinito debido a que se ha

simplificado una de, las x:

Haciendo ahora (x - 1) = X, al verificarse que cuando x = 1 ocurre que X = 0, escribimos

por condición de cierre

Por consiguiente, la esperanza matemática en la Distribución de Poisson es igual a c)

e) Parámetros de la Distribución de Poisson - Variancia: La variancia de una variable aleatoria se calcula aplicando

que en el caso de la Distribución de Poisson se convierte en

en la cual, reemplazando x2 por la expresión (x) (x - 1) + x, quedará

(*)

Analizaremos cada una de las expresiones indicadas como (1) y (2) en forma

Page 47: Estadistica I 2

independiente comenzando por la (1):

Tomando en consideración que 2 es constante y simplificando x (x - 1) del numerador y del denominador (con lo cual la sumatoria variará ahora a partir del valor x = 2), se verifica que la expresión (1) queda convertida en

. Haciendo ahora (x - 2)= X, (con lo cual cuando x = 2 será X = 0), tendremos

por condición de cierre

A continuación analizaremos la expresión (2): . Podemos verificar a simple vista que se

trata de la esperanza matemática de la variable aleatoria en el caso de la Distribución de Poisson (ver punto d) página 129), cuyo resultado es igual a .

Por consiguiente, volviendo a la expresión marcada con (*), reemplazando en ella adecuadamente cada uno de sus términos, veremos que, en el caso de la Distribución de Poisson

V(x) = 2 + - 2 =

Se verifica, entonces, que la Distribución de Poisson tiene la Esperanza Matemática igual a la Variancia, en ambos casos iguales a .

f) Proporcionalidad de la Distribución de Poisson: Se ha indicado teóricamente (ver punto a)- página 127) que entre las condiciones requeridas para la aplicación de la Distribución de Poisson se encuentra aquella que establece que las realizaciones del experimentó, aleatorio deben cumplirse en un intervalo de tiempo continuo. Eso permite la aplicación del principio de la proporcionalidad que establece que el parámetro Esperanza Matemática del proceso bajo estudio, indicado en este caso con el símbolo , es proporcional a la extensión total del tiempo de duración del proceso. Por eso mismo, una Distribución de Poisson con un valor particular de correspondiente a un proceso que tiene una duración determinada de tiempo, puede aplicarse sin inconvenientes, a un proceso que tiene una duración de tiempo menor, modificando proporcionalmente el valor de .

Ejemplo: La oficina de un servicio de reparaciones de equipos de aire acondicionado recibe durante el verano, en promedio, cinco pedidos de reparación por hora. ¿Cuál es la probabilidad de que reciban tres pedidos en media hora?

Para comprender mejor el problema, se calculará primero la probabilidad de que se reciban tres pedidos para el tiempo total, que equivale a una hora, teniendo presente que en el ejemplo planteado = 5:

P(en 1 hora, 3 pedidos)

Ahora obtengamos el valor proporcional de para media hora. Como para una hora = 5, para media hora deberá ser igual a 2,5, por lo que la probabilidad pedida se calcula haciendo:

P(en 1/2 hora, 3 pedidos)

3. Distribución de Hipergeométrica: deducción de su formula. Esperanza y varianza

a) Condiciones para su aplicación : La Distribución Hipergeométrica se aplica cuando las realizaciones del experimento aleatorio se realizan sin reposición o generan sucesos que son condicionales entre sí, lo cual

Page 48: Estadistica I 2

marca la principal diferencia con las distribuciones Binomial y de Poisson, ambas para realizaciones con reposición o independientes entre sí.

La Distribución Hipergeométrica tiene bastante aplicación para calcular probabilidades en el área de la Auditoria, ya que en esa área la selección de elementos suele efectuarse sin reposición.

El siguiente ejemplo de tipo teórico permite presentar el tema: un conjunto de N elementos contiene X elementos que poseen una característica determinada A, mientras el resto de los (N - X) elementos no la poseen. Se selecciona una cantidad n de elementos, efectuando la elección sin reponer y se desea calcular la probabilidad de que, en esos n elementos, haya x elementos que posean la característica A.

En las condiciones planteadas, debe cumplirse que

N > 0

X N

1 n N

0 x n y x X

lo que equivale a decir que la probabilidad de que se presente el suceso A en el primero de los experimentos es:

.

b) Deducción de la fórmula de la Distribución Hipergeométrica:

La deducción de la fórmula de la Distribución Hipergeométrica se plantea a partir de un análisis semejante al realizado en la deducción de la fórmula de la Distribución Binomial: el experimento aleatorio se realiza n veces,( pero en este caso sin reposición) y se desea que en x ocasiones se presente el suceso A, de lo cual surge claramente que en las restantes (n - x) ocasiones deberá presentarse el suceso opuesto . Denominaremos secuencia i-ésima a un conjunto de esas n realizaciones del experimento, que simbolizaremos con Si.

Supongamos ahora que la primera secuencia (S1) sea aquella en la que, realizados los n experimentos, en primer lugar se presentan los x sucesos A y, a continuación, los (n - x) sucesos . Teniendo presente que los sucesos son condicionales, esa secuencia S1 será:

Si en la igualdad precedente se aplica el concepto de probabilidad, tendremos que:

Como las n realizaciones del experimento son condicionales, el cálculo de la probabilidad se resuelve mediante la aplicación de la regla de la multiplicación para ese tipo de sucesos, o sea:

Page 49: Estadistica I 2

Tomando en consideración, como ya se ha indicado, que la y que con cada N realización del

experimento el valor de la probabilidad se calcula modificando en una unidad menos las cantidades tanto del numerador X como del denominador N, la expresión anterior se convierte en n factores

Ahora bien, en el numerador X (X '- 1)! (X - 2) ... [(X - x) +1] = .

(N – X) [(N - X) –1] .... [(N – X ) - (n - x) + 1] = ; y

mientras que en el denominador: N (N - 1) (N - 2) ... [(N – n) +1] = .

Reemplazando adecuadamente los términos de la fórmula de la probabilidad deducida anteriormente se obtiene:

que resulta ser la probabilidad de la secuencia S1.

Cualquier otra secuencia Si (para i 1) está compuesta por la misma cantidad de sucesos A y de sucesos que la secuencia S1, pero con un orden de aparición diferente. Por ejemplo, denominemos con S2 a la secuencia que modifica la posición de los sucesos Ax y :

Recordando la deducción realizada para la Distribución Binomial que, a pesar de incluir realizaciones con reposición sirve claramente de referencia para obtener los resultados en este caso, integrado por realizaciones sin reposición, verificaremos que la probabilidad de esa secuencia S2 es exactamente igual que la de la secuencia S1 y exactamente igual que cualquier otra secuencia Si. Por consiguiente, si todas las secuencias tienen igual probabilidad, el resultado de la probabilidad total buscada se obtiene multiplicando la probabilidad de una secuencia por la cantidad

total de secuencias. Esa cantidad esta dada por el resultado de realizar el cálculo del numero combinatorio .

Es decir que, finalmente, la probabilidad de realizar n experimentos condicionales y obtener x veces un suceso A está dada por la siguiente fórmula, correspondiente a la Distribución Hipergeométrica:

Page 50: Estadistica I 2

Por consiguiente, la probabilidad en la Distribución Hipergeométrica se obtiene haciendo

P(en n realizacíones; xapariciones)

Ejemplo: Un supermercado cuenta con un plantel de doce cajeros, de los cuales 4 son noveles y los demás son expertos. En un día de trabajo cualquiera se presentan a trabajar 9 de esos cajeros. ¿Cuál es la probabilidad de que haya 2 noveles?

Para aplicar la fórmula se requiere asignar los valores a los elementos que intervienen en ella, es decir que N = 12; X = 4 (X se refiere a la cantidad de cajeros noveles); n = 9 y x = 2. Luego

P(en 9 cajeros haya 2 noveles)

c) Condición de cierre: La condición de cierre en la Distribución Hipergeométrica se puede demostrar a partir de la igualdad

(u + v)A + B = (u+ v)A (u + v)B, mediante la cual se verifica que

Es decir que se puede afirmar que por lo que la suma de las probabilidades hipergeométricas es

igual a la unidad.

d) Parámetros de la Distribución Hipergeométrica - Esperanza matemática:

Del mismo modo que en los demás casos, en éste la Esperanza matemática se obtiene aplicando su fórmula de cálculo, es decir, haciendo

Page 51: Estadistica I 2

Sabiendo que X, N y n son constantes; que se pueden simplificar las x del denominador y del numerador; que cualquier término de la forma (a - b) se puede escribir como (a - 1) - (b - 1); y que la sumatoria deberá extenderse ahora hasta el término (n - 1), tenemos

Si ahora establecemos un procedimiento de reemplazo de variables haciendo

X - 1 = Z

x - 1 =Z

N – 1 = M

n - 1 = m

podemos modificar la última expresión hallada, para lo cual debemos recordar que la sumatoria de la Distribución Hipergeométrica es igual a uno por la condición de cierre y tomar en consideración que si la variable x se convierte en la variable z, cuando x sea igual a 1, z será igual a 0. Por eso, se obtiene:

Finalmente, como , podemos decir que

e) Parámetros de la Distribución Hipergeométrica - Variancia:

Partiendo de la aplicación de la fórmula de trabajo para la variancia, en el caso de esta distribución se tiene que

Page 52: Estadistica I 2

De los dos términos marcados con llaves, el término (2) corresponde al desarrollo de la esperanza matemática,

es decir que es igual a . Por consiguiente corresponde desarrollar el término indicado con (1), de lo cual resulta

la siguiente deducción:

(simplificando x (x - 1) tanto en el numerador como en el denominador y transformando las variables de modo que x - 2 = z,- X - 2= Z; n – 2 = m y N - 2 = M)

Retornado a la fórmula principal, quedará expresada del siguiente modo:

sacando común denominador N2 (N - 1) y factor común n X)

(simplificando los términos N y N n X que poseen signos contrarios)

Luego

4. Distribución Normal:

Page 53: Estadistica I 2

a) Conceptos fundamentales: La Distribución Normal fue descubierta simultánea e independientemente por los matemáticos Gauss y Laplace - por lo cual también lleva sus nombres - al estudiar la distribución de los errores en las mediciones realizadas en cierto tipo de pruebas experimentales. Ambos llegaron a la conclusión que esos errores, si bien tenían un comportamiento aleatorio, se manifestaban en general siguiendo un modelo que respondía a una expresión matemática, que simbolizáremos con f(x), del siguiente tipo:

(para - xi + )

cuya gráfica tiene una forma “campanular”, desciende simétricamente a ambos lados del valor o eje de simetría, es similar a la siguiente figura.

donde:

es la media poblacional

es el desvió estándar poblacional

e es el número base de los logaritmos neperianos

La característica fundamental es que f(x) 0 y f(x) 1 para calcular f(x) se debe usar la función de densidad es decir el calculo por áreas.

cuyos parámetros son

E(x) = x

V(X) = x2

a partir de lo cual se deduce que DS(x) = = x

Simbólicamente, la expresión de la normal se puede indicar escribiendo en forma abreviada del siguiente modo:

xi ~ N(x ; x2)

lo cual equivale a decir “la variable xi se distribuye según una distribución normal con parámetros x y x2”

Como en toda función de densidad, la probabilidad de que la variable aleatoria xi se encuentre entre dos valores arbitrarios x1 y x2 está dada por el área A bajo la curva cuyo valor se encuentra integrando la función f(x) entre ambos valores, es decir que

Page 54: Estadistica I 2

P(x1 xi x2) = A =

en tanto la probabilidad en un punto cualquiera, por ejemplo P(xi = x2), no tiene sentido.

b) Variables Normal estandarizada: Si bien previamente se ha indicado que la forma de hallar las probabilidades en la distribución normal consiste en calcular la integral de la función correspondiente entre dos puntos cualesquiera de la variable aleatoria bajo estudio, lo que equivale a un área, la solución práctica para obtener esas probabilidades consiste en utilizar la Tabla de Probabilidades, apropiada para calcular cualquier probabilidad en el caso normal, sin que importe cuáles son los valores particulares de la variable aleatoria ni los parámetros de la distribución. La tabla aparece al final del presente capítulo como Tabla Nº 1 (ver página 122) y se utiliza en cualquier circunstancia en la que la variable aleatoria se distribuya normalmente, pero para su aplicación se requiere transformar la variable xi bajo estudio en una variable estandarizada zi (ver Unidad 5 “Medidas de Dispersión” - punto 5 - página 61), utilizando

la transformación , con lo cual se consigue que la media y la variancia de zi sean,

respectivamente, iguales a cero y a uno o se la probabilidad de zi siempre se encontrara entre –1 y 1 P(- 1 zi 1) . Efectuada la transformación se utiliza la tabla, reconociéndose dos casos diferentes de búsqueda:

c) Cálculo de las probabilidades: uso de tablas

Caso de búsqueda directa: se dispone de determinados valores de la variable aleatoria y se obtienen en la tabla las probabilidades que les corresponden.

Caso de búsqueda inversa: se dispone de ciertos valores de probabilidad y se desea encontrar a qué valores de la variable aleatoria corresponden.

Caso directo: Para practicar el manejo de la tabla, se considerará que ya se ha efectuado la transformación de la variable xi en la variable estandarizada zi. y se presentarán las siguientes alternativas:

1) Hallar la probabilidad de que la variable zi se encuentre entre los valores cero y 1,38, es decir P(0 zi 1,38).

Se puede verificar en el gráfico de la izquierda que el área más oscura es la probabilidad requerida, y que ella se puede obtener, en este caso, directamente de la tabla. Luego la

P(0 zi 1,38) = 0,4162

Page 55: Estadistica I 2

2) Hallar la probabilidad de que la variable zi se encuentre entre los valores -1,53 y cero, es decir P(- 1,53 zi 0).

El área correspondiente a la probabilidad pedida se presenta sobre el semieje negativo de las abscisas. Como la curva es simétrica, esa área es equivalente a aquella extendida sobre el semieje positivo, alternativa que fuera planteada en el caso 1) anterior, es decir que

P(- 1,53 zi 0) = P(0 zi 1,53) = 0,4370

3) Hallar la probabilidad de que la variable zi se encuentre entre los valores -2,11 y 2,11, es decir que

P(- 2,11 zi + 2,11).

El área que corresponde a la probabilidad pedida es simétrica respecto del valor cero, por lo que se obtiene sumando dos áreas equivalentes extendidas sobre el semieje positivo, es decir que

P(- 2,11 zi 2,11) = P(0 zi 2,11) + P(0 zi 2,11) = 2 P(0 zi 2,11) = 2 (0,4826) = 0,9652

4) Hallar la probabilidad de que la variable zi se encuentre entre los valores -1,96 y 1,58, es decir

P(- 1,96 zi + 1,58).

El área que corresponde a la probabilidad pedida se puede obtener sumando los sectores de la izquierda y de la derecha, que en este caso no son iguales entre sí. Como la curva es simétrica, la

P(- 1,96 zi 1,58) =

= P(0 zi 1,96) + P(0 zi 1,58) = 0,4750+0,4429 == 0,9179

5) Hallar la probabilidad de que la variable zi se encuentre entre los valores 1,29 y 2,07, es decir P(1,29 zi 2,07).

El área que corresponde a la probabilidad pedida se puede obtener restando a la superficie bajo la curva entre los valores cero y 2,07, la superficie entre los valores cero y 1,29, es decir que

P(1,29 zi 2,07) == P(0 zi 2,07) - P(0 zi 1,29) = 0,4808 – 0,4015 = 0,0793

Page 56: Estadistica I 2

6) Hallar la probabilidad de que la variable zi se encuentre entre los valores -2,21 y -0,95, es decir P(- 2,21 zi - 0,95).

La probabilidad requerida puede obtenerse calculándola como si los valores de la variable fueran positivos, es decir, del mismo modo que como fue calculada en el caso 5 (anterior).

P(-2,21 zi - 0,95) = P(0,95 zi 2,21) == P(0 zi 2,21) - P(0 zi 0,95) = 0,4864 -0,3289 == 0, 1575

7) Hallar la probabilidad de que la variable zi sea mayor o igual que el valor 1,96, es decir P(zi 1,96). La probabilidad requerida se obtiene tomando toda el área a la derecha del valor cero, equivalente a 0,50, restándole el área entre 0 y 1,96.

P(zi 1,96) = 0,50 - P(0 zi 1,96) == 0,50 - 0,4750 = 0,025

8) Hallar la probabilidad de que la variable zi sea menor o igual que el valor - 1,47, es decir P(zi - 1,47).

La probabilidad requerida se calcula aplicando el procedimiento explicado en el caso 7, considerando el valor absoluto de 1,47, es decir que la

P(zi - 1,47) = P(zi 1,47) = 0,50 - P(0 zi 1,47) == 0,50 - 0,4292 = 0,0708

9) Hallar la probabilidad de que la variable zi sea mayor o igual que - 1,37, es decir P(zi - 1,37). La probabilidad buscada se obtiene luego de considerar que el área total requerida se extiende entre el valor -1,37 y + , lo cual equivale a tomar el área entre 0 y + , por un lado, y sumarle el área entre - 1,37 y 0 por el otro. Es decir,

P(zi - 1,37) = P(- 1,37 zi 0) + 0,50 == P(0 zi 1,37) + 0,50 = 0,4147 + 0,50 = 0,9147

Caso inverso: Se reconocen tres casos fundamentales.

Page 57: Estadistica I 2

1) Hallar el valor z1 tal que la probabilidad de que la variable zi esté entre 0 y z1 sea igual a 0,4441.

En el área de las probabilidades de la tabla. buscamos el valor 0,4441 y encontramos que ese valor está presente exactamente en la tabla y que se corresponde con un z1 igual a 1,59. Por consiguiente,

P(0 zi z1 = 1,59) = 0,4441 z1 = 1,59.

Si el valor de la probabilidad no estuviera presente exactamente en la tabla, se puede efectuar una interpolación aritmética entre aquellos dos que lo encierran o, en caso de no requerir demasiada precisión, tomar el valor más cercano que figura en la tabla.

2) Hallar los valores z1 y z2 tales que se tenga una probabilidad igual a 0,80 de que la variable zi se encuentre entre ambos.

En este caso se buscan dos valores de la variable zi, z1 y z2, que encierren una probabilidad igual a 0,80, es decir P(z1 zi z2) = 0,80. Este caso no tiene solución única, ya que hay infinitos pares de valores (z1 ; z2) que encierran un área igual a 0,80, y sólo puede resolverse si se amplía la información disponible.

3) Hallar el valor de z1 tal que la probabilidad de que la variable zi se encuentre entre - z1 y + z1 sea igual a 0,90. Para resolver este caso se busca aquel valor absoluto z1 de la variable zi que encierre una probabilidad igual a 0,90, es decir que P(- z1 zi + z1) = 0,90, el cual sí tiene solución única que se consigue reduciéndolo a un ejemplo del caso 1 anterior, es decir que correspondería calcular la P(0 zi z1) = 0,45, en la cual z1 = 1, 645.

Además del valor presentado en el ejemplo precedente, se reconocen como muy importantes dos valores adicionales de probabilidad, 0,95 y 0,99, por su futura aplicación.

Resumiendo: P(-z1 zi + z1) = 0,90 P(0 zi z1) = 0,45 = 1,65

P(-z1 zi + z1) = 0,95 P(0 zi z1) = 0,475 = 1,96

P(-z1 zi + z1) = 0,99 P(0 zi z1) = 0,495 = 2,58

Page 58: Estadistica I 2

Ejemplo: Una variable aleatoria tiene distribución normal con esperanza matemática x = 100 y variancia x2 = 900.

a) Hallar la probabilidad que la variable esté entre 50 y 150.

P(50 xi 150) = P(z1 zi z2)

Se obtienen los valores de z1 y z2:

Luego P(- 1,67 zi + 1,67) == 2 (0,4525) = 0,905

b) que la variable sea mayor o igual a 160.

P(xi 160) = P(zi z1)

El valor de z1 se obtiene mediante la estandarización, haciendo:

Luego: P(zi 2,00) = 0,50 - P(0 z1 2,00) = = 0,50 - 0,4772 = 0,0228

c) que la variable esté entre los valores 115 y 170.

P(115 xi 170) = P(z1 zi z2)

Se obtienen los valores de z1 y z2

mediante la estandarización:

Luego P(0,5 zi 2,33) == 0,4901 - 0,1915 = 0,2986

d) Condición de cierre en la Distribución Normal:

Para efectuar esta demostración, tomaremos en cuenta la existencia de la denominada integral de Gauss-Poisson, cuya expresión y solución son las siguientes:

Page 59: Estadistica I 2

Teniendo presente este dato, la condición de cierre se demuestra aplicando, como corresponde, la integral

Se efectúa a continuación el siguiente cambio de variables:

xi - x = x zi xi = x zi +x, por lo que resulta que dx =x zi . Si ahora se reemplazan esos términos en la integral anterior, queda la siguiente expresión:

,

en la cual se simplifican los términos semejantes del numerador y del denominador, tanto en la constante como en el exponente, de modo que la expresión queda finalmente

Esta última integral se extiende entre (- y +) y es equivalente a la suma de dos integrales de Poisson, una de las cuales se extiende entre (- y 0) mientras que la otra se extiende entre (0 y +) es decir que

La solución de las integrales, presentada al inicio de este punto, permite obtener el siguiente resultado final:

CUADRO SINOPTICO SOBRE DISTRIBUCIONES DE PROBABILIDAD- Colaboración de la Profesora María de los Arcos Martínez-

Page 60: Estadistica I 2

INFERENCIA ESTADISTICA

Unidad 12 – Teoría de las muestras

1. Conceptos y definiciones: media y proporción muestral.

En los capítulos iniciales del estudio de la Estadística se mencionó la existencia de la Teoría del Muestreo, que se ocupa de analizar y desarrollar los métodos apropiados para efectuar la selección de muestras que permitan llevar a cabo investigaciones estadísticas muestrales en reemplazo de las investigaciones censales, que requieren trabajar con toda la población.

En muchos casos resulta difícil trabajar con la totalidad de la población ya sea por la imposibilidad de recolectar la información como el tiempo que pueda demorar la realización de un censo, surge así la necesidad del uso

Page 61: Estadistica I 2

de las muestras, llamamos muestras a una parte de la población construida de tal manera que las conclusiones que de ella se obtengan sean aplicables y validas para toda la población.

El uso de muestras puede ser conveniente y otras veces indispensable como cuando el recuento de la población inutiliza la misma por ej., si probamos neumáticos y queremos hacer un control de calidad de los mimos no podemos probarlos a todos, para eso utilizamos una muestra que sea representativa de toda la población.

El uso de muestras plantea algunos interrogantes:

1) Como seleccionamos la muestra

2) Como hacer inferencias partiendo de esta muestra que sean validas para toda la población

3) Medir el grado de confianza de la muestra y su estimación

4) Poder aplicar partiendo de la muestra modelos matemáticos que sirvan para estimar la población.

Para efectuar el trabajo con muestras debemos realizar un muestreo, llamamos muestreo al proceso de seleccionar una muestra de elementos pertenecientes a la población pero de menor tamaño que permita establece conclusiones validas para toda la población, cuando las poblaciones son homogéneas no se justifica el muestreo podemos seleccionar una muestra de cualquier sector de la población por ejemplo en un análisis de sangre podemos seleccionar o extraer sangre de cualquier lugar del cuerpo, pero cuando las población no es tan homogénea debemos estudiar la formula para que al extraer la muestra los elementos que la componen sean lo suficientemente representativos de la población.

Ventajas del muestreo

Reducción de costos

Reducción de tiempo

Desventajas del muestro

Tiene trabajo adicional, ya que no solo se debe seleccionar hacer la encuesta sino que también se debe seleccionar cada unidad al azar pero con determinadas características.

La mayor desventaja del muestro es que puede ser no representativo lo que invalidaría todo el análisis posterior.

En el muestreo podemos cometer errores, algunos errores se llaman errores de muestreo y ocurren por ejemplo cuando la muestra no es suficientemente representativa de la población y otros se llaman sesgos, los errores del muestreo son debidos al azar, los sesgos son errores de muestro donde no intervienen el azar sino que se deben a procesos vinculados al personal encargado de recoger la información, los errores debidos al azar se pueden corregir aumentando el tamaño de la muestra, los sesgos en cambio no se pueden eliminar analíticamente sino que se debe realizar una nueva muestra.

En la Teoría de las Muestras se estudia que tipo de relaciones existen entre una población y las muestras

que pueden seleccionarse a partir de ella, con el objeto de describir estas relaciones y analizar qué provecho se puede obtener de ellas.

Para evitar desarrollos teóricos complejos, el tema será presentado empíricamente tomando como modelo un ejemplo publicado en el texto de aplicaciones estadísticas prácticas titulado “Teoría y Problemas de Estadística” de Murray Spiegel. La resolución del ejemplo permitirá la obtención de ciertas conclusiones generales que serán indicadas en cada caso.

2. Muestras grandes y muestras pequeñas.

Page 62: Estadistica I 2

No existe un criterio científicamente probado para determinar cuando una muestra es grande o pequeña, pero convencionalmente se acepta que si en una muestra es menor o igual a 30 es decir n 30 es pequeña y si es mayor que 30 o sea n > 30 se la considera como grande, la importancia de esta clasificación reside en que según el tamaño de la muestra se deberá elegir entre las distribuciones normal, t de Student o Chi cuadrado para levar a cabo estimaciones, pero eso es un tema que trataremos en la próxima bolilla.

3. Distribución muestral de las medias para casos:

a) con reposición

Ejemplo: Supongamos la existencia de una población de tamaño N = 5 que posee los siguientes valores de la variable aleatoria xi:

x1 = 2; x2 = 3; x3 = 6, x4 = 8; x5 = 11

Con los datos disponibles se calculan la media y la variancia poblacionales:

,

y se construye el siguiente gráfico de la distribución, llamado “de bastones”:

A continuación se procederá a efectuar la selección de muestras con reposición de tamaño n = 2. Como la selección de muestras con reposición impide que con la selección se agote el conjunto de elementos muestreados, el sistema es equivalente a trabajar con una población de tamaño infinito.

El siguiente cuadro contiene las muestras que se generan. Como se trata de todas las muestras posibles, puede considerarse que el cuadro contiene la población de muestras de tamaño n = 2 extraídas con reposición de una población de tamaño N = 5:

POBLACION DE MUESTRAS CON REPOSICION DE TAMAÑO n = 2

2-2 2-3 2-6 2-8 2-113-2 3-3 3-6 3-8 3-116-2 6-3 6-6 6-8 6-118-2 8-3 8-6 8-8 8-1111-2 11-3 11-6 11-8 11-11

Como puede verificarse fácilmente, se han logrado construir 25 muestras diferentes de tamaño n con reposición. Si el tamaño de la muestra hubiera sido de 3 elementos, se hubieran podido construir 125 muestras diferentes; en cambio, si el tamaño de la población hubiera sido igual a 6 y se extraían muestras de tamaño n = 2, el total de muestras hubiera sido 36. Estas observaciones permiten obtener la

Page 63: Estadistica I 2

1ª Conclusión: El total de muestras con reposición de tamaño n que pueden extraerse de una población de tamaño N es

M = Nn.

Definido claramente que el cuadro anterior contiene todas las muestras posibles y que en total ellas son 25, puede plantearse la siguiente pregunta: ¿cuántas muestras de tamaño n deben extraerse en la vida real, cuando se desea realizar una investigación estadística mediante el muestreo con reposición?

La respuesta a esta pregunta da lugar a la

2º Conclusión: Para realizar una investigación estadística por muestreo es suficiente una sola muestra de tamaño n.

Resulta oportuno aclarar, por supuesto, que la única muestra a la que se alude precedentemente debe estar bien seleccionada, para lo cual deben seguirse los lineamientos dados en la Unidad 1 - Introducción y Muestreo.

A continuación se calcularán las medias muestrales de cada una de las M muestras seleccionadas. El siguiente cuadro contiene los 25 valores:

2 2,5 4 5 6,52,5 3 4,5 5,5 74 4,5 6 7 8,55 5,5 7 8 9,56,5 7 8,5 9,5 11

Se observa claramente que hay varios resultados para el valor de la media muestral, y que ellos dependen de cómo se encuentren conformadas las M muestras diferentes de tamaño n = 2. Los resultados presentados en el cuadro anterior constituyen el conjunto de medias muestrales posibles de ser calculadas a partir de la población de medias muestrales definidas previamente, lo que implica que el cuadro contiene una población de medias muéstrales de tamaño M, y ese conjunto se denomina Distribución muestral de las medias.

Esto da a la media muestral una característica no descubierta hasta este momento, que origina la:

3º conclusión: la media muestral resulta ser una variable mientras la conformación de la muestra no se encuentre definida, lo cual no entra en contradicción con la primera propiedad de la media aritmética, que dice que ella es una constante para un conjunto definido de valores.

Esta conclusión puede ser generalizada del siguiente modo: por el mismo principio que rige para la media, cualquier cálculo muestral (es decir cualquier otra medida de posición y/o de dispersión que se obtenga a partir de los datos muestrales), y no sólo la media aritmética puede considerarse como variable.

Atendiendo al hecho de que la media muestral resulta una variable y que el cuadro precedente constituye la población de medias muestrales, se pueden obtener tanto la media poblacional como la variancia poblacional de la variable media muestral, es decir que se puede calcular la

, lo cual permite formular la

4ª conclusión: la media de la población de medias muestrales es igual a la media de la variable xi, es decir que

Para esa misma población de media muestrales se calcula la variancia poblacional, es decir,

lo cual permite enunciar la

Page 64: Estadistica I 2

5ª conclusión: la variancia de la población de medias muestrales es igual a la variancia de la variable xi

dividida por n, es decir que

o sea,

Si se construye el gráfico de la Distribución muestral de las medias se obtiene la siguiente figura

en la cual se observa lo siguiente:

a) los valores extremos de la variable medía muestral son coincidentes con los de la variable xi (en este caso son 2 y 1 l), y

b) a medida que el tamaño n de la muestra crece, como la cantidad de muestras posibles aumentará considerablemente, aparecerán para la media muestral nuevos valores, que siempre oscilarán entre los valores extremos ya determinados. Es decir que, en ese caso, la gráfica de bastones que se observa más arriba presentará nuevos valores y una mayor cantidad de bastones. En el límite, cuando n crezca indefinidamente, la variable media muestral se convertirá en continua y la gráfica de bastones se transformará en un área, lo que permite obtener la

6ª conclusión: en el muestreo con reposición, cuando n , la variable media muestral se distribuye

normalmente con parámetros y .

Es decir que si n . Obsérvese que en esta última conclusión no se menciona para nada cuál es

la distribución de la variable xi, por lo cual se puede afirmar que esta conclusión se cumple cualquiera sea la forma que toma la distribución de xi. Si ella fuera normal, el gráfico siguiente permite comparar cómo se verían tanto la distribución de las dos variables involucradas en este análisis.

Page 65: Estadistica I 2

Esta última conclusión suele encontrarse en los libros de texto bajo la denominación de Teorema Central del Límite.

b) sin reposición

Partiendo del ejemplo inicial en el cual la población tiene un tamaño N = 5, ahora se selecciona muestras de tamaño n = 2 sin reponer. El siguiente cuadro contiene todas las muestras posibles elegidas de acuerdo con ese procedimiento

POBLACION DE MUESTRAS SIN REPONER DE TAMAÑO n = 2

2-3 2-6 2-8 2-113-6 3-8 3-11

6-8 6-118-11

A partir del cuadro precedente se determina la

1ª conclusión : El total de muestras sin reposición de tamaño n que pueden extraerse de una población de

tamaño N es .

Es decir que esta primera conclusión tiene una diferencia comparada con la indicada para el caso con reposición.

El siguiente cuadro contiene las medias muestrales de cada una de las muestras que aparecen en el cuadro anterior:

2,5 4 5 6,54,5 5,5 7

7 8,59,5

Las conclusiones 2ª y 3ª no tienen modificación alguna en su texto, por lo que son válidas para los casos sin reposición.

Page 66: Estadistica I 2

Ahora verificaremos cuál es el valor de la media poblacional de la variable media muestral.

con lo cual comprobamos que tampoco se modifica la cuarta conclusión, y que también en el caso sin reposición

A continuación calcularemos la variancia de la variable media muestral, es decir que

lo cual permite decir que en el caso sin reposición la variancia de la

variable aleatoria media muestral es diferente al caso con reposición. Por consiguiente, la 5ª conclusión es que

en la cual el coeficiente se denomina factor de corrección para casos sin reposición (tomar en cuenta que ese

coeficiente apareció en el caso de la variancia de la Distribución Hipergeométrica - ver Unidad 11 - páginas 137 de estos apuntes, que es, sin dudas, un caso sin reposición).

Finalmente, diremos que la 6ª conclusión es similar a la señalada para el caso con reposición, es decir que en el muestreo sin reposición, cuando n , la variable media muestral se distribuye normalmente con media

poblacional y variancia poblacional

Es decir que si n .

4. Distribución muestral de proporciones para casos:

a) con reposición

En los puntos precedentes, cuando se obtuvo la 3ª conclusión, se indicó que cualquier cálculo muestral podría ser considerado como variable y que, como tal, podía estudiarse su Distribución Muestral. Ese fue el caso de la media aritmética, pero también puede ser el caso de la variancia muestral o de la proporción muestral.

Respecto de la proporción, recordemos que es un cálculo en el que se relacionan la cantidad de elementos de

una cierta característica A (suceso A) y el total de elementos n, ya explicado en el punto “frecuencia relativa” (hi = )

del tema “Distribuciones de frecuencias”, en el cual se considera que se está trabajando con muestras.

El concepto de proporción también aparece en la Distribución Binomial en la forma de la probabilidad p, que es la probabilidad denominada elemental de que se presente, un suceso particular A cuando se realiza un experimento. Este concepto de proporción es poblacional.

La relación entre la frecuencia relativa muestral hi y la probabilidad elemental poblacional p es evidente, sólo que deben distinguirse y aclararse los siguientes elementos:

a) en la Distribución Binomial la variable x resulta ser el número de veces que se desea que aparezca el suceso A, mientras que en una Distribución de frecuencias el número de veces que se presentan los elementos de un cierto intervalo se denomina fi.

Page 67: Estadistica I 2

b) por consiguiente, lo que en la Distribución Binomial se simboliza con x en la Distribución de frecuencias se simboliza con fi.

c) como en la Distribución Binomial se demostró que la E(x) =n p y que la V(x) = n p q, de acuerdo con lo indicado en el punto b) precedente, se verifica que E(fi)= n p y que la V(fi)= n p q

d) esto permite calcular la esperanza matemática y la variancia de la variable proporción hi, según el siguiente procedimiento:

lo cual, en virtud de que la 6ª conclusión es también válida para cualquier cálculo muestral, permite decir que en el muestreo con reposición la variable proporción muestral hi se distribuye normalmente con media poblacional p y

variancia poblacional si n .

Es decir que: si n .

b) sin reposición

Cuando se trabaja sin reposición (lo que equivale a trabajar con poblaciones finitas) la variable proporción

muestral tiene una distribución normal con media poblacional p y variancia poblacional cuando n

. Obsérvese que en la expresión de la variancia aparece el factor de corrección para casos sin reposición, ya presente en el caso de la Distribución muestral de las medias.

En definitiva, para casos sin reposición si n .

Distribución de los desvíos estándar:

El desvío estándar muestral (Sx) es, como cualquier cálculo muestral y en función de la generalización de la 3ª conclusión, una variable que posee su media y su variancia poblacionales, las cuales son (sin demostración en este caso particular):

y

por lo cual se puede decir que la variable desvío estándar muestral Sx se distribuye normalmente con parámetros

esperanza matemática . y variancia .

Es decir que si n .

TEORIA DE LAS MUESTRAS DISTRIBUCIONES MUESTRALES CUADRO RESUMEN

Page 68: Estadistica I 2

Variables EN POBLACIONES INFINITAS

Media Poblacional Variancia Poblacional D. Estándar Poblacional

Mediamuestral

Proporciónmuestralhi

DesvíoEstándarSx

Variables EN POBLACIONES FINITAS

Media Poblacional Variancia Poblacional D. Estándar Poblacional

Mediamuestral

Proporciónmuestralhi

INFERENCIA ESTADISTICA

Bolilla 13 –Teoría de la estimación estadística

1. Estimación conceptos fundamentales

Introducción La “Teoría de la Estimación Estadística” es la parte de la Inferencia Estadística que trata acerca de los procedimientos específicos que posibilitan inferir o estimar, sobre la base de resultados muestrales conocidos, denominados estadísticas (media muestral, variancia muestral, proporción muestral), cuáles son los valores

Page 69: Estadistica I 2

poblacionales desconocidos correspondientes (media poblacional, variancia poblacional, proporción poblacional), denominados parámetros.

En estos procedimientos los valores muestrales conocidos, las “estadísticas” se convierten en estimadores de los valores poblacionales desconocidos, los “parámetros”.

El siguiente cuadro permite apreciar más claramente el tema:

CUADRO COMPARATIVO

CONCEPTOS EN LA MUESTRA EN LA POBLACIONDenominación Estadísticas ParámetrosSimbología ; Me; Sx

2; Sx; hi x ; x2 ; x ; p

Función Son Estimadores Deben Ser estimadosCaracterísticas Son conocidos

Son variablesSon desconocidosSon fijos

Tipos de estimaciones: Hay dos tipos fundamentales de estimaciones:

a) Estimación puntual: es un procedimiento de estimación en el que se estima al parámetro mediante un solo valor muestral.

b) Estimación por intervalos: es un procedimiento que permite, a partir de un estimador puntual, obtener dos valores que limitan un intervalo denominado intervalo de confianza dentro del cual se encuentra el parámetro a estimar con una cierta probabilidad conocida cercana a uno, que se denomina nivel de confianza y que se simboliza NC. Este punto será desarrollado más adelante con mayor profundidad.

2. Propiedades de los estimadores

Un buen estimador debe cumplir con determinadas propiedades. Las más importantes son:

a) Estimador insesgado : Se denomina así a aquel estimador cuya esperanza matemática da como resultado el parámetro a estimar, es decir no tiene desvíos con respecto al parámetro poblacional.

1- Caso del estimador : en la siguiente demostración se verificará si el estimador media muestral es insesgado o no viciado. Para ello, calcularemos su esperanza matemática, recordando, tal como se afirmó en el cuadro inserto en la página anterior, que esa media muestral es una variable y que, como tal, su esperanza matemática puede calcularse.

Aplicando Esperanza, se obtiene el siguiente desarrollo, recordando que:

a) la esperanza de una suma de variables es la suma de sus esperanzas, y

b) la E(xi) = x.

con lo cual se ha demostrado que el estimador es no viciado o insesgado. Una demostración diferente de esta propiedad también puede verse en el tema Teoría de las Muestras- 4ª conclusión

A diferencia de la media aritmética, los estimadores mediana (Me) y modo (Mo) son viciados.

2- Caso del estimador hi: Según se ha demostrado en la Unidad 12 - Teoría de las Muestras (ver pag. 159) la E(hi) = p, con lo cual se verifica que hi es un estimador no viciado.

Page 70: Estadistica I 2

3- Caso del estimador Sx2: para poder desarrollar esta demostración, debe tenerse presente que:

(1)

y que (2)

A partir de esto, se obtiene la esperanza matemática de Sx2 procediendo del siguiente modo: en la igualdad

xi - = xi - + x - x se agrupan los elementos haciendoxi - = (xi - x) – ( - x)

Elevando al cuadrado ambos miembros y sumando para todo i

y dividiendo la igualdad por n

Sacamos afuera por ser constante

Aplicando Esperanza Matemática, y de acuerdo con lo indicado en (1) y en (2), se obtiene:

con lo cual se verifica que el estimador Sx2 es un estimador viciado o sesgado: su esperanza matemática no da un

resultado igual al parámetro a estimar, porque se obtuvo el parámetro a estimar acompañado por un coeficiente que, precisamente, convierte al estimador en viciado. Se verifica, también, que el estimador Sx

2 estima al parámetro x2

por defecto, ya que el coeficiente que acompaña al estimador da un resultado menor que 1.

Page 71: Estadistica I 2

4. Corrección del vicio: Cuando un estimador es viciado, ¿puede corregirse el vicio?. Analizaremos la posibilidad de realizar tal corrección en el caso del estimador Sx

2, procediendo del siguiente modo:

Efectuando el pasaje de los términos del coeficiente que acompaña a x2 al primer miembro de la igualdad, y

recordando que la Esperanza es un operador lineal, obtenemos:

con lo que se verifica que la esperanza matemática de una nueva “estadística”, que en este caso es

, da como resultado el parámetro variancia poblacional, por lo que esa nueva estadística es no

viciada. Observándola con detenimiento, se comprueba que tiene forma de una variancia, sólo que en lugar de estar dividida por n, lo está por (n- 1). Por eso mismo se la denomina variancia corregida y se la simboliza con Sc

2. Por consiguiente, se ha comprobado que Sc

2 es insesgada o no viciada, por cuanto su esperanza es el parámetro a estimar, es decir que

No siempre es necesario efectuar la corrección del vicio en el caso del estimador Sx2, ya que cuando n

crece indefinidamente, el término tiende a la unidad. Luego,

si n 1.

Empíricamente se considera que si el tamaño de la muestra n es menor o igual que 30 se está trabajando con las llamadas “muestras pequeñas”, en cuyo caso debe efectuarse la corrección, transformando Sx

2 en Sc2. En cambio,

si n > 30, se está trabajando con “muestras grandes”, en cuyo caso no debe corregirse el vicio. En este último caso, además, todas las estadísticas tienen distribución normal (según se demostró en la conclusión número 6 de la unidad temática “Teoría de las muestras”).

b) Estimador eficiente: Se denomina eficiente a aquel estimador que, de un conjunto de estimadores, posee la menor variancia.

Como se ha visto anteriormente, hay varios estimadores que estiman al mismo parámetro. Además, como todos son variables, tienen una variancia que podría llegar a calcularse. Un ejemplo de ello puede verse en el caso que se desee estimar la media poblacional: son estimadores posibles la media aritmética o la mediana. De ambos, la media aritmética posee la menor variancia, por lo que ella resulta ser un estimador eficiente. Para confirmarlo, bastará saber que así como la variancia de la media aritmética es x

2 /n, la variancia de la Mediana es (x2/n) (/2), resultado éste

que, como puede verificarse fácilmente, resulta mayor que el anterior.

c) Estimador consistente: Se denomina suficiente a aquel estimador que contiene toda la información que proviene de la muestra. Para entender este concepto conviene comparar a la media aritmética con la mediana: la primera contiene toda la información contenida en la muestra (recordar que es un “promedio”), mientras la segunda no contiene toda la información disponible en la muestra (recordar que se trata de “otra medida de posición” en cuyo cálculo no intervienen todos los valores de la variable). Luego, la media aritmética es un estimador suficiente, mientras que la mediana no lo es.

Page 72: Estadistica I 2

Ventajas de la media aritmética como estimador

A lo largo de los capítulos anteriores se han desarrollado una serie de demostraciones que han permitido verificar la existencia numerosas ventajas y propiedades de la media aritmética. En este punto se detallará ese conjunto de ventajas, que permiten mostrarla como una herramienta extraordinaria en el campo de la estadística en general y de la estimación en particular.

Esas ventajas de la media aritmética son:

a) La suma de desvíos respecto de ella es igual a cero.

b) La suma de los desvíos respecto de ella, al cuadrado, es un mínimo.

c) Puede ser considerada una variable en el campo de la teoría de las muestras.

d) Su distribución tiende a ser normal cuando el tamaño de la muestra n .

e) La media poblacional de su distribución muestral es igual a la media poblacional de la variable xi, es decir que es no viciada.

f) La dispersión de su distribución es menor que la distribución de la variable xi, es decir que .

g) Es suficiente y eficiente.

3. Estimación puntual principales: estimadores

Como ya se indicó en el Cuadro Comparativo, los estimadores puntuales están constituidos por las estadísticas, denominación que se da a los cálculos muestrales conocidos que permiten estimar a los correspondientes valores poblacionales desconocidos, denominados parámetros. Las estadísticas a las que se hace referencia son, por ejemplo: la media muestral ; la mediana Me; la variancia muestral Sx

2; el desvío estándar Sx; la proporción muestral hi. Cada uno de ellos estima al correspondiente parámetro, es decir, a la media poblacional x; a la variancia poblacional x

2; al desvío estándar poblacional x; o a la proporción poblacional p.

Siendo las estadísticas variables y los parámetros fijos, es imposible considerar que una estadística sea igual a un parámetro. Por consiguiente, y sólo a modo de ejemplo, no es factible aceptar la igualdad que se indica a continuación:

= x

Como esta igualdad es incorrecta, para indicar el hecho de que una estadística estima a un parámetro (en este ejemplo, que la media muestral estima al parámetro media poblacional), se utiliza la conocida simbología de estimador (denominada comúnmente “sombrerito”):

que se lee “mu estimado” o “estimador de mu”.

Idéntico criterio se utiliza para indicar que las restantes estadísticas estiman a los correspondientes parámetros, es decir,

En todos los casos la simbología utilizada indica que cada una de las estadísticas estima al parámetro, que lleva precisamente el símbolo del “sombrerito” para señalar que se lo está estimando.

Page 73: Estadistica I 2

Ejemplo: El gerente de una sucursal bancaria desea investigar el tema “adelantos en cuenta corriente” por parte de los clientes de la sucursal. De un total de 3.400 cuentas que tienen autorización para efectuar adelantos, obtiene una muestra de 40, y luego de consultar los datos, obtiene los siguientes resultados:

Número de cuentacorrentistas que solicitaron adelantos: 18

Suma de los importes solicitados por esos clientes: $ 102.000

Suma de los adelantos, al cuadrado: 312.816.160

El gerente desea:

a) un estimador puntual del promedio de los adelantos en cta. cte. para todas las cuentas de esa sucursal:

.

b) un estimador puntual de la proporción de cuentas corrientes que solicitaron adelantos en cuenta corriente

c) un estimador puntual para la variancia poblacional y para el desvío estándar

4. Estimación por intervalos: fundamentos y definiciones

Recordaremos que la estimación por intervalos de confianza se ha definido como un procedimiento que permite, a partir de un estimador puntual, encontrar dos valores que limitan un intervalo, denominado intervalo de confianza, dentro del cual se encuentra el parámetro a estimar con una cierta probabilidad conocida, se habla de probabilidad porque ese parámetro se estima dentro de una función de probabilidad, la probabilidad es cercana a uno y se denomina Nivel de Confianza.

En este tema deben plantearse dos situaciones completamente diferentes:

a) Estimación en el caso de muestras grandes, y

b) Estimación en el caso de muestras pequeñas.

Algo que es común en el caso de la construcción de todos los intervalos de confianza, cualquiera sea el tamaño de la muestra, es que en primer lugar debe fijarse el Nivel de confianza, que consiste en una probabilidad cercana a uno que se establece de antemano y que es fijada por quien encarga el trabajo de estimación (no puede ser una decisión de quien construye el intervalo). Los valores más comunes (aunque no los únicos) para el nivel de confianza son: 0,99; 0,95 o 0,90.

5. Estimación por intervalos para muestras grandes:

Para desarrollar este tema, recordemos que se presentan las siguientes condiciones:

1. La muestra tiene un tamaño mayor que 30.

Page 74: Estadistica I 2

2. Todas las estadísticas son variables y, como tales, tienen una determinada distribución que tiende a ser normal cuando n es grande.

3. Como n es grande, tampoco se requiere corregir el vicio del estimador Sx2.

a) en el caso de medias poblacionales.

En este caso, como la variable que se utiliza para estimar la media poblacional es la media muestral , y ella tiene distribución normal, podemos construir un gráfico que permita observar esta circunstancia. En ese gráfico se observa a la variable que, como ya se mencionó, tiene distribución normal con media poblacional , y que, como cualquier variable, puede ser estandarizada mediante su conversión a una variable zi, la cual se representa en un

segundo eje. Recordemos, además, que el desvío estándar de es igual a .

La estandarización mencionada más arriba se realiza del siguiente modo:

El nivel de confianza (NC) se ubica en el centro de la figura (zona grisada) y una vez determinado cuál es su valor concreto, se verifica que existen dos valores de la variable estandarizada zi, simétricos entre sí (-z1 y +z1), tales que la P(-z1 zi +z1) =NC

Reemplazando en este término la variable zi obtenemos la siguiente expresión:

Al efectuar en el interior del paréntesis las transformaciones apropiadas, pasando el término que divide en el centro del paréntesis como producto a ambos lados de las desigualdades:

Luego se despeja la media poblacional, dejándola en el centro:

Page 75: Estadistica I 2

Finalmente se multiplica todo por menos uno para modificar los signos, con lo cual cambia también el sentido de las desigualdades:

La anterior es una primera expresión para el intervalo de confianza, que está compuesta por los siguientes elementos:

: se trata del estimador puntual media muestral, que, como toda estadística, puede ser calculada sin ningún inconveniente a partir de la muestra disponible.

+z1 y -z1: se trata de dos valores simétricos que se obtienen a partir de la tabla de la distribución normal una vez fijado el valor de NC.

n: es el tamaño de la muestra y como tal debe ser un dato conocido.

x es el desvío estándar poblacional, un parámetro (y como tal, desconocido). Por consiguiente se lo reemplaza directamente por su estimador Sx sin efectuar corrección alguna por tratarse de muestras grandes, con lo que, en definitiva, la expresión final del intervalo de confianza para estimar la media poblacional queda del siguiente modo.

en el que todos los elementos son conocidos y puede calcularse sin inconvenientes.

Ejemplo: En el caso del gerente que desea investigar el tema “adelantos en cuenta corriente”, con los datos de la estimación puntual (ver página 156) construir una estimación por intervalos para el promedio los adelantos en cuenta corriente de todos los clientes de esa sucursal, con un nivel de confianza del 90%. Hacemos

P(2.847,68 x 2.252,32) = 0,90

Algunas características de los intervalos de confianza:

1. El intervalo de confianza tiene dos límites que se obtienen sumando y restando un mismo valor al estimador puntual media muestral ( ). Estos límites se denominan límite superior y límite inferior del intervalo de confianza.

2. Si el Nivel de Confianza aumenta, su superficie en el gráfico sería mayor y eso se correspondería con mayores valores para los z1. En ese caso, a mayor NC, mayor amplitud en el intervalo de confianza. Pero asimismo, una mayor amplitud para el intervalo implica que hay más valores posibles para estimar la media poblacional y, lo que convierte a la estimación en algo menos precisa, es decir que a mayor amplitud del intervalo, menor precisión en la estimación. Conclusión: a mayor nivel de confianza, menor precisión en la estimación.

3. Si el Nivel de confianza llegara a tomar el valor extremo máximo para una probabilidad, es decir un valor igual a 1, el valor de los z1 sería, según se puede observar en la tabla normal, el máximo posible, es decir que los z1 serían iguales . En ese caso, no sería posible obtener resultados para los límites del intervalo de

Page 76: Estadistica I 2

confianza porque darían un resultado indefinido. Conclusión: no puede exigirse un nivel de confianza igual a la unidad porque no se obtendrían resultados prácticos para los límites del intervalo.

4. La decisión de tomar al Nivel de Confianza entre dos valores simétricos de z1 no sólo es la única solución posible desde el punto de vista de la búsqueda inversa en la tabla; también conduce a un intervalo mínimo, ya que el intervalo conseguido es más pequeño que cualquier otro que pueda obtenerse tomando los valores de zi de cualquier otra forma diferente.

5. El Nivel de Confianza es una probabilidad, y como tal, según el planteo pascaliano, es el resultado de realizar un cociente entre el número de casos favorables sobre el número de casos posibles. Recordando este concepto, puede decirse entonces que de cada cien intervalos que se construyan, en una proporción de ellos igual a NC el parámetro quedará encerrado en el intervalo construido. Esta es una forma de medir la confianza existente de que en un porcentaje de los casos se estime correctamente el parámetro desconocido.

b) en el caso de proporciones

En este caso se utilizará la estadística hi y el procedimiento no difiere en nada del aplicado para los casos de la media y de la variancia poblacionales. Deberá recordarse, sin embargo, que como toda estadística, el estimador hi es

una variable que tiene distribución normal con media poblacional h = p y variancia (ver Unidad 12-

Teoría de las muestras, página 150). Si se desea calcular la variancia en un caso concreto, como p y q son parámetros desconocidos, se reemplazan por sus estimadores, y

Por consiguiente, la variable estandarizada zi se construye del siguiente modo:

y existirán dos valores de zi, simétricos respecto del origen(-z1 y +z1) tales que

P(-z1 zi + z1) = NC

Reemplazando zi por la expresión indicada más arriba, se tiene que la

En la última expresión algebraica, efectuando en el interior del paréntesis los pasajes de términos con el propósito de despejar p, objeto de la estimación, finalmente se encuentra que la

Page 77: Estadistica I 2

que constituye el intervalo de confianza buscado.

Ejemplo: En el problema del gerente de la sucursal bancaria, construir una estimación por intervalos para proporción de clientes que solicitaron adelantos en cuenta corriente con un nivel de confianza del 95%. Si hi = 0,45 (ver página 156), luego

Por consiguiente P[0,45 + 1,96 (0,079) p 0,45 - 1,96 (0,079)] = 0,95

P(0,6048 p 0,2952) = 0,95

c) en el caso de desvíos estándar

Para encarar la construcción de este intervalo de confianza, debe aclararse que la estimación que se realice permitirá construir un intervalo para estimar el desvío estándar poblacional porque el estimador puntual que se utiliza en este caso es Sx. Este estimador es una estadística que, como todas en el caso de muestras grandes, tiene distribución

normal con media poblacional y con variancia poblacional ( ver cuadro resumen final de Teoría

de las Muestras en las página 151). Esto permite construir la siguiente variable estandarizada

Con estos datos, se parte fijando el correspondiente Nivel de Confianza, para el cual existen dos valores de la variable zi, simétricos, tales que la P(-z1 zi + z1) = NC (Ver la siguiente figura que ilustra esta circunstancia)

En este término, reemplazando zi por la expresión a la que es igual, tenemos:

Procediendo del mismo modo que en el caso del intervalo para la media poblacional, es decir mediante un pasaje de términos en el interior del paréntesis, se obtiene la siguiente expresión final que permite estimar el desvío estándar poblacional por intervalos de confianza:

Page 78: Estadistica I 2

Este intervalo se puede convertir en un intervalo para estimar la variancia poblacional simplemente elevando al cuadrado los términos incluidos dentro del paréntesis:

Ejemplo : En el caso del gerente que toma una muestra para analizar los anticipos en cuenta corriente (ver página 156), construir una estimación por intervalos para la variancia poblacional con una confianza del 99 %. Se comienza construyendo el intervalo para el desvío estándar:

P(1.276,35 x 1.019,65) = 0,99

y se eleva al cuadrado todo el paréntesis P(1.629.069 x 1.038.361) = 0,99

6. Estimación por intervalos para muestras pequeñas:

Debe tomarse en consideración que para la construcción de estos intervalos se presentan las siguientes condiciones:

1. El tamaño de la muestra es menor o igual que 30.

2. En ese caso la distribución de las estadísticas suele no ser normal.

3. El estimador Sx2 la variancia poblacional es viciado y corregirse.

a) Distribución t de Student

Si la variable bajo estudio posee distribución normal, para la construcción de este intervalo de confianza se utiliza la variable “t de Student”, denominada así en honor a su descubridor, el matemático inglés Gosset (quien se autoasignó el seudónimo de “Student”), la cual tiene la siguiente forma:

Sabiendo que y modificando el denominador, se obtienen las siguientes dos alternativas de solución:

en las que puede observarse que la variable t de Student no es más que una forma diferente de variable estandarizada.

En la variable t de Student aparece el concepto de grados de libertad, que se simboliza con v y que resulta ser el número de variables linealmente independientes que se utilizan en el cálculo de las estadísticas. Gosset demostró que los grados de libertad son iguales al número de elementos de la muestra menos 1. Es decir que

Page 79: Estadistica I 2

v = n – 1

La variable t de Student tiene una forma simétrica. Si se desea construir un intervalo de confianza, el nivel de confianza elegido se ubica de tal modo que se genera un intervalo entre dos valores de la variable t (-t1 y +t1), simétricos al igual que en el caso de la normal. Asimismo existe una tabla que corresponde a la distribución t de Student que permite encontrar los valores de los t1, tomando en consideración el nivel de confianza requerido y los grados de libertad con los que se está trabajando.

Fijado el nivel de confianza NC, existirán dos valores de la variable tSt, iguales en valor absoluto pero de distinto signo, simétricos entre sí, tales que la

P(-ti tSt +ti) = NC

Reemplazando la variable tSt por una de las expresiones halladas mas arriba, eligiendo aquélla en la que

interviene el estimador Sx, esta probabilidad se convierte en

Efectuando los correspondientes pasajes de términos en el interior del paréntesis de modo de despejar la media poblacional que debe ser estimada (en un procedimiento ya repetido en los anteriores intervalos de confianza construidos), se obtiene

Esta expresión está compuesta por un conjunto de elementos todos conocidos y, por lo tanto, calculables por lo que el resultado final puede obtenerse sin mayores dificultades.

b) Distribución Chi cuadrado

Para la construcción de este intervalo de confianza se utiliza la estadística Sx2 que, como todas las demás, tiene

una distribución cuya determinación se realiza recordando que

Ahora dividimos ambos miembros de la última igualdad por un valor constante, que en este caso será x2 y

obtenemos una variable que llamaremos (chi cuadrado) con v grados de libertad.

Page 80: Estadistica I 2

Observando el gráfico de esta distribución, se descubrirán algunas diferencias con las distribuciones utilizadas anteriormente, correspondientes a la normal y a la t de Student:

1. Se desarrolla sobre el semieje positivo de la variable ( 0 ), y

2. La forma no es simétrica.

Fijado el NC, existen dos valores de la variable ( y ) tales que la

Reemplazando la variable por la expresión a la que es igual, se obtiene

Invirtiendo la expresión, se obtiene

con lo cual se ha encerrado el parámetro a estimar, x2, entre dos límites con una cierta probabilidad NC, obteniéndose

de ese modo el intervalo de confianza requerido.

El intervalo de confianza conseguido resultará mínimo si las dos superficies que quedan fuera del NC

bajo la curva fueran iguales, cada una de ellas, a .

Ejemplos: Partiendo del ejemplo del gerente de la sucursal bancaria que desea investigar el tema adelantos en cuenta corriente (ya visto en el caso de estimaciones puntuales y por intervalos para el caso de muestras grandes), tomemos los resultados puntuales ya calculados, pero consideremos que el tamaño de la muestra ahora es de 26 cuentas corrientes, lo que convierte al problema en uno de muestras pequeñas. En ese caso, se pide:

a) Construir un intervalo de confianza para el importe promedio de adelantos en cuenta corriente de todos los clientes de la sucursal, con una confianza del 95 %. En este caso, v = 26 –1 = 25

t25;0,95 = 2,06. Luego

Page 81: Estadistica I 2

P(2.779,60 x 2.320,40) = 0,95

b) Construir un intervalo de confianza para la variancia poblacional en estas condiciones, con un nivel de confianza de 0,90.

Como los valores de y son

=37,7

= 14,6

el intervalo se construye haciendo la

P(908.899,30 x2 2.346.952,30) = 0,90

Estimación por intervalos de confianza para la proporción poblacional en el caso de muestras pequeñas:

No resulta conveniente construir intervalos de confianza para estimar la proporción poblacional en el caso de muestras pequeñas. Fundamentalmente ello es debido a que, siendo el tamaño de la muestra menor o igual a 30, la proporción muestral hi resulta mucho menos confiable que en el caso de una muestra grande. Adicionalmente, eso también determina que el valor de la variancia de la proporción, que se obtiene haciendo hi (1 -hi) y que interviene en el cálculo de los límites inferior y superior del intervalo de confianza, estén exageradamente distanciados entre sí, por lo que el intervalo en sí mismo carece de sentido.7. Calculo del tamaño de la muestra:

a) para selección muestral con reposición

Se parte de la siguiente negación: la media muestral no es igual a la media poblacional. Por consiguiente

x

Como ambos elementos son diferentes, es lógico entender que entre ellos hay una diferencia, que se simbolizará con d, positiva o negativa, y que se denominará margen de error o tolerancia. Es decir que

- x = d

Dividimos ambos miembros de esta igualdad por una misma expresión

Siendo que es igual a , se tiene

Se toma la segunda parte de la igualdad:

Page 82: Estadistica I 2

De allí que se despeja n con el siguiente resultado:

obteniéndose un primer cálculo para el tamaño de la muestra.

Si se observa detenidamente la expresión hallada, se verá que el tamaño de la muestra n depende de los siguientes factores:

a) de la variancia de la variable bajo estudio (x2 ), en forma directa (la variancia aparece multiplicando), con

lo cual a mayor variabilidad de la variable bajo estudio, mayor tamaño de la muestra.

b) del valor z1, que representa al coeficiente que indica el grado de confianza exigido en la estimación, también en forma directa: a mayor grado de confianza exigido, mayor tamaño de la muestra. Si el grado de confianza fuera igual a 1, z1 sería infinito, por lo que el tamaño de la muestran n = .

c) del valor de la tolerancia d, en forma inversa: a mayor margen de error o tolerancia admitida, menor tamaño de la muestra. Si la tolerancia fuera cero, eso implicaría que la diferencia entre las medias muestral y poblacional debería ser cero, o, lo que es lo mismo, ambas media deberían ser iguales, con lo que el n deberá ser igual al N, es decir, infinito.

b) para selección muestral sin reposición

El procedimiento que se sigue es similar al del cálculo para poblaciones infinitas, sólo que en el momento de reemplazar , se recurre a la fórmula del desvío estándar para poblaciones finitas o sin reposición, lo cual dará como consecuencia la siguiente igualdad:

Operando para despejar n, el proceso permite obtener la siguiente fórmula:

Puede verificarse fácilmente que si en la última fórmula deducida N , aplicando algún método de resolución de casos indeterminados (Regla de L'Hopital, por ejemplo), se obtiene la que corresponde a los casos para poblaciones infinitas.

Análisis de la tolerancia o margen de error d:

Para poder efectuar empíricamente el cálculo del tamaño de la muestra, el valor que interviene en la fórmula correspondiente a la tolerancia d se suele presentar como un porcentaje de alguno de los valores conocidos en juego. En este caso aparece el concepto de tolerancia relativa, que resulta ser, por ejemplo, un porcentaje del valor de la media muestral, que es, precisamente, el valor que se ha obtenido para la estimación de la media poblacional.

Page 83: Estadistica I 2

Ejemplo: En el problema del gerente que desea evaluar el uso de los adelantos en cuenta corriente por parte de los clientes de la sucursal:

a) calcular cuál debería ser el tamaño de la muestra si se desea efectuar el trabajo de estimación con una confianza del 95 % y una tolerancia relativa del 10 % respecto del valor estimado para la media poblacional.

Como la media muestral resultó igual a 2.550, el 10 % de ese dato es 255; el nivel de confianza del 95 % se corresponde con un valor de z1 = 1,96 (Nota: siempre se utilizan los valores de la distribución normal para el cálculo del tamaño de la muestra), y la variancia (desconocida) se reemplaza por su estimador, igual a 1.317.904. Con estos datos, aplicando la fórmula que corresponde a un tamaño de población finito, que en este caso es igual a 3.400 cuentas, tenemos:

(se redondea a un valor superior, en este caso n = 77).

b) evaluar cuál es la tolerancia relativa con la que se está trabajando.

En este caso se trata de obtener el valor porcentual de la tolerancia relativa d, partiendo de los datos disponibles. Para ello, a partir de la fórmula para n y mediante adecuados pasajes de términos, se obtiene una fórmula de cálculo para d. Este procedimiento culmina con la siguiente expresión:

Como la tolerancia relativa se obtiene dividiendo el valor de d por la media aritmética (y luego se multiplica por 100 ese resultado para convertirlo en un valor porcentual), queda

CUADRO SINOPTICO SOBRE TEORIA DE LA ESTIMACIÓN

(Colaboración de la Profesora María de los Arcos Martínez)

Page 84: Estadistica I 2

INFERENCIA ESTADÍSTICA

Bolilla 14 Teoría de la decisión estadística

1. Conceptos fundamentales.

Page 85: Estadistica I 2

Introducción: La “Teoría de la Decisión Estadística” constituye la parte de la Inferencia Estadística que permite decidir, sobre la base de resultados muestrales y con los procedimientos estadísticos y matemáticos apropiados, acerca de la validez de algún supuesto que se formule respecto del valor de un parámetro.

En el desarrollo del tema Teoría de la Estimación los parámetros resultaban desconocidos y el objetivo de la investigación muestral era conocerlos. En este caso la situación se modifica parcialmente, ya que si bien los parámetros continúan siendo desconocidos el propósito de la Teoría de Decisión es verificar si pueden tomar valores particulares determinados.

Para ello se formulan “Hipótesis Estadísticas”, que son los supuestos formulados respecto del valor de algún parámetro.

Existen dos tipos de Hipótesis Estadísticas:

a) “Hipótesis Nula” (H0), que es la Hipótesis concreta que se formula acerca del valor del parámetro, y que consiste en suponer que el parámetro toma un valor determinado. Se denomina así porque el propósito del estudio es anularlo o rechazarlo.

b) “Hipótesis Alternativa” (H1), que constituye la hipótesis diferente de la Hipótesis Nula.

Las “Pruebas de hipótesis” son los procedimientos estadísticos apropiados que permiten probar la validez de cualquier parámetro bajo estudio.

La principal diferencia, ya anticipada, entre la Teoría de la estimación y la Teoría de la Decisión, es que en la primera no se sabe cuál es el valor de un parámetro y se, intenta estimarlo mediante una investigación muestral , mientras que en la segunda se supone un valor determinado para un parámetro y mediante una investigación muestral se trata de probar si ese supuesto es correcto. Esto hace útil a la Teoría de Decisión para comprobar, entre otras cosas, la validez de las especificaciones dadas por los fabricantes de cierto tipo de productos o equipos. Por ejemplo, es común que al comprar un vehículo se reciba un prospecto que contiene el dato del consumo por kilómetro. Otras veces, ciertas Academias anuncian que pueden conseguir en sus alumnos un rendimiento específico en un tema particular (la cantidad de palabras que escriben por minuto luego de un curso de escritura veloz, por ejemplo). O los anuncios de ciertas oficinas gubernamentales respecto del nivel social medio de cierto campo de familias que viven en un determinado barrio. Todos estos valores (el consumo por kilómetro; la cantidad de palabras por minuto; el nivel social medio de un grupo de familias) son parámetros valor se puede verificar, y para eso resulta apropiado utilizar los procedimientos de las Pruebas de Hipótesis, los que constituyen el conjunto de los “Pasos Operativos de la Prueba”.

2. Proceso de la construcción de la prueba: definición de sus etapas.

1. Expresar la hipótesis nula.

2. Expresar la hipótesis alternativa. Tanto la hipótesis nula como la alternativa deben ser expresadas en términos estadísticos.

3. Especificar el nivel de significación, . El nivel de significación se especifica según la importancia de y en el problema.

4. Determinar el tamaño de la muestra, n. El tamaño de la muestra se determina al tomar en cuenta la importancia de y y al considerar las restricciones presupuéstales al efectuar el estudio.

5. Establecer los valores críticos que dividen las regiones de rechazo y de no rechazo. Una vez conocidas las hipótesis nulas y alternativa, decididos el nivel de significación y el tamaño de la muestra, los valores críticos de la distribución apropiada se pueden establecer para indicar las regiones de rechazo y de no rechazo.

6. Determinar la prueba estadística. Se debe determinar la técnica a utilizar para determinar si el estadístico muestral ha caído en zona de rechazo o en la de no rechazo. Se debe indicar la prueba estadística apropiada junto con el modo en que el estadístico de la muestra se va ha comparar con el parámetro hipotético. Por

Page 86: Estadistica I 2

ejemplo en el caso de las medias, se debe encontrar cuanto se desvía el estadístico del parámetro hipotético, en términos de unidades de desviación estándar.

7. Correlacionar los datos y calcular el valor de la muestra de la prueba estadística apropiada.

8. Determinar si la prueba estadística ha caído en la región de rechazo o en la de no rechazo. El valor de la prueba estadística se compara con el valor critico en la distribución apropiada, para determinar si cae en zona de rechazo o de no rechazo.

9. Determinar la decisión estadística. Se determina la decisión de la prueba de hipótesis. Si la prueba estadística cae dentro de la región de no rechazo, entonces no se puede rechazar la hipótesis nula H0. Si la prueba cae en la región de rechazo, se rechaza la hipótesis nula H0.

10. Expresar la decisión estadística en términos del problema. Una vez tomada la decisión, se deben expresar sus consecuencias en términos del problema particular.

3. Prueba de hipótesis para los parámetros:

a) Media poblacional

El tema puede desarrollarse siguiendo varios métodos, pero para evitar complicaciones teóricas resultará útil plantearlo a la luz de un ejemplo práctico como el que sigue:

Ejemplo: Una empresa posee una máquina que elabora 400 productos por hora. Según informa el fabricante de la máquina, le ha introducido una mejora tecnológica que permitirá aumentar la cantidad de productos elaborados. Un eventual cliente que ya posee una versión anterior de la máquina se interesa en saber cuál es la cantidad de productos que producirá la nueva máquina. Para esta pregunta hay dos posibles respuestas: una, en la que el fabricante da una información precisa y concreta, diciendo, por ejemplo, que la mejora introducida ahora permitirá fabricar 500 o 600 productos por hora; la otra respuesta, en cambio, es aquella que el fabricante da cuando no tiene definida la cantidad esperada de producción, y en ese caso puede indicar que sólo asegura un aumento en la producción sin poder establecer la magnitud de ese aumento. En el caso que estamos presentando, consideraremos que el vendedor de la máquina no puede dar una idea de cuál será el valor de la producción promedio de la máquina que está vendiendo, y que sólo asegura un aumento en la producción.

Finalmente, el cliente decide que comprará la nueva máquina siempre que pueda efectuar una prueba de su funcionamiento. Aceptada esa condición, se realiza la prueba, que consiste en hacer funcionar la nueva máquina durante 36 horas con los siguientes resultados: el promedio de productos por hora fue de 490, y la suma de las producciones horarias al cuadrado dio un resultado igual a 10.717.200. Con estos datos, ¿conviene comprar la máquina?. Esta pregunta intenta resolver la cuestión de cuan verdadero será el supuesto de que la máquina nueva produce en mayor cantidad, es decir que intenta contestar si el vendedor ha incurrido en mentiras o falsedades para vender un producto, que no tiene diferencia alguna con el modelo anterior.

Admitamos que existe una cuestión adicional que puede plantearse, y es la duda acerca de si el mercado absorberá la cantidad total de productos adicionales que se fabriquen. Sobre esta cuestión, se conviene en considerar que no existirán inconvenientes para colocar toda la producción, por lo que tiene sentido adquirir la nueva máquina en tanto se verifique que realmente ella es mejor.

Ahora bien: una lectura cuidadosa del texto del problema permitirá descubrir que el valor “400 productos por hora” que la máquina anterior producía, constituye un promedio poblacional, ya que se trata del promedio producido por la máquina en su versión anterior a lo largo de todo el tiempo en que esa máquina prestó servicios, y que el valor “490 productos por hora” que surge luego de la prueba de 36 horas, constituye una media muestral, resultante de una muestra precisamente de 36 horas.

Prueba de Hipótesis para la media muestral (en muestras grandes o pequeñas)

Desarrollo de los pasos del proceso operativo:

Page 87: Estadistica I 2

1.º. paso: Formulación de la Hipótesis Nula: La Hipótesis Nula se formula del siguiente modo:

H0) = x =0

en donde =0 constituye el valor concreto y especifico que se asigna al parámetro. En el caso del ejemplo, si el vendedor de la máquina hubiera dado un valor tentativo para la producción de su nueva máquina (500 productos por hora, por ejemplo), la Hipótesis Nula debería ser:

H0) = x = 500

En este caso, de acuerdo con lo puntualizado, vendedor no ha dado ninguna idea sobre cuál será la producción promedio por hora de la máquina en su nueva versión. Como la Prueba de Hipótesis debe realizarse, precisamente, para probar el valor de un parámetro, y el único que se conoce es el de 400 productos por hora, que es el que corresponde a la máquina en su versión antigua, la Hipótesis Nula deberá plantearse, en este caso, del siguiente modo:H0) = x = 400

De primera intención, esta Hipótesis puede parecer inconveniente porque en apariencia no tiene sentido el hecho de que se prueba una nueva máquina asignándole un promedio de producción correspondiente a una versión anterior, pero se verá en el desarrollo de los pasos siguientes del proceso que esto no es así.

Resulta también oportuno indicar que, así como se puede probar el supuesto de un aumento en la producción, también puede efectuarse una prueba para verificar una mejora en los tiempos de duración de un proceso productivo, En este caso debe entenderse que lo deseable es que el tiempo de duración total del proceso disminuya en lugar de aumentar.

2.º. paso: Formulación de la Hipótesis Alternativa: La Hipótesis Alternativa, recordemos, es cualquier hipótesis diferente de la nula. Ella puede adoptar una de las siguientes tres formas diferentes, excluyentes entre si:

a) H1) x > 0 lo que da lugar a la “Prueba unilateral a la derecha”

b) H1) x < 0, lo que da lugar a la “Prueba unilateral a la izquierda”

c) H1) x 0, lo que da lugar a la “Prueba bilateral”.

Las tres formas se aplican en diferentes circunstancias, lo que puede resumirse en el siguiente cuadro:FORMA DE LA HIPÓTESIS ALTERNATIVA

Si se desea probar Sin parámetro nuevo Con parámetro nuevo conocido

Un aumento en la producción x > 0 x < 0 Una disminución en los tiempos x < 0 x > 0

Para una mejor comprensión de las alternativas planteadas, se efectuará una aplicación del cuadro anterior al ejemplo que se está desarrollando: como se está probando el rendimiento de una nueva máquina cuyo vendedor la publicita diciendo que posee una producción mayor que la versión anterior (aunque sin dar a conocer el valor del nuevo parámetro), en la hipótesis nula se ha supuesto que esa nueva versión tiene la misma producción que la versión antigua. Por consiguiente, puede verse que estamos en el caso que se desea probar un aumento de la producción sin tener conocido el nuevo el nuevo parámetro. Esto significa que la hipótesis alternativa tomará la forma a), la que se expresa del siguiente modo: “se prueba la hipótesis de que la máquina produzca 400 productos por hora contra la alternativa de que la producción sea mayor”. Si, en cambio, se pudiera tener un valor concreto de producción (como seria el caso de ella fuera de 500 productos por hora), haríamos la prueba teniendo un parámetro nuevo conocido, por lo que la hipótesis alternativa tomaría la forma b), y en ese caso diríamos que “se prueba la hipótesis de que la máquina produzca 500 productos por hora contra la alternativa de que la producción sea menor”. En definitiva: la hipótesis nula siempre se constituye con el valor disponible del parámetro (sea éste nuevo o antiguo), y la hipótesis alternativa variará según cuál sea la forma adoptada para la nula y qué proceso se desee probar: producción o tiempo, porque en el caso de probar una disminución en los tiempos de realización de un proceso las formas de las

Page 88: Estadistica I 2

alternativas se invierten, ya que estaríamos en el caso de un tipo de prueba opuesta a la de una mejora en la producción.

Finalmente, la prueba bilateral se utiliza cuando se desea probar que, a partir de un valor supuesto, pueden tener desvíos indistintamente hacia uno u otro lado. Ese es el caso de la prueba de hipótesis sobre parámetros que no se refieren directamente a un aumento de producción o a una disminución de tiempos, sino a productos o procesos que deben cumplir con especificaciones concretas: una cierta longitud, un cierto espesor, un cierto peso, etc., y que serían rechazados en caso de tener desvíos en un sentido o en otro.

Por consiguiente, en el ejemplo que planteamos. La hipótesis alternativa tomará la formaH1) x > 400

3.º. paso: Determinación de los valores muestrales: Este paso está reservado a la efectiva realización de la investigación muestral. Es decir que en este momento es cuando se realiza el estudio tendiente a obtener los valores muestrales que permitirán construir la Prueba de Hipótesis. Para ello se decide cuál es el tamaño de la muestra (que en el ejemplo bajo tratamiento se ha determinado que vale 36 horas) y se pone a prueba la nueva máquina. Los datos (en este caso ya anticipados) permiten determinar y calcular los siguientes valores

n = 36 = 490

4.º. paso: Elemento de comparación: A esta altura se encuentran formuladas las Hipótesis necesarias para efectuar la Prueba, y se dispone de los datos muestrales correspondientes.

La forma más apropiada para verificar la validez del supuesto formulado, consiste en comparar la media poblacional 0 (que en este caso toma el valor concreto 400) con la media muestral (que toma un valor igual a 490). timando en cuenta que de esa comparación pueden surgir las siguientes alternativas:

a) Si la media muestral obtenida se encuentra “lejos” de la media poblacional supuesta, es muy posible que no tenga nada que ver con 0 . lo Cual quiere decir que el nuevo proceso difiere del anterior y que se consiguió una verdadera mejora (recordar que estamos probando si el parámetro nuevo vale igual que el anterior).

b) En cambio si la media muestral se encuentra “cerca” de la media poblacional, es muy, posible que si tenga algo que ver con 0, lo cual implica que el nuevo proceso es muy similar al anterior y no se ninguna mejora.

El procedimiento para efectuar esta comparación, consiste en construir una variable estandarizada z1 cuando n >30, porque al estar trabajando con una muestra grande las estadísticas tienen Distribución Normal, en cuyo numerador aparece, precisamente, la diferencia entre y 0, es decir:

o en su defecto la variable t de Student (si se tratara de n 30 y trabajáramos con una muestra pequeña), haciendo:

El cálculo de la variable estandarizada permite obtener un resultado numérico. En el caso del problema a resolver, como n > 30, se utiliza la variable z1, y el resultado concreto será:

Page 89: Estadistica I 2

Al observar ese resultado y recordar el párrafo introductorio a este 4º paso, se podrá verificar que ese valor será más, grande o más chico según como sea la diferencia entre la media muestral y la media poblacional 0. Reiterando, si la media muestral se encuentra “lejos” de la media poblacional, el valor z1 será grande y es muy posible que no tenga nada que ver con 0, o, en otras es muy posible que los resultados producidos por la máquina nueva no tengan ninguna relación con el antiguo promedio. En cambio si la media muestral se encuentra “cerca” de la media poblacional, el valor de z1 será chico y es muy posible que si tenga algo que ver con 0 , o, en otras palabras, que los resultados producidos por la máquina nueva tengan alguna relación con el antiguo promedio.

5.º. paso: Criterio objetivo: Llegado a este punto, ha quedado establecido, en principio, un método que permite comparar las dos medidas de posición disponibles (las medias muestral y poblacional), y se ha aclarado que, obtener un resultado más grande o más pequeño para el valor de z1 implica que ellas estén “lejos” o “cerca” la una de la otra. Sin embargo, no se ha fijado un procedimiento objetivo para definir cuándo un valor de z1 será grande o pequeño.

Para poder establecer un método objetivo, se debe elegir una probabilidad cercana a cero (0,01; 0,05 ó 0,10, se consideran los valores más comunes), llamada “Nivel de significación” que se simboliza con , y que constituye un área (como toda probabilidad en una función de densidad), que se ubica a la derecha, a la izquierda o a ambos lados (en este caso, con la mitad de en cada lado) según como se haya definido la Hipótesis alternativa. Esta probabilidad permite encontrar, en la tabla correspondiente (normal o t de Student, según sea el caso), un valor de la variable z (ó t) denominado “valor crítico” simbolizado con zc (o eventualmente tc), que divide al eje de las abscisas en dos zonas: la “zona de rechazo” que se extiende por debajo de y la “zona de no rechazo” que se extiende a lo largo del resto del eje.

Las ubicaciones de ambas zonas, desde luego, variarán según cómo se haya planteado la Hipótesis Alternativa, pero en principio éste es el método que se utiliza para convertir en objetiva una comparación que, de otro modo, no podría realizarse. Debe quedar claro que el valor de debe fijarse al comenzar la construcción de la Prueba de Hipótesis, y que quien lo fija debe ser quien encarga la prueba, nunca quien la lleva a cabo. De ese modo el valor crítico se transforma en el elemento objetivo que permite decidir respecto del criterio de “lejos” o de “cerca”.

En nuestro problema, supongamos que se ha fijado = 0,015 zc = 1,65.

Los gráficos que se muestran a continuación ilustran lo señalado precedentemente.

Debe tenerse presente que se han construido considerando una prueba unilateral a la derecha y suponiendo tanto el caso de muestras grandes, utilizado la Distribución Normal, como de muestras pequeñas, utilizando la Distribución t de Student.

Page 90: Estadistica I 2

6.º. paso: Regla de Decisión: Es el momento de establecer la “Regla de Decisión”, para lo cual disponemos de dos valores: el de z1 calculado en el paso 4º y el de zc obtenido en el paso 5º. Comparamos los dos:

si z1 cae en la “zona de rechazo” y se considera que las diferencias entre z1 y zc son significativas Rechazo la Hipótesis nula.

si z1 cae en la “zona de no rechazo” y se considera que las diferencias entre z1 y zc no son significativos No Rechazo la Hipótesis nula.

Se aclara que en el caso de estar trabajando con muestras pequeñas la Regla de decisión no se modifica.

En nuestro ejemplo, como z1 = 2,25 > zc = 1,65 z1 cae en la zona de rechazo y debernos Rechazar la Hipótesis Nula que fue formada indicando que H0) = x = 400.

Ante esta decisión ¿debe o no debe comprarse la nueva versión de la máquina? De acuerdo con los datos restantes, la máquina debe compararse.

Justificación de la decisión tomada: Si se revisa la decisión tomada, se verá que rechazar la hipótesis nula implica que debe considerase como válida la hipótesis alternativa, que fue planteada haciendo H1) x > 400. Si esta es la hipótesis considerada válida, significa que la máquina, en su nueva versión, tiene un parámetro media poblacional mayor que la versión antigua y que, en ese caso, conviene comprarla.

En el lenguaje de la Teoría de Decisión, sólo resulta apropiado decir que una Hipótesis Nula se rechaza o no se rechaza. Es incorrecto hablar de aceptar una Hipótesis Nula.

Prueba bilateral (utilizando muestras pequeñas): Como ya se indicó, este tipo de prueba se utiliza cuando se desea probar el valor de aquellos parámetros que pueden tener desvíos tanto hacia la derecha como hacia la izquierda, lo que, en general ocurre cuando los parámetros tienen que ver con el cumplimiento de determinadas especificaciones. Para comprender el procedimiento se planteara el siguiente problema:

Ejemplo: Se ha asegurado que el peso promedio de los alumnos de un colegio es de 54,4 Kg., pero el profesor de Gimnasia no cree que tal afirmación sea correcta, y para verificarla selecciona una muestra aleatoria de 26 alumnos que da como resultado los siguientes datos: un peso promedio de 52 Kg. y un desvió estándar igual a 5,4 Kg. Probar la afirmación anunciada con un nivel de significación del 5 %.

Solución: la prueba debe realizarse de tal modo que cualquier desvío significativo, en más o en menos, constituya un motivo como para rechazar la hipótesis planteada. Por consiguiente debe plantearse una prueba bilateral del siguiente modo:

Page 91: Estadistica I 2

H0) = x = 54,4 KgH1) x 54,4 Kg.n = 26 como se trata de una muestra pequeña (n < 30) se utilizará la distribución de Student

= 52 Kg. Sx = 5,4

Se calcula

Si se ha establecido que el nivel de significación = 0,05, como la prueba es bilateral este valor se divide por dos, de modo que corresponde ubicar /2 = 0,025 a cada lado. En ese caso, el valor de tc para un número de libertad v = 25, es igual a 2,06.

Obsérvense en el gráfico siguiente estas circunstancias

Se aplica el 6º paso, Regla de Decisión, comparando los dos t disponibles:

como t1 cae en la zona de no rechazo y según aquella regla no se rechaza la hipótesis nula. Entonces la prueba no ha permitido encontrar diferencias significativas con un nivel de significación del 5 %, y la postura original que indicaba que los alumnos tenían un peso promedio de 54,4 Kg. debe mantenerse, rechazándose la postura del profesor de Gimnasia.

a) Varianza y desvió estándar poblacionales

Con muestras grandes (n >30):

El procedimiento que sigue la prueba de hipótesis para verificar la validez de un postulado respecto, del valor de la variancia poblacional no tiene modificaciones fundamentales respecto de la estructura de la prueba que fue realizada para la medía poblacional: en ambos casos deben cumplirse los seis pasos operativos y se utilizan aquellas Funciones de Densidad Normal o 2 según estemos en presencia de muestras grandes o muestras pequeñas, respectivamente.

Ejemplo: En el problema inicial de esta unidad, que consistió en probar el aumento de la producción de una máquina, probar la hipótesis que el desvío estándar es igual a 300 con un nivel de significación del 1%.

Se construirá la prueba correspondiente siguiendo los pasos enunciados en el punto 2:

H0) = x = 300H1) x < 300

Page 92: Estadistica I 2

Datos estadísticos n = 36Sx

2 = 57600

Tratándose de una muestra de tamaño n =36 (muestra a grande), se considera que las estadísticas tienen distribución normal. Luego

Como el nivel de significación = 0,01 zc = 2,33

Luego, comparo z1 con zc como z1 cae en cae en la zona de no rechazo

No rechazo H0, es decir que no se rechaza el supuesto que el desvío estándar pueda tomar un valor igual a 300, a un nivel de significación del 1 %.

Con muestras pequeñas ( n 30 ) :

Ejemplo: A partir de los datos del ejemplo del peso de los alumnos del colegio, planteado en el punto 2.2 de este mismo capítulo (ver página 173) se desea probar que el valor de la variancia es igual a 35 con un nivel de significación del 5%.

H0) = x2 = 25

H1) x2 > 25.

n = 26 como se trata de una muestra pequeña (n < 30) se utilizará la distribución 2 = 52 Kg.

Sx2 = (5,4)2 = 29,16

Se calcula

Para un nivel de significación del 5%, en una prueba unilateral a la derecha y con los grados de libertad v = 25, el valor crítico de = 40,6.

Page 93: Estadistica I 2

Como , eso significa que cae en la zona de no rechazo

No Rechazo la Hipótesis nula A un nivel de significación de 0,05 no se rechaza la Hipótesis de que la variancia poblacional sea igual 25.

4. Diferencias entre los casos con y sin reposición muestral.

5. Errores de tipo I y tipo II.

Análisis del nivel de significación:

En los párrafos precedentes se ha mencionado que el Nivel de significación es una probabilidad cercana a cero simbolizada con . Pero ¿De qué es esa probabilidad? Para responder adecuadamente a esta pregunta, conviene pensar que si bien la prueba realizada en el ejemplo de la máquina permitió rechazar la Hipótesis Nula que se postulaba, si ahora suponemos, por un instante que esa Hipótesis era verdadera, queda claro que se ha cometido un error, porque se ha rechazado una Hipótesis Nula que era verdadera. En otras palabras: si ahora se supone realmente que la nueva versión de la máquina no tiene mejor nivel de producción, pero la prueba realizada finaliza con una conclusión diferente y se la termina comprando (como ha ocurrido en este caso), se comete un error.

Sin embargo, este es uno de los riesgos inevitables del muestreo, que en ciertas ocasiones, como consecuencia de errores normales propios de la investigación muestral, puede generar resultados equívocos: Por consiguiente, sí una Hipótesis nula que es verdadera se ha rechazado, eso ha ocurrido porque en el paso 6º el valor calculado de z1 cayó en la zona de rechazo, lo cual indujo al investigador a incurrir en el error de rechazar una hipótesis verdadera que realmente no debía ser rechazada.

Este tipo de error se denomina error de tipo I (eI), de modo que es, precisamente, la probabilidad de cometer ese tipo de error, es decir, es la probabilidad de rechazar una hipótesis que es verdadera. Luego:

= P(eI)

Existe otro tipo de error que puede ser cometido por el investigador: no rechazar una hipótesis falsa, denominado error de tipo II (eII), cuya probabilidad se simboliza con , pero resulta imposible controlar simultáneamente ambos errores, por lo que en Teoría de Decisión se determina que el único error que puede controlarse anticipadamente es el error de tipo I, por lo cual debe fijarse con anterioridad a la realización de cualquier prueba de hipótesis.

Page 94: Estadistica I 2

CUADRO SINOPTICO SOBRE TEORIA DE DECISION ESTADISTICA(Colaboración de la Profesora María de los Arcos Martínez)