Parte 2: Distribuciones muestrales - WordPress.com · 2015-01-19 · muestrales”. Parte 2:...

13
Página | 1 IMADIL TEMA 5. Notas Tema 5. “Fundamentos de la inferencia estadística: Introducción a la probabilidad y distribuciones muestrales”. Parte 2: Distribuciones muestrales 1. Variables Aleatorias Existen situaciones aleatorias cuyo estudio se simplifica si, en vez de considerar el resultado del experimento aleatorio en cuestión, se toma como punto de partida una función numérica de sus posibles resultados. La simplificación conceptual que suele conllevar este proceso así como el hecho de que es mucho más fácil operar con valores numéricos que con conjuntos de sucesos hace que esta transformación, en la mayoría de los casos, ayude a conocer la naturaleza del fenómeno que se está tratando. Por ejemplo, si consideramos un examen en el que se enuncian veinte afirmaciones y los alumnos tienen que indicar si son verdaderas o falsas, es obvio que el nivel de conocimiento, sobre esta materia, de un alumno queda reflejado en su patrón de respuestas, que podría ser el siguiente: V, V, V, F, F, V, V, F, V, F, F, F, V, V, F, V, F, F, V, V. Considerando todos los patrones de respuesta posibles junto con sus probabilidades de aparición entre los alumnos de una clase tendríamos la distribución de los resultados de la prueba en esa clase. Aunque es cierto que en esa distribución está contenida toda la información de que disponemos sobre el nivel de ejecución de ese examen, también es cierto que dicha información es difícil de manejar y de resumir. Bajo determinadas condiciones (que las preguntas sean de igual dificultad y hagan referencia a un único rasgo) podemos simplificar extraordinariamente el manejo de la situación si asignamos a cada alumno una calificación numérica obtenida calculando el número de respuestas correctas y restándole a dicho número la cifra de respuestas incorrectas. Así, si las respuestas correctas eran: V, V, V, F, V, V, V, F, V, F, V, F, V, V, F, V, F, F, V, V. el alumno del patrón anterior obtendría una calificación de 16 = 18 aciertos - 2 errores. Esta asignación de números a los sucesos elementales de un experimento aleatorio simplifica el manejo de la situación de dos formas: En primer lugar asigna el mismo número a sucesos que son equivalentes, con lo cual reduce el número de resultados a considerar (En las condiciones anteriormente enunciadas, dos individuos con la misma puntuación tienen el mismo grado de conocimiento de la materia, con independencia de cual haya sido su patrón de respuestas) y en segundo lugar permite realizar mediante las operaciones estadísticas, que ya conocemos, síntesis numéricas como promedios, medidas de dispersión, etc.

Transcript of Parte 2: Distribuciones muestrales - WordPress.com · 2015-01-19 · muestrales”. Parte 2:...

Page 1: Parte 2: Distribuciones muestrales - WordPress.com · 2015-01-19 · muestrales”. Parte 2: Distribuciones muestrales 1. Variables Aleatorias Existen situaciones aleatorias cuyo

Página | 1 IMADIL TEMA 5. Notas

Tema 5. “Fundamentos de la inferencia estadística:

Introducción a la probabilidad y distribuciones

muestrales”.

Parte 2: Distribuciones muestrales

1. Variables Aleatorias

Existen situaciones aleatorias cuyo estudio se simplifica si, en vez de considerar el resultado

del experimento aleatorio en cuestión, se toma como punto de partida una función numérica

de sus posibles resultados. La simplificación conceptual que suele conllevar este proceso así

como el hecho de que es mucho más fácil operar con valores numéricos que con conjuntos de

sucesos hace que esta transformación, en la mayoría de los casos, ayude a conocer la

naturaleza del fenómeno que se está tratando.

Por ejemplo, si consideramos un examen en el que se enuncian veinte afirmaciones y

los alumnos tienen que indicar si son verdaderas o falsas, es obvio que el nivel de

conocimiento, sobre esta materia, de un alumno queda reflejado en su patrón de respuestas,

que podría ser el siguiente:

V, V, V, F, F, V, V, F, V, F, F, F, V, V, F, V, F, F, V, V.

Considerando todos los patrones de respuesta posibles junto con sus probabilidades

de aparición entre los alumnos de una clase tendríamos la distribución de los resultados de la

prueba en esa clase. Aunque es cierto que en esa distribución está contenida toda la

información de que disponemos sobre el nivel de ejecución de ese examen, también es cierto

que dicha información es difícil de manejar y de resumir. Bajo determinadas condiciones (que

las preguntas sean de igual dificultad y hagan referencia a un único rasgo) podemos simplificar

extraordinariamente el manejo de la situación si asignamos a cada alumno una calificación

numérica obtenida calculando el número de respuestas correctas y restándole a dicho número

la cifra de respuestas incorrectas. Así, si las respuestas correctas eran:

V, V, V, F, V, V, V, F, V, F, V, F, V, V, F, V, F, F, V, V.

el alumno del patrón anterior obtendría una calificación de 16 = 18 aciertos - 2 errores.

Esta asignación de números a los sucesos elementales de un experimento aleatorio

simplifica el manejo de la situación de dos formas: En primer lugar asigna el mismo número a

sucesos que son equivalentes, con lo cual reduce el número de resultados a considerar (En las

condiciones anteriormente enunciadas, dos individuos con la misma puntuación tienen el

mismo grado de conocimiento de la materia, con independencia de cual haya sido su patrón

de respuestas) y en segundo lugar permite realizar mediante las operaciones estadísticas, que

ya conocemos, síntesis numéricas como promedios, medidas de dispersión, etc.

Page 2: Parte 2: Distribuciones muestrales - WordPress.com · 2015-01-19 · muestrales”. Parte 2: Distribuciones muestrales 1. Variables Aleatorias Existen situaciones aleatorias cuyo

Página |2 IMADIL José María Salinas y José Luis Padilla

A estas funciones que asignan a cada suceso elemental de un experimento aleatorio un

número real, cuando verifiquen determinadas condiciones que especificaremos a lo largo del

tema, las denominaremos variables aleatorias.

2. Distribución de probabilidad de una variable aleatoria

En una primera aproximación, podemos decir que la sucesión de probabilidades con las que

una variable aleatoria toma sus distintos valores constituye la distribución de probabilidad de

esa variable. Vemos por consiguiente que para especificar la distribución de una variable

debemos conocer tanto sus posibles valores como la probabilidad de aparición de los mismos.

Un sencillo ejemplo nos ayudará a clarificar como determinar la distribución de una

variable aleatoria. Sea un experimento aleatorio consistente en lanzar simultáneamente tres

monedas y consideremos la función que asigna a cada lanzamiento el número de caras que

aparecen en el mismo. Esta función va a ser la variable aleatoria de la cual estudiaremos su

distribución. En primer lugar determinaremos los posibles valores, obviamente estos son:

0 si al lanzar no sale ninguna cara, es decir salen tres cruces

1 si sale una cara y dos cruces, cualquiera que sea el orden en que aparecen

2 si aparecen dos caras y una cruz

3 si las tres monedas muestran la cara

Veamos ahora como calcular la probabilidad de que se presente cada uno de estos

valores. Para que aparezca el valor 0 tiene que ocurrir que salgan tres cruces al lanzar las

monedas y solamente en ese caso se puede dar el valor 0, por consiguiente parece bastante

obvio que la probabilidad de que el número de caras sea cero es la misma que la que se dé el

suceso:

( +, +, + )

Como la probabilidad de que aparezca cruz al lanzar una moneda es 1/2 y el resultado

del lanzamiento de cada moneda es independiente de los resultados de las restantes,

aplicando las propiedades del cálculo de probabilidades tenemos que:

Pr(X =0) = Pr( +, +, +) = Pr( + + +) = 1/2 · 1/2 · 1/2 = 1/8

Para que la variable aleatoria número de caras valga 1 tiene que ocurrir que salga una

cara y sólo una al lanzar las tres monedas, por consiguiente tiene que aparecer el suceso

elemental C, +, + o bien que aparezca el suceso +, C, + o el suceso +, +, C por consiguiente la

probabilidad del valor 1 es la misma que la probabilidad del suceso unión de los tres sucesos

elementales reseñados, como estos sucesos son incompatibles tendremos que:

Pr(X=1) = Pr[(C, +, +)(+, C, +)(+, +, C)] = Pr(C, +, +) + Pr(+, C, +) + Pr(+, +, C)

siguiendo el mismo razonamiento anterior tendremos que:

Pr(C, +, +) = 1/2 · 1/2 · 1/2 = 1/8

Page 3: Parte 2: Distribuciones muestrales - WordPress.com · 2015-01-19 · muestrales”. Parte 2: Distribuciones muestrales 1. Variables Aleatorias Existen situaciones aleatorias cuyo

Página | 3 IMADIL TEMA 5. Notas

Pr(+, C, +) = 1/2 · 1/2 · 1/2 = 1/8 y

Pr( +, C, +) = 1/2 · 1/2 · 1/2 = 1/8

por consiguiente:

Pr( X = 1 ) = 1/8 + 1/8 + 1/8 = 3/8

De forma análoga para que el número de caras valga 2 tiene que ocurrir uno de los

siguientes sucesos: ( C, C, + ) o ( C, +, C ) o ( +, C, C ) y por tanto:

Pr(X=2) = Pr[(C, C, +)(C, +, C)(+, C, C)] = Pr(C, C, +) + Pr(C, +, C) + Pr(+, C, C)

de lo que resulta que:

Pr( X = 2 ) = 1/8 + 1/8 + 1/8 = 3/8

Finalmente para que el número de caras tome el valor 3 tiene que ocurrir el suceso ( C,

C, C ) luego:

Pr( X= 3) = Pr( C, C, C ) = Pr ( C C C ) = 1/2 · 1/2 · 1/2 = 1/8

Presentando en forma de tabla esta distribución tendríamos:

X Pr

0 1/8

1 3/8

2 3/8

3 1/8

Resumiendo el proceso seguido, vemos que la distribución se ha obtenido calculando

las probabilidades de los distintos valores de la variable aleatoria y que para ello hemos

calculado la probabilidad del suceso que da origen a que ese valor se presente. En términos

matemáticos este suceso se denomina imagen inversa del valor, por ello la condición para que

una función, del tipo que hemos visto, sea una variable aleatoria es que se pueda calcular las

probabilidades de las imágenes inversas de los valores que presenta o lo que es lo mismo, que

las imágenes inversas pertenezcan al sigma-álgebra que es la familia de sucesos sobre los que

está definida la probabilidad.

La condición anterior de que puedan calcularse las probabilidades de las imágenes

inversas habrá que exigirla siempre para poder calcular la distribución de la variable aleatoria,

no obstante esta condición puede adoptar una forma ligeramente distinta según se trate de

variables aleatorias discretas o continuas cuyas características pasamos a estudiar.

3. Variable aleatoria discreta

Si el conjunto de valores posibles de una variable aleatoria es numerable se dice que dicha

variable es discreta. Recordaremos, que un conjunto es numerable cuando puede ponerse en

correspondencia biunívoca con un subconjunto de los números naturales es decir que hay un

primer valor, un segundo y así sucesivamente. En términos prácticos, el que una variable

Page 4: Parte 2: Distribuciones muestrales - WordPress.com · 2015-01-19 · muestrales”. Parte 2: Distribuciones muestrales 1. Variables Aleatorias Existen situaciones aleatorias cuyo

Página |4 IMADIL José María Salinas y José Luis Padilla

aleatoria sea discreta se traduce en que sus valores, aunque sean infinitos, son números fijos y

aislados. Esto no implica que necesariamente tenga que tomar como valores números enteros,

por ejemplo, una variable aleatoria que tomase los valores 0,5 1 1,5 2 2,5 3 3,5 ... sería

una variable aleatoria discreta.

Como indicamos antes, la distribución de probabilidad de una variable aleatoria

discreta es la sucesión de probabilidades con las que la variable toma cada valor, obsérvese

que la variable utilizada en el ejemplo era discreta, ahora bien esta distribución puede

describirse especificando la Función de probabilidad o alternativamente indicando cual es la

Función de distribución de dicha variable.

Función de Probabilidad

A toda regla que permita asociar a cada valor xi de la variable aleatoria su probabilidad pi la

llamaremos Función de Probabilidad y la designaremos (x). Esta regla o correspondencia

entre los valores de la variable y sus probabilidades la podemos especificar bien mediante una

tabla o bien mediante una expresión analítica que permita calcular en función de los valores,

las probabilidades que les corresponden.

Por ejemplo, la distribución de probabilidad que aparece en la siguiente tabla:

xi 0 1 2 3 4

pi 3/20 1/5 3/10 1/5 3/20

Puede también especificarse mediante la siguiente expresión:

( ) Pr( )x X x

x

3

5 2 2

Como pueden comprobar.

Obviamente, en una distribución de probabilidad debe de verificarse que la suma de

todas las probabilidades sea igual a la unidad

( )xii 1

Función de Distribución

De forma general, tanto para variables discretas como continuas, se define la Función de

Distribución, F(x), de una variable aleatoria, X , como la función que para cada valor x nos

proporciona la probabilidad de que la variable aleatoria tome valores inferiores o iguales a x,

es decir:

F(x) = Pr( X x )

Para variables aleatorias discretas la Función de Distribución es igual a la suma de las

probabilidades de los valores inferiores o iguales a x :

Page 5: Parte 2: Distribuciones muestrales - WordPress.com · 2015-01-19 · muestrales”. Parte 2: Distribuciones muestrales 1. Variables Aleatorias Existen situaciones aleatorias cuyo

Página | 5 IMADIL TEMA 5. Notas

F x xix xi

( ) ( )

Por ejemplo, la distribución de la variable aleatoria número de caras al lanzar tres

monedas, tenía la siguiente Función de Probabilidad:

xi 0 1 2 3

pi 1/8 3/8 3/8 1/8

Por consiguiente, la Función de Distribución tomaría los siguientes valores:

F(0) = Pr(X 0) = Pr(X = 0) = 1/8

F(1) = Pr(X 1) = Pr(X = 0) + Pr(X = 1) = 1/8 + 3/8 = 4/8

F(2) = Pr(X 2) = Pr(X = 0) + Pr(X=1) + Pr(X = 2) = 1/8 + 3/8 + 3/8 = 7/8

F(3) = Pr(X 3) = Pr(X = 0) + Pr(X = 1) + Pr(X = 2) + Pr(X = 3) = 1

Hay que hacer notar que la función de distribución está definida para cualquier

número real, es decir que toma un valor también para valores que no tome la variable

aleatoria, por ejemplo:

F(1,272) = Pr(X 1,272) = Pr(X = 0) + Pr(X = 1) = 1/8 + 3/8 = 4/8

Ahora bien, puede observarse que para cualquier valor de x comprendido entre 1 y 2 la

Función de distribución toma el valor 4/8, es decir que la Función de Distribución sólo cambia

de valor en los puntos de existencia de la función de probabilidad. Esto hace que las Funciones

de Distribución de las variables aleatorias discretas tengan una forma característica de curva

escalonada.

4. Variable aleatoria continua

Una variable aleatoria se dice que es continua si sus valores posibles son todos los números

reales de un intervalo, o dicho de otra forma, una variable es continua si dados dos valores

cualesquiera, existe siempre un valor intermedio. Puede ayudar a clarificar este concepto el

pensar en el cómo lo opuesto de lo que era una variable aleatoria discreta, es decir sus valores

en vez de ser valores aislados que se situarían como marcas aisladas y diferenciadas en la recta

real, constituyen en este caso un continuo de puntos que rellena sin solución de continuidad

un intervalo de la recta real.

Tenemos por tanto, que una variable aleatoria continua puede tomar una infinidad no

numerable de valores y por consiguiente la probabilidad de un valor aislado es nula. Esto hace

que la función de probabilidad, tal y como la definimos para el caso de variables discretas,

carezca ahora de sentido, ya que al ser nula en todos los puntos no tiene utilidad a la hora de

describir la distribución de probabilidad .

Page 6: Parte 2: Distribuciones muestrales - WordPress.com · 2015-01-19 · muestrales”. Parte 2: Distribuciones muestrales 1. Variables Aleatorias Existen situaciones aleatorias cuyo

Página |6 IMADIL José María Salinas y José Luis Padilla

Cuando manejemos una variable aleatoria continua no podremos hablar de la

probabilidad de un valor, sino que tendremos que referirnos a la probabilidad de que el valor

de la variable esté comprendido en un intervalo de valores. De esta forma, la condición para

que una función que asigna números reales a los sucesos elementales sea una variable

aleatoria tiene en cuenta que las probabilidades que deben de poderse calcular son las de los

intervalos y por consiguiente exige que pertenezcan al sigma álgebra las imágenes inversas de

los intervalos (-, x] para todo valor de x.

Función de Distribución

La condición anterior implica que no haya ninguna dificultad en definir la Función de

Distribución de una variable aleatoria continua pues está definida la probabilidad de que la

variable aleatoria pertenezca a los intervalos el tipo anterior, pero esas probabilidades son

precisamente las que definen la Función de Distribución, en efecto:

Pr , PrX x X x F x

A partir de la Función de Distribución es posible calcular la probabilidad de cualquier

intervalo del tipo (a, b] pues:

Pr , Pr Pr ( ) ( )X a b X b X a F b F a

Para ver como varía la probabilidad de un intervalo a otro deberemos tomar en

consideración tanto la probabilidad de esos intervalos como su amplitud y comparar las

probabilidades promedio o densidad de probabilidad. La densidad de probabilidad de un

intervalo se determina dividiendo la probabilidad de que la variable aleatoria pertenezca a ese

intervalo por su amplitud, es decir:

F b F a

b a

( ) ( )

Función de Densidad

Por distintas razones es conveniente disponer de una función que nos indique como varía la

probabilidad, o un valor relacionado con ella, de un punto a otro de la distribución esta

necesidad viene a cubrirla la Función de Densidad que habitualmente se designa por f(x).

Veamos cual es el proceso mediante el cual se construye esa función, para cada valor x

de la variable aleatoria se toma un intervalo de la forma ( )x x y se calcula la densidad de

probabilidad de ese intervalo, mediante la expresión del apartado anterior, con lo cual

tendríamos:

Page 7: Parte 2: Distribuciones muestrales - WordPress.com · 2015-01-19 · muestrales”. Parte 2: Distribuciones muestrales 1. Variables Aleatorias Existen situaciones aleatorias cuyo

Página | 7 IMADIL TEMA 5. Notas

F x x F x

x

( ) ( )

A continuación tomaría un incremento de x menor y repetiría el cálculo anterior, con lo

cual tendría un nuevo valor. Repitiendo este proceso indefinidamente con intervalos de

amplitud decreciente tendría una sucesión de densidades de probabilidad, el límite de esa

sucesión será precisamente el valor de la Función de Densidad en el punto x. En términos de

una expresión matemática lo anteriormente expuesto sería:

f x limF x x F x

xx( )

( ) ( )

0

Pero esta expresión es precisamente la que define el concepto de derivada de una

función, por consiguiente podemos afirmar que la Función de Densidad es la derivada de la

Función de Distribución, es decir:

f x F x( ) ( )

Recordando que la integración es la operación inversa de la derivación también

podemos escribir:

F x f x dxx

( ) ( )

Por consiguiente, conocida la Función de Distribución de una variable aleatoria puede

conocerse su Función de Densidad y viceversa. Por ello la distribución de una variable aleatoria

continua puede caracterizarse tanto mediante su Función de Densidad como por su Función de

Distribución.

5. Esperanza Matemática

Al igual que en el caso de las variables estadísticas es conveniente disponer de unos valores

numéricos que sinteticen la distribución de las variables aleatorias, dando idea de su posición

global de su dispersión y de otras características. De esta forma podremos comparar distintas

distribuciones y resumir en uno o dos números los elementos esenciales que nos interesa

examinar. Para ello comenzamos definiendo el concepto de Esperanza Matemática de una

variable aleatoria también denominado Valor Esperado o Media.

Se define la Esperanza Matemática de una variable aleatoria discreta como la suma de

los productos de los valores de la variable por sus respectivas probabilidades:

E X x pi ii

Page 8: Parte 2: Distribuciones muestrales - WordPress.com · 2015-01-19 · muestrales”. Parte 2: Distribuciones muestrales 1. Variables Aleatorias Existen situaciones aleatorias cuyo

Página |8 IMADIL José María Salinas y José Luis Padilla

Por ejemplo, en el caso de la variable aleatoria número de caras al lanzar tres monedas

la Esperanza Matemática sería:

E[X] = 0·1/8 + 1·3/8 + 2·3/8 + 3·1/8 = 3/8 + 6/8 + 3/8 = 12/8 = 1,5

Esto nos indica que si lanzásemos las tres monedas un gran número de veces nos

aparecerían por término medio 1,5 caras en cada lanzamiento o dicho de otra forma que si

lanzamos tres monedas n veces el número total de caras en los n lanzamientos sería

aproximadamente 1,5·n

La Esperanza Matemática de una variable aleatoria continua se define como la integral

de los valores de la variable por la Función de Densidad:

E X x f x dx

( )

Propiedades

1ª La Esperanza de una constante es esa misma constante

E a a

2ª La Esperanza de una constante por una variable es igual a la constante por la Esperanza de

la variable

E a X a E X

3ª La Esperanza de una suma es igual a la suma de las Esperanzas

E X Y E X E Y

Varianza

Una medida de dispersión de las distribuciones de variables aleatorias que es habitualmente

utilizada es la Varianza. Se define la Varianza de una variable aleatoria como la Esperanza de

los cuadrados de las diferencias a la media

Varianza X E X E X 2

Page 9: Parte 2: Distribuciones muestrales - WordPress.com · 2015-01-19 · muestrales”. Parte 2: Distribuciones muestrales 1. Variables Aleatorias Existen situaciones aleatorias cuyo

Página | 9 IMADIL TEMA 5. Notas

Modelos Teóricos de Distribuciones. Introducción

En general, la determinación de la distribución de una variable aleatoria y el cálculo de las

características que hemos visto en el tema anterior, es un problema arduo que sólo puede

abordarse de forma directa, es decir calculando la probabilidad de cada valor, en contadas

ocasiones. Por ello se prefiere la utilización de Modelos Teóricos que son representaciones

esquemáticas de experimentos aleatorios ideales. El carácter abstracto de las condiciones que

se imponen a estos experimentos aleatorios ideales es lo que permite conocer, con relativa

facilidad, la distribución de la variable aleatoria considerada.

Por ejemplo, si tomamos como variable aleatoria el número que aparece al lanzar un

dado será muy fácil calcular su distribución si yo considero un dado ideal, es decir un hexaedro

perfecto construido de un material perfectamente homogéneo cuya densidad es constante en

todos los puntos del cubo, pues en este caso todas las caras tendrán la misma probabilidad de

aparecer y por consiguiente todos los valores tendrán igual probabilidad, 1/6.

Por el contrario, un dado real de los que podemos adquirir en las tiendas no cumplirá

las condiciones anteriormente descritas y por consiguiente la distribución de la aparición de los

números de sus caras diferirá en mayor o menor medida de la distribución antes descrita, si

quisiéramos determinar su distribución real tendríamos que realizar un número ingente de

lanzamientos para calcular las distintas probabilidades.

Bajo los supuestos de un modelo teórico será posible conocer la distribución de una

variable aleatoria y todas sus características que habrán sido previamente calculadas de forma

general. Por tanto, el primer paso en el estudio de una situación caracterizada por una variable

aleatoria no será hallar directamente la distribución, sino buscar el modelo teórico que mejor

se adecua al problema en cuestión. A continuación en el tema se verá una selección, muy

breve, de algunas de las distribuciones mas sencillas y conocidas.

Distribución Normal

La distribución Normal constituye un modelo teórico de distribución de una variable continua

al cual se ajusta, al menos de forma aproximada, la distribución de un gran número de

medidas de características psicológicas, biológicas, demográficas, etc.

Fue hallada en 1733 por De Moivre como límite de la distribución Binomial y

redescubierta por Gauss y Laplace, ochenta años después, al estudiar la distribución de los

errores de observación.

La Función de Densidad de una variable aleatoria X que siga una distribución Normal

tiene la siguiente expresión:

f x e

x

( )/

( )

1

2

1 22

2

Page 10: Parte 2: Distribuciones muestrales - WordPress.com · 2015-01-19 · muestrales”. Parte 2: Distribuciones muestrales 1. Variables Aleatorias Existen situaciones aleatorias cuyo

Página |10 IMADIL José María Salinas y José Luis Padilla

Como vemos la distribución Normal depende de dos parámetros, , la media, y , la

desviación típica, esto nos indica que especificadas la media y desviación típica de una variable

aleatoria normal queda perfectamente determinada su distribución, que denotaremos N(,).

Algunas características básicas de esta distribución pueden ser conocidas estudiando la

representación gráfica de la Función de Densidad que se conoce con el nombre de campana de

Gauss.

0

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

Como podemos ver, la curva tiene un único máximo en un punto cuya abscisa coincide

con la media, como la moda de una distribución continua es el valor en el que toma el máximo

la Función de Densidad , resulta que en una distribución Normal, media y moda van a coincidir.

También podemos observar que la representación es simétrica respecto al eje vertical

trazado el punto de abscisa , por tanto la probabilidad de encontrar de encontrar valores

inferiores a es la misma que la de encontrar valores superiores, luego es la mediana de

esta distribución, en consecuencia podemos afirmar que en una distribución Normal media,

mediana y moda coinciden.

Esta curva tiene una asíntota horizontal que es el eje de abscisas, por consiguiente la

función de densidad va a existir para cualquier valor x comprendido entre - y +, o lo que es

lo mismo, que una variable aleatoria, en principio, puede tomar cualquier número real. Sin

embargo la aproximación al eje es bastante rápida de tal forma que la probabilidad de

Page 11: Parte 2: Distribuciones muestrales - WordPress.com · 2015-01-19 · muestrales”. Parte 2: Distribuciones muestrales 1. Variables Aleatorias Existen situaciones aleatorias cuyo

Página | 11 IMADIL TEMA 5. Notas

encontrar valores que disten mas de cuatro desviaciones típicas de la media es prácticamente

despreciable.

Esta curva tiene dos puntos de inflexión, cuyas abscisas son - y +

respectivamente.

El área comprendida entre la curva y el eje de abscisas es igual a la unidad ya que en

virtud de las propiedades de la Función de Distribución se verifica:

1

F f x dx( ) ( )

Normal Estandarizada

Dentro de las distribuciones Normales va a jugar un papel destacado la Normal de media cero

y desviación típica uno N(0,1) cuya función de densidad tendrá la siguiente expresión:

f x ex

( ) 1

2

2

2

Veamos la razón del papel singular asignado a esta distribución N(0,1). Como ya

dijimos en una distribución continua carece de sentido plantearse cual es la probabilidad de

que la variable tome un valor aislado, por ello cuando se utiliza la distribución Normal las

cuestiones que se plantean hacen referencia a la probabilidad de que la variable tome valores

dentro de un determinado intervalo (a, b] el calculo de esta probabilidad requiere evaluar la

siguiente integral:

Pr( ) ( ) ( )/

( )

a X b F b F a e dx

x

a

b

1

2

1 2

2

2

El problema reside en que la función a integrar no tiene una primitiva expresable

analíticamente, por ello el valor de la integral debería obtenerse por métodos numéricos para

cada intervalo, para obviar estos cálculos la Función de Distribución de la Normal cero uno, se

encuentra tabulada ya que, como vamos a ver a continuación, conociendo los valores de la

Función de Distribución de la N(0,1) pueden conocerse los de cualquier otra distribución

Normal.

Si en la expresión de la Función de Distribución de una Normal cualquiera de media y

desviación típica :

F x X x e dxx

x

( ) Pr( )/

1

2

1 2

2

Hacemos el cambio de variable:

Page 12: Parte 2: Distribuciones muestrales - WordPress.com · 2015-01-19 · muestrales”. Parte 2: Distribuciones muestrales 1. Variables Aleatorias Existen situaciones aleatorias cuyo

Página |12 IMADIL José María Salinas y José Luis Padilla

zx

dzdx

tendremos que:

Pr( )X x e dzz

z

1

2

2

2

Pero esa es precisamente la expresión de la Función de Distribución de la Normal cero

uno. Por consiguiente para calcular el valor de la Función de Distribución, de cualquier

distribución Normal, en un punto x, basta conocer el valor el valor de la Función de

Distribución de la N(0,1) en el punto que se obtiene tipificando el valor de x, es decir:

Pr( ) Pr PrX xX x

Zx

Por ejemplo, suponiendo que el Cociente Intelectual sigue una distribución Normal de

media 100 y desviación típica 10 ¿ Cual es la probabilidad de que un individuo seleccionado al

azar posea un Cociente Intelectual menor o igual que 90 ?

Pr( ) Pr Pr( ) ,X Z Z

90

90 100

101 01587

Esta misma propiedad puede utilizarse en sentido inverso para calcular los Percentiles

de una distribución Normal cualquiera o de forma genérica el valor de la variable que deja por

encima o por debajo de si una determinada probabilidad.

Por ejemplo, supongamos que hacemos una selección de personal para un puesto en

el cual los individuos necesitan un alto nivel de aptitud mecánica. Para ello utilizamos un test

de aptitud mecánica cuyas puntuaciones, según el baremo, siguen una distribución Normal de

media 50 y desviación típica 15. Si necesitamos sujetos que se encuentren entre el 10% de la

población con mayores aptitudes mecánicas ¿ Que puntuación mínima debemos exigir a los

candidatos para admitirlos?

Pr( ) , Pr( ) ,X x X x 0 1 0 9

Restando la media y dividiendo por la desviación típica ambos miembros de la

desigualdad obtenemos:

Pr , Pr ,X x

Zx

50

15

50

150 9

50

150 9

Por otra parte en las tablas de la Normal(0,1) podemos determinar el valor de la

variable que deja por debajo de si una probabilidad de 0,9, es decir:

Page 13: Parte 2: Distribuciones muestrales - WordPress.com · 2015-01-19 · muestrales”. Parte 2: Distribuciones muestrales 1. Variables Aleatorias Existen situaciones aleatorias cuyo

Página | 13 IMADIL TEMA 5. Notas

Pr( , ) ,Z 1 28 0 9

Comparando las dos igualdades anteriores deducimos que necesariamente se cumple

que:

x

50

151 28,

luego:

x 1 28 15 50 69 2, ,

Propiedades

Aparte de la importancia que tiene la distribución Normal como modelo teórico al que

supuestamente se adapta la distribución de un gran número de variables biológicas, sociales y

psicológicas cuestión que no discutiremos en este momento, su amplia utilización también ha

venido potenciada por las propiedades de tipo algebraico que posee esta distribución y que

permiten realizar con facilidad cálculos y derivaciones muy complejas si se considera otros

tipos de distribuciones. De entre estas propiedades solo mencionaremos dos, relativas a la

distribución de la suma y diferencia de variables Normales, por la importancia que tendrán en

próximos temas.

Sea una variable X1 que sigue una distribución Normal de media 1 y varianza 1

2 . Sea

otra variable X2 que sigue una distribución Normal de media 2 y varianza 2

2 . Entonces la

suma de esas 2 variables X1 + X2 sigue también una distribución Normal de media la suma de

las medias y de varianza la suma de las varianzas más dos veces el producto del coeficiente de

correlación por las dos desviaciones típicas, es decir:

X X N1 2 1 2 1

2

2

2

1 22 ,

Cuando esas dos variables sean independientes el coeficiente de correlación de

Pearson valdrá cero y por tanto la distribución de la suma será:

X X N1 2 1 2 1

2

2

2 ,

De forma semejante se puede establecer que la distribución de la diferencia de dos

variables Normales sigue una distribución Normal de media la diferencia de las medias y de

varianza la suma de las varianzas menos el producto del coeficiente de correlación por las

desviaciones típicas, es decir:

X X N1 2 1 2 1

2

2

2

1 22 ,

y si ambas variables son independientes: X X N1 2 1 2 1

2

2

2 ,