Distribución Normal
-
Upload
ysrael-oswaldo-leon-cordero -
Category
Documents
-
view
241 -
download
0
Transcript of Distribución Normal
5/7/2018 Distribución Normal - slidepdf.com
http://slidepdf.com/reader/full/distribucion-normal-559abcec21aec 1/20
Distribución Normal
Definición formal
Hay varios modos de definir formalmente una distribución de probabilidad. La formamás visual es mediante su función de densidad. De forma equivalente, también pueden
darse para su definición la función de distribución, los momentos, la función
característica y la función generatriz de momentos, entre otros.
Función de densidad
Se dice que una variable aleatoria continua X sigue una distribución normal de
parámetros y y se denota X~N (, ) si su función de densidad está dada por:
donde (mu) es la media y (sigma) es la desviación típica ( 2 es la varianza).5
Se llama distribución normal "estándar" a aquélla en la que sus parámetros toman losvalores = 0 y = 1. En este caso la función de densidad tiene la siguiente expresión:
Su gráfica se muestra a la derecha y con frecuencia se usan tablas para el cálculo de losvalores de su distribución.
5/7/2018 Distribución Normal - slidepdf.com
http://slidepdf.com/reader/full/distribucion-normal-559abcec21aec 2/20
Función de distribución
La función de distribución de la distribución normal está definida como sigue:
Por tanto, la función de distribución de la normal estándar es:
Esta función de distribución puede expresarse en términos de una función especialllamada función error de la siguiente forma:
y la propia función de distribución puede, por consiguiente, expresarse así:
El complemento de la función de distribución de la normal estándar, 1 í ( x), se denota
con frecuencia Q( x), y es referida, a veces, como simplemente función Q,
especialmente en textos de ingeniería. Esto representa la cola de probabilidad de ladistribución gaussiana. También se usan ocasionalmente otras definiciones de la función
Q, las cuales son todas ellas transformaciones simples de .
La inversa de la función de distribución de la normal estándar (función cuantil) puedeexpresarse en términos de la inversa de la función de error:
5/7/2018 Distribución Normal - slidepdf.com
http://slidepdf.com/reader/full/distribucion-normal-559abcec21aec 3/20
y la inversa de la función de distribución puede, por consiguiente, expresarse como:
Esta función cuantil se llama a veces la función probit. No hay una primitiva elemental
para la función probit. Esto no quiere decir meramente que no se conoce, sino que se ha probado la inexistencia de tal función. Existen varios métodos exactos para aproximar la
función cuantil mediante la distribución normal (véase función cuantil).
Los valores ( x) pueden aproximarse con mucha precisión por distintos métodos, talescomo integración numérica, series de Taylor, series asintóticas y fracciones continuas.
Lí mite inferior y superior estrictos para la función de distribución
Para grandes valores de x la función de distribución de la normal estándar es muy
próxima a 1 y está muy cerca de 0. Los límites elementales
en términos de la densidad son útiles.
Usando el cambio de variable v = u²/2, el límite superior se obtiene como sigue:
De forma similar, usando y la regla del cociente,
Resolviendo para proporciona el límite inferior.
Funciones generadoras
Función generadora de momentos
5/7/2018 Distribución Normal - slidepdf.com
http://slidepdf.com/reader/full/distribucion-normal-559abcec21aec 4/20
La función generadora de momentos se define como la esperanza de e (tX )
. Para una
distribución normal, la función generadora de momentos es:
como puede comprobarse completando el cuadrado en el exponente.
Función caracterí stica
La función característica se define como la esperanza de eitX , donde i es la unidad
imaginaria. De este modo, la función característica se obtiene reemplazandot por it enla función generadora de momentos.
Para una distribución normal, la función característica es
Propiedades
Algunas propiedades de la distribución normal son:
1. Es simétrica respecto de su media, ;
Distribución de probabilidad alrededor de la media en una distribución N( , ).
2. La moda y la mediana son ambas iguales a la media, ;
3. Los puntos de inflexión de la curva se dan para x = y x = + .
4. Distribución de probabilidad en un entorno de la media:
5/7/2018 Distribución Normal - slidepdf.com
http://slidepdf.com/reader/full/distribucion-normal-559abcec21aec 5/20
1. en el intervalo [ - , + ] se encuentra comprendida,
aproximadamente, el 68,26% de la distribución;
2. en el intervalo [ - 2 , + 2 ] se encuentra, aproximadamente, el
95,44% de la distribución;
3. por su parte, en el intervalo [ -3 , + 3 ] se encuentra comprendida,
aproximadamente, el 99,74% de la distribución. Estas propiedades son
de gran utilidad para el establecimiento de intervalos de confianza. Por otra parte, el hecho de que prácticamente la totalidad de la distribución seencuentre a tres desviaciones típicas de la media justifica los límites de
las tablas empleadas habitualmente en la normal estándar.5. Si X ~ N ( , 2) y a y b son números reales, entonces (aX + b) ~ N (a+b, a2 2).
6. Si X ~ N ( x, x2) e Y ~ N( y, y
2) son variables aleatorias normales
independientes, entonces:
o Su suma está normalmente distribuida conU = X + Y ~ N ( x + y, x2
+ y
2) (demostración). Recíprocamente, si dos variables aleatorias
independientes tienen una suma normalmente distribuida, deben ser normales (Teorema de Crámer).
o Su diferencia está normalmente distribuida con
.
o Si las varianzas de X e Y son iguales, entonces U y V son independientesentre sí.
o La divergencia de Kullback-Leibler,
Si e son variables aleatorias independientes
normalmente distribuidas, entonces:
o Su producto X Y sigue una distribución con densidad p dada por
donde K 0 es una función de Bessel
modificada de segundo tipo.
o Su cociente sigue una distribución de Cauchy con X / Y ×Cauchy (0, X /Y ). De este modo la distribución de Cauchy es un tipo especial de
distribución cociente.
Si son variables normales estándar independientes, entonces
sigue una distribución ² con n grados de libertad.
Si son variables normales estándar independientes, entonces la
media muestral y la varianza muestral
son independientes. Esta
propiedad caracteriza a las distribuciones normales y contribuye a explicar por qué el
test-F no es robusto respecto a la no-normalidad).
5/7/2018 Distribución Normal - slidepdf.com
http://slidepdf.com/reader/full/distribucion-normal-559abcec21aec 6/20
Estandarizaci n de variables aleatorias normales
C consecuenci de l Propiedad 1; es posi le relacionar todas las var iables
aleator ias normales con la distr i buci n normal est ndar.
Si X ~ N (, 2), entonces
es una var iable aleator ia normal est ndar : Z ~ N (0,1).
La transformaci n de una distr i buci n X ~ N (, ) en una N (0, 1) se llama
normalizaci n, estandarizaci n o ti i icaci n de la var iable X.
Una consecuencia impor tante de esto es que la funci n de distr i buci n de unadistr i buci n normal es, por consi uiente,
la inversa, si Z es una distr i buci n normal est ndar, Z ~ N (0,1), entonces
X = Z +
es una var iable aleator ia normal ti pif icada de media y var ianza 2.
La distr i buci n normal est ndar est tabulada (habitualmente en la forma del valor de la
funci n de distr i buci n ) y las otras distr i buciones normales pueden obtenerse comotransformaciones simples, como se descr i be más arr i ba, de la distr i buci n estándar. De
este modo se pueden usar los valores tabulados de la funci n de distr i buci n normal estándar para encontrar valores de la funci n de distr i buci n de cualquier otra
distr i buci n normal.
Momentos
Los pr imeros momentos de la distr i buci n normal son:
Número Momento Momento central Cumulante
0 1 1
1 0
5/7/2018 Distribución Normal - slidepdf.com
http://slidepdf.com/reader/full/distribucion-normal-559abcec21aec 7/20
2 2 + 2 2 2
3 3 + 32 0 0
4 4 + 622 + 34 34 0
5 5 + 1032 + 154 0 0
6 6 + 1542 + 4524 + 156 156 0
7 7 + 2152 + 10534 + 1056 0 0
8 8 + 2862 + 21044 + 42026 + 1058 1058 0
Todos los cumulantes de la distribución normal, más allá del segundo, son cero.
Los momentos centrales de orden superior (2k con = 0) vienen dados por la fórmula
El Teorema del Lí mite Central
Gráfica de la función de distribución de una normal con = 12 y = 3, aproximando la
función de distribución de una binomial con n = 48 y p = 1/4
5/7/2018 Distribución Normal - slidepdf.com
http://slidepdf.com/reader/full/distribucion-normal-559abcec21aec 8/20
El Teorema del límite central establece que bajo ciertas condiciones (como pueden ser
independientes e idénticamente distribuidas con varianza finita), la suma de un gran
número de variables aleatorias se distribuye aproximadamente como una normal.
La importancia práctica del Teorema del límite central es que la función de distribución
de la normal puede usarse como aproximación de algunas otras funciones de
distribución. Por ejemplo:
y Una distribución binomial de parámetros n y p es aproximadamente normal para
grandes valores de n, y p no demasiado cercano a 1 ó 0 (algunos libros
recomiendan usar esta aproximación sólo si n p y n(1 p) son ambos, al menos,
5; en este caso se debería aplicar una corrección de continuidad).
La normal aproximada tiene parámetros =n p, 2 = n p (1 í p).
y Una distribución de Poisson con parámetro es aproximadamente normal para
grandes valores de .
La distribución normal aproximada tiene parámetros = 2 = .
La exactitud de estas aproximaciones depende del propósito para el que se necesiten yde la tasa de convergencia a la distribución normal. Se da el caso típico de que talesaproximaciones son menos precisas en las colas de la distribución. El Teorema de
Berry-Esséen proporciona un límite superior general del error de aproximación de la
función de distribución.
Divisibilidad infinita
Las normales tienen una distribución de probabilidad infinitamente divisible: dada una
media , una varianza 2
� 0, y un número natural n, la suma X 1 + . . . + X n de n variables aleatorias independientes
tiene esta específica distribución normal (para verificarlo, úsese la función característica
de convolución y la inducción matemática).
Estabilidad
Las distribuciones normales son estrictamente estables.
Desviación tí pica e intervalos de confian a
Alrededor del 68% de los valores de una distribución normal están a una distancia > 0
(desviación típica) de la media, ; alrededor del 95% de los valores están a dos
desviaciones típicas de la media y alrededor del 99,7% están a tres desviaciones típicas
de la media. Esto se conoce como la "regla 68-95-99,7" o la "regla empírica".
Para ser más precisos, el área bajo la curva campana entre n y + n en términos
de la función de distribución normal viene dada por
5/7/2018 Distribución Normal - slidepdf.com
http://slidepdf.com/reader/full/distribucion-normal-559abcec21aec 9/20
donde erf es la función error. Con 12 decimales, los valores para los puntos 1-, 2-, hasta
6- son:
1 0,682689492137
2 0,954499736104
3 0,997300203937
4 0,999936657516
5 0,999999426697
6 0,999999998027
La siguiente tabla proporciona la relación inversa de múltiples correspondientes a
unos pocos valores usados con frecuencia para el área bajo la campana de Gauss. Estos
valores son útiles para determinar intervalos de confianza para los niveles especificados
basados en una curva normalmente distribuida (o estimadores asintóticamente
normales):
0,80 1,28155
0,90 1,64485
0,95 1,95996
5/7/2018 Distribución Normal - slidepdf.com
http://slidepdf.com/reader/full/distribucion-normal-559abcec21aec 10/20
0,98 2,32635
0,99 2,57583
0,995 2,80703
0,998 3,09023
0,999 3,29052
0,9999 3,8906
0,99999 4,4172
donde el valor a la izquierda de la tabla es la proporci n de valores que caerán en el
intervalo dado y n es un múlti plo de la desviaci n tí pica que determina la anchura del
intervalo.
Forma familia exponencial
La distr i buci n normal tiene forma de familia exponencial bi paramétr ica con dos
parámetros naturales, y 1/2, y estadísticos naturales X y X 2. La forma canónica tiene
como parámetros y y estadísticos suf icientes y
Distribuci n normal compleja
Considérese la var iable aleator ia comple ja gaussiana
donde X e Y son var iables gaussianas reales e independientes con igual var ianza . Lafunción de distr i bución de la var iable con junta es entonces
Como , la función de distr i bución resultante para la var iable gaussiana
comple ja Z es
5/7/2018 Distribución Normal - slidepdf.com
http://slidepdf.com/reader/full/distribucion-normal-559abcec21aec 11/20
Distribuciones relacionadas
y R×Rayleigh () es una distribución de Rayleigh si donde
y son dos distribuciones normales
independientes.
y es una distribución ² con grados de libertad si donde
X k × N (0,1) para y son independientes.
y Y ×Cauchy ( = 0, = 1) es una distribución de Cauchy si Y = X 1 / X 2 para X 1× N
(0,1) y X 2× N (0,1) son dos distribuciones normales independientes.
y Y ×Log-N (, 2) es una distribución log-normal si Y = e
X y X × N (,
2).
y Relación con una distribución estable: si
entonces X × N (, 2).
y Distribución normal truncada. si entonces truncando X por
debajo de A y por encima de B dará lugar a una variable aleatoria de media
donde
y es la función de densidad de una variable normal estándar.
y Si X es una variable aleatoria normalmente distribuida e Y = | X |, entonces Y
tiene una distribución normal doblada.
Estadí stica descriptiva e inferencial
Resultados
De la distribución normal se derivan muchos resultados, incluyendo rangos de percentiles ("percentiles" o "cuantiles"), curvas normales equivalentes, stanines, z-
scores, y T-scores. Además, un número de procedimientos de estadísticos de
comportamiento están basados en la asunción de que esos resultados están normalmente
distribuidos. Por ejemplo, el test de Student y el análisis de varianza (A NOVA) (véase
más abajo). La gradación de la curva campana asigna grados relativos basados en una
distribución normal de resultados.
5/7/2018 Distribución Normal - slidepdf.com
http://slidepdf.com/reader/full/distribucion-normal-559abcec21aec 12/20
Tests de normalidad
Los tests de normalidad se aplican a conjuntos de datos para determinar su similitud con
una distribución normal. La hipótesis nula es, en estos casos, si el conjunto de datos es
similar a una distribución normal, por lo que un P-valor suficientemente pequeño indica
datos no normales.
y Prueba de Kolmogórov-Smirnov
y Test de Lillieforsy Test de Anderson±Darling
y Test de Ryan±Joiner y Test de Shapiro±Wilk
y Normal probability plot (rankit plot)y Test de Jarque±Bera
y Test omnibús de Spiegelhalter
Estimación de parámetros
Estimación de parámetros de máxima verosimilitud
Supóngase que
son independientes y cada una está normalmente distribuida con media y varianza 2
> 0. En términos estadísticos los valores observados de estas n variables aleatorias
constituyen una "muestra de tamaño n de una población normalmente distribuida. Se
desea estimar la media poblacional y la desviación típica poblacional , basándose en
los valores observados de esta muestra. La función de densidad conjunta de estasn
variables aleatorias independientes es
Como función de y , la función de verosimilitud basada en las observaciones X 1,...,
X n es
con alguna constanteC > 0 (de la cual, en general, se permitiría incluso que dependiera
de X 1,..., X n, aunque desapareciera con las derivadas parciales de la función de log-
verosimilitud respecto a los parámetros tenidos en cuenta, véase más abajo).
5/7/2018 Distribución Normal - slidepdf.com
http://slidepdf.com/reader/full/distribucion-normal-559abcec21aec 13/20
En el método de máxima verosimilitud, los valores de y que maximizan la función
de verosimilitud se toman como estimadores de los parámetros poblacionales y .
Habitualmente en la maximización de una función de dos variables, se podrían
considerar derivadas parciales. Pero aquí se explota el hecho de que el valor de que
maximiza la función de verosimilitud con fijo no depende de . No obstante,
encontramos que ese valor de , entonces se sustituye por en la función deverosimilitud y finalmente encontramos el valor de que maximiza la expresiónresultante.
Es evidente que la función de verosimilitud es una función decreciente de la suma
Así que se desea el valor de que minimiza esta suma. Sea
la media muestral basada en las n observaciones. Nótese que
Sólo el último término depende de y se minimiza por
Esta es la estimación de máxima verosimilitud de basada en las n observaciones X 1,...,
X n. Cuando sustituimos esta estimación por en la función de verosimilitud, obtenemos
Se conviene en denotar la "log-función de verosimilitud", esto es, el logaritmo de la
función de verosimilitud, con una minúscula , y tenemos
5/7/2018 Distribución Normal - slidepdf.com
http://slidepdf.com/reader/full/distribucion-normal-559abcec21aec 14/20
entonces
Esta der ivada es positiva, cero o negativa según 2
esté entre 0 y
o sea igual a esa cantidad, o mayor que esa cantidad. (Si hay solamente unaobservación, lo que signif ica que n = 1, o si X 1 =... = X n, lo cual sólo ocurre con
probabilidad cero, entonces por esta fórmula, ref le ja el hecho de que en estos
casos la función de verosimilitud es ilimitada cuando decrece hasta cero.)
Consecuentemente esta media de cuadrados de residuos es el estimador de máxima
verosimilitud de 2, y su raíz cuadrada es el estimador de máxima verosimilitud de
basado en las n observaciones. Este estimador es sesgado, pero tiene un menor error
medio al cuadrado que el habitual estimador insesgado, que es n/(n í 1) veces esteestimador.
Sorprendente generalizaci
n
La der ivada del estimador de máxima verosimilitud de la matr iz de covar ianza de una
distr i bución normal multivar iante es despreciable. Involucra el teorema espectral y larazón por la que puede ser me jor para ver un escalar como la traza de una matr iz 1×1
matr ix que como un mero escalar. Véase estimación de la covar ianza de matr ices.
Estimaci n insesgada de parámetros
El estimador de máxima verosimilitud de la media poblacional de una muestra es unestimador insesgado de la media. El estimador de máxima verosimilitud de la var ianza
es insesgado si asumimos que la población es conocida a pr ior i, pero en la práctica esto
no ocurre. No obstante, si nos enfrentamos con una muestra y no sabemos nada de lamedia o la var ianza de la población de la que se ha extraído, como se asumía en la
der ivada de máxima verosimilitud de arr i ba, entonces el estimador de máximaverosimilitud de la var ianza es sesgado. Un estimador insesgado de la var ianza
2es:
5/7/2018 Distribución Normal - slidepdf.com
http://slidepdf.com/reader/full/distribucion-normal-559abcec21aec 15/20
Esta "var ianza muestral" sigue una distr i bución Gamma si todas las X i son
independientes e idénticamente distr i buidas:
con media y var ianza
La estimación de máxima verosimilitud de la desviación tí pica es la raíz cuadrada de laestimación de máxima verosimilitud de la var ianza. No obstante, ni esta, ni la raíz
cuadrada de la var ianza muestral proporcionan un estimador insesgado para ladesviación tí pica (véase estimación insesgada de la desviación tí pica para una fórmula
par ticular para la distr i bución normal.
Incidencia
Las distr i buciones apr oximadam¡
nte normales aparecen por doquier, como quedaexplicado por el teorema central del límite. Cuando en un fenómeno se sospecha la
presencia de un gran número de pequeñas causas actuand o d e f or ma ad it iva e
ind e pend iente es razonable pensar que las observaciones serán "normales". Hay
métodos estadísticos para probar empír icamente esta asunción, por e jemplo, el test de
Kolmogorov-Smirnov.
Hay causas que pueden actuar de forma mult i pl icat iva (más que aditiva). En este caso,
la asunción de normalidad no está justif icada y es el logar itmo de la var iable en cuestión
el que estar ía normalmente distr i buido. La distr i bución de las var iables directamente
observadas en este caso se denomina log-normal.
Finalmente, si hay una simple inf luencia externa que tiene un gran efecto en la var iableen consideración, la asunción de normalidad no está tampoco justif icada. Esto es cier to
incluso si, cuando la var iable externa se mantiene constante, las distr i bucionesmarginales resultantes son, en efecto, normales. La distr i bución completa será una
superposición de var iables normales, que no es en general normal. Ello está relacionado
con la teor ía de errores (véase más aba jo).
continuación se muestran una lista de situaciones que estar ían, aproximadamente,
normalmente distr i buidas. Más aba jo puede encontrarse una discusión detallada de cada
una de ellas:
y En problemas de recuento, donde el teorema central del límite incluye una
aproximación de discreta a continua y donde las distr i buciones inf initamente
divisi bles y descomponi bles están involucradas, tales como:
o var iables aleator ias binomiales, asociadas con preguntas sí/no;
o var iables aleator ias de Poisson, asociadas con eventos raros;
y En medidas f isiológicas de especímenes biológicos:
o El l og ar it mo de las medidas del tamaño de te jidos vivos (longitud, altura,
superf icie de piel, peso);
o La l on gitud de apéndices iner te¢ (pelo, garras, rabos, dientes) de
especímenes biológicos en l a d ir ección d el cr ecimient o;
5/7/2018 Distribución Normal - slidepdf.com
http://slidepdf.com/reader/full/distribucion-normal-559abcec21aec 16/20
o Otras medidas f isiológicas podr ían estar normalmente distr i buidas,
aunque no hay razón para esperar lo a pr ior i;y Se asume con frecuencia que los errores de medida están normalmente
distr i buidos y cualquier desviación de la normalidad se considera una cuestiónque deber ía explicarse;
y Var iables f inancieras, en el modelo Black-Scholes:
o Cambios en el l og ar it mo de
Changes in the l og ar ithm of tasas de cambio, índices de precios, índices de existencias
de mercado; estas var iables se compor tan como el interés compuesto, no como el interés
simple, por tanto, son multi plicativas;
y o Mientras que el modelo Black-Scholes presupone normalidad, en
realidad estas var iables exhi ben colas pesadas, como puede verse encrash de las existencias de mercado;
o Otras var iables f inancieras podr ían estar normalmente distr i buidas, perono hay razón para esperar lo a pr ior i;
y Intensidad de la luz: o La intensidad de la luz láser está normalmente distr i buida;
o La luz térmica tiene una distr i bución de Bose-Einstein en escalas de
tiempo muy breves y una distr i bución normal en grandes escalas de
tiempo debido al teorema central del límite.
Es relevante para la biología y la economía el hecho de que los sistemas comple jos
tienden a mostrar power laws más que normal.
R ecuento de fotones
La intensidad de la luz de una sola fuente var ía con el tiempo, así como lasf luctuaciones térmicas que pueden observarse si la luz se analiza a una resolución
suf icientemente alta. La mecánica cuántica interpreta las medidas de la intensidad de la
luz como un recuento de fotones, donde la asunción natural es usar la distr i bución de
Poisson. Cuando la intensidad de la luz se integra a lo largo de grandes per iodos detiempo mayores que el tiempo de coherencia, la aproximación Poisson - Normal es
apropiada.
Medida de errores
La normalidad es la asunción cent ral de la teor ía matemática de errores. De forma
similar en el a juste de modelos estadístico, un indicador de la bondad del a juste es que
el error residual (así es como se llaman los errores en esta circunstancia) seaindependiente y normalmente distr i buido. La asunción es que cualquier desviación de la
normalidad necesita ser explicada. En ese sentido, en ambos, a juste de modelos y teor íade errores, la normalidad es la única observación que no necesita ser explicada, sino que
es esperada. No obstante, si los datos or iginales no están normalmente distr i buidos (por e jemplo, si siguen una distr i bución de Cauchy, entonces los residuos tampoco estarán
normalmente distr i buidos. Este hecho es ignorado habitualmente en la práctica.
5/7/2018 Distribución Normal - slidepdf.com
http://slidepdf.com/reader/full/distribucion-normal-559abcec21aec 17/20
Las medidas repetidas de la misma cantidad se espera que cedan el paso a resultados
que están agrupados en torno a un valor par ticular. Si todas las fuentes pr inci pales deerrores se han tomado en cuenta, se asume que el error que queda debe ser el resultado
de un gran número de muy pequeños y ad it ivo s efectos y, por consiguiente, normal. Lasdesviaciones de la normalidad se interpretan como indicaciones de errores sistemáticos
que no han sido tomados en cuenta. Puede debatirse si esta asunción es válida.
Una famosa observación atr i buida a Gabr iel Li ppmann dice:
Todo el mundo cree en la ley normal de los errores: los matemáticos, porque piensan que es un
hecho exper imental; y los exper imentadores, porque suponen que es un teorema matemático
Otra fuente podr ía ser Henr i Poincaré.
Caracterí sticas f í sicas de especí menes biol gicos
Los tamaños de los animales adultos siguen aproximadamente una distr i buciónlognormal. La evidencia y explicación basada en modelos de crecimiento fue publicada
por pr imera vez en el li bro P r oblemas d e cr ecimient o r el at ivo, de 1932, por JulianHuxley.
Las diferencias de tamaño debido a dimorf ismos sexuales u otros polimorf ismos de
insectos, como la división social de las abe jas en obreras, zánganos y reinas, por
e jemplo, hace que la distr i bución de tamaños se desvíe hacia la lognormalidad.
La asunción de que el tamaño lineal de los especímenes biológicos es normal (más que
lognormal) nos lleva a una distr i bución no normal del peso (puesto que el peso o el
volumen es proporcional al cuadrado o el cubo de la longitud y las distr i buciones
gaussianas sólo mantienen las transformaciones lineales). la inversa, asumir que el
peso sigue una distr i bución normal implica longitudes no normales. Esto es un problema porque, a pr ior i, no hay razón por la que cualquiera de ellas (longitud, masa
corporal u otras) deber ía estar normalmente distr i buida. Las distr i buciones lognormales,
por otro lado, se mantienen entre potencias, así que el " problema" se desvanece si se
asume la lognormalidad.
Por otra par te, hay algunas medidas biológicas donde se asume normalidad, tales como
la presión sanguínea en humanos adultos. Esta asunción sólo es posi ble tras separar a
hombres y mu jeres en distintas poblaciones, cada una de las cuales está normalmente
distr i buida.
Variables f inancieras
El modelo normal de movimiento de activos no incluye movimientos extremos tales
como quiebras f inancieras.
Ya en 1900 Louis Bachelier propuso representar los precios de cambio usando la
distr i bución normal. Esta aproximación se ha modif icado desde entonces ligeramente.causa de la naturaleza multi plicativa del interés compuesto, los indicadores f inancieros
como valores de mercado y precios de las mater ias pr imas exhi ben un "compor tamientomulti plicativo". Como tales, sus cambios per iódicos (por e jemplo, cambios anuales) no
5/7/2018 Distribución Normal - slidepdf.com
http://slidepdf.com/reader/full/distribucion-normal-559abcec21aec 18/20
son normales, sino lognormales. Esta es todavía la hi pótesis más comúnmente aceptada
en economía.
No obstante, en realidad las var iables f inancieras exhi ben colas pesadas y así, laasunción de normalidad infravalora la probabilidad de eventos extremos como quiebras
f inancieras. Se han suger ido correcciones a este modelo por par te de matemáticos como
Benoît Mandel brot, quien observó que los cambios en el logar itmo durante breves per iodos de tiempo (como un día) se aproximan bien por distr i buciones que no tienenuna var ianza f inita y, por consiguiente, el teorema central del límite no puede aplicarse.
Más aún, la suma de muchos de tales cambios sigue una distr i bución de log-Levy.
Distribuciones en tests de inteligencia
veces, la dif icultad y número de preguntas en un test de inteligencia se selecciona de
modo que proporcionen resultados normalmente distr i buidos. Más aún, las puntuaciones
"en crudo" se convier ten a valores que marcan el cociente intelectual a justándolas a la
distr i bución normal. En cualquier caso se trata de un resultado causado deli beradamente
por la construcción del test o de una interpretación de las puntuaciones que sugiere
normalidad para la mayor ía de la población. Sin embargo, la cuestión acerca de si la
inteligencia en sí está normalmente distr i buida es más complicada porque se trata de
una var iable latente y, por consiguiente, no puede observarse directamente.
Ecuaci n de difusi n
La función de densidad de la distr i bución normal está estrechamente relacionada con la
ecuación de difusión (homogénea e isótropa) y, por tanto, también con la ecuación de
calor. Esta ecuación diferencial parcial descr i be el tiempo de evolución de una función
de densidad ba jo difusión. En par ticular, la función de densidad de masa
para la distr i bución normal con esperanza 0 y var ianza t satisface la ecuación de
difusión:
Si la densidad de masa para un tiempo t = 0 viene dada por la delta de Dirac, lo cual signif ica, esencialmente que toda la masa está inicialmente concentrada en un punto,
entonces la función de densidad de masa en el tiempo t tendrá la forma de la función dedensidad de la normal, con var ianza creciendo linealmente con t . Esta conexión no es
coincidencia: la difusión se debe a un movimiento Browniano que queda descr itomatemáticamente por un proceso de Wiener, y tal proceso en un tiempo t también
resultará normal con var ianza creciendo linealmente con t' .
Más generalmente, si la densidad de masa inicial viene dada por una función ( x),
entonces la densidad de masa en un tiempo t vendrá dada por la convolución de y una
función de densidad normal.
5/7/2018 Distribución Normal - slidepdf.com
http://slidepdf.com/reader/full/distribucion-normal-559abcec21aec 19/20
Uso en estadí stica computacional
Generaci n de valores para una variable aleatoria normal
Para simulaciones por ordenador es útil, en ocasiones, generar valores que podr ían
seguir una distr i bución normal. Hay var ios métodos y el más básico de ellos es inver tir la función de distr i bución de la normal estándar. Se conocen otros métodos más
ef icientes, uno de los cuales es la transformación de Box-Muller. Un algor itmo incluso
más rápido es el algor itmo zigurat. mbos se discuten más aba jo. Una aproximación
simple a estos métodos es programar los como sigue: simplemente súmense 12
desviaciones uniformes (0,1) y réstense 6 (la mitad de 12). Esto es bastante útil en
muchas aplicaciones. La suma de esos 12 valores sigue la distr i bución de Irwin-Hall;
son elegidos 12 para dar a la suma una var ianza de uno, exactamente. Las desviaciones
aleator ias resultantes están limitadas al rango (í6, 6) y tienen una densidad que es una
doceava sección de una aproximación polinomial de undécimo orden a la distr i buciónnormal.
El método de Box-Muller dice que, si tienes dos números aleator ios U y V uniformemente distr i buidos en (0, 1], (por e jemplo, la salida de un generador denúmeros aleator ios), entonces X e Y son dos var iables a leator ias estándar normalmente
distr i buidas, donde:
Esta formulación aparece porque la distr i bución ² con dos grados de li ber tad (véase la
propiedad 4, más arr i ba) es una var iable aleator ia exponencial fácilmente generada (la
cual corresponde a la cantidad lnU en estas ecuaciones). sí, un ángulo elegido
uniformemente alrededor de un círculo vía la var iable aleator ia V y un radio elegido
para ser exponencial se transforman entonces en coordenadas x e y normalmente
distr i buidas.
Un método mucho más rápido que la transformación de Box-Muller, pero que siguesiendo exacto es el llamado algor itmo Zigurat, desarrollado por George Marsaglia. En
alrededor del 97% de los casos usa sólo dos números aleator ios, un entero aleator io y ununiforme aleator io, una multi plicación y un test-si. Sólo un 3% de los casos donde la
combinación de estos dos cae fuera del "corazón del zigurat", un ti po de rechazo
muestral usando logar itmos, exponenciales y números aleator ios más uniformes
deber ían ser empleados.
Hay también alguna investigación sobre la conexión entre la rápida transformación de
Hadamard y la distr i bución normal, en vir tud de que la transformación emplea sóloadición y sustracción y por el teorema central del límite los números aleator ios de casi
cualquier distr i bución serán transformados en la distr i bución normal. En esta visión se
pueden combinar una ser ie de transformaciones de Hadamard con permutaciones
aleator ias para devolver con juntos de datos aleator ios normalmente distr i buidos.
Aproximaciones numéricas de la distribuci n normal y su funci n de
distribuci n
5/7/2018 Distribución Normal - slidepdf.com
http://slidepdf.com/reader/full/distribucion-normal-559abcec21aec 20/20
La función de distribución normal se usa extensamente en computación científica y
estadística. Por consiguiente, ha sido implementada de varias formas.
La Biblioteca Científica GNU calcula valores de la función de distribución normal
estándar usando aproximaciones por funciones racionales a trozos. Otro método de
aproximación usa polinomios de tercer grado en intervalos. El artículo sobre el lenguaje
de programación bc proporciona un ejemplo de cómo computar la función dedistribución en GNU bc.
Para una discusión más detallada sobre cómo calcular la distribución normal, véase la
sección 3.4.1C. de The Art of C om put er Programmin g ( El art e d e la programación por
ord enador ), de Knuth.
Uso de tablas
La probabilidad de que una variable aleatoria (que sigue una distribución normal) se
encuentre entre dos valores determinados será en general difícil de calcular (hay que
usar la integral de la función de probabilidad). Para ello, existen tablas con los valorescorrespondientes, si bien éstos se calculan para la distribución Normal Tipificada.
Básicamente, se busca un valor de x (por ejemplo, ), y la tabla nos da la
probabilidad de que :
En el caso de que la distribución no sea estándar, por ejemplo, con
y , tendremos que tipificar la variable:
Se obtiene una variable Z normal, que además está tipificada. Si ahora se consulta en la
tabla,