Estudio de distribucion estadistica Log-Normal

20
Exposición general e indicaciones para el uso de la distribución lognormal por F. AZ^RIN y M. J. PALACIOS Departamento de Estadística. Facultad de Ciencias Unlversidad Autónoma de Madrid o. INTRODUCCION En diferentes campos de aplicación se hace uso de distribuciones asimétricas con fines de análisis, ajuste, inferencia y predicción; así, en la etapa de elección de modelo representativo o especificación de un sistema estocástico cuyos resulta- dos aparecen más o menos asimétricamente distribuidos, suelen aonsiderarse como posibles candidatos las funciones de d^ensida^d gamma, beta, de Pareto, normal truncada, lognormal y otras. Entre éstas tiene especial interés la lognormal o logarítmico-normal por la sencillez y fácil interpretación del esquema aleatorio que puede originarla y por las propiedades que la caracterizan. Su empleo se ha extendido considerablemente, a lo que, sin duda, ha contribuido la obra monogró,fica de^ Aitchison y 8rown (1957) y su utilidad práctica en aplica- ciones muy diversas: biológicas, económicas, geológicas (estud^io de partículas, concentración en depósitos, espesores de capas, etc.). Pvr ello creemos de interés la presentación sistematizada de los principales ele- mentos que requiere su utilización, para facilitar el trabajo de los interesados en sus posibilidades y limitaciones. 1. DISTRIBUGION LOGNORMAL DE DOS PARAMETROS Se dice que una variable aleatoria tiene distribució^n lognormal o logarítmico- normal cuando su transformada logarítmica (o, rnás generalmente, la transforma- ción lflgarítmica de una transformación lineal de la variable original) tiene una distribución normal. En el caso más simple, que es el que se considera en este apartadb, se dice que la variable X es logn^ormal si la función de densidad de su transformada logarítmica Y! log X, es la normal N(«, a-):

Transcript of Estudio de distribucion estadistica Log-Normal

Page 1: Estudio de distribucion estadistica Log-Normal

Exposición general e indicaciones para el usode la distribución lognormal

por F. AZ^RIN y M. J. PALACIOS

Departamento de Estadística. Facultad de CienciasUnlversidad Autónoma de Madrid

o. INTRODUCCION

En diferentes campos de aplicación se hace uso de distribuciones asimétricas

con fines de análisis, ajuste, inferencia y predicción; así, en la etapa de elección

de modelo representativo o especificación de un sistema estocástico cuyos resulta-

dos aparecen más o menos asimétricamente distribuidos, suelen aonsiderarse como

posibles candidatos las funciones de d^ensida^d gamma, beta, de Pareto, normal

truncada, lognormal y otras. Entre éstas tiene especial interés la lognormal o

logarítmico-normal por la sencillez y fácil interpretación del esquema aleatorio

que puede originarla y por las propiedades que la caracterizan.

Su empleo se ha extendido considerablemente, a lo que, sin duda, ha contribuido

la obra monogró,fica de^ Aitchison y 8rown (1957) y su utilidad práctica en aplica-

ciones muy diversas: biológicas, económicas, geológicas (estud^io de partículas,

concentración en depósitos, espesores de capas, etc.).

Pvr ello creemos de interés la presentación sistematizada de los principales ele-

mentos que requiere su utilización, para facilitar el trabajo de los interesados en

sus posibilidades y limitaciones.

1. DISTRIBUGION LOGNORMAL DE DOS PARAMETROS

Se dice que una variable aleatoria tiene distribució^n lognormal o logarítmico-

normal cuando su transformada logarítmica (o, rnás generalmente, la transforma-

ción lflgarítmica de una transformación lineal de la variable original) tiene una

distribución normal. En el caso más simple, que es el que se considera en este

apartadb, se dice que la variable X es logn^ormal si la función de densidad de su

transformada logarítmica Y! log X, es la normal N(«, a-):

Page 2: Estudio de distribucion estadistica Log-Normal

8 BSTADISTIGA E.SPAlYO].A

1-. exp (- ^y -- ac)^/2 cr^ para y E(- oo, vc^ [ i.il

cr ti1 2 rr

Aunque en las aplicaciones prácticas se supone el logaritmo decimal, para los

desarrollos algebraicos que siguen 1© más simp:e es Cuponer que es neperiano t 1)

[ sin ernbargo, al final deI aparta^do 2 se expondrán los resulta.dos correspondien-cix

tes a logaritmo decimal t2), con lo cual x^ exp (y) y, por consiguiente, dy ' ,x

que sustituida en f 1.1I da lugar a la funcián de densidad^ de la variable X:

1fL (x) - exp ^-- (log x -- ^► )^/2 ^r= ^ ; x E (0, ^) [ 1.2]

cr ^3 2 >t

Abreviadarnente se dice que ]a variable X es L(,^, ^rl y su trans^formada, Y,

N (x, +rr^-

2. CARACTE.RISTiCAS DL'. LA DISTRIBUCIOIV LOGNURMALDE DOS PARAMETRC^S

Puesto que X- exp (Y), la función generatriz de momentos de Y verificará:

^^v (t^ - E [exp (tY^^ .- E (Xt) [2.i1

Por tanio, para t- r el momento r-ésimo ordinario de X tque de ahora en ade-

lante se dotar^, de subíndice para evitar confusiones con el de la normal), será:

ar fx . = E (X r) = ^v (r)

Por otra parte, a1 ser ^ la funcián generatriz de una variable N(a, cr):

^v (t^ - exp (oc t + t^ ^-$^2j

y, por consíguiente, el momento ordinario [ 2.21

xr, x-' eXp (!X 1' -^- (T" r' /2^

(i) Conviene recordar que en general se verific^x, para una base b cua,lquiera:

b lo^; = eiog ^

log. xlog, x= _(log, x) ilog. b)

log. e

[ 2.2 ^

en particular para logaritmos decimal•3s:log^. x logt, x

log, x _ _ -. log,. x• log. 10 - 2,30258... log,. zloglo e ! 0,43429... T

(`'l ^éase al final de esta exposición la relación de ^ímbolos ampleados.

Page 3: Estudio de distribucion estadistica Log-Normal

EXPOSICION GENERAL E INDICACIONES PARA EL USO DE LA DISTRIBUC10:^3 iOGNORMAL 7

En par^ticular, la esperanza o media lognormal

xl =- E(X^ = exp (z -f- cr='^`2) 12.3)

la, varlarlZa IO$nOrln&^

o►^ ^ . (X^) -- E (X) ^ - exp (2 x + 0^2) • ( exp (v-2) -- 1 ^ [ 2.4 ]z

el cuadrado del coeflciente de variación

$^ -.- exp (cr^ -- 1^

el coeflciente de asimetría

! (exp

y el de curtosis

^ -2̀,9c 4

^s

Cuando exp (^^) se acerque a 1, disminuirá la varianza y la asimetría, y el

coe8ciente de curtosis se acercará a 3, que es el de la normal.

En cuanto a los cuantiles, cua,ntilas, percentiles, centiles, fractiles o valores

divisorios, se tiene, en general, para la cuantila r-ésima de orden s, es decir, la

que ocupa el lugar r entre las que dividen el á,rea de la curva en s partes iguales,

en ambas distribuciones [ i. i l y [ 1.31;

fL (L/,) (^ l.^ _= fN (V) G^ Vf

.- exp (4 0-^^ -t- 2 exp (3 v-a^ -{- 3 exp (2 v-^^ - 3lu^.z

- 1 ^^ eXp (^2) + 2^ > 0

^Tr Ja.t!

es decir:

lo,g rr ^a, x-^r J^, ,J o bien ^r^^, y `-- eXp (^r ^ ^. 1/)

En particular, la mediana ^C^,,^ = exp (µe, U) = exp (x^, por ser mediana y media

coincidentes en la distribución normal; y las cuantilas primera y tercera serán:

^1^4, z = exp (a -- 0,675 . . . o-^

^r3^^, z .- exp (a -1- O,1375 . . . v-^

La m©da se o?atendrá al igualar a cero la derivad^a primera de la función de den-

sidad [ 1.31, resultando

,ud, s--- exp a-- cT`)

Page 4: Estudio de distribucion estadistica Log-Normal

8

CASO DE LOGARITMO DLCIMAL

83TADISTICA ESPAÑOI..A

A continua^ción se indican las características de una distribución lognormal, en

la que el logaritmo se ha considerado con base decimal; los 9ímb41os se corres-poncien con las antes empleados:

[2.51

3. EST"IMACI4N Y AJIJSTE

[2.61

[ 2.? )

[2.81

[2.9)

[Z.io^

La media rnuestral, esto es, la media de las observaciones obtenidas con unamuestra aleatoria simple es un estimador insesgado de la media teórica de la

variable en estudio en la población de procedencia. Designando por X esta varia-ble, el estimador insesgado de la media ser^á

_ ^ xt^ni=2, n

y el de la varianza cTx

[3.11

^ _ ^i ^xt - a^^^^ln, -- 1^ [3.21f^l, tt

La pmpiedad de ins^esgamiento se verifica cualquiera que sea la distribuciónde origen; si además hay fundamento para especificar determinada distribución,puede ocurrir que otros estimadores, insesgados o no, tengan propiedades que loshagan preferibles a los antes indicados. Por ejemplo, si la distribución de p^roce-dencia es lognormal, los estimadore^ obtenidos indirectamente a partir d^e los loga-ritmos de las observaciones son m^s precisos en el sentido de que tienen menorvarianza en el muestreo.

La media y la cuasivarianza de los logaritmfls de las observaciones son:

á„ _ ^ log x,^n [3.31tal. w

Page 5: Estudio de distribucion estadistica Log-Normal

EXPOSICION GENE^i.AL E INDICACIONES PARA EL USO DB LA DISTRIBUCION IAG NORMAL 8

ó-y = ^ (log xi -- x^}2^(rL - 1^ [3.41

Estas^ expresiones son, por tanto, estimadores insesgados en la distríbución de

los logaritmos; sin embargo, debido a las relaciones [ 2.3 ] y[ 2.41 sus antilogarit-

m^os no serán estimadores insesgados de la variable original, empleándose como

estimadores en esta distribución (Aitchison y Brown y Koch y L.ink) los siguientes:

á^.v = eXp ^x^Ĵ ' ^ri ^^y^2^ [3.51

n--2c^-x ^ exp (2 G^cy^ . ^n (2 v-^ ^ -- t^i'n c:r^ [3.61

n -- 1

donde los valores de ^n están tabulados en las obras antes citadas. Dichos valores

aumentan con Q-^ y con el tamaño muestral, n; para n suficientemente grande, ^J es

aproximadamente igual a la función exponencial, con lo que se conservan las re-

laciones [2.31 y[2.41. Por ejemplo, para n - 2 y ^-^ --^ 0,1 es ^n = 1,025, y para n= 50

y ^2 = 4 es ^n = 6,628.

Si se parte de observaciones agrupadas en clases (loglo xi_1, logl© xi) i= 1, ..., m.,

con ni observa^ciones en dicha clas^e, se puede tomar como estimador de la media

de los logaritmos :

][° 3.7z _ ^,^ ni

i=1, m

en donde log ° x= designa la marca de clase del intervalo i-ésimo. Análogamente,

el estimador de la varianza

^^ ni (2,30258, . . ., logó x1- ^)'^é^I,m

^ry ^ [ 3.81,^ ni - 1

i.--1, m

La elección entre los métodos de estima^cián indicados, y otros posibles, depende

de las propiedades d^e los estimadores correspondientes^ y de las facilidades de

cálculo. Y las propiedades dependen, a su vez, de la distribución de origen y del

procedimiento de muestreo. Por ejemplo, la eficiencia de la media directa, á, de

las ob^servaciones disminuye en forma conocid^a, según demostró Finney (1941), al

aumentar el coeficiente de variación de la distribución Iognormal. Esta eflciencia,

que es del 100 por l00 para S= 0, pasa a s^er del 90 por 100 para ^= 1,2, menor

del ?5 por 100 para ^= 2 y menor del 60 por 100 para ^= 3. Por otra parte, los

estimadores c^ , c^^ pueden tener sesgos si la distribución de p^rocedencia no es,

como se ha supuesto, lognormal, lo que n^o justificaría la mayor complicación de

cálculo en los casos de especificación más dudosa.

Pueden vers^e varaios métodbs de estimación y aj uste y comparacic^n de resulta-

dos en Aitchison y Brown y en Koch y Link; los primeros recorniendan, para

2,30258, . . ., ^ n^ logt^ x^í -^ 1. ^n

^,.

Page 6: Estudio de distribucion estadistica Log-Normal

l0 B.SiTADISTICA ESPAÑOLA

rnuestras gra.ndes, una estimación por cuantilas, por su sencillez de cz^.lculo y

porque su eflciencia puede superar al SO por l00 del estimador más eficiente. Las

relaciones entre cuantilas dan para las simétricas del mis^rno orden: log ^rr^,, x=

- Q-- k^ ^r y logl ^r,^,,,^ ^ a^ + k,^ cr, donde ky es la consiante asociada a Ia cuan-

tila en la distribución de I'; por consiguiente, desígnando por pr,^ las cuantilas

observad^as

10$' pr^i. ^ + ^Og pl-r/s. ^c•2 -

2

log p^-r^,.: - log prr.. ^

generalmente se utilizan las cuartillas prirnera y tercera aunque se consigue mayor

eficiencia con las p, ,^, y A^^,^,.

4. APLICACIONES DEL PAPEL PROBABILISTICO A LA DISTRIBUCION

LQGNORMAL (3)

Si X es una variable aleatoria lognormal, L(x, ^-), su función de distribución,

F (x), puede escríbírse:

log x -- aF (x^ _` c^ ^-

[4.11

en donde ^ es la función de distribución de la N(o,l). Por tanto, si se hace la

transformacidn

^ ^ log x , ^^ _ ^-^ [F (x)^ [4.21

la curva [4.11 se transforma en la recta

t4.3]

El papel probabilístico correspondiente al sistema (^, ►^) se llama normal-logarít-

mico o gausso-logarítrnico y consta de :

1. Un eje, el de abscisas, construido a escala logarítmica y con doble escala indi-

cativa; Ia aritmética, correspondiente a los logaritmos y la de los antilogaritmos

(véa,se p. 23).

2. Un e ĵe de ordenadas aritmético en >> _^^-1 [ F(x):) y también con d^oble esca-

la, la segunda correspondiente a F(x^ _^(rj).

(3) Varios ejeniplos de aplicación del papel pr^babilístico a problemas relacionados con la dis-1.ríbucíán Iognormal pueden v^srse en G. CAr.aT (pp. 193 y ss.) y Kocx y LiNK (pp. 23? y as.).

Page 7: Estudio de distribucion estadistica Log-Normal

EXPOSICION GENERAL E INDICACIONES PARA EI. USO DE LA DISTRIBUCION IAGNORMAt lI

Un papel de este tipo se incluye en la p^.gina 23. En él está^n señalizados en un

eje los antilogaritmos decimales, aunque para fle^ibilidad de representacián sólo

se indican los dígitos 1, 2, 3, ..., 9, repetidos con ia periodicidad adecuada, lo

que permite representaciones, según los casos, de números del 0,5 aI 20 o del 5 aI 200,

etcétera; el eje vertica^ contiene también dos escalas, una correspondiente a

100 F tx) y otra, aritmética en crr^ (4).

Qr^ EXAbIEN DE LA HIPÓTE.SIS DE LOGNORMALIDAD

Dada una distribución empírica xI, x.,, ..., x,^, con frecuencias relativas n,/N, ...,

n^/N, N- ^ nt sru representacián en papel gausso-logar-ftmico se hará por losf-1, k

puntos (x^, F^), i= i, k, donde Fr .- ^+... + n{ .N

Si la d^istribución está agrupada en intervalos a^ --- a,, aI -- a y, ..., a,^_ 1 -- a,^, confrecuencias r^f/N, los puntos a representar seré.n (ai, Fi), i- 1, h, donde, como en eIcaso anterior, F{ - F (a{).

Si los puntos así representados se alinean sensiblemente, según una recta quesería la ^=(,^ -- a)/o-, se podrá aceptar con este criterio gráfico que la distribuciónempírica es lognormai y sus pará,metros podr^.n estimarse como a continuación seindica.

b) ESTIMACIÓN DS a T cr

i. Puesto que a es la abs^cisa, en la escala aritrnética, del punto de corte de larecta [4.31 con el eje de abscisas, ya que F(x) ^ 0,5 y, por tanto, ^= x, resulta quesi x* es el punto que indica esta intersección, será «^ log x*.

2. Análogamente, F(x) ^ 0,9772. ., si y sólo si ^._- a+ 2 ^; por tanto, si x* * es

el correspondiente valor, será cr ^(1 /2) log (x* */x*), siendo x* y x** tales que

F(x*) ^ lJ,5 y F(x**^ - 0,9772...

Como dice G. Calot, es ►tas estimaciones pueden ser más precisas que las analíti-

cas por no estar afectadas del error d^ agrupamiento en clases; sin embargo, hay

que tener en cuenta que ajustar una recta a los puntos (a,, F^), i.- 1, h, también

puede conllevar un error subj etivo.

C) C^BSERVACIONES SOIIRE LOS INTERVALOS DE PROBABILIDAD PREPTJADA

Es conocido que en Ia distribución N(^► , c^) los intervalos de la forma (« f h a-)

con ^, = 0,68, 1,96, 2,58, 3,29, son importantes en cuanto que son centradas en media

y aontienen, respectivamente, el 50 por 10^0, 95 por 100, 99 por 100, 99,9 por 100 de la

distribución. Ahora bien, se quiere hacer notar que los correspondientss intervalos

í4) Dicho papel contiene, además, líneas verticales equidistantes que pueden utilizarse comolas marcas de clase de una distribución agrupada en intervalos; ello corr?sponde a tomar en ladistribución de los logaritmos clases de amplitud constante (de tamaño múltiplos decimales de0,125 en este papel). En ol ejemplo de la p. 23 no se ha, tenido en cuenta esta posibilidad.

Page 8: Estudio de distribucion estadistica Log-Normal

12 BSTADISTICA ESPAÑOLA

para la distribución lognormal serán exp (x --,^ cr), exp {^ -^t ^r) y, por tanto, no

centrados en media ni ta.n siquiera en mediana.Por otra parte, si X es L(a, cr}, entonces el valor x^. tal que P (X > xt) - E puede

obtenerse para e^ 1/2, de xe - exp (ac + crh,^), siendo ^.^ tal que:

P{^Z^>^.^) .- e

dond^e Z es N (0,1}; ell© se debe a que si Z es N (0,1), entonces para 0^ p c 1/2 es

P( ^ Z>> Ap) - P=^' (-- J1_,,} Y, por tanto,

^ --. P(X>x,^} -- 1-F(xQ} = 1-c^^((log x£`x)/^Ĵ - ^^-'^-(log x^--aÍ^^) _= ^^ (- ^^}, y alsi : xE ^ exp (x -+- cr A^^ )

Al final de esta exposición se incluye un ejemplo numérico de los métodos hasta

aquf expuestos.

s. RELACIONES ENTRE LAS CARACTERISTICAS DE LA DISTRIBUCION

NORMAL Y DE LA LOGNORMAL DE DOS PARAMETROS

Adem^s de las relaciones de la sección 2, y en virtud de ellas, se verifican

las siguientes expresiones en las que aparecen las características de la distribu-

ción normal en función de las de la lognormal:

x= 2 log al,^ - t1^2) log x.^,,^ d©nde ,^^,? = E(Xa)

rr" = l^g ^^2 .ac^al, x} - l^g ^1 + °^,^ /^ 1, ,^^

x- log ^t^14, x= log µ^ ^

^T = (1^2 ^,) log (^r^,^.x^^r,^#,x) donde A = 0,675 ...

6. FUNCIOIVES DE VARIABLES ALEATQRIAS LOGNORMALES

Puesto que combina^ciones lineales de variables aleatorias independientes dis-

tribuidas normalmente dan lugar a variables con distribución normal, se verificará:

Si X,, XZ, ..., Xn son variables aleatorias independientes con dis^tribución L(^,^, v-k},

k= 1, n, y hl, h^, .. ., h„ sfln números enteros, entonces la variable aleatoria Y= xhl,^

Xh', ..., Xh'^ tiene distribución L(^c, cr) donde

^c = II h^: _ ►, Y (T^ --- II hk o-^kk=1, n k=1, n

En particular:

1. El producto de dos variables aleataria,s independientes, X1, X^, lognormales

tiene distribución L{al -1- a^, ^/ a? + rr^^ )

Page 9: Estudio de distribucion estadistica Log-Normal

F^CPOSICION GENERAL E INbICACIONF.S PARA EL USO DE LA DI5I'RIBUCION LOG NOR.MAL 13

2. E1 cociente de dos variables aleatorias independientes lognorrnales tiene dis-

tribucibn L (a, - x j, ^Y ^g -}- ^Y ).

7. EXTEI^TSi(^N A LA DISTRIBUCION LOGNORMAL DE TRES PARAMETRC3S

Si en lugar d® la transformación Y= log X, considerada en la sección 1, se

efectúa Ia más general:

y --. log (X - ^3)

en donde ^ es un parámetro real y X>/^ , se tiene la función de densidad lognar-

mal de tres parámetros :

f (x) - 1 exp( ( lag (x -- ^3) --- x ]^^ /2^ra.i ^

(x - ^) ^ ^32^

Las características de esta distribución resultan ser:

xr x- E(Xr) _ ,^ ( k) ^3r~^ exp (h x + kry cr^^2)k,^o,r

en particular, la media

Los momentos centrados

x^. r=/^ -#- exp (^ + v-^^/2) 17.11

fu^. ^ _ ^E (x) - E (X )^r - ^ ( - 1)^` ( ^: ) exp I ra -}- (r -- Y^" -i- h) ^` ^2^^ ^a. P

resrultan independientes de /3, en particular la varianza

Q `^ = rexp (2 x + a-A)^ ^exp (cr2) -1 ^ [ 7.21

el coeficiente de variación

óx = ^^exp (x + c^^/2)^ ^-exp (^r=' ---- 1

las cuantilas

y en particular, la mediana

lar moda

^ J_^

^^+exp (x-^-cr^=/2)

^;, r,s, ^. _ ^3 -t- exp „,.,^, ^,)

u^. :^ = /^ + eXp (^ ^ ^` 1

Page 10: Estudio de distribucion estadistica Log-Normal

19

y el coeficiente de asimetría

gsr^,nisric^ Esp^ÑO^

^i. Z = (2 + exp c^-'l) ^eXp ,I^^;^}u

que es creciente con o-.

Estas relaciones dan lugar a otra.s, inversas de ellas, y que se indican a con-tinuación:

1^c - 21og (^i,,^ -- ^Í ` 2 l^g ^x^,: -- a 1^ ai. ^ + 1^) [?.3]

x^ log ^. `^3:+.x ^z;^.t^ t^= ;,r ` ^1 {,:r ^1 (fiZ,^{^r -^-

og ^ 1 +

^r = 1 log (rr^ ^ 3!4, r

r ^(x^. ^----- ^^^^'^l

^3^*, x^ Z ?iĴ f^ r/J

[?.41

[ ?.5 ]

^4,r^^t^;,,^,^ ' ^1^^,^}^ A, = 0,675 ... [?.6]

^^ -^^ 114. 2^3^^, aC !^2/4^ x I l\^ 114, x+^^(4. x- 2^`^14, r^[7.7^

Esta última expresián tiene interés, ya que permite una aproximación no dema-

siado complicada, además de ser la única analítica, del tercer parámetro de ladistrik^ución lognorznal.

En cuanto al empleo de la distribución lognorrnal de tres par^,metros en algu-

nas aplicacivnes concretas, deben tomarse especiales precauciones por las dificul-

tades en estimar ^3 cuando la muestra es pequeña. En general, una subestimación

de ^ Ileva a varios sesgos en la estimación de la media (Koch y Link), pero s^u

sobreestimación puede dar lugar a límites de confianza demasiado próximos, por

ser demasiado pequeña la varianza de los logaritmos.

8. ACEPTACION O RECHAZO DE LA HIPOTESIS DE LOGNORMI^LIDAD CON

PAPEL PROBABILISTICO

De forma, análoga al caso de la d^istrib^ución lognormal de dos pará,metros, sepuede examinar gráficamente la lognormalidad en una distribución de tres pará-metros; puesto que si X es una variable aleatoria L(^(^, x, rr) tiene función de dis-tribución

F (x) _ ^^ [(log (x - ^^) -- ^)/tT J [8.1 ]

resulta que, según que ^(3 sea conocido o no, se podrá realizar una transformación

sobre el sistema de coordenadas para que la curva 18.1 ] se convierta o no en

una recta.

Page 11: Estudio de distribucion estadistica Log-Normal

F:JCPOSICION GSNF:^RAL E INDICACIONES PARA EI. USO DE LA DISTRIBUGION IAGNORMAL

a) Si ^ es conc^cicia.--En un sistema caordena^do (^, r^) donde

y,^ -^^ -^ 1 ( F(x) ], la curva t 8.11 se transf orma en la recta

^-^C8.21

y se mantienen ias consideraciones de la sección 4, con sólo repres^entar los pun-

tos x^ -- ^3 (h = 1, n) en el eje de abscisas. Resultando como estimación de z y cr,

respectivamente:

^ĉ .- log x* = log (x' - ,,^)

siendo x' tal que F(x') --= 1/2.

1 x* * 1 x" --- ^3c.^- - log = log

2 x* 2 x'-^

siendo x" tal que F(ac"^ - 0,9??2...

E1 intervalo [ f3 -1- exp (a -^la-), ^3 + exp (u +^cr)] corresponderá al (« t Ac^-) de la

normal y el valor xg -^3 -{- exp (^ -}- o-^2F) será tal que P(X > xE) .= e.

b) Si /3 es desconacida.--En este caso caben dos posibilidades. Realizar una

estimación analítica del tipo indicado en la sección 7, o bien tratar de encontrar

una estimación gráfica como a continuación se establece.

A1 ser ^ desconocido, la transforma^ción a hacer será ^.^ Iog x y f1 =^-1 [ F(x) ],

con Io que la curva [8.11 se transformará en la

log (exp ^ - ^C3) -- x

a~

A continuación se estudia esta curva distinguiendo que /3 sea pos^itivo o negativo:

1. /3 > 0. La, curva existe para todo valor ^> log /3, siendo ^= log ^f3 y

` a,= ^! asintotas vertical y oblicua, respectfvamente.J

^r

15

= log (x - ^3)

FIGURA 1 FIGURA 2

Page 12: Estudio de distribucion estadistica Log-Normal

16 LSTADISTICA ESPAÑOL^►

^. /; ^ o. La curva tendrá existencia para todo valor positivo de ^, siendof^ _. ^ lag (- ^,') - ^^/cr y ,^ _ (^ - =)/^T asintotas horizontal y oblicua.

En cualqu:era de los dos casos, sea (0, r^^) un punto arbitrario del eje y sean(^,, ^^^,) y(^2, .►1u) los puntos correspondientes en la asíntota oblicua y en la curva;entonces:

^1 = ^ -^ ar t]n

ahora,

y ^^ = log ^ IQ + exp ( x+ cr r^c► ) ^

,^ ^= log x' y ^,^ = log x"

por tanto:

,^ -- x" - x^

y ésta será una forma de estimación de ,^3 (véanse figuras 1 y 2).E1 problema práctico consiste en determinar la asíntota oblicua; ello puede

hacerse eligiendo una recta tal que la desviación horizontal entre la curva y ella

se mantenga, aproximadamente, conytante cuando es medida en antiiogaritmos, y

comprobando después que ŝ = log /3 0^^ _[log (- ^3) - x^/^- es asfntota vertical u

horizontal, respectivamente, para ^3 > 0 0^3 < 0 t5).

9. EXTENSI(JN A LA DISTRIBUCION LOGNORMAL DE CUATRC^ O CINCO

PARA1ViETR05 Y A LA DE ASIMETRIA NE(^ATIVA

Si en lugar de las transformaciones de las secciones 1 y 7 se efectúa la más

general :

y = ^s + ^^ log (x ""' ^1) [ 9.11

que se reduce a la de tres parámetros cuando R3 = 0 y^.3^ = 1, y a Ia de dos cuandoadem^ís ^3^ ^ ^, se tiene la función de densidad de la variable aleatoria X:

f (x1 .- ^a e X j 3+ 3,, 1 o x- -^^ 2 v-'' x^ (/^► ^ao jl I p^ l,^ 3 ^. g( ^1) ^/ , lNl^ I

cr ^/ 2 ^t (x - %31^

con cinco parámetros: L (a, ^, ^1, ^2, ^3'3).Para la de cuatro (^33 - 4) se verifica para la función generatriz de momentos:

r r 1 r r^^ ry ^^•' -' ^ ►-, x - (1) 1^1 ^,^-1. .r + . . . -}- - ) ^Q i

y, por tanta, la media

xi.x = I^ji + exp [(x -^- crl/2)/l^•.^

(5) Véase nota (3) de la aección 4.

Page 13: Estudio de distribucion estadistica Log-Normal

E3LFOSIGION GENERAL Ir INDICACIONES PARA EL USO DE LA DiSTRIBUGION LAGNOR!tiiAL 1^

y la varianza

^r^-' -- [exp (2 ^c -1- cJ-^}lÍ^ ^^ ( eXP (_`" ^.^`^/,^^7) ^ 1.^

Por otra parte, la transformación

y - log ((3 -- x)

da como función de densidad de la distribución lognormal de asimetría negativa:

f (x^ = 1 exp - [log (^3 - x) + ^]^^^ °`:: x E {-- a^, ^)L Jcr ^3 2 7t (^3 - x^

Esta distribución constituye una representación simétrica respecto a un eje de

la correspondiente de asimetría positiva y tiene en valor absoluto las mismos

parámetros. (Véase Koch y Link para aplicaciones.)

l0. P4SIBLES MECANI"SMOS GENEr.RADOF^ES DE LA DISTR,IBUCIQN

L4GNORMAL

La distribucián lognormal puede originarse a través de ciertos mecanismos

aleatorios, como, por ejemplo, cuando el incremento de una variable es función de

su valor anterior, multiplicada por una variable aleatoria, esto es:

xc ^ xt-i - Et g (xc-i^ tlo.ll

Esta es la llamada teoría del efecto proporcional, que fue forrnulada por Kapteyn

en 1903, y en la que se supone que las et son variables aleatorias independientes

(frecuentemente se suponen también con igual distribuciónl, y que L1 X es una

proporción aleatoria del valor anterior de la variable. (Véase Aitchison y Brown,así como Agterberg.)

Casos particulares importantes de [ 10.1 ] son :

a1 Cuando la función ^r se reduce a una constante, se tiene entonces

Xt ^ ^ ^kn^i, c

Y en virtud del teorema central del límite, su distribución tiende a la normal.

bl Cuando p(X t_1} - Xx _^, se tiene

^̂h sl , i

xh -- xn-i

x^h-^- ^ ^n

1t-1, fi

ESTADISTICA BSPAÑOI.A.-2

Page 14: Estudio de distribucion estadistica Log-Normal

1$ $sTADísTíCA FSPAIíiQ1.A

que en el limíte resulta

o bien

dxx

i log Xt - log X^

1©g Xt = log Xn -}- ^ ei^.^^. ^

según lo cual la distribución asintótica de X, es la lognormal.

11. ALGUNAS APLICACIONES ESPECIFICAS DE LA DISTRIBUCION

LOGNORMAL

Ya se han mencionado en las secciones anteriores algunas aplicaciones de la

distribución lognormal, y en la blbllografla se hace referencia a obras que^ tratan

con detalle algunos cas^os pr^cticos. Aplicaciones geolágicas pueden verse en las

de Agterberg y en las de Koch y Link. En esta última se dedica amplia exten-

sión (cap. 1s) a esta distribución en relación con datos procedentes de minas de

oro en Africa del Sur. Los problemas de muestreo, ensayos, prospección y deci-

sión sobre explotación de yacimientos relativos al oro pueden extenderse en mu-

chas casos a otros elementos, así como a aplicaciones no geológicas.

Una característica que se pone de manifiesto en el caso del oro es que el coefl-

ciente de variación es muy alto (la tabla 16.1 de Koch y Link da valores desde

0,33 a 5,10 donde la mayor parte superan 1,2, lo que apoya la transformación lo-

garítmica). Las distribuc^ones estudiadas se presentan en intervalos de clase de

amplitud 5, desde (0,5) a(82a0, 625) y frecuencias absolutas que configuran una

distribución muy asimétrica, adernás de tener val^ores muy inferiores a 10 a partir

del intervalo (55, 60) (6). Por otra parte, la distribución espacial es muy irregular,

y un gran número de observaciones pueden tener gran efecto en las estimaciones

de medias y varianzas. Esto plantea problernas de exploración y muestreo de

gran interés, pero que no corresponde ahora considerar. Conviene insistir en que

la transfarmacián logarítmica de dos parámetros aplicada a estos datos no es siem-

pre la mejor entre las distribuciones asimétricas. Además de la distribución log-

normal de tres pará,metros, que supone sumar una constante a todos los datos,

pueden ajustarse otras distribuciones asimétricas como las mencionadas en la

sección 1.

(s) Como el contenido de oro de las menas suele ser pequeño, los valor3s de la variable empleadasa expresan en dwt/short ton (el significado es dwt ^ penny weight); un depósito con una onza deoro por ton^slada contiene 34 partes de oro por un millón, esto es 34 gramos por tonelada métricao ^,0034 por i0o de oro. En muchas minas se trabaja con grados de cinco a diez partes de oropor miilón (KocH y LINK, vol. 2, p. 385).

Page 15: Estudio de distribucion estadistica Log-Normal

EXPOSICION GENERAL E INDICACIONE^ PARA EL USCI DI~ LA DISTRI©UCION IAGNORMAL 1^

12. EJEMPLl7

Considérese la siguiente distribución empírica, ordenada y agrupada en inter-

valos de clase (1):

a._, - at n. t?)

0 - 100 588lU0 - 20U &4?

200 - 34C3 ?42300 - 400 42?400 - 500 344500 - 600 209804 - 8t}(i 2388t^ - 1. (X^0 119

1. QOa - 2.000 1082.000 - 3.000 83.000 - 5.000 8

Se tratará de estudiar si esta distribución se ajusta bien a una l^ognormal;

para ello se estiman los parámetros de la hipotética distribución y se^ examina la

bondad del ajuste mediant+e algún test xz o de Kolmogorov, etc. Sin embarga, como

este último proceso se realiza de manera análoga cualquiera que sea la distribu-

ción, se limitará nuestra atención a la estimación de los parárnetros, procediendo

para ello por diferentes métodos según lo expuesto en las secciones anteriores.

1. Estimación directa de los parámetros de la distribucián dada

^:1 CARACTBRÍSTICA3 PROPIAB DE LA DISTRIBUCIÓI^

De acuerdo a las expresiones ( 3.11 y t 3.21 se obtienen los estimadores de la

media y la varianza

z= 341,64333? y s^. ' 119866,43898

resultando los demás parámetros:

desviación tipica

sx = 346,21?32

caeficiente de variación

dx = 1,01338

(7) Los datos corresponden al ejercicio número 20, p. 215 de G. C^LOx, y represontan los resul-tados de una encuesta sobre ^el consumo anual de el©ctricidad (en kwh} de 3.572 familias.

Page 16: Estudio de distribucion estadistica Log-Normal

20

moda

mediana

y cuantilas

B3TADIS?1CA BSPAIYOLA

ad^=150

pi^^, s = 250,28

p^^^4,,^ = 138,^68 p3,^.,^ = 431,9078

b^ ESTIMACIÓN DE LOS PARÁMETROS DE LA DISTRIBL^CIÓN NORMAL ASOCIADA POR TRANSFORMA-

CIÓN LOGARÍTMICA DECI^iAL ^8^

1) Estimctción del tercer pará.metro /j.--En caso de que la distribución lo,gnormal

sea de tres par^.metros, será ^3 c 4, y para su estimación puede utilizarse la ex-

presión [7.71, resultando: ^3 =--- 39,5003. A partir de ahora se supone correcta esta

estirr^ación y se utiliza en eI resto de la seccián.

2) Estimaci.ón de ta media.--Pueden emplearse estimadores diferentes que son:

por cuantilas, relación [7.41:

a = 2,46225055

por momentas (2)

« -- log (z - j3^ --

pgr mediana

2 log e- 2,450445

x = log (^u^, x - ^3^ = 2,48203845

3) Estimación de lcx variariz,a.---Aná,Iogamente al caso anterior pueden conside-

rarse los estimadores:

por cuantilas, relación [7,81

a- = 0,31312 y ^`^ ^ 0,(398044 ^.3

por momentos (9) :

s^v-`^ .- log ^ 1-^- --_ ^, • log e= 0,1 Y347423 y cr = 0,3388

^x - ^)"

(e) En el resto de la sección ts utilizarán los mismos sfmbolos para los parámetros reales y susestimadores.

(9) Estas expresiones se corresponden, respectivament^, con las i7.1 y t7.51, pero utilizadas aquíen el caso de logaritmo decimal en la trarisforrnacibn.

Page 17: Estudio de distribucion estadistica Log-Normal

EXPOS3GION GENERAL E INDIGACIONES PARA EL USO DE LA DISTRIBUCION LoGNORMAL 2i

2. Estimación en la distribución asociada por transformación logarítmica decimal

^^ CARACTERÍSTICAS DE LA DIST^IBUCIóN ASOCIADA

De acuerdo a lo expuesto en la seccidn 3, y adrnitiendo que ^3 =-- 39,5003, debe-

rá considerarse la distribución empfrica de intervalos de clase: log (ak_1 + 39,5003) --

- log (ak -}- 39,5003}, y efectivos nk (k .- 1,11). Los estimadores de la media y va-rianza resultan ser, de acuerda a las expresiones t3.71 y[3.81 consideradas en el

caso de logaritmo decimal:

x= 2,44041g699 y a-'-' = 0,11436995395

con lo que

r^ = 0,338186 y b= 0,13857726

Ŭ ^ CARACTERÍSTICAS DE LA DISTRIBUCIÓN ORIGINAL

A partir del apartado anterior se pueden obtener las características de esta

distribución utilizando las expresiones [ 7.1 l y[ 7.21 para logaritmo decimal:

x - ^ -}- 10a +'/^ 1-10 ^-' = 333,822745471, ^ --

^r'x= (10"^1• Io - 1) 143^`+^^^•IO = 118201,9224133

o-x = 340,88403074

8^. = 1,021152798501

3. Estimaci^ón mediante el uso de papel probabilistico

Según lo expuesto en la sección 8, puede procederse de dos formas:

Cl^ SUPUESTO ^Q DESCONOCIDO

Representando en papel probabilístico los puntos (ak, F^ = ni --{- n^ -}- n3 -}- ... + r^k)

con h = 1,11 se obtiene una curva del tipo de la figura 2 y+que se representa con

trazo discontinuo en el papel probabilístico (p. 23. Si éste hubiera sido el primer

contacto establecido con la distribución que nos ocupa habría llevado a suponerque era ajustable por una lognormal de tres par^,metros cuyfl tercer parámetro

sería negativo; en ese caso hubiese sido conveniente estimarlo conforme se hahecho . arriba. _

Page 18: Estudio de distribucion estadistica Log-Normal

22 BS T'A.t1I 9 TI CA BsPA ĤOL^A

tJ! SUPUESTO ^,3 DADl7

Admitimos que la distribuci^n ®n caso de ser lognormal tendrá parámetro

l3 --- 39,5003, Se han de representar en el papel probabilfstic© los puntos (ak - j3,

F,^) con h- 1,11; el resultado^ de alinear estos puntos es una recta (representada

con trazo continuo en la p. 23l ^ de la que se deduce de acuerdo a Ia sección 8 ai ;

a[ = 1+Q$' ^rJ = 2,454t345 y U. ^ 1 log 127^J _ U,325.Ŝ32v

2 285

con l^o que

cr^ = 0,1058412

La estimación de los parámetros de ia distribución original se reatiza como en

el apart^ado 2 b^ de esta sección.

4. R^e►sumen de las estima.ciones obtenidas

A continuación se expone un cuadro con los métodos empleados y 1©s valores

encantrados para cada parámetro:

METODO L?E ESTIMACION

Cuartilas ...........................................Momentos .. . ..... ... .. . ...... ... . . . . .... . .. . . . . . . ..Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Normal asociada ...............................Papel probabiifstico ...........................

_

2,46225rJ5S2,45444522, 4ó2038452, 44+D41fi692,454845

^

0,313120,3368

0, 33^8180, 32533

0, 098044130,11347423

0,1143699O,1 d58412

13. RE.LACICJN DE SIMBC}LQS EMPLEADUS

^ ^ Coefi-

DISTR,IBUCIQN Medie. Median^ Moda Varianz^ cientede va-

Momen-tos M, cent Cuant.

riación

De variable abser-vada x .............. ^ PYJ^, x a^^. z ^ á^ a^r, x ^, : hr^a. x

De hip^atética log-normal. .7r . . . . . . . .. .. oex }^e, x ,^d, x ^ ^x ^ r, s !u r. x ^r Js, ae

De hip^tética nor-1i381 ^7 ....... ..... .. ^ f ^. Y f'^d. iI ^^ S xr. L fr. Y ^rl^, 3r

Page 19: Estudio de distribucion estadistica Log-Normal

EXPOSICION GENER.AL E INDICACIONES PARA LI. USO DE LA DISTRIBUCION LUGNORMAL

EXFO^SICION GENERAL E INDICACIONES PARA EL USO DE LA DISTRIBUCION

LOGNORMAL

T s e ^

3

2 3 6 T 8 91►^ 9e, -

-_^. _.__ _--_ _ __ .

`_ _- _ _-^- - _^

, ^ . ,

_ _ _ _ ^^

__..^

_ _

^s

>is

sa _ _. _ ---- __^. _ ______ ___ _______- -___^_ ______ _____ _--^ --__,. ._-9T

>i 6

93

!0

R -

so

TO

s0 -

50

40

30

20

^ ^ _ ^ _ ___ ____.-_ _ _._ _ __--_. _._ _._ ^ __

f0

S4

_

3

0'2 - - -- _ . _ ^ _^- - - - _ ^ ^. . .._ - - - _^. .^ _.. ^ ^ ..._ ^

1

^^, a .__

^D 1

_ .,_._ ^ ._.. _. .._ _ ^ ___ _ ._._ __ _ _ _... _ _. _. ____ .^ . _ ^ ._._ ._,

a a T s e i z 3 4 a e T e e 1,

:

2

2

3

Page 20: Estudio de distribucion estadistica Log-Normal

2^ FSTADISTICA EsPA2+F4LA

^ 4. BIBLIt7GRAFIA

AGT"ERHERG, F. P. (19?4} : Geom^ath,ematics ( Elsevier) ,

Ai^^soN, J., y BROwrr, J. (1957}: T'he Lo^gncw-mal Distributi+c^n (Cambridge UniversityPress).

CAiAT, G. (1974} : C u rso de es tad ís tica desarip t ivp. i Faraninfo ).

CRA^x, H. (1g48}: Mathematiaai Method's of Statisti^cs. (Traducción española en ^d.Aguflar.}

Frxx^, D. J. t 1941) :•^On the distribution of a variable whose logarithm is no^r^mallydistributed-. Journal Roy. Stat. So^c., vol. 17, núm. 2, p. 155.

KENDALL, M. ..C^^. (1943 y ss.): The Advrxnced Theory of Sta^tistics (Griffinl.

Kocx, G., y Lrxx, R. F. (19741: Statistical Analysis of G^alragicat I^ata (J. Wiley).