Clase n--ª3 Estadistica E.Gonzalez 2009

download Clase n--ª3 Estadistica E.Gonzalez 2009

of 80

Transcript of Clase n--ª3 Estadistica E.Gonzalez 2009

ESTADISTICA APLICADA A LA HIDROLOGIALos procesos hidrolgicos evolucionan en el espacio y en el tiempo en una forma que son parcialmente:

Pr edecibles Deter min sti cos

Pr ocesos estocsti cos y parcialmente aleatorios

En hidrologa en la mayora de los casos la variabilidad aleatoria de los procesos es considerable en comparacin con la determinstica, por lo que pueden considerarse como puramente aleatoreas, o sea, que estn regidos por las leyes del azar Por lo tanto el tratamiento de este azar. tipo de procesos, se pueden aplicar tcnicas de probabilidad y estadstica.

Desde el momento en que se aplica la estadstica a la hidrologa pasa hidrologa, a segundo plano el problema de conocer las leyes que rigen los fenmenos hidrolgicos, estudiando slo los datos numricos o estadsticos de este fenmeno. El estudio estadstico de los datos hidrolgico tiene dos niveles: Primer nivel: Conocimiento del fenmeno, distribuciones, medias, desviaciones tpicas, etc. Segundo Nivel: Inferencia estadstica, es decir, el anlisis de la naturaleza de la muestra que permite conocer datos esenciales. A partir de esta fase, se pueden inferir sucesos del futuro con datos conocidos.

Sucesos aleatorioSon sucesos aleatorios aquellos que estn regidos por el azar. A este concepto se opone el de suceso determinstico. Se dice suceso determinstico si al ser repetido en la misma situacin el resultado siempre es el mismo. Por otra parte, un suceso es aleatorio (o estocstico) si repetido en anlogas condiciones el resultado es distinto. Espacio muestral (E) Conjunto de todos los resultados (sucesos) posibles del experimento. Evento (suceso) Es un subconjunto del espacio muestral (E)

Discretos Experimentos aleatorios Continuos

Por ejemplo 1.- Lanzar un dado {1 6} (discreto) 2.- Intensidad de lluvia o caudal ( 30 mm/h, 420 m3/s) (continuo) Los sucesos pueden ser: Suceso elemental Suceso compuesto cierto o seguro i t imposible : uno : dos o ms : siempre se realiza i li : nunca se realiza

Algebra de eventos ( o sucesos) AUB=BUA [AU B ]U C =AU [B U C ] AU [BC]=[AUB][AUC] (A) = A [ A B ] = A U B A A = AUU=A AU=A A=

Definicin de probabilidadProbabilidad se ha definido empricamente como el nmero de casos favorables de un suceso sobre el nmero de casos posibles.

Pr ( X ) =

Nmero de casos favorables al suceso x = ; Nmero de casos posibles nPr(X) = Probabilidad del evento x = nmero de ocurrencias de X n = nmero t t l d eventos registrados total de t i t d

lim n

donde:

Axioma de probabilidad 1.- Para t d suceso A P(A) 0 1 P todo 2.- La probabilidad del suceso cierto E es uno. P(E) = 1 3.- Probabilidad de dos sucesos incompatibles A y B AB = P(AUB) = P(A) + P(B) ( U ) ( ) ( ) A P( A B) P = P ( A) B

Propiedades de Probabilidad Los eventos hidrolgicos se pueden asumir como discretos pero a menudo son discretos, variables continuas. Las propiedades de probabilidad de distribucin son anlogas para funciones discretas, Pr(x), y continuas, f(x), esto es:f ( x) 0

Pr ( x) o

Para todo x

Pr ( x) = 1 o

+

f ( x) = 1

La suma de las probabilidades est referida a la funcin de distribucin acumulativa y puede ser escrita como: F ( x) = P ( X x) = P ( z ) 1.- Tipo menor que:r z x r

2.- Tipo mayor que: (excedencia)

F ( x) = Pr ( X x) = f ( z )dzx

G ( x) = Pr ( X x) = 1 Pr ( z ) = 1 F ( x)

3. Si 3 -Si p(A) es la probabilidad del suceso A la probabilidad del suceso contrario es: A, P(A) = 1 P(A) 4.-Si un suceso A est contenido en otro suceso B, se tiene: AB P(A) P(B) G( x) = Pr ( X x) = f ( z )d dzx

5.-La probabilidad de cualquier suceso es igual o menor que la unidad P(A) 1 6.-La probabilidad de unin de dos sucesos P(AUB) = P(A) + P(B) P(AB) Ejemplo Sea Tirar una moneda dos veces. A = { al menos sale 1 cara } B = { sale cara dos veces }

Perodo de Retorno (T) y Riesgo de fallaEn hidrologa es habitual el uso del valor inverso de la probabilidad. Este valor se denomina Perodo de Retorno y se define como:

1 T= p( x)

(Unidad de tiempo, 5, 10, 20, 100 aos)

Por ejemplo: Si un evento se presente (en trmino medio) cada 10 aos, su probabilidad es de 0,10 0 10 (10%) Por otra parte, si la probabilidad de que algo suceda es de 0,04 (4%), esto quiere decir que, en promedio, suceder 4 veces en 100 aos, o sea, una vez cada 25 aos. Por lo tanto, podemos decir que T, es el intervalo de tiempo promedio dentro del cual la magnitud de un evento es excedida o igualada una vez.

Analizar un caudal de 50,000 cfs

De las series de tiempo se aprecia que el caudal 50 000 es excedido 8 veces 50,000 durante el registro, con intervalos que varan de 1 a 16. Luego el Perodo de Retorno T es aprox. 41/8 = 5.1 aos.

Pero cuidado, lo anterior no puede llevar a falsas conclusiones: un suceso con T = 20 aos tiene una probabilidad de 1/20=0 05 lo que quiere decir que en aos, 1/20=0,05, trmino medio deber suceder cada 20 aos, pero no quiere decir que la probabilidad que se presente en los prximos 20 aos sea 100%. La probabilidad que esto suceda en los prximos 20 aos es 64% (Ver *) Si un evento hidrolgico igual o superior a X ocurre una vez en T aos, tenemos: P(X x) = 1 /T P(X x) = 1 - 1/T Probabilidad de excedencia Probabilidad de no excedencia

Ejemplo Si decimos que el caudal de un ro para un perodo de retorno de 500 aos es de 350 m3/s, significa que la probabilidad de que el caudal mximo real del ro este ao sea superior a ese valor es de 1/500 o 0 2 % valor, 0,2 %.

La probabilidad p p puede calcularse segn: g La probabilidad que este ao se supere el caudal est dada por P = 1/T y la probabilidad de que no se supere P = 1 - (1/T) La probabilidad de que en n aos consecutivos el actual no sea superado ser: P = [ 1 (1/T) ]n ( / ) La probabilidad de que en los n aos sucesivos sea superado ser: P = 1 [ 1 (1/T)]n

Para n y T muy grandes: P = 1 1/e 0,632 Por otra parte el valor: R = 1 [ 1 (1/T)]n

Se denomina Ri S d i Riesgo y representa l probabilidad d que un valor sea superado t la b bilid d de l d al menos una vez en una serie de n aos consecutivos. Si n representa la expectativa de vida til de una obra, R representa el riesgo de una variable sea sob epasada e sobrepasada en este tiempo. t e poRiesgo en %1 2 5 10 25 50 75

5498 248 98 48 18 8 4

vida til del proyecto (en aos) 10 25 50996 496 195 95 35 15 7 2488 1238 488 238 87 37 18 4975 2475 976 475 174 72 36

1009953 1950 1949 950 348 145 73

Funciones de probabilidadEl comportamiento de las variables aleatorias discretas o continuas se describe con la ayuda de Distribuciones de Probabilidad. La variable se designa por mayscula y un valor especfico de ella por minscula minscula. Por P(x = a) se denota la probabilidad de que un evento asuma el valor a; similarmente P(a x b) denota la probabilidad de que un evento se encuentre en el intervalo (a,b). Si conocemos la probabilidad P(a x b) para todos los valores de a y b, se dice que conocemos la Distribucin de Probabilidades de la variable x x. Si x es un nmero dado y consideramos la probabilidad P(X x): F(x)= P(X x): y llamamos F(x) la funcin de distribucin acumulada.

Si se tiene una variable aleatoria continua, en la Tabla se presenta el histograma de 85 aos de registro de caudales de crecida (mximos instantneos), agrupados en 9 intervalos de clase.x 1 2 3 4 5 6 7 8 9 Total P(x) 0.05 0.10 0.15 0 15 0.20 0.10 0.10 0.15 0.10 0.05 1.00 F(x) 0.05 0.15 0.30 0 30 0.50 0.60 0.70 0.85 0.95 1.00

Cuando el nmero de observaciones se incrementa, el tamao de los intervalos decrece y se puede tener algo s:

donde f(x) es la llamada funcin de densidad de probabilidades y tiene las siguientes caractersticas:

f (x) = 1x

P ( a x b) = f ( x )a

b

F ( x) =

f ( x)b

f ( x )) = 0b

b

P ( a x b) = P ( x b) P ( x a ) =

f ( x) f ( x) = F (b) F (a)

a

Lo que implica que las probabilidades se definen slo como REAS bajo la funcin de densidad de probabilidad (FDP) entre lmites finitos.

MOMENTOS DE LAS DISTRIBUCIONES Las propiedades de las distribuciones pueden ser definidas completamente en trminos de los momentos. Los momentos en estadstica son similares a los momentos en fsica (rotacin respecto al origen) para la variable continua para la variable discreta o respecto a la media (eje de rotacin diferente al origen) para la variable continua

para la variable discreta

PARMETROS ESTADSTICOS Los parmetros estadsticos extraen informacin de una muestra, indicando las caractersticas de la poblacin. Los principales parmetros estadsticos son los momentos de primer, segundo y tercer orden correspondiente a la media, varianza, y asimetra respectivamente respectivamente. Media : Es el valor esperado de la variable misma. Primer momento respecto al origen Muestra la tendencia central de la distribucin origen.

el valor estimado de la media a partir de la muestra es

Varianza : V i Mide la variabilidad de los datos. Es el segundo momento respecto a la media.

el valor estimado de la varianza a partir de la muestra es

en el cual el divisor es n-1 en lugar de n, para asegurar que la estadstica de la muestra no sea sesgada, es decir, que no tenga una tendencia, en promedio, a ser mayor o menor que el valor verdadero. L unidades d l di l l d d Las id d de la varianza son la media al cuadrado, la desviacin estndar es una medida de la variabilidad que tiene las mismas dimensiones que la media y simplemente es la raz cuadrada de la varianza, se estima por s. p , p

El significado de la desviacin estndar se ilustra en la siguiente figura

Efectos de la funcin de densidad de probabilidad causados por cambios en la desviacin estndar Coeficiente de variacin es una medida adimensional de la variabilidad. Se estima como:

Coeficiente de asimetra La distribucin de los valores de una distribucin alrededor de la media se mide por la asimetra. Se obtiene a partir del tercer momento alrededor de la media, dividindolo por el cubo de la desviacin estndar p p para q sea adimensional. que tercer momento respecto a la media

El valor del coeficiente de asimetra est dado por

Funciones de Distribucin de Probabilidad usadas en HidrolgicasSe presenta un resumen de las funciones de distribucin de probabilidad comunmente usada en Hidrologa Modelos discretos a).- Distribucin Binomial La distribucin desarrollada por J. Bernoulli y el binomial proviene debido a que solo tiene dos posibles resultados, xito o fracaso. Su funcin de probabilidad queda definida por:n Pr ( x) = p x (1 p) n x x n n! = x x!(n x)!

para x = 0,1,......., n

Donde p es la probabilidad de un valor, usualmente 0 p 1

n : nmero de intentos X : nmero de sucesos

b).- Distribucin de Poisson Una variable aleatoria X tiene una distribucin de Poisson si su funcin de probabilidad est dada por:

Pr =Donde

x e x!

para x = 0,1,2,....

es un nmero real positivo, equivalente al nmero esperado de ocurrencias durante un intervalo dado y x es el nmero de ocurrencias del evento.

Modelos Continuos Distribucin Normal (Gauss) Es una distribucin continua y simtrica (campana de Gauss) que describe la ley natural de errores. Se caracteriza por la media y la desviacin estandar , siendo la funcin de densidad:( x )2 2 2

1 f ( x) = e 2

para

x

Y su funcin de distribucin acumulada:

F ( x) =

f ( x)dx

Esta funcin no es integrable analticamente, pero se encuentra tabulada.

Realizando la transformacin: Tenemos:

z=

x

Z: se denomina variable estandarizada

f ( x) =

1 e 2

z2 2

y su funcin de distribucin:

F ( x) =

1 2

e

x

z2 2

du

Hay distintas expresiones analticas para calcular en forma aproximada la variable z. A partir de z Con

Fz ( z ) = 1 0.5(1 + C1 z + C2 z 2 + C3 z 3 + C4 z 4 ) 4C1=0 196854 0.196854 C3=0.000344 C2=0 115194 0.115194 C4=0.019527

A partir de F(z) Para F(z)> 0.5 Con

C0 + C1t + C2t 2 z = 1 1 + d1t + d 2t 2 + d3t 3C1=0.802853 d2=0.189269

t = ln

1 (1 F ( z ))2

C0=2.515517 d1=1.432788

C2=0.010328 d3=0.001308

La estimacin de los parmetros de la muestra y respectivamente est dada por :

z=

x

EJEMPLO Para la serie de datos de caudal mximo tabulada: a).-Cul a) Cul es la probabilidad de que en un ao cualquiera el caudal sea que, cualquiera, mayor o igual a 7 500 m3/s? b).- Se planea construir cerca de este sitio un borde de proteccin contra inundaciones. Cul debe ser el caudal de diseo si se desea que el Periodo de retorno sea de 60 aos? Los datos siguen una distribucin normal con x=3886 m3/s y S= 1825 9 normal, 1825.9 m3/sAo CaudalMax(m3/s) Ao CaudalMax(m3/s) Ao CaudalMax(m3/s) 1954 2230 1964 2489 1974 5565 1955 3220 1965 2350 1975 3130 1956 2246 1966 3706 1976 2414 1957 1804 1967 2675 1977 1796 1958 2737 1968 6267 1978 7430 1959 2070 1969 5971 1960 3682 1970 4744 1961 4240 1971 60000 1962 2367 1972 4060 1963 7061 1973 6900

Distribucin logartmica normal Para la funcin de densidad de la distribucin normal se realiza el cambio y = ln x, tenemos:( y y ) 2

f ( y) =

1

y 2

e

2 2 y

donde la d d l media y d di desviacin estandar d l i i t d de los l logaritmos d l it de las variables aleatorias son y y y respectivamente. Esta no es una funcin simtrica. Para este caso el valor de la variable estandarizada est dado por: p

z=

ln x y

y

Distribucin Pearson tipo III o Gamma de tres parmetros La funcin Gamma tiene la siguiente funcin de densidad

x 1 1 f ( x) = 1( 1 ) 1 Donde

1 1

x 1

e

1

x = 11 + 1

S = 12 2 1

=

2

1

( xi x) 3 / n = S3 i =1n

La funcin de distribucin de probabilidad es:

x 1 1 F ( x) = 1( 1 ) 1 0x

1 1

x 1

e

1

dx

Sustituyendo

x 1 y= 1

1 F ( y) = y 1 1e y dy ( 1 ) 0

y

Distribucin Gumbel La distribucin Gumbel tipo I se utiliza para valores extremos de caudales y precipitaciones y tiene la siguiente funcin de distribucin:

F ( x) = e

e ( x )

Los parmetros se estiman como:

Y para muestras pequeas

1.2825 = S

=

yS

= x 0.45SPara muestras muy grandes

= x

uy

=

yS

= x

uy

Distribucin Log - Pearson Tipo III Si log(Xi) sigue una distribucin Pearson Tipo III, entonces se dice que Xi sigue una distribucin de Log Pearson Tipo III. Aplicacin: 1 1 Transformar los datos originales yi = log(xi) 2 Determinar la media de los Logaritmos 3 Calcular l D C l l la Desviacin E t d d l L i i Estndar de los Logaritmos, Sy it 4 Determinar el Coeficiente de Asimetra o Oblicuidad Cs 5 5 De tablas se obtiene KT 6 Calcular yT= + Sy KT 7 Calcular xT=10^(yT)

Seleccin de la Mejor Funcin de Distribucin. Existen dos mtodos por los cuales es posible seleccionar la mejor distribucin de ajuste: a) Anlisis Grafico. b) Mtodo del Error cuadrtico Mnimo.

Anlisis Grafico Este mtodo consiste simplemente en inspeccionar una grfica donde se haya dibujado cada una de las diferentes funciones junto con los puntos medidos La funcin de medidos. distribucin que seleccione ser la que mejor se ajuste visualmente a los datos medidos.

Por Ejemplo: Para una serie de datos

Mtodo de los Mnimos Cuadrticos Este error es menos subjetivo que el anterior, y consiste en calcular para cada funcin el error cuadrtico para cada funcin de distribucin

Donde

es el i-simo dato estimado y

es el i-simo dato calculado con la funcin de distribucin bajo anlisis. Para el ejemplo Anterior tenemos la siguiente grafica:

En la siguiente tabla se muestran los resultados del ejemplo anterior, y adems se entregan los errores mnimos cuadrticos.

Mejor j aproximacin Pearson III

ANALISIS DE FRECUENCIAEl anlisis de frecuencia es una herramienta utilizada para, predecir el comportamiento futuro de eventos extremos en un sitio de inters, a partir de la informacin histrica. Es un mtodo basado en procedimientos estadsticos que permite calcular la magnitud del evento extremo un perodo de retorno asociado. El clculo d magnitudes d eventos extremos por l l l de i d de los mtodos ya vistos, d i requiere que la funcin de probabilidad sea invertible. No obstante algunas funciones no son fcilmente y se requiere un mtodo alternativo para el clculo de sus magnitudes. Para determinar la magnitud de eventos extremos cuando la distribucin de probabilidades no es una funcin fcilmente invertibles se requiere conocer la variacin d l variable respecto a l media. Ch i i de la i bl t la di Chow en 1951 propuso d t determinar i esta variacin a partir de un factor de frecuencia KT que puede ser expresado:

y se puede estimar a partir de los datos

Para una distribucin dada, puede determinarse una relacin entre KT y el perodo de retorno Tr. Esta relacin puede expresar en trminos matemticos o por medio del uso de una tabla. El anlisis de frecuencia consiste en determinar los parmetros de las distribuciones de probabilidad y determinar con el factor de frecuencia la magnitud del evento para un perodo de retorno dado

Anlisis de Frecuencia para Funciones ContinuasDISTRIBUCION NORMAL

Factor de frecuencia

este factor es el mismo de la variable normal estndar

Limites de confianza:

donde es el nivel de probabilidad

es el cuantl de la distribucin normal estandarizada para una probabilidad acumulada de 1- y Se es el error estandar

DISTRIBUCIN LOGNORMAL DE DOS PARMETROS Funcin de densidad:

Estimacin de parmetros:

Factor de frecuencia:Puede trabajarse en el campo original y en el campo transformado. Campo transformado: Si se trabaja en el campo transformado se trabaja con la media y la desviacin estndar de los logaritmos, as:

Ln(XTr) = xTr+KSy (de donde,

XTr = eln (xTr)con K con variable normal estandarizada para el Tr dado, xy media de los p , logaritmos y Sy es la desviacin estndar de los logaritmos.

Campo original: Si se trabaja con los X sin transformar el K se calcula como

K es la variable normal estandarizada para el Tr dado , es el coeficiente de variacin, x media de los datos originales y s desviacin estndar de los datos originales. Limites de confianza: En el campo transformado.

en d d n numero d d t donde, de datos, S error estndar, KT variable normal Se t d i bl l estandarizada

DISTRIBUCION GUMBEL O EXTREMA TIPO IUna familia importante de distribuciones usadas en el anlisis de frecuencia hidrolgico es la distribucin general de valores extremos, la cual ha sido ampliamente utilizada para representar el comportamiento de crecientes y p p p p sequas (mximos y mnimos).

Funcin de densidad:

En donde y son los parmetros de la distribucin.

Estimacin de parmetros pdonde son la media y la desviacin estndar estimadas con la muestra. Factor de frecuencia:

Donde Tr es el periodo de retorno. Para la distribucin Gumbel se tiene que el caudal para un perodo de retorno de 2.33 aos es igual a la media de los caudales mximos.

Limites de confianza

Xt t(1-) Se

KT es el factor de frecuencia y t(1 ) es la variable normal (1-) estandarizada para una probabilidad de no excedencia de 1-.

DISTRIBUCION GAMMA DE TRES PARMETROS O PEARSON TIPO 3Esta distribucin ha sido una de las mas utilizadas en hidrologa. Como la mayora de las variables hidrolgicas son sesgadas la funcin Gamma se utiliza sesgadas, para ajustar la distribucin de frecuencia de variables tales como crecientes mximas anuales, Caudales mnimos, Volmenes de flujo anuales y estacionales, valores de precipitaciones extremas y volmenes de lluvia de corta duracin. La funcin de distribucin Gamma tiene dos o tres parmetros.

Funcin de densidaddonde, x0 x < para > 0 < x x0 para < 0

y son los parmetros de escala y forma, respectivamente , y x0 es el parmetro de localizacin localizacin.

Estimacin de parmetros

Cs es el coeficiente de asimetra asimetra, Estndar de la muestra respectivamente. Factor de frecuencia:

son la media y la desviacin

donde z es la variable normal estandarizada Este valor de K se encuentra tabulado de acuerdo al valor de Cs calculado con la muestra.

Intervalos de confianza:Xt t(1-) Se

Donde S es la desviacin estndar de la muestra, n es el nmero de datos y se encuentra tabulado en funcin de Cs y Tr.

DISTRIBUCIN LOG GAMMA O LOGPEARSON DE 3 PARMETROS Esta distribucin es ampliamente usada en el mundo para el anlisis de frecuencia de Caudales mximos. Esta se trabaja igual que para la Pearson Tipo III pero con Xy y Sy como la media y desviacin estndar de los logaritmos de la d l variable original X i bl i i l X.

Funcin de densidad:donde, y0 y < para > 0 pa a y y0 para < 0

y son los parmetros de escala y forma respectivamente , y y0 es el forma, parmetro de localizacin.

Estimacin de parmetros: Cs es el coeficiente de asimetra, son la media y la desviacin estndar de los logaritmos de la muestra respectivamente. Factor de frecuencia:

donde z es la variable normal estandarizada Este valor de K se encuentra tabulado de acuerdo al valor de Cs calculado con la muestra.

Intervalos de confianza: Xt t(1 ) Se t(1-)

Donde Sy es la desviacin estndar de los logaritmos de la muestra, n es el nmero de datos y se encuentra tabulado en funcin de Cs y Tr.

Anlisis de Frecuencia Mtodo gficoPlotting P iti Pl tti Position

Se trabaja con la probabilidad de excedencia asignada a cada valor de la muestra. Para este caso se han propuesto numerosos mtodos empricos. Si n es el total de valores y m es el rango de un valor en una lista ordenada de mayor a menor (m=1 para el valor mximo) la probabilidad de excedencia se puede obtener por medio de las siguientes expresiones California Weibull Hazen3 (m ) 8 P= 1 N+ 4

Blom Gringorten

La expresin ms utilizada es la Weibull. Con las anteriores expresiones se halla lo que se conoce como la distribucin emprica de una muestra, esta luego se puede ajustar a una de las distribuciones tericas presentadas anteriormente anteriormente. Los resultados pueden ser dibujados en el papel de probabilidad; este es diseado para que los datos se ajusten a una lnea recta y se puedan p q j p comparar los datos muestrales con la distribucin terica (lnea recta).

Seleccin de modelos probabilsticos

Mtodo Grfico Modelo Mtodos Cuantitati vos

Mtodo Grfico Este mtodo consiste en comparaciones grficas entre el modelo y los datos, utilizando funcin de densidad de probabilidad o distribucin acumulada. Para este caso se utiliza papel de probabilidades y los resultados permiten p p p p vizualizar rpidamente el ajuste del modelo.

Prueba Chi Cuadrado Una medida de las discrepancia entre las frecuencias observadas (fo) y las frecuencias calculadas (fc) por medio de una distribucin terica esta dada por el estadstico

en donde

si el estadstico =0 significa que las distribuciones terica y emprica ajustan exactamente, mientras que si el estadstico >0, ellas difi j t t t i t i l t d ti >0 ll difieren. La distribucin del estadstico se puede asimilar a una distribucin Chicuadrado con ( (k-n-1) grados de libertad, donde k es el nmero de intervalos 1) y n es el nmero de los parmetros de la distribucin terica. La funcin se encuentra tabulada

Suponiendo que una hiptesis Ho es aceptar que una distribucin emprica se ajusta a una distribucin Normal. Si el valor calculado de por la ecuacin anterior es mayor que algn valor crtico de , con niveles de significancia de 0.05 y 0.01 (el nivel de confianza es 1-) se puede decir que las frecuencias observadas difieren significativamente de las frecuencias esperadas (o calculadas) y entonces la hiptesis Ho se rechaza, si ocurre lo contrario entonces se acepta.

Prueba Smirnov Kolmogorov El estadstico Smirnov Kolmogorov D considera la desviacin de la funcin de distribucin de probabilidades de la muestra P(x) de la funcin de p probabilidades terica, escogida Po(x) tal que g ( ) q

La prueba requiere que el valor Dn calculado con la expresin anterior sea menor que el valor tabulado Dn para un nivel de probabilidad requerido. requerido

Esta prueba es fcil de realizar y comprende las siguientes etapas:El estadstico Dn es la mxima diferencia entre la funcin de distribucin acumulada de la muestra y la funcin de distribucin acumulada terica escogida. Se fija el nivel de probabilidad , valores de 0.05 y 0.01 son los ms usuales. usuales El valor crtico D de la prueba debe ser obtenido de tablas en funcin de y n. Si el valor calculado Dn es mayor que el D, la distribucin escogida se debe rechazar.