Informe Gráfico P-p Plot

12
1 Diagrama P-P plot para una distribución Log-normal a partir de da DIAGRAMA P-PPLOT imm! D" Alme!da At#ncar $%I&'R(IDAD %A)IO%AL D' I%G'%I'R*A +acultad de Ingeniería Geológica Minera ! Metal#rgica 'scuela Pro,esional de Ingeniería de Minas Augusto Te es Ro.as" Ing"

description

p-p plot

Transcript of Informe Gráfico P-p Plot

11Diagrama P-P plot para una distribucin Log-normal a partir de datos empricos

DIAGRAMA P-PPLOTJimmy D. Almeyda AtncarUNIVERSIDAD NACIONAL DE INGENIERA

Facultad de Ingeniera Geolgica Minera y MetalrgicaEscuela Profesional de Ingeniera de MinasAugusto Teves Rojas. Ing.

TABLA DE CONTENIDO1.OBJETIVOS32.ALCANCES33.INTRODUCCIN34.FUNDAMENTO TEORICO35.PRIMER TRABAJO DEJADO POR EL PHD . MARN76.TABLAS Y FIGURAS76.1 Tablas de datos Tabla de datos de poblacin anormal76.2 Figuras histogramas y P-P plot87.SEGUNDO TRABAJO DEJADO POR EN PHD. MARN117.1Algoritmo del Variograma117.2Visualizacin del programa117.3Algoritmo del programa en VBA117.4Creacin de datos con el T.L.C iniciar el programa128.TABLAS Y FIGURAS138.1Tablas de datos generados138.2Figuras149.CONCLUSIONES1510.REFERENCIAS15

OBJETIVOS Analizar la grfica p-p plot de los Ln de los datos dejador por el PHD Marn. Analizar la grfica p-p plot de los Ln de los datos con un incremento de datos anormales. Tener capacidad para comprender porque se produce cambios es la grfica p-p plot. Crear un algoritmo para generar datos con distribucin de gauss usando el Teorema del Limite Central.

INTRODUCCINLa necesidad de acudir a herramientas estadsticas para el anlisis de datos en todas las reas del conocimiento, ha hecho que aparezcan con el correr de los aos nuevas metodologas que, no obstante se centran en fundamentos probabilsticos comunes, son especficas para cada una de las diversas disciplinas del saber. Algunos ejemplos son, entre otros, la econometra, psicometra o la bioestadstica. La gran relevancia que tiene actualmente a nivel mundial el tema ambiental ha hecho que los profesionales en estadstica encaminen esfuerzos en el desarrollo de nuevas tcnicas apropiadas para el anlisis de informacin enmarcada dentro de este contexto. Como consecuencia de este impulso surgi la geoestadstica, teniendo como padre a George Matheron.

FUNDAMENTO TEORICOPROBABILIDAD-PROBABILIDAD (PP) TERRENOUna probabilidad-probabilidad (PP) parcela se utiliza para ver si un determinado conjunto de datos sigue alguna distribucin especificada. Debe ser aproximadamente lineal si la distribucin especificada es el modelo correcto.

La probabilidad-probabilidad (PP) trama se construye utilizando la funcin de distribucin acumulada terica, F (x), del modelo especificado. Los valores de la muestra de datos, en orden de menor a mayor x, se denotan X (1), X (2),..., X (n). Para i = 1, 2,....., n, F (x (i)) se representa frente a (i-0.5) / n.EjemploEn la figura de abajo, dos conjuntos de datos se han visualizado en grficos de probabilidad normal. El primer conjunto de datos (que se muestra en negro) realmente proviene de una distribucin normal, por lo que la trama PP es lineal. El segundo conjunto de datos (que se muestra en rojo) proviene de una distribucin exponencial, por lo que no es ni siquiera cerca de simetra, y la trama del PP se desva de una lnea recta. El uso de estas parcelas, queremos inferir correctamente que el primer conjunto de datos es normal, pero la segunda no lo es.

HISTOGRAMAEn estadstica, un histograma es una representacin grfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados. Sirven para obtener una "primera vista" general, o panorama, de la distribucin de la poblacin, o la muestra, respecto a una caracterstica, cuantitativa y continua, de la misma y que es de inters para el observador (como la longitud o la masa). De esta manera ofrece una visin en grupo permitiendo observar una preferencia, o tendencia, por parte de la muestra o poblacin por ubicarse hacia una determinada regin de valores dentro del espectro de valores posibles (sean infinitos o no) que pueda adquirir la caracterstica. As pues, podemos evidenciar comportamientos, observar el grado de homogeneidad, acuerdo o concisin entre los valores de todas las partes que componen la poblacin o la muestra, o, en contraposicin, poder observar el grado de variabilidad, y por ende, la dispersin de todos los valores que toman las partes, ..En el eje vertical se representan las frecuencias, es decir, la cantidad de poblacin o la muestra, segn sea el caso, que se ubica en un determinado valor o subrango de valores de la caracterstica conocido como intervalo de clase. En el eje horizontal se representa el espectro de valores posibles que toma la caracterstica de inters, evidentemente, cuando ste espectro de valores es infinito o muy grande el mismo es reducido a slo una parte que muestre la tendencia o comportamiento de la poblacin, en otras ocasiones ste espectro es extendido para mostrar el alejamiento o ubicacin de la poblacin o la muestra analizada respecto de un valor de inters.

TEOREMA DEL LIMITE CENTRALEl teorema del lmite central o teorema central del lmite indica que, en condiciones muy generales, si Sn es la suma de n variables aleatorias independientes y de varianza no nula pero finita, entonces la funcin de distribucin de Sn se aproxima bien a una distribucin normal (tambin llamada distribucin gaussiana, curva de Gauss o campana de Gauss). As pues, el teorema asegura que esto ocurre cuando la suma de estas variables aleatorias e independientes es lo suficientemente grande.Sealafuncin de densidadde ladistribucin normaldefinida como:

Con unamediay unavarianza2. El caso en el que su funcin de densidad sea, a la distribucin se le conoce comonormal estndar. Se defineSncomo la suma denvariables aleatorias, independientes, distribuidas, y con una mediay varianza2finitas (20):

De manera que, la media deSnesny lavarianzan2, dado que son variables aleatorias independientes. Con tal de hacer ms fcil la comprensin del teorema y su posterior uso, se hace una estandarizacin deSncomo:

Para que la media de la nueva variable sea igual a 0 y ladesviacin estndarsea igual a 1. As, las variablesZnconvergern en distribucina la distribucin normal estndarN(0,1), cuandontienda ainfinito. Como consecuencia, si (z) es lafuncin de distribucinde N(0,1), para cadanmero realz:

Donde Pr () indicaprobabilidady lim se refiere allmite matemtico.

DIAGRAMA P-P PLOT PARA UNA DISTRIBUCIN LOG- NORMALAgregar datos al archivo una poblacin anormal y ver la media y desviacin tpica hacer el P-P plot.Tabla de datos de poblacin anormal#DatosLn(datos)

11.9080.64605557

20.7630.27049725

30.760.27443685

40.9040.10092592

52.991.09527339

60.490.71334989

70.6890.37251401

81.5870.46184544

92.3930.87254781

100.8730.13581972

111.8810.63180355

120.9670.03355678

131.1030.09803374

142.0840.73428912

19650.7420.29840604

19660.908-0.0965109

19672.0480.71686371

19681.5110.41277168

19693.0331.10955223

19701.1220.11511281

19710.6130.48939034

19720.950.05129329

19731.4430.36672428

19741.1590.14755756

19751.4120.34500714

19761.1460.13627762

19770.8640.14618251

19782.6510.97493693

6.2 Figuras histogramas y P-P plotHISTOGRAMA DE DATOS

HISTOGRAMA DE LN(DATOS)

P-P PLOT DE LN DE DATOS

CONCLUSIONES El p-p plot sirve para identificar la funcin ms adecuada para representar los datos. El p-p plot ayuda a identificar posibles anomalas en el muestreo al variar la recta. El Teorema del Limite central nos ayuda a simular datos con una media y desviacin estndar dados. El teorema del lmite central nos da como resultado una funcin de gauss

REFERENCIASClases de Informtica por Ing. Chvez, Adolfo Clases del PhD. Alfredo Marn SuarezClases realizadas por el Ing. Tves.http://www.stats.gla.ac.uk/glossary/?q=node/392http://es.wikipedia.org/wiki/Teorema_del_l%C3%ADmite_central