Tratamiento estadistico

66
7/21/2019 Tratamiento estadistico http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 1/66 PG8: TRATAMIENTO ESTADISTICO DE DATOS GEOQUÍMICOS Preparado: Miguel Calcina B. Fuente: Levinson, Keith Kenyon, Landin, Howart.

description

tratamiento estadistico aplicado en la prospeccion geoqumica

Transcript of Tratamiento estadistico

Page 1: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 1/66

PG8: TRATAMIENTO ESTADISTICODE DATOS GEOQUÍMICOS

Preparado: Miguel Calcina B. Fuente: Levinson, Keith Kenyon, Landin,

Howart.

Page 2: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 2/66

Page 3: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 3/66

Este proceso es enormemente facilitado siel conjunto de datos son primeramentedesagregados en sus grupos de

componente naturales. Las computadoraspersonales actualmente son económicas ylos paquetes de software son disponibles(por ejemplo., Estadística, Surfer, ARC

GIS, Map Info) permiten que a esto seallevado rápidamente y eficientemente(Lloyd, 1998).

Page 4: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 4/66

SOFTWARE ESTADISTICA

 – Excel, Minitab, SPSS – Distribución de datos bien organizado – Base de datos de gran capacidad

SAS – PROGRAMABLE y MUY POTENTE

MAPEO  ARC VIEW, ARC MAP, ARC GIS MAP INFO GEOSOFT, OASIS, MONTAGE

 – Con aplicaciones de estadistica

Page 5: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 5/66

 ANALISIS ESTADISTICO La aplicación efectiva de procedimiento estadístico

a los datos geoquímicos es dependiente sobre elprograma correcto, y propone la aplicaciónapropiada del muestreo y las fases analíticas.

El tratamiento estadístico avanzado de un conjuntode datos podría ser un ejercicio insulso cuando larepresentatividad y calidad es inadecuado. Sinembargo, con tal de que sus limitaciones se aprecien

totalmente, las técnicas estadísticas constituyenherramientas útiles y a menudo poderosas para elanálisis de datos geoquímicos

Page 6: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 6/66

Desafortunadamente, los procedimientosestadísticos son aplicados de una maneraindistinta sin entender los principios subyacenteso de la conducta de los elementos de interésdentro del ambiente geológico y geoquímico.Como lo nombrado por Sinclair, (1987) “intentar

llevar a cabo una evaluación ciega de datossometiéndolo a cualquier número creciente depaquetes de software y esperar que unacomputadora haga nuestro pensamiento para

nosotros está patentemente equivocado.... " . Losmodelos estadísticos siempre deben reflejarrealidades geológicas y geoquímicas.

Page 7: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 7/66

 Análisis Estadístico Univariante

Gran parte de la estadística aplicada tieneque ver con la organización, presentacióny resumen de los datos. La primera fase

de la interpretación geoquímica consisteen condensar grandes cantidades de datosnuméricos y extraer de ellos lainformación esencial.

Page 8: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 8/66

Por lo tanto, desagregar la población de datos

es a menudo esencial antes e incluso de losprocedimientos estadísticos simples seanaplicados. Métodos de conseguir esta inclusión: – Identificación y separación del componente

poblacional relacionado para diferentes tipos de roca,

ambientes geoquímicos, etc; – Retirar outliers (valores extremadamente altos o

bajos distintos de las poblaciones principales). Estopuede ser conseguido usando uno de los métodosgráficos simples descritos en la siguiente sección.

Page 9: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 9/66

Parámetros Estadísticos

 Algunos parámetros usados comúnmenteque describen la tendencia central, yayudan a definir poblaciones geoquímicasincluyen:

Media aritmética (X) = X1, X2, X3…. Xn

Page 10: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 10/66

Media Geométrica Y= x1, x2, x3… xn

Mediana = valor central n valores que divide en dosgrupos de = n

Si med y prom. Arit/Geom = entonces ladistribución es Normal/Log-normal.

Moda conj X1,X2,X3…xn , es el que ocurre conmayor frecuencia

 Vmax, Vmin .

“La Media geométrica es un estadígrafo que no se dejainfluenciar mucho por los altos o bajos erráticos, por lo tanto

es mucho más representativo de la población examinada”

Page 11: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 11/66

Medidas de dispersion: – Rango, x1,x2,x3…xn = Vmax –Vmin –  Varianza (S2) x1,x2,x3…xn = – Desviación Estandar squard S2

 – Percentiles (P10/P90, P50) – Cuartiles (Q25,Q75) =Q75-Q25, sirverelieve geoquímico

 – Coef. Variación= Construir relaciones bivariantes

(Correlaciones).

Histogramas

100 x

scv

¿Porqué usar “n-1” y no “ n”?

Bien la respuesta es algo complicada, pero en general si su grupo dedatos es una muestra del universo, entonces Ud. Están tomando un sub

grupo del mundo real, entonces debe utilizar “n-1” 

C.V = “Es más homogénea o presentamenos discrepancia aquella distribuciónque tiene el menor coeficiente devariación” 

Page 12: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 12/66

MEDIANAEs el valor de la variable que divide el total de las “n” observacionesdebidamente ordenadas en dos parte de igual tamaño. Esto significa que auno o al otro lado de este valor mediano se encuentra no más del 50% deltotal de las observaciones.

2 CASOS:

• IMPARES.- La mediana es igual al valor del término central.

4, 1, 4, 8, 5, 6, 9 n = 7

1, 4, 4, 5, 6, 8, 9 n + 1 /2 = 4

• PARES.- La mediana es igual al promedio de los dos valores del centro

323, 425, 428, 432, 440, 445, 500, 510n + 1 /2 = 4.5

432 + 440 /2 = 436.

Page 13: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 13/66

MODA

Es simplemente el valor más frecuente de una variable.• 2, 2, 5, 7, 9, 9, 9, 10, 10, 11, 13 -------- 9

• 3, 5, 8, 10, 12, 16, 18 ----- no hay

• 2, 3, 4, 4 , 4, 5, 5, 7, 7, 7, 9 ------- 4 y 7

Datos agrupados:

# personas por familia # de familias

 Y 1 = 2 N1 = 16

 Y 2 = 3 N2 = 24

 Y 3 = 4 N3 = 52

 Y 4 = 5 N4 = 76 Y 5 = 6 N5 = 40

 Y 6 = 7 N6 = 12

Page 14: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 14/66

LA VARIANZA

(es una alternativa para medir la dispersión)Con la perspectiva de construir un indicador que dimensione ladesviación o distancia promedio de los Xi respecto a su media, sepropuso elevar al cuadrado su desviación, a fin de que no sea siemprenegativa.

Si los valores están muy concentrados las desviaciones respecto a lamedia serán muy pequeños y en consecuencia también sus cuadrados,se evita que las desviaciones positivas se compensen con las negativas

 “PERO DESDE ESTE PUNTO DE VISTA, LA VARIANZA TIENDE AEXAGERAR LOS VERDADEROS VALORES RESPECTO A LAMEDIA” 

 “BAJO ESTA ALTERNATIVA PARA MEDIR LA DISPERSIÓN YQUE AMORTIGUE DICHO EFECTO ES LA DESVIACIÓNESTÁNDAR” 

1

2

 

n

 x x Varianza

Page 15: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 15/66

DESVIACIÓN ESTÁNDAR

La desviación estándar o típica se definecomo la raíz cuadrada de la varianza.

NOTA:¿Porqué usar “n-1” y no “ n”?

Bien la respuesta es algo complicada, pero engeneral si su grupo de datos es una muestra

del universo, entonces Ud. Están tomando unsub grupo del mundo real, entonces debeutilizar “n-1” 

DesviaciónEstándar

Page 16: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 16/66

EJEMPLO DE DISPERSIÓN

Grupo 1:

 X X – X (X – X)2

0 -10 100

8 -2 4

12 2 4

20 10 100

208 / n – 1 = (69.33)1/2

= 8.3 (DESV. ESTÁNDAR)

Grupo 2:

 X X – X (X – X)2

8 -2 4

9 -1 1

11 1 1

12 2 4

10/ n – 1 = (3.33)1/2 = 1.8257 (DESV. ESTÁNDAR)

Page 17: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 17/66

COEFICIENTE DE VARIACIÓN

C.V. = DESV. ESTÁNDAR/ MEDIA ARITMÉTICA

Se expresa en términos porcentuales.

 “Es más homogénea o presenta menos discrepancia aquelladistribución que tiene el menor coeficiente de variación” 

 “Una distribución puede considerarse como Gaussiana si el coeficientede variación es menos a 0.5, en caso contrario indicaría un carácter log – normal.” 

Page 18: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 18/66

CUARTILES.-Los cuartiles son estadígrafos de posición que dividen al total de lasobservaciones, debidamente ordenadas en cuatro partes de igual tamaño.

 Valor mínimo.

• Q1 = n/4 ----- el 25% de las observaciones tienen valores inferiores o

iguales a Q1 y el 75% es > a Q1.• Q2 = n/2 = mediana

• Q3 = 3n/4 = es un valor que supera a más del 75% y que es superadopor no más del 25%.

 Valor máximo.

Page 19: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 19/66

PERCENTILES.-

Los percentiles son estadígrafos de posición que

dividen al totalidad de las observaciones en 100partes iguales, es un estádígrafo que dá una ideaporcentual de las distribución de los datos. Es uno delos estadígrafos más utilizados

RANGO INTERCUARTÍLICO.-(Q3 – Q1) ----- 50%

De la misma forma, que como alternativa a la media, lamediana es una mediad de la tendencia central basadaen percentiles.

El RI puede considerarse como una alternativa de ladesviación típica para calcular la dispersión de loselementos.

Page 20: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 20/66

CORRELACIÓN.-

Trata de encontrar variables que estén relacionadas o

asociadas entre sí, existen muchas variables, es especialcuantitativas que dependen en algún grado de otras;entonces es posible que una variable pueda estarcorrelacionada matemáticamente en función de la otra.

• Correlación Positiva.- Cuando el incremento en unavariable , significa el incremento en la otra.

• Correlación Negativa.- Cuando el incremento en unavariable, significa la disminución en la otra.

Hay dos formas de representar la correlación:

• Numérica .- (Coeficiente de Pearson)

• Gráfica .- (Nube de puntos)

Page 21: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 21/66

COEFICIENTES DE LA FORMA DE LADISTRIBUCIÓN

CURTOSIS.-Es una medida de la concentración de la distribución entorno a la media, si lavariable es normal el valor del coeficiente es cero. Valores mayores que ceroindicarán que la distribución tiende a concentrarse entorno a la media más queuna distribución normal, mientras que valores menores que cero indicarán quetienden a desplazarse.

SESGO.-

Es una medida de la simetría de la distribución de los valores respecto a lamedia. Valores mayores que cero indicarán que las desviaciones respecto a lamedia son mayores para los valores superiores (sesgo positivo), mientras quevalores menores que cero indicarán que las desviaciones respecto a la mediason mayores para los valores inferiores. (sesgo negativo)

Page 22: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 22/66

Histograma con

sesgo Positivodebido a valoresaltos.

Histograma consesgo negativodebido a valore

bajos

Page 23: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 23/66

Presentación de Gráficos

Una vez iniciada la discriminación se logroen base a las características geológicas ygeomorfológicas, los gráficos presentados

como: histogramas de distribución defrecuencia, los box-plots y gráfico deprobabilidad pueden adelantar el procesode reconocimiento de población y

delineación de outlier .

Page 24: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 24/66

BOX – PLOT (Caja de Bigotes)Proporciona una distribución de la variable.

• Los límites superior e inferior de la cajacorresponden a los cuartiles tercero y primero

(percentil 75 y 25)respectivamente, enconsecuencia la altura de la caja coincide con elrango intercuartílico (RI).

• La línea horizontal dentro de la cajacorresponde al segundo cuartil Q2 (mediana).

• Los bigotes inferior y superior al mínimo y

máximo valor , tal que su distancias a los límitessuperior e inferior respectivamente de la caja esinferior a una vez el RI.

• En el caso de que un valor diste de los límitesinferior y superior de la caja más de 1.5 veces elRI, el valor se le denomina fuera de rango y se le

representa por el símbolo “O” y por “X” si losvalores son superiores a tres veces la longitud dela caja o RI, llamados valores extremos.

 Valores

extremos

 Valoresobservados

Page 25: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 25/66

RECTA DE HENRY

Si los puntosobtenidos estánalineados podemosdecir que la

distribuciónestudiada seaproxima a unadistribución normal

Page 26: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 26/66

 Además de

indicarnos lanormalidad delcomportamiento delas muestras nosindican al igual que

los gráficosanteriores losvalores extremosque podrían serobservados en el

tratamientoestadístico

 Valorextremo

Page 27: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 27/66

Distribución de frecuencias porhistogramas

Los histogramas de frecuencia pueden serfácilmente construidos con softwareauxiliado por computadora o

manualmente. Estos muestran lafrecuencia de valores en clases sucesivas(i.e. especificar rangos de concentraciónaritméticos o logarítmicos). Los intervalos

generalmente se seleccionan de 10 a 20clases que cubren todo el conjunto dedatos.

Page 28: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 28/66

HISTOGRAMAS.-

Tratan de dividir elconjunto de datosen una serie deintervalos yrepresentarlos bajo

la forma de unhistograma defrecuencias, lasimilitud con unacurva Gaussiana,

puede inducir queesta tiene uncomportamientonormal.

Curva

Gaussiana

Page 29: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 29/66

Como construir histogramas de frec. Ordenar los datos en forma ascendente o

descendente Calcular el rango o amplitud de frecuencias,

contando para ello con valores máximos ymínimos. R=A= (Lim Sup – Lim Inf.)

Calcular el número de intérvalos de clase (K), noexiste una regla general en cuanto al númeroóptimo de clases (K), sin embargo existen técnicas

que permiten determinar para n observaciones Ej.Ley de Sturges, K= 1+3,32 log (n). La de Dixon &Kronwell, K= 10 log (n).

Calcular el ancho o amplitud de cada clase, C=R/K.

Definir los límites de cada clase, para esto se sumael intervalo de clase al menor valor observado.

Contar la cantidad de observaciones que caendentro de cada intervalo y tabular los resultados.  A partir de los histogramas, son construidos las

curvas o polígonos de frecuencia, existen unadiversidad de curvas

Page 30: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 30/66

Distribución Normal Típica(Estándar).

La Distribución Normal o Gausiana escaracterizada por una perfecta simetría y unadisposición en forma de seno, está definida porla siguiente formula:

Donde: y= es la altura de la curva, = promedioaritmético, x= es cualquiera dato medido, y 2 esla varianza de la población.

  22 /2/1

2

1     

   

 x xe y

Page 31: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 31/66

Gráfico de Probabilidad Acumuladas

Particularmente la información útil sobre ladistribución estadística de datos con unadistribución normal o lognormal se muestra porgráfico de probabilidad acumulativa. En estos

gráficos la ordenada es aritmética o logarítmica yen la abcisa la escala de probabilidad el cual escolocado para una distribución normal olognormal acumulativo, en el cual se graficará

como una línea recta. Éstos gráficos puedencrearse manualmente (Sinclair, 1987) o con unprograma de computador conveniente (ej,PROBPLOT como lo descrito por Sinclair, 1987).

Page 32: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 32/66

Cuando es creadomanualmente se traza condatos agrupados para lospropósitos de construcción

del histograma (de valoresaltos para bajos o viceversa)y se traza directamente en elpapel de probabilidad. Losgráficos de probabilidadpueden indicar una

delineación efectiva de laspoblaciones múltiples. Porejemplo, una mezcla de dospoblaciones normalesdistintas aparece como dossegmentos casi rectos

separados por segmentosencorvados que contienen unpunto de la inflexión

Page 33: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 33/66

Diagramas Bivariates Los diagramas bivariantes simples tambiénpueden ayudar a veces definir la importancia de los

outlier . Esta aproximación ha proporcionado enocasiones a la exploración una guía de igual omayor valor que los complejos parámetrosestadísticos multivariados. Por ejemplo, en loscasos dónde el umbral anómalo (o nivel de lainspección) puede ser una función de otra variable(debido a la adsorción por Fe y/o Mn) un

procedimiento de la regresión puede ayuda en elreconocimiento de muestras verdaderamenteanómalas (Garrett, 1991).

Page 34: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 34/66

Correlación

La muestra del coeficiente de correlación r, mideel grado de la asociación linear entre dosvariables (el grado en la cual una variablecambia con otra).

Una correlación positiva indica que ambasvariables tienden a incrementarse juntas. Unacorrelación negativa indica que una variable seincrementa, y la otra decrece.

Page 35: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 35/66

Correlación de Pearson Se calcula la correlación de Pearson en cada

población a escala logarítmica, con el fin dedeterminar la relación que existe entre par deelementos, considerando en la interpretación losque muestran rasgos fuertes a muy fuertes

El coeficiente de la correlación de la muestra (r)es calculado por la fórmula:

Page 36: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 36/66

El Coeficiente de Correlación Lineal de Pearson es uníndice estadístico que permite medir la fuerza de larelación lineal entre dos variables. Su resultado es unvalor que fluctúa entre –1 (correlación perfecta de

sentido negativo) y +1 (correlación perfecta de sentidopositivo). Cuanto más cercanos al 0 sean los valores,indican una mayor debilidad de la relación o inclusoausencia de correlación entre las dos variables.

Su cálculo se basa enla expresión:

EL COEFICIENTE DE CORRELACIÓN LINEAL DEPEARSON

Page 37: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 37/66

SECUENCIA DE INTERPRETACION1.  ANÁLISIS UNIVARIATE2. RELACIONES BIVARIATE Y CORRELACIONES

3. GRAFICOS SCATTER PLOTS, BOX PLOTS,HISTOGRAMAS

4.  ANALISIS COMPONENTES PRINCIPALES (PCA)5.  ANALISIS DISCRIMINANTE Y PETROLOGIA

6.  ANALISIS DISCRIMINANTE CANONICAL7.  ANALISIS CLUSTER8. PROBABILIDAD

 ANÁLISIS ESTADISTICO DE DATOSMULTIELEMENTALES

Page 38: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 38/66

EJEMPLOS DE PRESENTACION DEDATOS

1. Un esboso de análisis UNIVARIANTEMedidas de tendencia central: Promedio(arit-geom), Mediana, Vmax, Vmin.

Medidas de dispersion: Rango, Varianza, Sd,percentiles (P10/P90, P50), cuartiles(Q25,Q75)

1. Construir relaciones BIVARIANTES

(Correlaciones).2. Histogramas

Page 39: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 39/66

PRESENTACION DE DATOS LITOGEOQUIMICOSESTADISTICA UNIVARIANTE - ESTUDIO ORIENTACION

4 Acid digest

vs.

Li Metaborate Fusion

ELEMENT Valid N Mean Median Min imum Maximum Lower Upper Percent i le Percent ile Range Std.Dev. Skewness COEFF.

Quartile Quar t ile 90 98 VAR.

 As_ms61 1388 100.0 31.4 1.2 1470.0 11.0 93.4 249.0 782.0 1468.8 185.2 3.5 185.3

B a_ms 81 1389 2429.9 1430.0 0.3 20000.0 1120.0 2010.0 3910.0 20000.0 19999.8 3771.9 3.9 155.2

BaO_MS81% 1389 0.4 0.2 0.0 19.5 0.2 0.3 0.5 2.3 19.5 1.0 11.1 272.4

Bi_ms61 1388 1.0 0.6 0.0 54.4 0.3 0.9 1.9 5.6 54.4 2.0 15.4 208.0

CaO_ms81% 1389 1.0 0.4 0.0 33.6 0.1 1.2 2.4 5.5 33.6 1.8 7.3 186.4

Co_ms61 1388 7.8 7.2 0.2 66.9 2.6 10.1 14.6 26.2 66.7 7.0 2.6 90.1

Co_ms81 1389 7.8 6.5 0.3 568.0 2.5 10.0 14.0 28.0 567.8 16.6 28.1 212.0

Cr2O3_ms81% 1389 0.0 0.0 0.0 0.1 0.0 0.0 0.0 0.0 0.1 0.0 9.5 83.3

Cu_ms61 1388 34.8 25.0 0.1 927.0 16.4 34.6 58.2 142.5 926.9 53.2 9.1 152.8

Fe2O3_ms81% 1389 4.2 4.2 0.6 16.5 3.1 4.9 5.9 8.3 15.9 1.6 1.6 36.9

Hg_ppb 1389 398.7 40.0 0.5 96900.0 10.0 180.0 530.0 3320.0 96899.5 2959.6 26.5 742.2

K2O_ms81% 1389 10.4 10.9 0.2 16.1 7.8 13.1 13.9 14.8 15.9 3.0 -0.4 28.7

Nb_ms61 1388 88.6 84.1 1.1 228.0 64.7 110.0 141.0 188.5 226.9 38.8 0.5 43.8

Nb_ms81 1389 93.0 90.0 0.5 285.0 78.0 103.0 119.0 167.0 284.5 27.3 1.4 29.3

Pb_ms61 1388 132.0 46.0 6.5 3140.0 30.5 117.0 345.0 870.0 3133.5 233.8 4.7 177.1

Pb_ms81 1389 109.9 40.0 2.5 2130.0 25.0 100.0 280.0 750.0 2127.5 187.4 4.1 170.5

Sn_ms61 1388 1.0 1.0 0.1 7.2 0.8 1.2 1.4 2.0 7.1 0.4 4.3 39.0

Sn_ms81 1389 3.6 1.0 0.5 2420.0 1.0 2.0 4.0 7.0 2419.5 65.0 37.1 1793.8

TiO2_ms81% 1389 0.7 0.7 0.0 1.6 0.5 0.8 1.0 1.2 1.6 0.2 0.1 34.3

Zn_ms61 1388 215.4 118.0 12.0 7200.0 78.0 184.0 426.0 1245.0 7188.0 381.2 7.9 176.9

Zr_ms81 1389 427.9 390.0 18.5 2230.0 340.0 440.0 672.0 916.0 2211.5 172.0 2.7 40.2

Page 40: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 40/66

REPORTED AS

•Fe2O3

•FeO

•Fe

Fe2+, Fe3+

Mg2+, Co2+ ,Ni2+

SULPHIDE MINERALS)

BIOTITE

CHLORITE

MAGNETITE

 ANKERITE

THE OXIDATIONSTATE OF IRON

Fe2+

Page 41: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 41/66

Normal P-Plot: vanadium (ppm)

0 20 40 60 80 100 120 140 160 180 200 220 240 260 280 300

Value

-4

-3

-2

-1

0

1

2

3

4

5

6

   E  x  p  e  c   t  e   d   N  o  r  m  a   l   V  a   l  u  e

 V_PPM: N = 1111, Mean = 42.55, StdDv = 38.61, Max = 275, Min = 0.5

Mean = 42.55

  Rock Chip Geochemistry

Histogram (All Rocks Outcrop Rockchips) )

0.5027.95

55.4082.85

110.30137.75

165.20192.65

220.10247.55

275.00

V_PPM

0

50

100

150

200

250

300

350

400

450

500

   N  o  o   f  o   b  s

0%

5%

9%

14%

18%

23%

27%

32%

36%

41%

45%

Page 42: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 42/66

Page 43: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 43/66

Fuente: Kenyon

Page 44: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 44/66

EJEMPLOS DE ESTADISTICA MULTI- VARIATE

1.  ANALISIS DISCRIMINANTE2.  ANALISIS COMPONETES PRINCIPALES3.  ANALISIS DISCRIMINANTE CANONICAL4.  ANALISIS CLUSTER 

ANALISIS ESTADISTICO DE DATOS MULTI

Page 45: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 45/66

SECUENCIA DE INTERPRETACION1.  ANALISIS UNIVARIATE2. RELACIONES Y CORRELACIONES BIVARIATES3. GRAFDICOS DE SCATTER, BOX Y BIGOTES

PLOTS, HISTOGRAMAS.4.  ANALISIS COMPONETES PRINCIPALES (PCA)5. SELECCION DE ELEMENTOS STEPWISE

 ANALISIS DISCRIMINATE Y PETROLOGIA6.  ANALISIS DISCRIMINANTE POR CANONICA7.  ANALISIS CLUSTER (WARD).

8. ITERACION DE ANALISIS CLUSTER 9. CHEQUEO POR ANALISIS DISCRIMINANTE

(POST POSTERIOR PROBABILIDAD)

 ANALISIS ESTADISTICO DE DATOS MULTI-ELEMENTALES

 

Page 46: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 46/66

ANALISIS DE COMPONENTES

PRINCIPALES

UN RESUMEN DE LA VARIANZA

TOTAL DE LA MUESTRA

Page 47: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 47/66

 Análisis discriminante Canonical es unatécnica usado para reducir el tamaño.

Da una variable de clasificación y varios

intervalos de variables, análisisdiscriminant canonical deriva de variables 

canonical que resume la variación entreclases.

Los variables tienen un aproximadoDISTRIBUCION NORMAL multivariate

 ANALISIS MULTIVARIANTE Análisis Discriminante Canonical

Page 48: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 48/66

 ANALISIS CLUSTER  Permite explorar semilaridades entre individuos

(muestras) Modo-Q, o entre variables (modo-R)definiéndolo en grupos.

 Análisis por agrupamiento jerarquizado; se obtiene de “n” lineas = muestras y “p” columnas = varaiables.

Usando un coeficiente de similaridad cualquiera entrelíneas se obtiene una matriz [nxn] utilizada en el Modo –Q. Si la comparación es entre columnas se obtendrá unamatriz inicial de [pxp].

En la matriz inicial de coeficientes de similaridad estespresentan el grado o semejanza entre pares de objetos ylos mismos deverán ser ordenados de acuerdo con logrados de similaridad (0 - 1), de modo que quedanagrupados según una disposición jerarquizada.

Page 49: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 49/66

 Al2O3Na2OMnOK2OFe2O3FeOP2O5CaOMgOTiO2SiO2

56.38

70.92

85.46

100.00

 Variables

     S     i    m     i     l    a    r     i    t    y

Granito Itaoca

Page 50: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 50/66

Stream sediment

23221516132524310129185421201714768192111

29.80

53.20

76.60

100.00

Observaciones - casos

   S   i  m   i   l  a  r   i   t  y

Dendrograma Stream SedimentSingle Linkage, Euclidean Distance

- Casos

Page 51: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 51/66

Coeficientes de similaridad

1. Coeficiente de distancia: expresa el grado desemilaridad con la distancia en un espaciomultidimensional, si las variables tiene el mismo peso, lafunción distancia será limitada a valores entre 0 (mayorsimilaridad) y 1 (menor similaridad).

2. Coeficiente de Correlación: mide el grado deasociación entre valores por la representación de puntosen un sistema de coordenadas y sus respectivasposiciones en relación a una línea recta. Se considera elceoficiente de correlación paramétrica (Pearson) y noparamétrica (Sperman).

Coeficiente coseno-teta: medida de proporcionalidad queexpresa el grado de similaridad en terminos deseparación angular (p, q) valores comparados.

Page 52: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 52/66

CORRELACIONESPEARSON (PRODUCTO-MOMENTO)

SPEARMAN (RANK-ORDER)

Page 53: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 53/66

 Análisis de ComponentesPrincipales (CPA)

Es una transformación linear de “m” variablesoriginales en “m” nuevas valores, es el calculode los autovalores y sus correspondientesautovectores de una matriz de varianza-

covarianza. El CPA es un método factorial que intenta

identificar variables subyacentes o factores, queexpliquen la configuración de correlación dentro

de un conjunto de variables observadas, decarácter numérico para todos ellos..

Page 54: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 54/66

 ACP

1.00.80.60.40.20.0

0.9

0.8

0.7

0.6

0.5

0.4

0.3

0.2

0.1

0.0

First Factor

   S  e  c  o  n   d   F  a  c   t  o  r

Pb

Cu

Cdppm

Mn

Fe(%x100)

Zn

Loading Plot of Zn, ..., Pb

Page 55: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 55/66

43210

4

3

2

1

0

-1

First Factor

   S  e  c  o  n   d   F  a  c   t  o  r

Score Plot of Zn, ..., Pb

Page 56: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 56/66

 ANOMALIAS GEOQUIMICAS

La distribución geoquímica de los elementos enlos diferentes materiales geológicos depende delas condiciones y eventos que ocurren en rocas,suelos, agua. Mientras no ocurran eventos

mineralizantes, estos materiales van amantener los niveles de abundancia normales(fondo, background) y en el otro caso, ladistribución de los elementos será diferente a laabundancia normal, esto es mayor o menor y

estaremos ante la presencia de anomalíasgeoquímicas.

Page 57: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 57/66

 VALOR DE FONDO –BACKGROUND-

Su determinación se realiza por evaluacionesestadísticas y comparándolo con los valoresreferenciales calculados para diferentes tipos demateriales naturales en la Tierra.

 Además el ploteo de los valores de los elementoscon sus coordenadas nos permite realizar unanálisis de los elementos en los denominadospatrones de dispersión.

Page 58: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 58/66

 Valor de fondo –Background-Todo conjunto de datos puede contener dos componentes:

1.- Valores promedio de abundancia normal o background2.- Valores anómalos.  Además, para cada elemento analizado, el promedio o valor

background y su fluctuación alrededor de este valor(desviación estándar) deben ser calculados para determinarcuales valores son normales y cuales anómalos, que puedenestar relacionados a mineralización. Frecuentemente losvalores de los elementos trazas son distribuidoslognormalmente; esto es, el logaritmo del contenido de los

elementos trazas forma una distribución gaussiana ”forma decampana” en un histograma.

Page 59: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 59/66

 AJUSTE A UNA DISTRIBUCIÓN LOGNORMAL

En prospección geoquímica, estudiamos elcontenido de elementos trazas en variosmateriales naturales, y decir que los valoresson distribuidos en forma lognormal significa

que los logaritmos de estos valores sondistribuidos siguiendo una ley normal (o ley deGauss) bien conocida como la curva con formade campana.

Page 60: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 60/66

Histogramas y curvas de frecuenciaacumulada

Page 61: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 61/66

UMBRAL GEOQUIMICO-THRESHOLD -

Estadísticamente es el límite superior de lasfluctuaciones del background. Los valoresiguales o mayores al threshold son consideradosanómalos. Ajuste al comportamiento lognormal

es generalmente el caso de muestras de suelos,fragmentos de rocas, sedimentos de drenajes,etc.

Page 62: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 62/66

Cálculo del umbral o Threshold

Ha sido observado que en caso de unadistribución simétrica (normal olognormal), 95% de los valoresindividuales están entre Media+2DS, es

decir que solamente el 2.5% de lapoblación excede el límite superiorMedia+2DS. Este límite superior estomado convencionalmente como el

threshold (Th), encima del cual los valoresson considerados como anómalos.

Page 63: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 63/66

Distr ibuciòn Log Au

0

10

20

30

40

50

60

   1 .

   1 

  -   1 .

   2   0

   1 .   3

   0  -   1 .

   4   0

   1 .   5

   0  -   1 .

   6   0

   1 .   7

   0  -   1 .

   8   0

   1 .   9

   0  -   2 .

   0   0

   2 .   1

   0  -   2 .

   2   0

   2 .   3

   0  -   2 .

   4   0

   2 .   5

   0  -   2 .

   6   0

   2 .   7

   0  -   2 .

   8   0

Intervalos de clas es

       F      r      e      c     u      e      n      c       i      a      s

1.1 -1.20 1

1.20-1.30 161.30-1.40 33

1.40-1.50 50

1.50-1.60 50

1.60-1.70 36

1.70-1.80 9

1.80-1.90 6

1.90-2.00 5

2.00-2.10 4

2.10-2.20 10

2.20-2.30 8

2.30-2.40 5

2.40-2.50 4

2.50-2.60 2

2.60-2.70 0

2.70-2.80 1Background Anomalías

CLASES – FREC.

Page 64: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 64/66

 Anomalia Geoquímica

 Anomalias geoquimica Anomalía.- Teóricamente sonvalores alejados al background debido al aumento de laconcentración en uno o más elementos; por lo tanto Anomalía geoquímica es una desviación de los valoresgeoquímicos que son normales para una región., por lo

tanto una yacimiento es una anomalía  Anomalía significativa, son usados como guías en la

prospección debido a su relación con la mineralización,se determina con métodos estadisticos.

 Anomalía no significativa no tiene relación con lamineralización natural, puede ser por la actividadindustrial o contaminación antropógena.

Page 65: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 65/66

Fig: Anomalía, threshold regional y local, dispersión primaria.Fuente: Levinson (1980).

Rangos de Anomalia.

T — 2T:Débilmente

anómalos

2T – 3T:Moderadamente anómalos

>3T:Fuertementeanómalos

Page 66: Tratamiento estadistico

7/21/2019 Tratamiento estadistico

http://slidepdf.com/reader/full/tratamiento-estadistico-56d9f0a04c8ae 66/66