DIPLOMATURA D'ESTADíSTICA

77
DIPLOMATURA D'ESTADíSTICA Compara ció de metodes d'aplicació de processos espaials amb distribució lognormal Alumnes: Clara Foz Altarriba Bibiana Prat Pubill Directora: Vera Pawlowsky Glahn Departament: Matematica Aplicada III Data d'entrega: 4 de juliol del 2.000 UNIVE RSITAT POLI CN ICA DECATALUN YA B iblioteca II111111111 1111 11 11111 111 11 111111 1111 111111 1111 11111 1111I 111 1400351504 Facultat de Matematiques I i Estadística UNIVERSITAT POLITÉCNICA DE CATALUNYA

Transcript of DIPLOMATURA D'ESTADíSTICA

DIPLOMATURA DESTADiacuteSTICA

Comparacioacute de metodes daplicacioacute de processos espaials amb distribucioacute lognormal

Alumnes Clara Foz Altarriba Bibiana Prat Pubill

Directora Vera Pawlowsky Glahn Departament Matematica Aplicada III Data dentrega 4 de juliol del 2000

UNIVERSITATPOLI TEacuteCNICA DECATALUNYA Biblioteca

II111111111111111 11111 11111 11111111111111111111 11111 1111I111 1400351504

Facultat de Matematiques I

i Estadiacutestica

UNIVERSITAT POLITEacuteCNICA DE CATALUNYA

Capitol 1 Introduccioacute

El projecte esta estructurat de manera que en un principi sintrodueixen una seacuterie

dexplicacions de les eines geoestadiacutestiques i en concret es remarquen les que

posteriorment susaran en el desenvolupament de Iestudi

A continuacioacute i duna forma esquematica sexplica el procediment de desenvolupament

i treball del projecte que es detalla al capiacutetol 5

Fmalment en els capiacutetols 6 i 7 sanalitzen els resultats i sextreuen les conclusions

Lobjectiu del projecte eacutes comparar dos meacutetodes destimacioacute de dades amb

dependeacutencia espaial en el cas de dades amb distribucioacute experimental asimeacutetrica El

primer meacutetode sanornena krigeat lognormal el segon krigeat indicador

El krigeat lognormal parteix de la hipoacutetesis que les dades soacuten realitzacions dun

proceacutes espaial lognormal i consiste ix en aplicar la transformacioacute logariacutetmica a les

3

Capitol 2 Nocions de geoestadiacutestica

on E() denota el valor esperat

m eacutes un escalar constant que representa la mitjana

h eacutes la distancia vectorial en Iespai mostrejat

CovO eacutes la covariancia de la funcioacute aleatoria

Requisit 3 El krigeat simple requereix que la mitjana de la variable regionalitzada en

estudi sigui coneguda

Un cop shan tingut en compte aquests requ isits podem passar a la formulacioacute de

Iestimador

Sent Z una funcioacute aleatoria estacionaria de segon ordre amb mitjana m Iestimacioacute

Zk (xo) en la posicioacute Xove donada per la segOent combina cioacute lineal de variables

aleatories a les posicions Xi considerades en la mostra

k

Zk(XO) = m+ Lwiexcl(Z(xiexcl-m) =1

El proposit principal del krigeat simple eacutes trobar un conjunt de pesos per a la estimacioacute

en Iequacioacute anterior de forma que es minimitzi Ierror quadratic migo

La variancia daquest estimador ve donada per

n

OK(U) =C(O)- LWiexcl(u)C(u-uo) O =1

2212 El krigeat ordinari

El krigeat ordinari va sovint acompanyat del qualificatiu de BLUE Eacutes linear (lineal)

perqueacute les seves estimacions soacuten combinacions lineals ponderades de les dades

existents Eacutes unbiased (no esbiaixat) perqueacute intenta que la miijana residual (mr) sia

igual a zero I eacutes bese (millor) perqueacute fa la variancia deis errors (cr2R) miacutenima

15

Capiacutetol 2 Nocions de geoestadiacutestica

Lavantatge que presenta el krigeat ordinari davant daltres metodes destimacioacute eacutes

precisament que fa miacutenima la variancia residual ja que nhi ha que tambeacute soacuten lineals i

no esbiaixats

Com hem dit anteriorment el krigeat simple requereix el coneixement de la mitjana per

resoldre el problema de trobar els pesos que miacutenimitzin la variancia de Ierror

destimacioacute Si la mitjana no eacutes coneguda sera convenient utilitzar el krigeat ordinari

Iestimacioacute del qual eacutes independent de la mitjana ja que safegeix la restriccioacute de que

els pesos han de sumar 1 daquesta manera els pesos de la mitjana a Iequacioacute

(2221) sumen O i Iestimacioacute depeacuten norneacutes de la mostra

(2221)

Aixiacute dones podem afirmar que el krigeat ordinari no eacutes res rneacutes que un krigeat simple

que compleix la condicioacute que els pesos tenen una suma unitaria

Considerem una funcioacute aleatoria Z estacionaria de segon ordre Lestimador Zk(XO )

en la posicioacute ve donada per les seguumlents combinacions lineals de les variables Xo

aleatories a les posicions Xi considerades en la mostra

k

Zk(XO) =LwiexclZ(xJ iexcl=l

subjecte a Lk

Wiexcl = 1 =1

Les principals propietats del krigeat ordinari soacuten

- Minimitza error quadratic migo

-Interpolacioacute exacte amb variancia de krigeat O

- Independencia de la translacioacute deis nodes de referencia

- Dependencia del patroacute de la mostra

- Independencia de la variancia de krigeat per les observacions individuals

16

Capiacutetol2 Nocions de geoestadiacutestica

23 Simulacioacute sequumlencial gaussiana

La simulacioacute sequumlencial gaussiana es basa en la simulacioacute de dades a partir duna variable

continua de distribucioacute normal que a meacutes ha de ser estandarditzada En geoestadiacutestica

susa la simulacioacute per tal de poder coneacuteixer el valors de la variable en estudi en punts no

mostrejats En el nostre cas Ihem usat per tal de poder tenir dades a partir de les quals fer

Iestudi Per tant nomeacutes detallarem la seva mecanica

1 Determinar la funcioacute de distribucioacute Fz(z) que representa tota Iarea destudi i no norneacutes

els punts mostrejats

2 Transformar Fz(z) en una distribucioacute Normal (01)

3 Comprovar que realment la nova variable (Y) es distribueix normalment En el cas que

no shagi pogut conservar el model gaussia considerar models aHematius com ara una

barreja de poblacions gaussianes o beacute plantejar-se fer un altre tipus de simulacioacute

estocastica

4 A partir daquiacute ja podem usar meacutetodes computacionals que actuen de la seguumlent

manera

41 Es crea una ruta que consisteix en la visita una sola vegada de cada node (u) de la

xarxa De cada node visitat es reteacute un nombre maxim de nodes veins per tal de

poder fer simulacioacute condicionada

42 Escollir un tipus de krigeat i un tipus de semivariograma per tal de poder determinar

la mitjana i la variancia de la funcioacute de distribucioacute condicionada Y(u) en la localitzacioacute

u

43 Treure un valor simulat yP)(u) de la funcioacute de distribucioacute condicionada

44 Afegir el valor simulat y(I)(U) al conjunt de dades

5 Continuar amb el seguumlent node fins que es simuli el darrer

FLUXOGRAMA DEL DESENVOLUPAMENT DEL PROJECTE

Simulem 625 dades (25x25) duna N(01) amb un variograma

exponencial SGSIM

Fem Iexponencial de les dades per obtenir una distribucioacute lognormai

Prenem una mostra r-1-----i aleatoria de 100 dades r------- ~ MINITAB

Decidim 5 cut-offs a partir

deis percentils MINITAB

Obtenim els variogrames per a cada cut-off i hi aproximem un modelo

GEO-EAS EXCEL

Realitzem el Krigeado indicador simultani per

cada cut-off IK3D

j Realitzem la

interpolacioacute de la mediana

POSTIK

Fem els logaritmes Obtenim el model

de variograma per la mostra GEO-EAS

EXCEL

Realitzem el Krigeado ordinario

KB2D

Realitzem la transformacioacute de les

dades per obtenir una xarxa amb distribucioacute

Iqgnormai

1------1-~ Apliquem la funcioacute ~

logaritme a les dades L-___________-I~ per tal de poder-les 1--___-

comparar

Comparem els dos meacutetodes destimacioacute entre si i amb les dades simulades Calculem ISTRESS i grafiquem els

1 CONCLUSIOacute I resultats FORTRAN MINITA8

Capiacutetol 5 Desenvolupament del projecte

Tot estudi geoestadiacutestic segueix un guioacute de treball

bull Determinacioacute i analisi de Iestructura espaial

bull Modelitzacioacute de la variabilitat espaial

bull Estimacioacute de punts no mostrejats

bull Simulacioacute

bull Conclusions i descripcioacute de la zona estudiada

En el nostre cas malgrat no teniacuter dades reals i que el nostre objectiu no sia el coneixement

de la variable regionalitzada sinoacute el comparar dos metodes destimacioacute el proceacutes sera el

mateix Luacutenica diferencia eacutes que nosaltres fem una simulacioacute per tal dobtenir una base de

realitat a partir de la qual comenyar a treballar i no per tenir realitzacions de punts no

mostrejats Per tant en el nostre cas la simulacioacute esdeveacute el primer pas a realitzar

Capitol 5 Desenvolupament del projecte

51 La simulacioacute

Per tal de tenir una regi6 en la que poder treballar construim una xarxa de 25x25x1 eacutes a

dir treballem a R2bull

Volem obtenir una realitzaci6 en cada un deis nodes de la xarxa per tant realitzem una

simulaci6 de 625 dades Figura 511

Ix= o 1 2 23 24

~ yslz= 004 J

l

~] iexcllo

-t yrnn==O

-- xsiz== 004T-Eshy

o 11

~

Figura 511 Xarxa sobre la que es treballa i punts mostrejats

En el camp de la geologiacutea eacutes molt difiacutecil obtenir gaires mostres duna regi6 per aix6 els

meacutetodes de simulaci6 i destimaci6 s6n tant importants en geoestadiacutestica Com que a

nosaltres ens interesa tenir una xarxa complerta (perqueacute el que ens interessa eacutes veure quin

deis dos meacutetodes destimaci6 eacutes millor i no el saber com eacutes la regi6) el que fem eacutes simular

realitzacions duna N(O1) amb semiacutevariograma exponencial de meseta unitat en tots els

nodes de la nostre xarxa Sha escollit aquest tipus de semivariograma per ser el meacutes

habitual en el camp de la geologiacutea [ref 2]

En aquestes dad es els hi apliquem exponencials i per tant la nostra realitat segueix una

distribuci6 lognormal de mitjana unitat

El fet de treballar sobre dades lognormals ve justificat perque hi ha molts fenomens naturals

que segueixen aquesta distribuci6 [ref 11] (cerca de determinat mineral bosses de petrali

quantitat de sediments exploracions geoquimiques )

Per tant la nostre realitat eacutes aquesta eacutes a dir la distribuci6 lognormal de la variable

regionalitzada La N(O1) tant sois la fem servir per ser facil de maniobrar

computacionalment [ref 16]

Capiacutetol5 Desenvolupament del projecte

Per tal dassegurant-se que la nostre realitat eacutes mes o menys exacta mirem la seguumlent taula

Variable N Mean Median StDev SE Mean Hin 121 123

exp(siacutem) 625 10546 07742 10075 00403 00250 95965 03934 13721

Taula 511 Descriptiva de la variable regionalitzada exp(sim)

Amb els seguumlents grafics comprovem que realment les nostres dades segueixen una

distribucioacute lognormal

-200

() e Q) J CT 100 ~

IJ -

o

o 5 10 exp(sim)

Figura 512 Histograma de la realitat

Jo

Capiacutetol 5 Desenvolupament del projecte

Lognormal Probablllty Plot tor exp(sim)

Ml Estimates

l ocatiolt -0325300

Scale 0910009

99

95 90

80 70

e 60 (lJ 50 Uuml 40 shy 30 (lJ 20 a

10

5

001 010 100 1000

Data

Figura 513 Lognormal probability plot de la variable regionalitzada exp(sim)

exp(sim)

10

B

7

6 5

4

2

20

Figura 514 Surface plot de la variable exp(sim)

Capiacutetol 5 Desenvolupament del projecte

El surface plot eacutes una eina molt uacutetil ja que ens doacutena una visioacute de com es la nostra realitat a

Iespai A meacutes un cop haguem fet les dues estimacions tambeacute podrem fer el surface plot i

amb un cop dull podrem treure una primera impressioacute de si les estimacions han estat bones

o no

Capiacutetol 5 Desenvolupament del projecte

52 La mostra

A partir de les dades que hem obtingut amb la simulacioacute prenem una mostra aleatoria

de 100 dades a partir de la qual realitzarem les dues estimacions de la realitat Cal

tenir en compte que a partir daquest moment es treballara sobre la mostra i no sobre

les dades simulades que en Iexperimentacioacute real soacuten desconegudes

La mostra sha pres de forma que constitueixi una bona representacioacute del total de la

xarxa La figura 521 mostra la localitzacioacute de cada una de les dades que formen part

de la mostra sobre la xarxa inicial de 25x25 nodes

20 shy

gt x middotcv 10 _

o shy

middot o

bull It bullbullbullbullbullbull bull middot 4 bull bull bull bullbullbull bullbullbullbull bull bull bullbullbullbullbull bull bull bull bull bull bullbullbullbullbull bull bull bullbullbull -Jf bull middot middot middot bull middot 1t bullbullbullbull bullbullbullmiddot o bull bull bull bull bullbull bull bull bull bullbull II JI Jt bull bullbullbull lttt bullbullbull bullbullbull bullbull bull bull bull bullbull bull shy ~ ~ ~ ~ ~ It bull bull bullbullbull bull bull bullbullbull bullbull bull bullbullbullbull bullbull bull bull bull bullbullbullbullbullbull ti bull bull -41 bull bull bull bull bull bull jf middot bull bullbullbull -If bull bull bull 1( bull bullbull bull middot middot - bullbullbullbullbull bull bullbull bullbullbullbullbullbull bull bull bull bullbullbullbull bullbull bull

o 10 20

eix x

Figura 521 Distribucioacute de la mostra dins la xarxa real

La mostra obtinguda conserva les propietats de les dades provinents de la simulacioacute

daquesta manera podem afirmar que eacutes una bona extrapolacioacute de la realitat Vegem a

continuacioacute la descriptiva (Taula 52 1) i Ihistograma de la mostra (Figura 522) amb el

grafic de probabilitats (Figura 52 3) Podem observar que segueix efectivament una

distribucioacute lognormal

Variable N Mean Median TrMean StDev SE Mean rnos tra 1 00 1 0552 0 8330 0 9458 0 9566 0 0957

Variable Minimum Maximum Ql Q3 rnost ra 0 0250 441 85 0 328 1 1 3714

Taula 521 Descriptiva de la mostra

33

Capiacutetol 5 Desenvoluparnent del proiecte

30

gtshyo 20c Q) J oshy~

LL 10

-

1--

- --r--

n I Io

o 2 3 4 5 mostra

Figura 522 Histograma de la mostra

Lognormal Probability Plot for mostra

99

I 95

_ 90 - l -~80 70c jIQ) 60

50e 40Q) 30a 20

10 5

bull

~

001 010 100 1000

Data

MLEstimaacutee5

LocaIion -0341481

Scaacutee 0946372

Figura 523 Plot de probabilitat lognormal

34

Capiacutetol 5 Desenvolupament del projecte

La superfiacutecie descrita per la mostra podem representar-la tambeacute graficament (Figura

524)

mostra

45

40

3 5

30

25

20 15

10

05

00

eixy 20

Figura 524 Superfiacutecie definida per la mostra

35

Capiacutetol 5 Desenvolupament del projecte

53 Lestimacioacute per krigeat indicador

Per tal de realitzar el krigeat indicador definim 5 punts de tall o cut-off Aquests punts de tall

els escollim de forma que guardin simetria respecte el percentil del 50 tal i com mostra la

taula 531

Categoria Percentil Percentatge

1 90 009952

2 300 037637

3 500 073142

4 700 127046

5 910 254092

Taula 531 Els cinc punts de tall escollits

Un cop decidides les categories o punts de tall necessitem saber el semivariograma que

segueixen cada una delles per a poder dur a terme el krigeat indicador ja que Iestimacioacute

realitzada a partir daquest rneacutetode requereix una modelitzacioacute deis cinc semivariogrames

experimentals

El procediment eacutes el seguumlent

Partim de la mostra de 100 dades que segueix una distribucioacute 10gnormaL

Per cada una de les categories creem una columna de O i 1 de manera que si aquell

punt concret eacutes per sota del punt de tall el valor que pren la variable dicotoacutemica eacutes 1 i si eacutes

per sobre pren el valor O

Els semivariogrames els creem amb aquestes cinc columnes de zeros i uns

Per cada semivariograma provem dajustar un model esfeacuteric i un dexponencial Aquests dos

tipus de models els anirem ajustant a ull movent el valor del rang i de Iabast Partim

daquests models per ser els meacutes habituals en la realitat i ens quedarem amb el que ajusti millor deis dos [ref 2]

A continuacioacute presentem els resultats daquests ajustaments per a cada punt de tall

Capiacutetol 5 Desenvolupament del proiecte

Categoriacutea 1 y(h)

Model Exponencial Abast =8 Model Esferic Abast = 75

Meseta =003 Meseta = 003

VARIOGRANlA CATEGORIA 1

005

004 sectr bull ESF= ro E 003 E ro O)

002

001

000

o 2 4 6 8 10 12

Ihl

Figura 531 Model de semivariograma esfeacuteric i exponencial per la categoria 1

)1

Capiacutetol 5 Desenvolupament del projecte

Categoria 2

Model Exponencial Abast = 4 Model Esferic Abast = 4

Meseta = 022 Meseta = 022

VARIOGRAMA CATEGORIA 2

025

--

c bull ESF- sectro 020

E E ro Ogt

015

010

8 10 12

Figura 532 Model de semivariograma esferic i exponencial per la categoria 2

o 2 4 6

Ihl

Capitol 5 Desenvolupament del projecte

Categoriacutea 3

ModeJ Exponencial Abast =7 ModeJ Esferic Abast =6

Meseta =027 Meseta = 0265

VARIOGRAMA CATEGORIA 3

03

~ c (1] ~E 02E (1]

Ogt

01

o 2 4 6

Ihl

Figura 533 Model de semivariograma esfeacuteric i exponencial per la categoria 3

8 10 12

)9

Capiacutetol 5 Desenvolupament del projecte

Categoria 4

Model Exponencial Abast = 5 Model Esfeacuteric Abast = 4

Meseta = 02 Meseta = 02

VARIOGRAMA CATEGORIA 4

03

~ ~ -- ro E ~

02 E ro Ogt

01

deg 2 4 6

Ihl

Figura 534 Model de semivariograma esfeacuteric i exponencial per la categoria 4

8 10 12

Capiacutetol 5 Desenvolupament del projecte

Categoriacutea 5

Model Exponencial Abast =4 Model Esferic Abast = 3

Meseta =006 Meseta = 006

VARIOGRAMA CATEGORIA 5

008

= sect~ 007-shy ESFro E E 006 ro Ol

005

004

003

o 2 4 6 8 10 12

Ihl

Figura 535 Model de semivariograma esfeacuteric i exponencial per la categoria 5

Capiacutetol5 Desenvolupament del projecte

Mirant els cinc grafics veiem que el model que ajusta millor eacutes Iesferic en tots els casos

encara que no hi ha diferencies massa significatives respecte el model exponencial A meacutes

observem una certa simetria pel que fa a la meseta i abast de cada un deis models esferics

de cada categoria Taula 532

Cat 1 Cat2 Cat3 Cat4 Cat5

Meseta 003 022 0265 02 006

Abast 75 4 6 4 3

Taula 532 Meseta i abast per cada categoria

Aquesta simetria sobserva sobretot per les categories 2 3 i 4

Els models corresponents a les categories 1 i 5 no ajusten del tot beacute degut a que soacuten les

categories deis extrems i per tant la gran majoria de mostres si no totes estaran per sobre o

per sota respectivament

Ara ja podem fer Iestimacioacute per krigeat indicador Al programa ik3d li introduim els cinc

models de semivariogrames per tal que ens calculi Iestimacioacute

El resultat que obtenim soacuten cinc columnes de 625 dades on els valors van de O a 1

Concretament ens calcula la probabilitat de que el valor atorgat a cada punt sigui inferior al

daquell cut-off

El que es preteacuten ara eacutes a partir daquest conjunt de probabilitats interpolar la mediana per a

cada un deis punts de la xarxa per tant el que fem eacutes executar el programa postik en Iopcioacute

3 de manera que ens tregui Iestimacioacute de la mediana

A continuacioacute passem a detallar en que consisteix el postik Per tal de poder-ho expressar

millor ens centrare m en un punt concret de la xarxa el (30)

- - - - -

Capiacutetol 5 Desenvolupament del projecte

Els tercer valor de cada una de les 5 columnes obtingudes amb el krigeat indicador eacutes a dir

els valors corresponents a la mostra situada en el node (30) representen la probabilitat de

que el valor de la variable en aquest punt sigui major que cada un deis cut-off

respectivament aixiacute podem afirmar que

P(Xiexcl lt el ) = P(x(3Q) lt 00995) =00000

P(xiexcl lt e2) = P(X(3 Q) lt 03764) =00397

P(xiexcl lt c3) = P(X(30) lt 07314) = 00409

P(xiexcl lt e4) = P(X(30) lt 12705) = 02079

P(xiexcl lt e5) = P(X(3 0) lt 25402) =10000

Si ara grafiquem aquests 5 valors obtenim una estimacioacute de la probabilitat que teacute el punt

estudiat (30) de ser meacutes petit que qualsevol valor eacutes a dir Iestimacioacute de la funcioacute de

probabilitat en aquest punt Com que el que es preteacuten estimar en el nostre estudi eacutes la

mediana mirarem quin valor aproxima per la probabilitat del 05 eacutes a dir

m tal que P(X(30) lt m) = 05

Per aixoacute tracem una liacutenia a Ialcada 05 i daquesta manera obtenim el valor estimat de la

mediana Aquest valor correspon al valor que obtenim amb el POSTIK que eacutes per aquesta

primera observacioacute 06983

10

x v 6 68 05 o

00

Figura 536 Els 5 cut-off aplicats al punt (30)

Capiacutetol 5 Desenvolupament del projecte

Laplicacioacute del POSTIK realitza aquesta estimacioacute per a cada un deis punts obtinguts (625)

i daquesta manera podem obten ir una interpolacioacute de la mediana per cada un deis valors a

estimar

Capiacutetol 5 Desenvolupament del projecte

SEMIVARIOGRAMA DE LA MOSTRA

model exponencial

12

= r 07 -- ca E E ca O)

02

o 2 4 6 8 10 12

Ihl

Figura 541 Semivariograma experimental amb un model exponencial

Aquest model obtingut a ull teacute els seguumlents parametres abast=7

meseta=1 05

Aplicant aquest valors al model general obtenim la formulacioacute per a les nostres dades

46

middotCapiacutetol 5 Desenvolupament del projecte

MODEL ESFERIC La formulacioacute general eacutes

sih a

sih gt a

on a eacutes Iabast i c la meseta

SEMIVARIOGRAMA DE LA MOSTRA

model esferic

12

---shyro E 07 E ro Ol

02

o 2 4 6 8 10 12

Ihl

Figura 54 2 Semivariograma experimental amb un model esfeacuterico

Aquest model Ihem obtingut de la mateixa manera que Ianterior a ull i els seus

parametres que tambeacute aplicarem a la forma general soacuten abast=6 i meseta=1

47

Capiacutetol 5 Desenvolupament del projecte

Finalment pode m representar la superfiacutecie que hem estimat a partir del krigeat

lognormal utilitzant un grafic de superfiacutecie (Figura 54 5)

6

5

Krig Logn 3

2

o

20 eix y

Figura 545 Grafic de superfiacutecie pel krigeat lognormal

50

Capiacutetol 6Comparacioacute deis resultats obtinguts

61 Regressioacute lineal

Per tal de dur a terme la compara cioacute entre els dos meacutetodes destimacioacute i les dades que

simulen la realitat hem expressat els resultats obtinguts graficament mitjancant els

grafics de punts ajustant en cada cas la recta de regressioacute i dibuixant la bisectriu Cal

tenir en compte que per augmentar la claredat i per a simplificar la interpretacioacute deis

resultat hem transformat les dades a una N(O1) encara que el nostre estudi es basi en

un model lognormal

Passem a continuacioacute a analitzar els grafics

En primer lIoc (Figura 611) tenim el grafic de punts entre les dades obtingudes amb el

primer meacutetode destimacioacute el krigeat lognormal i les dades provinents de la simula cioacute

de la realitat

Regression Plot y =3a1E -02jo O6lt40216X

R-Sq = 594

_0 ro

ro EID o middot Ole

~~ -2

-3

- -3 -2 -1

redade regresioacute

Bisectriu

realitat simulada

Figura 611 Recta de regressioacute entre el krigeat lognormal i la simulacioacute de la realitat

Si mirem aquest grafic podem observar que el valor de Iestimacioacute realitzada

sobreestima els valors petits de la simulacioacute i en canvi en els valors grans subestima

El coeficient de correlacioacute es del 594 eacutes a dir que el meacutetode del krigeat lognormal

explica un 594 de la realitat

52

Capiacutetol 6Comparacioacute deis resultats obtinguts

Passem ara a realitzar el gratic entre el segon meto de destimacioacute el krigeat indicador

i la realitat simulada (Figura 612)

0 _O

m~ 0)-- o

~~ -1

-2

-3

Regression Plot y = -23E-02 + 0711 615X

R-Sq 526

bull bull

-3 -2 -1

realitat simulada

recta de regresi oacute

I Bisectriu

Figura 612 Recta de regressioacute entre el krigeat indicador i la simulacioacute de la realitat

Podem observar que el gratic obtingut eacutes molt semblant a Ianterior i que ens trobem

amb el mateix problema de sobreestimacioacute deis valors petits i subestimacioacute deis valors

grans de la simulacioacute

El valor del coeticient de correlacioacute tambeacute eacutes torga semblant 52 6 Aixiacute doncs la

realitat eacutes explicada en un 526 pel krigeat indicador

53

Capiacutetol 6Comparacioacute deis resultats obtinguts

Finalment i per tenir una idea de la relacioacute que hi ha entre els dos meacutetodes emprats en

el projecte realitzarem un uacuteltim grafic comparatiu (Figura 613) que representa els dos

meacutetodes destimacioacute el krigeat lognormal i el krigeat indicador

Regression Plot y = -7 SE-02 + 105401X

R-Sq 796

middot2

middot3

recta de regresi6

bull Bisectriu

middot 4 middot3 middot2 -1

krigeat lognormal

Figura 613 Recta de regressioacute entre el krigeat lognormal i el krigeat indicador

En aquest cas podem observar que la recta de regressioacute coincideix gairebeacute a la

perfeccioacute amb la bisectriu cosa que vol dir que els dos meacutetodes soacuten molt semblants

entre siacute i que per tant eacutes normal que Iaproximacioacute de cada un dells a la realitat sigui

semblant

El valor de la regressioacute eacutes meacutes gran que en els altres dos casos 796 eacutes a dir que

els dos meacutetodes no donen resultats significativament diferents entre si

Podem observar un conjunt de dades que prenen valors especialment elevats en

Iestimacioacute per krigeat indicador Si analitzem aquests punts podem comprovar que

soacuten punts que tenen una probabilitat de ser meacutes grans que el cinqueacute cut-off (percentil

097) igual a 1 Per tant aquest tipus de punts no shan de tenir en compte en el

moment dextreure conclusions De fet aixo ja es sospitava en el grafic anterior pero

en que en aquell hi ha una elevada dispersioacute i per tant Iefecte queda dissimulat

54

Capitol 1 Introduccioacute

El projecte esta estructurat de manera que en un principi sintrodueixen una seacuterie

dexplicacions de les eines geoestadiacutestiques i en concret es remarquen les que

posteriorment susaran en el desenvolupament de Iestudi

A continuacioacute i duna forma esquematica sexplica el procediment de desenvolupament

i treball del projecte que es detalla al capiacutetol 5

Fmalment en els capiacutetols 6 i 7 sanalitzen els resultats i sextreuen les conclusions

Lobjectiu del projecte eacutes comparar dos meacutetodes destimacioacute de dades amb

dependeacutencia espaial en el cas de dades amb distribucioacute experimental asimeacutetrica El

primer meacutetode sanornena krigeat lognormal el segon krigeat indicador

El krigeat lognormal parteix de la hipoacutetesis que les dades soacuten realitzacions dun

proceacutes espaial lognormal i consiste ix en aplicar la transformacioacute logariacutetmica a les

3

Capitol 2 Nocions de geoestadiacutestica

on E() denota el valor esperat

m eacutes un escalar constant que representa la mitjana

h eacutes la distancia vectorial en Iespai mostrejat

CovO eacutes la covariancia de la funcioacute aleatoria

Requisit 3 El krigeat simple requereix que la mitjana de la variable regionalitzada en

estudi sigui coneguda

Un cop shan tingut en compte aquests requ isits podem passar a la formulacioacute de

Iestimador

Sent Z una funcioacute aleatoria estacionaria de segon ordre amb mitjana m Iestimacioacute

Zk (xo) en la posicioacute Xove donada per la segOent combina cioacute lineal de variables

aleatories a les posicions Xi considerades en la mostra

k

Zk(XO) = m+ Lwiexcl(Z(xiexcl-m) =1

El proposit principal del krigeat simple eacutes trobar un conjunt de pesos per a la estimacioacute

en Iequacioacute anterior de forma que es minimitzi Ierror quadratic migo

La variancia daquest estimador ve donada per

n

OK(U) =C(O)- LWiexcl(u)C(u-uo) O =1

2212 El krigeat ordinari

El krigeat ordinari va sovint acompanyat del qualificatiu de BLUE Eacutes linear (lineal)

perqueacute les seves estimacions soacuten combinacions lineals ponderades de les dades

existents Eacutes unbiased (no esbiaixat) perqueacute intenta que la miijana residual (mr) sia

igual a zero I eacutes bese (millor) perqueacute fa la variancia deis errors (cr2R) miacutenima

15

Capiacutetol 2 Nocions de geoestadiacutestica

Lavantatge que presenta el krigeat ordinari davant daltres metodes destimacioacute eacutes

precisament que fa miacutenima la variancia residual ja que nhi ha que tambeacute soacuten lineals i

no esbiaixats

Com hem dit anteriorment el krigeat simple requereix el coneixement de la mitjana per

resoldre el problema de trobar els pesos que miacutenimitzin la variancia de Ierror

destimacioacute Si la mitjana no eacutes coneguda sera convenient utilitzar el krigeat ordinari

Iestimacioacute del qual eacutes independent de la mitjana ja que safegeix la restriccioacute de que

els pesos han de sumar 1 daquesta manera els pesos de la mitjana a Iequacioacute

(2221) sumen O i Iestimacioacute depeacuten norneacutes de la mostra

(2221)

Aixiacute dones podem afirmar que el krigeat ordinari no eacutes res rneacutes que un krigeat simple

que compleix la condicioacute que els pesos tenen una suma unitaria

Considerem una funcioacute aleatoria Z estacionaria de segon ordre Lestimador Zk(XO )

en la posicioacute ve donada per les seguumlents combinacions lineals de les variables Xo

aleatories a les posicions Xi considerades en la mostra

k

Zk(XO) =LwiexclZ(xJ iexcl=l

subjecte a Lk

Wiexcl = 1 =1

Les principals propietats del krigeat ordinari soacuten

- Minimitza error quadratic migo

-Interpolacioacute exacte amb variancia de krigeat O

- Independencia de la translacioacute deis nodes de referencia

- Dependencia del patroacute de la mostra

- Independencia de la variancia de krigeat per les observacions individuals

16

Capiacutetol2 Nocions de geoestadiacutestica

23 Simulacioacute sequumlencial gaussiana

La simulacioacute sequumlencial gaussiana es basa en la simulacioacute de dades a partir duna variable

continua de distribucioacute normal que a meacutes ha de ser estandarditzada En geoestadiacutestica

susa la simulacioacute per tal de poder coneacuteixer el valors de la variable en estudi en punts no

mostrejats En el nostre cas Ihem usat per tal de poder tenir dades a partir de les quals fer

Iestudi Per tant nomeacutes detallarem la seva mecanica

1 Determinar la funcioacute de distribucioacute Fz(z) que representa tota Iarea destudi i no norneacutes

els punts mostrejats

2 Transformar Fz(z) en una distribucioacute Normal (01)

3 Comprovar que realment la nova variable (Y) es distribueix normalment En el cas que

no shagi pogut conservar el model gaussia considerar models aHematius com ara una

barreja de poblacions gaussianes o beacute plantejar-se fer un altre tipus de simulacioacute

estocastica

4 A partir daquiacute ja podem usar meacutetodes computacionals que actuen de la seguumlent

manera

41 Es crea una ruta que consisteix en la visita una sola vegada de cada node (u) de la

xarxa De cada node visitat es reteacute un nombre maxim de nodes veins per tal de

poder fer simulacioacute condicionada

42 Escollir un tipus de krigeat i un tipus de semivariograma per tal de poder determinar

la mitjana i la variancia de la funcioacute de distribucioacute condicionada Y(u) en la localitzacioacute

u

43 Treure un valor simulat yP)(u) de la funcioacute de distribucioacute condicionada

44 Afegir el valor simulat y(I)(U) al conjunt de dades

5 Continuar amb el seguumlent node fins que es simuli el darrer

FLUXOGRAMA DEL DESENVOLUPAMENT DEL PROJECTE

Simulem 625 dades (25x25) duna N(01) amb un variograma

exponencial SGSIM

Fem Iexponencial de les dades per obtenir una distribucioacute lognormai

Prenem una mostra r-1-----i aleatoria de 100 dades r------- ~ MINITAB

Decidim 5 cut-offs a partir

deis percentils MINITAB

Obtenim els variogrames per a cada cut-off i hi aproximem un modelo

GEO-EAS EXCEL

Realitzem el Krigeado indicador simultani per

cada cut-off IK3D

j Realitzem la

interpolacioacute de la mediana

POSTIK

Fem els logaritmes Obtenim el model

de variograma per la mostra GEO-EAS

EXCEL

Realitzem el Krigeado ordinario

KB2D

Realitzem la transformacioacute de les

dades per obtenir una xarxa amb distribucioacute

Iqgnormai

1------1-~ Apliquem la funcioacute ~

logaritme a les dades L-___________-I~ per tal de poder-les 1--___-

comparar

Comparem els dos meacutetodes destimacioacute entre si i amb les dades simulades Calculem ISTRESS i grafiquem els

1 CONCLUSIOacute I resultats FORTRAN MINITA8

Capiacutetol 5 Desenvolupament del projecte

Tot estudi geoestadiacutestic segueix un guioacute de treball

bull Determinacioacute i analisi de Iestructura espaial

bull Modelitzacioacute de la variabilitat espaial

bull Estimacioacute de punts no mostrejats

bull Simulacioacute

bull Conclusions i descripcioacute de la zona estudiada

En el nostre cas malgrat no teniacuter dades reals i que el nostre objectiu no sia el coneixement

de la variable regionalitzada sinoacute el comparar dos metodes destimacioacute el proceacutes sera el

mateix Luacutenica diferencia eacutes que nosaltres fem una simulacioacute per tal dobtenir una base de

realitat a partir de la qual comenyar a treballar i no per tenir realitzacions de punts no

mostrejats Per tant en el nostre cas la simulacioacute esdeveacute el primer pas a realitzar

Capitol 5 Desenvolupament del projecte

51 La simulacioacute

Per tal de tenir una regi6 en la que poder treballar construim una xarxa de 25x25x1 eacutes a

dir treballem a R2bull

Volem obtenir una realitzaci6 en cada un deis nodes de la xarxa per tant realitzem una

simulaci6 de 625 dades Figura 511

Ix= o 1 2 23 24

~ yslz= 004 J

l

~] iexcllo

-t yrnn==O

-- xsiz== 004T-Eshy

o 11

~

Figura 511 Xarxa sobre la que es treballa i punts mostrejats

En el camp de la geologiacutea eacutes molt difiacutecil obtenir gaires mostres duna regi6 per aix6 els

meacutetodes de simulaci6 i destimaci6 s6n tant importants en geoestadiacutestica Com que a

nosaltres ens interesa tenir una xarxa complerta (perqueacute el que ens interessa eacutes veure quin

deis dos meacutetodes destimaci6 eacutes millor i no el saber com eacutes la regi6) el que fem eacutes simular

realitzacions duna N(O1) amb semiacutevariograma exponencial de meseta unitat en tots els

nodes de la nostre xarxa Sha escollit aquest tipus de semivariograma per ser el meacutes

habitual en el camp de la geologiacutea [ref 2]

En aquestes dad es els hi apliquem exponencials i per tant la nostra realitat segueix una

distribuci6 lognormal de mitjana unitat

El fet de treballar sobre dades lognormals ve justificat perque hi ha molts fenomens naturals

que segueixen aquesta distribuci6 [ref 11] (cerca de determinat mineral bosses de petrali

quantitat de sediments exploracions geoquimiques )

Per tant la nostre realitat eacutes aquesta eacutes a dir la distribuci6 lognormal de la variable

regionalitzada La N(O1) tant sois la fem servir per ser facil de maniobrar

computacionalment [ref 16]

Capiacutetol5 Desenvolupament del projecte

Per tal dassegurant-se que la nostre realitat eacutes mes o menys exacta mirem la seguumlent taula

Variable N Mean Median StDev SE Mean Hin 121 123

exp(siacutem) 625 10546 07742 10075 00403 00250 95965 03934 13721

Taula 511 Descriptiva de la variable regionalitzada exp(sim)

Amb els seguumlents grafics comprovem que realment les nostres dades segueixen una

distribucioacute lognormal

-200

() e Q) J CT 100 ~

IJ -

o

o 5 10 exp(sim)

Figura 512 Histograma de la realitat

Jo

Capiacutetol 5 Desenvolupament del projecte

Lognormal Probablllty Plot tor exp(sim)

Ml Estimates

l ocatiolt -0325300

Scale 0910009

99

95 90

80 70

e 60 (lJ 50 Uuml 40 shy 30 (lJ 20 a

10

5

001 010 100 1000

Data

Figura 513 Lognormal probability plot de la variable regionalitzada exp(sim)

exp(sim)

10

B

7

6 5

4

2

20

Figura 514 Surface plot de la variable exp(sim)

Capiacutetol 5 Desenvolupament del projecte

El surface plot eacutes una eina molt uacutetil ja que ens doacutena una visioacute de com es la nostra realitat a

Iespai A meacutes un cop haguem fet les dues estimacions tambeacute podrem fer el surface plot i

amb un cop dull podrem treure una primera impressioacute de si les estimacions han estat bones

o no

Capiacutetol 5 Desenvolupament del projecte

52 La mostra

A partir de les dades que hem obtingut amb la simulacioacute prenem una mostra aleatoria

de 100 dades a partir de la qual realitzarem les dues estimacions de la realitat Cal

tenir en compte que a partir daquest moment es treballara sobre la mostra i no sobre

les dades simulades que en Iexperimentacioacute real soacuten desconegudes

La mostra sha pres de forma que constitueixi una bona representacioacute del total de la

xarxa La figura 521 mostra la localitzacioacute de cada una de les dades que formen part

de la mostra sobre la xarxa inicial de 25x25 nodes

20 shy

gt x middotcv 10 _

o shy

middot o

bull It bullbullbullbullbullbull bull middot 4 bull bull bull bullbullbull bullbullbullbull bull bull bullbullbullbullbull bull bull bull bull bull bullbullbullbullbull bull bull bullbullbull -Jf bull middot middot middot bull middot 1t bullbullbullbull bullbullbullmiddot o bull bull bull bull bullbull bull bull bull bullbull II JI Jt bull bullbullbull lttt bullbullbull bullbullbull bullbull bull bull bull bullbull bull shy ~ ~ ~ ~ ~ It bull bull bullbullbull bull bull bullbullbull bullbull bull bullbullbullbull bullbull bull bull bull bullbullbullbullbullbull ti bull bull -41 bull bull bull bull bull bull jf middot bull bullbullbull -If bull bull bull 1( bull bullbull bull middot middot - bullbullbullbullbull bull bullbull bullbullbullbullbullbull bull bull bull bullbullbullbull bullbull bull

o 10 20

eix x

Figura 521 Distribucioacute de la mostra dins la xarxa real

La mostra obtinguda conserva les propietats de les dades provinents de la simulacioacute

daquesta manera podem afirmar que eacutes una bona extrapolacioacute de la realitat Vegem a

continuacioacute la descriptiva (Taula 52 1) i Ihistograma de la mostra (Figura 522) amb el

grafic de probabilitats (Figura 52 3) Podem observar que segueix efectivament una

distribucioacute lognormal

Variable N Mean Median TrMean StDev SE Mean rnos tra 1 00 1 0552 0 8330 0 9458 0 9566 0 0957

Variable Minimum Maximum Ql Q3 rnost ra 0 0250 441 85 0 328 1 1 3714

Taula 521 Descriptiva de la mostra

33

Capiacutetol 5 Desenvoluparnent del proiecte

30

gtshyo 20c Q) J oshy~

LL 10

-

1--

- --r--

n I Io

o 2 3 4 5 mostra

Figura 522 Histograma de la mostra

Lognormal Probability Plot for mostra

99

I 95

_ 90 - l -~80 70c jIQ) 60

50e 40Q) 30a 20

10 5

bull

~

001 010 100 1000

Data

MLEstimaacutee5

LocaIion -0341481

Scaacutee 0946372

Figura 523 Plot de probabilitat lognormal

34

Capiacutetol 5 Desenvolupament del projecte

La superfiacutecie descrita per la mostra podem representar-la tambeacute graficament (Figura

524)

mostra

45

40

3 5

30

25

20 15

10

05

00

eixy 20

Figura 524 Superfiacutecie definida per la mostra

35

Capiacutetol 5 Desenvolupament del projecte

53 Lestimacioacute per krigeat indicador

Per tal de realitzar el krigeat indicador definim 5 punts de tall o cut-off Aquests punts de tall

els escollim de forma que guardin simetria respecte el percentil del 50 tal i com mostra la

taula 531

Categoria Percentil Percentatge

1 90 009952

2 300 037637

3 500 073142

4 700 127046

5 910 254092

Taula 531 Els cinc punts de tall escollits

Un cop decidides les categories o punts de tall necessitem saber el semivariograma que

segueixen cada una delles per a poder dur a terme el krigeat indicador ja que Iestimacioacute

realitzada a partir daquest rneacutetode requereix una modelitzacioacute deis cinc semivariogrames

experimentals

El procediment eacutes el seguumlent

Partim de la mostra de 100 dades que segueix una distribucioacute 10gnormaL

Per cada una de les categories creem una columna de O i 1 de manera que si aquell

punt concret eacutes per sota del punt de tall el valor que pren la variable dicotoacutemica eacutes 1 i si eacutes

per sobre pren el valor O

Els semivariogrames els creem amb aquestes cinc columnes de zeros i uns

Per cada semivariograma provem dajustar un model esfeacuteric i un dexponencial Aquests dos

tipus de models els anirem ajustant a ull movent el valor del rang i de Iabast Partim

daquests models per ser els meacutes habituals en la realitat i ens quedarem amb el que ajusti millor deis dos [ref 2]

A continuacioacute presentem els resultats daquests ajustaments per a cada punt de tall

Capiacutetol 5 Desenvolupament del proiecte

Categoriacutea 1 y(h)

Model Exponencial Abast =8 Model Esferic Abast = 75

Meseta =003 Meseta = 003

VARIOGRANlA CATEGORIA 1

005

004 sectr bull ESF= ro E 003 E ro O)

002

001

000

o 2 4 6 8 10 12

Ihl

Figura 531 Model de semivariograma esfeacuteric i exponencial per la categoria 1

)1

Capiacutetol 5 Desenvolupament del projecte

Categoria 2

Model Exponencial Abast = 4 Model Esferic Abast = 4

Meseta = 022 Meseta = 022

VARIOGRAMA CATEGORIA 2

025

--

c bull ESF- sectro 020

E E ro Ogt

015

010

8 10 12

Figura 532 Model de semivariograma esferic i exponencial per la categoria 2

o 2 4 6

Ihl

Capitol 5 Desenvolupament del projecte

Categoriacutea 3

ModeJ Exponencial Abast =7 ModeJ Esferic Abast =6

Meseta =027 Meseta = 0265

VARIOGRAMA CATEGORIA 3

03

~ c (1] ~E 02E (1]

Ogt

01

o 2 4 6

Ihl

Figura 533 Model de semivariograma esfeacuteric i exponencial per la categoria 3

8 10 12

)9

Capiacutetol 5 Desenvolupament del projecte

Categoria 4

Model Exponencial Abast = 5 Model Esfeacuteric Abast = 4

Meseta = 02 Meseta = 02

VARIOGRAMA CATEGORIA 4

03

~ ~ -- ro E ~

02 E ro Ogt

01

deg 2 4 6

Ihl

Figura 534 Model de semivariograma esfeacuteric i exponencial per la categoria 4

8 10 12

Capiacutetol 5 Desenvolupament del projecte

Categoriacutea 5

Model Exponencial Abast =4 Model Esferic Abast = 3

Meseta =006 Meseta = 006

VARIOGRAMA CATEGORIA 5

008

= sect~ 007-shy ESFro E E 006 ro Ol

005

004

003

o 2 4 6 8 10 12

Ihl

Figura 535 Model de semivariograma esfeacuteric i exponencial per la categoria 5

Capiacutetol5 Desenvolupament del projecte

Mirant els cinc grafics veiem que el model que ajusta millor eacutes Iesferic en tots els casos

encara que no hi ha diferencies massa significatives respecte el model exponencial A meacutes

observem una certa simetria pel que fa a la meseta i abast de cada un deis models esferics

de cada categoria Taula 532

Cat 1 Cat2 Cat3 Cat4 Cat5

Meseta 003 022 0265 02 006

Abast 75 4 6 4 3

Taula 532 Meseta i abast per cada categoria

Aquesta simetria sobserva sobretot per les categories 2 3 i 4

Els models corresponents a les categories 1 i 5 no ajusten del tot beacute degut a que soacuten les

categories deis extrems i per tant la gran majoria de mostres si no totes estaran per sobre o

per sota respectivament

Ara ja podem fer Iestimacioacute per krigeat indicador Al programa ik3d li introduim els cinc

models de semivariogrames per tal que ens calculi Iestimacioacute

El resultat que obtenim soacuten cinc columnes de 625 dades on els valors van de O a 1

Concretament ens calcula la probabilitat de que el valor atorgat a cada punt sigui inferior al

daquell cut-off

El que es preteacuten ara eacutes a partir daquest conjunt de probabilitats interpolar la mediana per a

cada un deis punts de la xarxa per tant el que fem eacutes executar el programa postik en Iopcioacute

3 de manera que ens tregui Iestimacioacute de la mediana

A continuacioacute passem a detallar en que consisteix el postik Per tal de poder-ho expressar

millor ens centrare m en un punt concret de la xarxa el (30)

- - - - -

Capiacutetol 5 Desenvolupament del projecte

Els tercer valor de cada una de les 5 columnes obtingudes amb el krigeat indicador eacutes a dir

els valors corresponents a la mostra situada en el node (30) representen la probabilitat de

que el valor de la variable en aquest punt sigui major que cada un deis cut-off

respectivament aixiacute podem afirmar que

P(Xiexcl lt el ) = P(x(3Q) lt 00995) =00000

P(xiexcl lt e2) = P(X(3 Q) lt 03764) =00397

P(xiexcl lt c3) = P(X(30) lt 07314) = 00409

P(xiexcl lt e4) = P(X(30) lt 12705) = 02079

P(xiexcl lt e5) = P(X(3 0) lt 25402) =10000

Si ara grafiquem aquests 5 valors obtenim una estimacioacute de la probabilitat que teacute el punt

estudiat (30) de ser meacutes petit que qualsevol valor eacutes a dir Iestimacioacute de la funcioacute de

probabilitat en aquest punt Com que el que es preteacuten estimar en el nostre estudi eacutes la

mediana mirarem quin valor aproxima per la probabilitat del 05 eacutes a dir

m tal que P(X(30) lt m) = 05

Per aixoacute tracem una liacutenia a Ialcada 05 i daquesta manera obtenim el valor estimat de la

mediana Aquest valor correspon al valor que obtenim amb el POSTIK que eacutes per aquesta

primera observacioacute 06983

10

x v 6 68 05 o

00

Figura 536 Els 5 cut-off aplicats al punt (30)

Capiacutetol 5 Desenvolupament del projecte

Laplicacioacute del POSTIK realitza aquesta estimacioacute per a cada un deis punts obtinguts (625)

i daquesta manera podem obten ir una interpolacioacute de la mediana per cada un deis valors a

estimar

Capiacutetol 5 Desenvolupament del projecte

SEMIVARIOGRAMA DE LA MOSTRA

model exponencial

12

= r 07 -- ca E E ca O)

02

o 2 4 6 8 10 12

Ihl

Figura 541 Semivariograma experimental amb un model exponencial

Aquest model obtingut a ull teacute els seguumlents parametres abast=7

meseta=1 05

Aplicant aquest valors al model general obtenim la formulacioacute per a les nostres dades

46

middotCapiacutetol 5 Desenvolupament del projecte

MODEL ESFERIC La formulacioacute general eacutes

sih a

sih gt a

on a eacutes Iabast i c la meseta

SEMIVARIOGRAMA DE LA MOSTRA

model esferic

12

---shyro E 07 E ro Ol

02

o 2 4 6 8 10 12

Ihl

Figura 54 2 Semivariograma experimental amb un model esfeacuterico

Aquest model Ihem obtingut de la mateixa manera que Ianterior a ull i els seus

parametres que tambeacute aplicarem a la forma general soacuten abast=6 i meseta=1

47

Capiacutetol 5 Desenvolupament del projecte

Finalment pode m representar la superfiacutecie que hem estimat a partir del krigeat

lognormal utilitzant un grafic de superfiacutecie (Figura 54 5)

6

5

Krig Logn 3

2

o

20 eix y

Figura 545 Grafic de superfiacutecie pel krigeat lognormal

50

Capiacutetol 6Comparacioacute deis resultats obtinguts

61 Regressioacute lineal

Per tal de dur a terme la compara cioacute entre els dos meacutetodes destimacioacute i les dades que

simulen la realitat hem expressat els resultats obtinguts graficament mitjancant els

grafics de punts ajustant en cada cas la recta de regressioacute i dibuixant la bisectriu Cal

tenir en compte que per augmentar la claredat i per a simplificar la interpretacioacute deis

resultat hem transformat les dades a una N(O1) encara que el nostre estudi es basi en

un model lognormal

Passem a continuacioacute a analitzar els grafics

En primer lIoc (Figura 611) tenim el grafic de punts entre les dades obtingudes amb el

primer meacutetode destimacioacute el krigeat lognormal i les dades provinents de la simula cioacute

de la realitat

Regression Plot y =3a1E -02jo O6lt40216X

R-Sq = 594

_0 ro

ro EID o middot Ole

~~ -2

-3

- -3 -2 -1

redade regresioacute

Bisectriu

realitat simulada

Figura 611 Recta de regressioacute entre el krigeat lognormal i la simulacioacute de la realitat

Si mirem aquest grafic podem observar que el valor de Iestimacioacute realitzada

sobreestima els valors petits de la simulacioacute i en canvi en els valors grans subestima

El coeficient de correlacioacute es del 594 eacutes a dir que el meacutetode del krigeat lognormal

explica un 594 de la realitat

52

Capiacutetol 6Comparacioacute deis resultats obtinguts

Passem ara a realitzar el gratic entre el segon meto de destimacioacute el krigeat indicador

i la realitat simulada (Figura 612)

0 _O

m~ 0)-- o

~~ -1

-2

-3

Regression Plot y = -23E-02 + 0711 615X

R-Sq 526

bull bull

-3 -2 -1

realitat simulada

recta de regresi oacute

I Bisectriu

Figura 612 Recta de regressioacute entre el krigeat indicador i la simulacioacute de la realitat

Podem observar que el gratic obtingut eacutes molt semblant a Ianterior i que ens trobem

amb el mateix problema de sobreestimacioacute deis valors petits i subestimacioacute deis valors

grans de la simulacioacute

El valor del coeticient de correlacioacute tambeacute eacutes torga semblant 52 6 Aixiacute doncs la

realitat eacutes explicada en un 526 pel krigeat indicador

53

Capiacutetol 6Comparacioacute deis resultats obtinguts

Finalment i per tenir una idea de la relacioacute que hi ha entre els dos meacutetodes emprats en

el projecte realitzarem un uacuteltim grafic comparatiu (Figura 613) que representa els dos

meacutetodes destimacioacute el krigeat lognormal i el krigeat indicador

Regression Plot y = -7 SE-02 + 105401X

R-Sq 796

middot2

middot3

recta de regresi6

bull Bisectriu

middot 4 middot3 middot2 -1

krigeat lognormal

Figura 613 Recta de regressioacute entre el krigeat lognormal i el krigeat indicador

En aquest cas podem observar que la recta de regressioacute coincideix gairebeacute a la

perfeccioacute amb la bisectriu cosa que vol dir que els dos meacutetodes soacuten molt semblants

entre siacute i que per tant eacutes normal que Iaproximacioacute de cada un dells a la realitat sigui

semblant

El valor de la regressioacute eacutes meacutes gran que en els altres dos casos 796 eacutes a dir que

els dos meacutetodes no donen resultats significativament diferents entre si

Podem observar un conjunt de dades que prenen valors especialment elevats en

Iestimacioacute per krigeat indicador Si analitzem aquests punts podem comprovar que

soacuten punts que tenen una probabilitat de ser meacutes grans que el cinqueacute cut-off (percentil

097) igual a 1 Per tant aquest tipus de punts no shan de tenir en compte en el

moment dextreure conclusions De fet aixo ja es sospitava en el grafic anterior pero

en que en aquell hi ha una elevada dispersioacute i per tant Iefecte queda dissimulat

54

Capitol 2 Nocions de geoestadiacutestica

on E() denota el valor esperat

m eacutes un escalar constant que representa la mitjana

h eacutes la distancia vectorial en Iespai mostrejat

CovO eacutes la covariancia de la funcioacute aleatoria

Requisit 3 El krigeat simple requereix que la mitjana de la variable regionalitzada en

estudi sigui coneguda

Un cop shan tingut en compte aquests requ isits podem passar a la formulacioacute de

Iestimador

Sent Z una funcioacute aleatoria estacionaria de segon ordre amb mitjana m Iestimacioacute

Zk (xo) en la posicioacute Xove donada per la segOent combina cioacute lineal de variables

aleatories a les posicions Xi considerades en la mostra

k

Zk(XO) = m+ Lwiexcl(Z(xiexcl-m) =1

El proposit principal del krigeat simple eacutes trobar un conjunt de pesos per a la estimacioacute

en Iequacioacute anterior de forma que es minimitzi Ierror quadratic migo

La variancia daquest estimador ve donada per

n

OK(U) =C(O)- LWiexcl(u)C(u-uo) O =1

2212 El krigeat ordinari

El krigeat ordinari va sovint acompanyat del qualificatiu de BLUE Eacutes linear (lineal)

perqueacute les seves estimacions soacuten combinacions lineals ponderades de les dades

existents Eacutes unbiased (no esbiaixat) perqueacute intenta que la miijana residual (mr) sia

igual a zero I eacutes bese (millor) perqueacute fa la variancia deis errors (cr2R) miacutenima

15

Capiacutetol 2 Nocions de geoestadiacutestica

Lavantatge que presenta el krigeat ordinari davant daltres metodes destimacioacute eacutes

precisament que fa miacutenima la variancia residual ja que nhi ha que tambeacute soacuten lineals i

no esbiaixats

Com hem dit anteriorment el krigeat simple requereix el coneixement de la mitjana per

resoldre el problema de trobar els pesos que miacutenimitzin la variancia de Ierror

destimacioacute Si la mitjana no eacutes coneguda sera convenient utilitzar el krigeat ordinari

Iestimacioacute del qual eacutes independent de la mitjana ja que safegeix la restriccioacute de que

els pesos han de sumar 1 daquesta manera els pesos de la mitjana a Iequacioacute

(2221) sumen O i Iestimacioacute depeacuten norneacutes de la mostra

(2221)

Aixiacute dones podem afirmar que el krigeat ordinari no eacutes res rneacutes que un krigeat simple

que compleix la condicioacute que els pesos tenen una suma unitaria

Considerem una funcioacute aleatoria Z estacionaria de segon ordre Lestimador Zk(XO )

en la posicioacute ve donada per les seguumlents combinacions lineals de les variables Xo

aleatories a les posicions Xi considerades en la mostra

k

Zk(XO) =LwiexclZ(xJ iexcl=l

subjecte a Lk

Wiexcl = 1 =1

Les principals propietats del krigeat ordinari soacuten

- Minimitza error quadratic migo

-Interpolacioacute exacte amb variancia de krigeat O

- Independencia de la translacioacute deis nodes de referencia

- Dependencia del patroacute de la mostra

- Independencia de la variancia de krigeat per les observacions individuals

16

Capiacutetol2 Nocions de geoestadiacutestica

23 Simulacioacute sequumlencial gaussiana

La simulacioacute sequumlencial gaussiana es basa en la simulacioacute de dades a partir duna variable

continua de distribucioacute normal que a meacutes ha de ser estandarditzada En geoestadiacutestica

susa la simulacioacute per tal de poder coneacuteixer el valors de la variable en estudi en punts no

mostrejats En el nostre cas Ihem usat per tal de poder tenir dades a partir de les quals fer

Iestudi Per tant nomeacutes detallarem la seva mecanica

1 Determinar la funcioacute de distribucioacute Fz(z) que representa tota Iarea destudi i no norneacutes

els punts mostrejats

2 Transformar Fz(z) en una distribucioacute Normal (01)

3 Comprovar que realment la nova variable (Y) es distribueix normalment En el cas que

no shagi pogut conservar el model gaussia considerar models aHematius com ara una

barreja de poblacions gaussianes o beacute plantejar-se fer un altre tipus de simulacioacute

estocastica

4 A partir daquiacute ja podem usar meacutetodes computacionals que actuen de la seguumlent

manera

41 Es crea una ruta que consisteix en la visita una sola vegada de cada node (u) de la

xarxa De cada node visitat es reteacute un nombre maxim de nodes veins per tal de

poder fer simulacioacute condicionada

42 Escollir un tipus de krigeat i un tipus de semivariograma per tal de poder determinar

la mitjana i la variancia de la funcioacute de distribucioacute condicionada Y(u) en la localitzacioacute

u

43 Treure un valor simulat yP)(u) de la funcioacute de distribucioacute condicionada

44 Afegir el valor simulat y(I)(U) al conjunt de dades

5 Continuar amb el seguumlent node fins que es simuli el darrer

FLUXOGRAMA DEL DESENVOLUPAMENT DEL PROJECTE

Simulem 625 dades (25x25) duna N(01) amb un variograma

exponencial SGSIM

Fem Iexponencial de les dades per obtenir una distribucioacute lognormai

Prenem una mostra r-1-----i aleatoria de 100 dades r------- ~ MINITAB

Decidim 5 cut-offs a partir

deis percentils MINITAB

Obtenim els variogrames per a cada cut-off i hi aproximem un modelo

GEO-EAS EXCEL

Realitzem el Krigeado indicador simultani per

cada cut-off IK3D

j Realitzem la

interpolacioacute de la mediana

POSTIK

Fem els logaritmes Obtenim el model

de variograma per la mostra GEO-EAS

EXCEL

Realitzem el Krigeado ordinario

KB2D

Realitzem la transformacioacute de les

dades per obtenir una xarxa amb distribucioacute

Iqgnormai

1------1-~ Apliquem la funcioacute ~

logaritme a les dades L-___________-I~ per tal de poder-les 1--___-

comparar

Comparem els dos meacutetodes destimacioacute entre si i amb les dades simulades Calculem ISTRESS i grafiquem els

1 CONCLUSIOacute I resultats FORTRAN MINITA8

Capiacutetol 5 Desenvolupament del projecte

Tot estudi geoestadiacutestic segueix un guioacute de treball

bull Determinacioacute i analisi de Iestructura espaial

bull Modelitzacioacute de la variabilitat espaial

bull Estimacioacute de punts no mostrejats

bull Simulacioacute

bull Conclusions i descripcioacute de la zona estudiada

En el nostre cas malgrat no teniacuter dades reals i que el nostre objectiu no sia el coneixement

de la variable regionalitzada sinoacute el comparar dos metodes destimacioacute el proceacutes sera el

mateix Luacutenica diferencia eacutes que nosaltres fem una simulacioacute per tal dobtenir una base de

realitat a partir de la qual comenyar a treballar i no per tenir realitzacions de punts no

mostrejats Per tant en el nostre cas la simulacioacute esdeveacute el primer pas a realitzar

Capitol 5 Desenvolupament del projecte

51 La simulacioacute

Per tal de tenir una regi6 en la que poder treballar construim una xarxa de 25x25x1 eacutes a

dir treballem a R2bull

Volem obtenir una realitzaci6 en cada un deis nodes de la xarxa per tant realitzem una

simulaci6 de 625 dades Figura 511

Ix= o 1 2 23 24

~ yslz= 004 J

l

~] iexcllo

-t yrnn==O

-- xsiz== 004T-Eshy

o 11

~

Figura 511 Xarxa sobre la que es treballa i punts mostrejats

En el camp de la geologiacutea eacutes molt difiacutecil obtenir gaires mostres duna regi6 per aix6 els

meacutetodes de simulaci6 i destimaci6 s6n tant importants en geoestadiacutestica Com que a

nosaltres ens interesa tenir una xarxa complerta (perqueacute el que ens interessa eacutes veure quin

deis dos meacutetodes destimaci6 eacutes millor i no el saber com eacutes la regi6) el que fem eacutes simular

realitzacions duna N(O1) amb semiacutevariograma exponencial de meseta unitat en tots els

nodes de la nostre xarxa Sha escollit aquest tipus de semivariograma per ser el meacutes

habitual en el camp de la geologiacutea [ref 2]

En aquestes dad es els hi apliquem exponencials i per tant la nostra realitat segueix una

distribuci6 lognormal de mitjana unitat

El fet de treballar sobre dades lognormals ve justificat perque hi ha molts fenomens naturals

que segueixen aquesta distribuci6 [ref 11] (cerca de determinat mineral bosses de petrali

quantitat de sediments exploracions geoquimiques )

Per tant la nostre realitat eacutes aquesta eacutes a dir la distribuci6 lognormal de la variable

regionalitzada La N(O1) tant sois la fem servir per ser facil de maniobrar

computacionalment [ref 16]

Capiacutetol5 Desenvolupament del projecte

Per tal dassegurant-se que la nostre realitat eacutes mes o menys exacta mirem la seguumlent taula

Variable N Mean Median StDev SE Mean Hin 121 123

exp(siacutem) 625 10546 07742 10075 00403 00250 95965 03934 13721

Taula 511 Descriptiva de la variable regionalitzada exp(sim)

Amb els seguumlents grafics comprovem que realment les nostres dades segueixen una

distribucioacute lognormal

-200

() e Q) J CT 100 ~

IJ -

o

o 5 10 exp(sim)

Figura 512 Histograma de la realitat

Jo

Capiacutetol 5 Desenvolupament del projecte

Lognormal Probablllty Plot tor exp(sim)

Ml Estimates

l ocatiolt -0325300

Scale 0910009

99

95 90

80 70

e 60 (lJ 50 Uuml 40 shy 30 (lJ 20 a

10

5

001 010 100 1000

Data

Figura 513 Lognormal probability plot de la variable regionalitzada exp(sim)

exp(sim)

10

B

7

6 5

4

2

20

Figura 514 Surface plot de la variable exp(sim)

Capiacutetol 5 Desenvolupament del projecte

El surface plot eacutes una eina molt uacutetil ja que ens doacutena una visioacute de com es la nostra realitat a

Iespai A meacutes un cop haguem fet les dues estimacions tambeacute podrem fer el surface plot i

amb un cop dull podrem treure una primera impressioacute de si les estimacions han estat bones

o no

Capiacutetol 5 Desenvolupament del projecte

52 La mostra

A partir de les dades que hem obtingut amb la simulacioacute prenem una mostra aleatoria

de 100 dades a partir de la qual realitzarem les dues estimacions de la realitat Cal

tenir en compte que a partir daquest moment es treballara sobre la mostra i no sobre

les dades simulades que en Iexperimentacioacute real soacuten desconegudes

La mostra sha pres de forma que constitueixi una bona representacioacute del total de la

xarxa La figura 521 mostra la localitzacioacute de cada una de les dades que formen part

de la mostra sobre la xarxa inicial de 25x25 nodes

20 shy

gt x middotcv 10 _

o shy

middot o

bull It bullbullbullbullbullbull bull middot 4 bull bull bull bullbullbull bullbullbullbull bull bull bullbullbullbullbull bull bull bull bull bull bullbullbullbullbull bull bull bullbullbull -Jf bull middot middot middot bull middot 1t bullbullbullbull bullbullbullmiddot o bull bull bull bull bullbull bull bull bull bullbull II JI Jt bull bullbullbull lttt bullbullbull bullbullbull bullbull bull bull bull bullbull bull shy ~ ~ ~ ~ ~ It bull bull bullbullbull bull bull bullbullbull bullbull bull bullbullbullbull bullbull bull bull bull bullbullbullbullbullbull ti bull bull -41 bull bull bull bull bull bull jf middot bull bullbullbull -If bull bull bull 1( bull bullbull bull middot middot - bullbullbullbullbull bull bullbull bullbullbullbullbullbull bull bull bull bullbullbullbull bullbull bull

o 10 20

eix x

Figura 521 Distribucioacute de la mostra dins la xarxa real

La mostra obtinguda conserva les propietats de les dades provinents de la simulacioacute

daquesta manera podem afirmar que eacutes una bona extrapolacioacute de la realitat Vegem a

continuacioacute la descriptiva (Taula 52 1) i Ihistograma de la mostra (Figura 522) amb el

grafic de probabilitats (Figura 52 3) Podem observar que segueix efectivament una

distribucioacute lognormal

Variable N Mean Median TrMean StDev SE Mean rnos tra 1 00 1 0552 0 8330 0 9458 0 9566 0 0957

Variable Minimum Maximum Ql Q3 rnost ra 0 0250 441 85 0 328 1 1 3714

Taula 521 Descriptiva de la mostra

33

Capiacutetol 5 Desenvoluparnent del proiecte

30

gtshyo 20c Q) J oshy~

LL 10

-

1--

- --r--

n I Io

o 2 3 4 5 mostra

Figura 522 Histograma de la mostra

Lognormal Probability Plot for mostra

99

I 95

_ 90 - l -~80 70c jIQ) 60

50e 40Q) 30a 20

10 5

bull

~

001 010 100 1000

Data

MLEstimaacutee5

LocaIion -0341481

Scaacutee 0946372

Figura 523 Plot de probabilitat lognormal

34

Capiacutetol 5 Desenvolupament del projecte

La superfiacutecie descrita per la mostra podem representar-la tambeacute graficament (Figura

524)

mostra

45

40

3 5

30

25

20 15

10

05

00

eixy 20

Figura 524 Superfiacutecie definida per la mostra

35

Capiacutetol 5 Desenvolupament del projecte

53 Lestimacioacute per krigeat indicador

Per tal de realitzar el krigeat indicador definim 5 punts de tall o cut-off Aquests punts de tall

els escollim de forma que guardin simetria respecte el percentil del 50 tal i com mostra la

taula 531

Categoria Percentil Percentatge

1 90 009952

2 300 037637

3 500 073142

4 700 127046

5 910 254092

Taula 531 Els cinc punts de tall escollits

Un cop decidides les categories o punts de tall necessitem saber el semivariograma que

segueixen cada una delles per a poder dur a terme el krigeat indicador ja que Iestimacioacute

realitzada a partir daquest rneacutetode requereix una modelitzacioacute deis cinc semivariogrames

experimentals

El procediment eacutes el seguumlent

Partim de la mostra de 100 dades que segueix una distribucioacute 10gnormaL

Per cada una de les categories creem una columna de O i 1 de manera que si aquell

punt concret eacutes per sota del punt de tall el valor que pren la variable dicotoacutemica eacutes 1 i si eacutes

per sobre pren el valor O

Els semivariogrames els creem amb aquestes cinc columnes de zeros i uns

Per cada semivariograma provem dajustar un model esfeacuteric i un dexponencial Aquests dos

tipus de models els anirem ajustant a ull movent el valor del rang i de Iabast Partim

daquests models per ser els meacutes habituals en la realitat i ens quedarem amb el que ajusti millor deis dos [ref 2]

A continuacioacute presentem els resultats daquests ajustaments per a cada punt de tall

Capiacutetol 5 Desenvolupament del proiecte

Categoriacutea 1 y(h)

Model Exponencial Abast =8 Model Esferic Abast = 75

Meseta =003 Meseta = 003

VARIOGRANlA CATEGORIA 1

005

004 sectr bull ESF= ro E 003 E ro O)

002

001

000

o 2 4 6 8 10 12

Ihl

Figura 531 Model de semivariograma esfeacuteric i exponencial per la categoria 1

)1

Capiacutetol 5 Desenvolupament del projecte

Categoria 2

Model Exponencial Abast = 4 Model Esferic Abast = 4

Meseta = 022 Meseta = 022

VARIOGRAMA CATEGORIA 2

025

--

c bull ESF- sectro 020

E E ro Ogt

015

010

8 10 12

Figura 532 Model de semivariograma esferic i exponencial per la categoria 2

o 2 4 6

Ihl

Capitol 5 Desenvolupament del projecte

Categoriacutea 3

ModeJ Exponencial Abast =7 ModeJ Esferic Abast =6

Meseta =027 Meseta = 0265

VARIOGRAMA CATEGORIA 3

03

~ c (1] ~E 02E (1]

Ogt

01

o 2 4 6

Ihl

Figura 533 Model de semivariograma esfeacuteric i exponencial per la categoria 3

8 10 12

)9

Capiacutetol 5 Desenvolupament del projecte

Categoria 4

Model Exponencial Abast = 5 Model Esfeacuteric Abast = 4

Meseta = 02 Meseta = 02

VARIOGRAMA CATEGORIA 4

03

~ ~ -- ro E ~

02 E ro Ogt

01

deg 2 4 6

Ihl

Figura 534 Model de semivariograma esfeacuteric i exponencial per la categoria 4

8 10 12

Capiacutetol 5 Desenvolupament del projecte

Categoriacutea 5

Model Exponencial Abast =4 Model Esferic Abast = 3

Meseta =006 Meseta = 006

VARIOGRAMA CATEGORIA 5

008

= sect~ 007-shy ESFro E E 006 ro Ol

005

004

003

o 2 4 6 8 10 12

Ihl

Figura 535 Model de semivariograma esfeacuteric i exponencial per la categoria 5

Capiacutetol5 Desenvolupament del projecte

Mirant els cinc grafics veiem que el model que ajusta millor eacutes Iesferic en tots els casos

encara que no hi ha diferencies massa significatives respecte el model exponencial A meacutes

observem una certa simetria pel que fa a la meseta i abast de cada un deis models esferics

de cada categoria Taula 532

Cat 1 Cat2 Cat3 Cat4 Cat5

Meseta 003 022 0265 02 006

Abast 75 4 6 4 3

Taula 532 Meseta i abast per cada categoria

Aquesta simetria sobserva sobretot per les categories 2 3 i 4

Els models corresponents a les categories 1 i 5 no ajusten del tot beacute degut a que soacuten les

categories deis extrems i per tant la gran majoria de mostres si no totes estaran per sobre o

per sota respectivament

Ara ja podem fer Iestimacioacute per krigeat indicador Al programa ik3d li introduim els cinc

models de semivariogrames per tal que ens calculi Iestimacioacute

El resultat que obtenim soacuten cinc columnes de 625 dades on els valors van de O a 1

Concretament ens calcula la probabilitat de que el valor atorgat a cada punt sigui inferior al

daquell cut-off

El que es preteacuten ara eacutes a partir daquest conjunt de probabilitats interpolar la mediana per a

cada un deis punts de la xarxa per tant el que fem eacutes executar el programa postik en Iopcioacute

3 de manera que ens tregui Iestimacioacute de la mediana

A continuacioacute passem a detallar en que consisteix el postik Per tal de poder-ho expressar

millor ens centrare m en un punt concret de la xarxa el (30)

- - - - -

Capiacutetol 5 Desenvolupament del projecte

Els tercer valor de cada una de les 5 columnes obtingudes amb el krigeat indicador eacutes a dir

els valors corresponents a la mostra situada en el node (30) representen la probabilitat de

que el valor de la variable en aquest punt sigui major que cada un deis cut-off

respectivament aixiacute podem afirmar que

P(Xiexcl lt el ) = P(x(3Q) lt 00995) =00000

P(xiexcl lt e2) = P(X(3 Q) lt 03764) =00397

P(xiexcl lt c3) = P(X(30) lt 07314) = 00409

P(xiexcl lt e4) = P(X(30) lt 12705) = 02079

P(xiexcl lt e5) = P(X(3 0) lt 25402) =10000

Si ara grafiquem aquests 5 valors obtenim una estimacioacute de la probabilitat que teacute el punt

estudiat (30) de ser meacutes petit que qualsevol valor eacutes a dir Iestimacioacute de la funcioacute de

probabilitat en aquest punt Com que el que es preteacuten estimar en el nostre estudi eacutes la

mediana mirarem quin valor aproxima per la probabilitat del 05 eacutes a dir

m tal que P(X(30) lt m) = 05

Per aixoacute tracem una liacutenia a Ialcada 05 i daquesta manera obtenim el valor estimat de la

mediana Aquest valor correspon al valor que obtenim amb el POSTIK que eacutes per aquesta

primera observacioacute 06983

10

x v 6 68 05 o

00

Figura 536 Els 5 cut-off aplicats al punt (30)

Capiacutetol 5 Desenvolupament del projecte

Laplicacioacute del POSTIK realitza aquesta estimacioacute per a cada un deis punts obtinguts (625)

i daquesta manera podem obten ir una interpolacioacute de la mediana per cada un deis valors a

estimar

Capiacutetol 5 Desenvolupament del projecte

SEMIVARIOGRAMA DE LA MOSTRA

model exponencial

12

= r 07 -- ca E E ca O)

02

o 2 4 6 8 10 12

Ihl

Figura 541 Semivariograma experimental amb un model exponencial

Aquest model obtingut a ull teacute els seguumlents parametres abast=7

meseta=1 05

Aplicant aquest valors al model general obtenim la formulacioacute per a les nostres dades

46

middotCapiacutetol 5 Desenvolupament del projecte

MODEL ESFERIC La formulacioacute general eacutes

sih a

sih gt a

on a eacutes Iabast i c la meseta

SEMIVARIOGRAMA DE LA MOSTRA

model esferic

12

---shyro E 07 E ro Ol

02

o 2 4 6 8 10 12

Ihl

Figura 54 2 Semivariograma experimental amb un model esfeacuterico

Aquest model Ihem obtingut de la mateixa manera que Ianterior a ull i els seus

parametres que tambeacute aplicarem a la forma general soacuten abast=6 i meseta=1

47

Capiacutetol 5 Desenvolupament del projecte

Finalment pode m representar la superfiacutecie que hem estimat a partir del krigeat

lognormal utilitzant un grafic de superfiacutecie (Figura 54 5)

6

5

Krig Logn 3

2

o

20 eix y

Figura 545 Grafic de superfiacutecie pel krigeat lognormal

50

Capiacutetol 6Comparacioacute deis resultats obtinguts

61 Regressioacute lineal

Per tal de dur a terme la compara cioacute entre els dos meacutetodes destimacioacute i les dades que

simulen la realitat hem expressat els resultats obtinguts graficament mitjancant els

grafics de punts ajustant en cada cas la recta de regressioacute i dibuixant la bisectriu Cal

tenir en compte que per augmentar la claredat i per a simplificar la interpretacioacute deis

resultat hem transformat les dades a una N(O1) encara que el nostre estudi es basi en

un model lognormal

Passem a continuacioacute a analitzar els grafics

En primer lIoc (Figura 611) tenim el grafic de punts entre les dades obtingudes amb el

primer meacutetode destimacioacute el krigeat lognormal i les dades provinents de la simula cioacute

de la realitat

Regression Plot y =3a1E -02jo O6lt40216X

R-Sq = 594

_0 ro

ro EID o middot Ole

~~ -2

-3

- -3 -2 -1

redade regresioacute

Bisectriu

realitat simulada

Figura 611 Recta de regressioacute entre el krigeat lognormal i la simulacioacute de la realitat

Si mirem aquest grafic podem observar que el valor de Iestimacioacute realitzada

sobreestima els valors petits de la simulacioacute i en canvi en els valors grans subestima

El coeficient de correlacioacute es del 594 eacutes a dir que el meacutetode del krigeat lognormal

explica un 594 de la realitat

52

Capiacutetol 6Comparacioacute deis resultats obtinguts

Passem ara a realitzar el gratic entre el segon meto de destimacioacute el krigeat indicador

i la realitat simulada (Figura 612)

0 _O

m~ 0)-- o

~~ -1

-2

-3

Regression Plot y = -23E-02 + 0711 615X

R-Sq 526

bull bull

-3 -2 -1

realitat simulada

recta de regresi oacute

I Bisectriu

Figura 612 Recta de regressioacute entre el krigeat indicador i la simulacioacute de la realitat

Podem observar que el gratic obtingut eacutes molt semblant a Ianterior i que ens trobem

amb el mateix problema de sobreestimacioacute deis valors petits i subestimacioacute deis valors

grans de la simulacioacute

El valor del coeticient de correlacioacute tambeacute eacutes torga semblant 52 6 Aixiacute doncs la

realitat eacutes explicada en un 526 pel krigeat indicador

53

Capiacutetol 6Comparacioacute deis resultats obtinguts

Finalment i per tenir una idea de la relacioacute que hi ha entre els dos meacutetodes emprats en

el projecte realitzarem un uacuteltim grafic comparatiu (Figura 613) que representa els dos

meacutetodes destimacioacute el krigeat lognormal i el krigeat indicador

Regression Plot y = -7 SE-02 + 105401X

R-Sq 796

middot2

middot3

recta de regresi6

bull Bisectriu

middot 4 middot3 middot2 -1

krigeat lognormal

Figura 613 Recta de regressioacute entre el krigeat lognormal i el krigeat indicador

En aquest cas podem observar que la recta de regressioacute coincideix gairebeacute a la

perfeccioacute amb la bisectriu cosa que vol dir que els dos meacutetodes soacuten molt semblants

entre siacute i que per tant eacutes normal que Iaproximacioacute de cada un dells a la realitat sigui

semblant

El valor de la regressioacute eacutes meacutes gran que en els altres dos casos 796 eacutes a dir que

els dos meacutetodes no donen resultats significativament diferents entre si

Podem observar un conjunt de dades que prenen valors especialment elevats en

Iestimacioacute per krigeat indicador Si analitzem aquests punts podem comprovar que

soacuten punts que tenen una probabilitat de ser meacutes grans que el cinqueacute cut-off (percentil

097) igual a 1 Per tant aquest tipus de punts no shan de tenir en compte en el

moment dextreure conclusions De fet aixo ja es sospitava en el grafic anterior pero

en que en aquell hi ha una elevada dispersioacute i per tant Iefecte queda dissimulat

54

Capiacutetol 2 Nocions de geoestadiacutestica

Lavantatge que presenta el krigeat ordinari davant daltres metodes destimacioacute eacutes

precisament que fa miacutenima la variancia residual ja que nhi ha que tambeacute soacuten lineals i

no esbiaixats

Com hem dit anteriorment el krigeat simple requereix el coneixement de la mitjana per

resoldre el problema de trobar els pesos que miacutenimitzin la variancia de Ierror

destimacioacute Si la mitjana no eacutes coneguda sera convenient utilitzar el krigeat ordinari

Iestimacioacute del qual eacutes independent de la mitjana ja que safegeix la restriccioacute de que

els pesos han de sumar 1 daquesta manera els pesos de la mitjana a Iequacioacute

(2221) sumen O i Iestimacioacute depeacuten norneacutes de la mostra

(2221)

Aixiacute dones podem afirmar que el krigeat ordinari no eacutes res rneacutes que un krigeat simple

que compleix la condicioacute que els pesos tenen una suma unitaria

Considerem una funcioacute aleatoria Z estacionaria de segon ordre Lestimador Zk(XO )

en la posicioacute ve donada per les seguumlents combinacions lineals de les variables Xo

aleatories a les posicions Xi considerades en la mostra

k

Zk(XO) =LwiexclZ(xJ iexcl=l

subjecte a Lk

Wiexcl = 1 =1

Les principals propietats del krigeat ordinari soacuten

- Minimitza error quadratic migo

-Interpolacioacute exacte amb variancia de krigeat O

- Independencia de la translacioacute deis nodes de referencia

- Dependencia del patroacute de la mostra

- Independencia de la variancia de krigeat per les observacions individuals

16

Capiacutetol2 Nocions de geoestadiacutestica

23 Simulacioacute sequumlencial gaussiana

La simulacioacute sequumlencial gaussiana es basa en la simulacioacute de dades a partir duna variable

continua de distribucioacute normal que a meacutes ha de ser estandarditzada En geoestadiacutestica

susa la simulacioacute per tal de poder coneacuteixer el valors de la variable en estudi en punts no

mostrejats En el nostre cas Ihem usat per tal de poder tenir dades a partir de les quals fer

Iestudi Per tant nomeacutes detallarem la seva mecanica

1 Determinar la funcioacute de distribucioacute Fz(z) que representa tota Iarea destudi i no norneacutes

els punts mostrejats

2 Transformar Fz(z) en una distribucioacute Normal (01)

3 Comprovar que realment la nova variable (Y) es distribueix normalment En el cas que

no shagi pogut conservar el model gaussia considerar models aHematius com ara una

barreja de poblacions gaussianes o beacute plantejar-se fer un altre tipus de simulacioacute

estocastica

4 A partir daquiacute ja podem usar meacutetodes computacionals que actuen de la seguumlent

manera

41 Es crea una ruta que consisteix en la visita una sola vegada de cada node (u) de la

xarxa De cada node visitat es reteacute un nombre maxim de nodes veins per tal de

poder fer simulacioacute condicionada

42 Escollir un tipus de krigeat i un tipus de semivariograma per tal de poder determinar

la mitjana i la variancia de la funcioacute de distribucioacute condicionada Y(u) en la localitzacioacute

u

43 Treure un valor simulat yP)(u) de la funcioacute de distribucioacute condicionada

44 Afegir el valor simulat y(I)(U) al conjunt de dades

5 Continuar amb el seguumlent node fins que es simuli el darrer

FLUXOGRAMA DEL DESENVOLUPAMENT DEL PROJECTE

Simulem 625 dades (25x25) duna N(01) amb un variograma

exponencial SGSIM

Fem Iexponencial de les dades per obtenir una distribucioacute lognormai

Prenem una mostra r-1-----i aleatoria de 100 dades r------- ~ MINITAB

Decidim 5 cut-offs a partir

deis percentils MINITAB

Obtenim els variogrames per a cada cut-off i hi aproximem un modelo

GEO-EAS EXCEL

Realitzem el Krigeado indicador simultani per

cada cut-off IK3D

j Realitzem la

interpolacioacute de la mediana

POSTIK

Fem els logaritmes Obtenim el model

de variograma per la mostra GEO-EAS

EXCEL

Realitzem el Krigeado ordinario

KB2D

Realitzem la transformacioacute de les

dades per obtenir una xarxa amb distribucioacute

Iqgnormai

1------1-~ Apliquem la funcioacute ~

logaritme a les dades L-___________-I~ per tal de poder-les 1--___-

comparar

Comparem els dos meacutetodes destimacioacute entre si i amb les dades simulades Calculem ISTRESS i grafiquem els

1 CONCLUSIOacute I resultats FORTRAN MINITA8

Capiacutetol 5 Desenvolupament del projecte

Tot estudi geoestadiacutestic segueix un guioacute de treball

bull Determinacioacute i analisi de Iestructura espaial

bull Modelitzacioacute de la variabilitat espaial

bull Estimacioacute de punts no mostrejats

bull Simulacioacute

bull Conclusions i descripcioacute de la zona estudiada

En el nostre cas malgrat no teniacuter dades reals i que el nostre objectiu no sia el coneixement

de la variable regionalitzada sinoacute el comparar dos metodes destimacioacute el proceacutes sera el

mateix Luacutenica diferencia eacutes que nosaltres fem una simulacioacute per tal dobtenir una base de

realitat a partir de la qual comenyar a treballar i no per tenir realitzacions de punts no

mostrejats Per tant en el nostre cas la simulacioacute esdeveacute el primer pas a realitzar

Capitol 5 Desenvolupament del projecte

51 La simulacioacute

Per tal de tenir una regi6 en la que poder treballar construim una xarxa de 25x25x1 eacutes a

dir treballem a R2bull

Volem obtenir una realitzaci6 en cada un deis nodes de la xarxa per tant realitzem una

simulaci6 de 625 dades Figura 511

Ix= o 1 2 23 24

~ yslz= 004 J

l

~] iexcllo

-t yrnn==O

-- xsiz== 004T-Eshy

o 11

~

Figura 511 Xarxa sobre la que es treballa i punts mostrejats

En el camp de la geologiacutea eacutes molt difiacutecil obtenir gaires mostres duna regi6 per aix6 els

meacutetodes de simulaci6 i destimaci6 s6n tant importants en geoestadiacutestica Com que a

nosaltres ens interesa tenir una xarxa complerta (perqueacute el que ens interessa eacutes veure quin

deis dos meacutetodes destimaci6 eacutes millor i no el saber com eacutes la regi6) el que fem eacutes simular

realitzacions duna N(O1) amb semiacutevariograma exponencial de meseta unitat en tots els

nodes de la nostre xarxa Sha escollit aquest tipus de semivariograma per ser el meacutes

habitual en el camp de la geologiacutea [ref 2]

En aquestes dad es els hi apliquem exponencials i per tant la nostra realitat segueix una

distribuci6 lognormal de mitjana unitat

El fet de treballar sobre dades lognormals ve justificat perque hi ha molts fenomens naturals

que segueixen aquesta distribuci6 [ref 11] (cerca de determinat mineral bosses de petrali

quantitat de sediments exploracions geoquimiques )

Per tant la nostre realitat eacutes aquesta eacutes a dir la distribuci6 lognormal de la variable

regionalitzada La N(O1) tant sois la fem servir per ser facil de maniobrar

computacionalment [ref 16]

Capiacutetol5 Desenvolupament del projecte

Per tal dassegurant-se que la nostre realitat eacutes mes o menys exacta mirem la seguumlent taula

Variable N Mean Median StDev SE Mean Hin 121 123

exp(siacutem) 625 10546 07742 10075 00403 00250 95965 03934 13721

Taula 511 Descriptiva de la variable regionalitzada exp(sim)

Amb els seguumlents grafics comprovem que realment les nostres dades segueixen una

distribucioacute lognormal

-200

() e Q) J CT 100 ~

IJ -

o

o 5 10 exp(sim)

Figura 512 Histograma de la realitat

Jo

Capiacutetol 5 Desenvolupament del projecte

Lognormal Probablllty Plot tor exp(sim)

Ml Estimates

l ocatiolt -0325300

Scale 0910009

99

95 90

80 70

e 60 (lJ 50 Uuml 40 shy 30 (lJ 20 a

10

5

001 010 100 1000

Data

Figura 513 Lognormal probability plot de la variable regionalitzada exp(sim)

exp(sim)

10

B

7

6 5

4

2

20

Figura 514 Surface plot de la variable exp(sim)

Capiacutetol 5 Desenvolupament del projecte

El surface plot eacutes una eina molt uacutetil ja que ens doacutena una visioacute de com es la nostra realitat a

Iespai A meacutes un cop haguem fet les dues estimacions tambeacute podrem fer el surface plot i

amb un cop dull podrem treure una primera impressioacute de si les estimacions han estat bones

o no

Capiacutetol 5 Desenvolupament del projecte

52 La mostra

A partir de les dades que hem obtingut amb la simulacioacute prenem una mostra aleatoria

de 100 dades a partir de la qual realitzarem les dues estimacions de la realitat Cal

tenir en compte que a partir daquest moment es treballara sobre la mostra i no sobre

les dades simulades que en Iexperimentacioacute real soacuten desconegudes

La mostra sha pres de forma que constitueixi una bona representacioacute del total de la

xarxa La figura 521 mostra la localitzacioacute de cada una de les dades que formen part

de la mostra sobre la xarxa inicial de 25x25 nodes

20 shy

gt x middotcv 10 _

o shy

middot o

bull It bullbullbullbullbullbull bull middot 4 bull bull bull bullbullbull bullbullbullbull bull bull bullbullbullbullbull bull bull bull bull bull bullbullbullbullbull bull bull bullbullbull -Jf bull middot middot middot bull middot 1t bullbullbullbull bullbullbullmiddot o bull bull bull bull bullbull bull bull bull bullbull II JI Jt bull bullbullbull lttt bullbullbull bullbullbull bullbull bull bull bull bullbull bull shy ~ ~ ~ ~ ~ It bull bull bullbullbull bull bull bullbullbull bullbull bull bullbullbullbull bullbull bull bull bull bullbullbullbullbullbull ti bull bull -41 bull bull bull bull bull bull jf middot bull bullbullbull -If bull bull bull 1( bull bullbull bull middot middot - bullbullbullbullbull bull bullbull bullbullbullbullbullbull bull bull bull bullbullbullbull bullbull bull

o 10 20

eix x

Figura 521 Distribucioacute de la mostra dins la xarxa real

La mostra obtinguda conserva les propietats de les dades provinents de la simulacioacute

daquesta manera podem afirmar que eacutes una bona extrapolacioacute de la realitat Vegem a

continuacioacute la descriptiva (Taula 52 1) i Ihistograma de la mostra (Figura 522) amb el

grafic de probabilitats (Figura 52 3) Podem observar que segueix efectivament una

distribucioacute lognormal

Variable N Mean Median TrMean StDev SE Mean rnos tra 1 00 1 0552 0 8330 0 9458 0 9566 0 0957

Variable Minimum Maximum Ql Q3 rnost ra 0 0250 441 85 0 328 1 1 3714

Taula 521 Descriptiva de la mostra

33

Capiacutetol 5 Desenvoluparnent del proiecte

30

gtshyo 20c Q) J oshy~

LL 10

-

1--

- --r--

n I Io

o 2 3 4 5 mostra

Figura 522 Histograma de la mostra

Lognormal Probability Plot for mostra

99

I 95

_ 90 - l -~80 70c jIQ) 60

50e 40Q) 30a 20

10 5

bull

~

001 010 100 1000

Data

MLEstimaacutee5

LocaIion -0341481

Scaacutee 0946372

Figura 523 Plot de probabilitat lognormal

34

Capiacutetol 5 Desenvolupament del projecte

La superfiacutecie descrita per la mostra podem representar-la tambeacute graficament (Figura

524)

mostra

45

40

3 5

30

25

20 15

10

05

00

eixy 20

Figura 524 Superfiacutecie definida per la mostra

35

Capiacutetol 5 Desenvolupament del projecte

53 Lestimacioacute per krigeat indicador

Per tal de realitzar el krigeat indicador definim 5 punts de tall o cut-off Aquests punts de tall

els escollim de forma que guardin simetria respecte el percentil del 50 tal i com mostra la

taula 531

Categoria Percentil Percentatge

1 90 009952

2 300 037637

3 500 073142

4 700 127046

5 910 254092

Taula 531 Els cinc punts de tall escollits

Un cop decidides les categories o punts de tall necessitem saber el semivariograma que

segueixen cada una delles per a poder dur a terme el krigeat indicador ja que Iestimacioacute

realitzada a partir daquest rneacutetode requereix una modelitzacioacute deis cinc semivariogrames

experimentals

El procediment eacutes el seguumlent

Partim de la mostra de 100 dades que segueix una distribucioacute 10gnormaL

Per cada una de les categories creem una columna de O i 1 de manera que si aquell

punt concret eacutes per sota del punt de tall el valor que pren la variable dicotoacutemica eacutes 1 i si eacutes

per sobre pren el valor O

Els semivariogrames els creem amb aquestes cinc columnes de zeros i uns

Per cada semivariograma provem dajustar un model esfeacuteric i un dexponencial Aquests dos

tipus de models els anirem ajustant a ull movent el valor del rang i de Iabast Partim

daquests models per ser els meacutes habituals en la realitat i ens quedarem amb el que ajusti millor deis dos [ref 2]

A continuacioacute presentem els resultats daquests ajustaments per a cada punt de tall

Capiacutetol 5 Desenvolupament del proiecte

Categoriacutea 1 y(h)

Model Exponencial Abast =8 Model Esferic Abast = 75

Meseta =003 Meseta = 003

VARIOGRANlA CATEGORIA 1

005

004 sectr bull ESF= ro E 003 E ro O)

002

001

000

o 2 4 6 8 10 12

Ihl

Figura 531 Model de semivariograma esfeacuteric i exponencial per la categoria 1

)1

Capiacutetol 5 Desenvolupament del projecte

Categoria 2

Model Exponencial Abast = 4 Model Esferic Abast = 4

Meseta = 022 Meseta = 022

VARIOGRAMA CATEGORIA 2

025

--

c bull ESF- sectro 020

E E ro Ogt

015

010

8 10 12

Figura 532 Model de semivariograma esferic i exponencial per la categoria 2

o 2 4 6

Ihl

Capitol 5 Desenvolupament del projecte

Categoriacutea 3

ModeJ Exponencial Abast =7 ModeJ Esferic Abast =6

Meseta =027 Meseta = 0265

VARIOGRAMA CATEGORIA 3

03

~ c (1] ~E 02E (1]

Ogt

01

o 2 4 6

Ihl

Figura 533 Model de semivariograma esfeacuteric i exponencial per la categoria 3

8 10 12

)9

Capiacutetol 5 Desenvolupament del projecte

Categoria 4

Model Exponencial Abast = 5 Model Esfeacuteric Abast = 4

Meseta = 02 Meseta = 02

VARIOGRAMA CATEGORIA 4

03

~ ~ -- ro E ~

02 E ro Ogt

01

deg 2 4 6

Ihl

Figura 534 Model de semivariograma esfeacuteric i exponencial per la categoria 4

8 10 12

Capiacutetol 5 Desenvolupament del projecte

Categoriacutea 5

Model Exponencial Abast =4 Model Esferic Abast = 3

Meseta =006 Meseta = 006

VARIOGRAMA CATEGORIA 5

008

= sect~ 007-shy ESFro E E 006 ro Ol

005

004

003

o 2 4 6 8 10 12

Ihl

Figura 535 Model de semivariograma esfeacuteric i exponencial per la categoria 5

Capiacutetol5 Desenvolupament del projecte

Mirant els cinc grafics veiem que el model que ajusta millor eacutes Iesferic en tots els casos

encara que no hi ha diferencies massa significatives respecte el model exponencial A meacutes

observem una certa simetria pel que fa a la meseta i abast de cada un deis models esferics

de cada categoria Taula 532

Cat 1 Cat2 Cat3 Cat4 Cat5

Meseta 003 022 0265 02 006

Abast 75 4 6 4 3

Taula 532 Meseta i abast per cada categoria

Aquesta simetria sobserva sobretot per les categories 2 3 i 4

Els models corresponents a les categories 1 i 5 no ajusten del tot beacute degut a que soacuten les

categories deis extrems i per tant la gran majoria de mostres si no totes estaran per sobre o

per sota respectivament

Ara ja podem fer Iestimacioacute per krigeat indicador Al programa ik3d li introduim els cinc

models de semivariogrames per tal que ens calculi Iestimacioacute

El resultat que obtenim soacuten cinc columnes de 625 dades on els valors van de O a 1

Concretament ens calcula la probabilitat de que el valor atorgat a cada punt sigui inferior al

daquell cut-off

El que es preteacuten ara eacutes a partir daquest conjunt de probabilitats interpolar la mediana per a

cada un deis punts de la xarxa per tant el que fem eacutes executar el programa postik en Iopcioacute

3 de manera que ens tregui Iestimacioacute de la mediana

A continuacioacute passem a detallar en que consisteix el postik Per tal de poder-ho expressar

millor ens centrare m en un punt concret de la xarxa el (30)

- - - - -

Capiacutetol 5 Desenvolupament del projecte

Els tercer valor de cada una de les 5 columnes obtingudes amb el krigeat indicador eacutes a dir

els valors corresponents a la mostra situada en el node (30) representen la probabilitat de

que el valor de la variable en aquest punt sigui major que cada un deis cut-off

respectivament aixiacute podem afirmar que

P(Xiexcl lt el ) = P(x(3Q) lt 00995) =00000

P(xiexcl lt e2) = P(X(3 Q) lt 03764) =00397

P(xiexcl lt c3) = P(X(30) lt 07314) = 00409

P(xiexcl lt e4) = P(X(30) lt 12705) = 02079

P(xiexcl lt e5) = P(X(3 0) lt 25402) =10000

Si ara grafiquem aquests 5 valors obtenim una estimacioacute de la probabilitat que teacute el punt

estudiat (30) de ser meacutes petit que qualsevol valor eacutes a dir Iestimacioacute de la funcioacute de

probabilitat en aquest punt Com que el que es preteacuten estimar en el nostre estudi eacutes la

mediana mirarem quin valor aproxima per la probabilitat del 05 eacutes a dir

m tal que P(X(30) lt m) = 05

Per aixoacute tracem una liacutenia a Ialcada 05 i daquesta manera obtenim el valor estimat de la

mediana Aquest valor correspon al valor que obtenim amb el POSTIK que eacutes per aquesta

primera observacioacute 06983

10

x v 6 68 05 o

00

Figura 536 Els 5 cut-off aplicats al punt (30)

Capiacutetol 5 Desenvolupament del projecte

Laplicacioacute del POSTIK realitza aquesta estimacioacute per a cada un deis punts obtinguts (625)

i daquesta manera podem obten ir una interpolacioacute de la mediana per cada un deis valors a

estimar

Capiacutetol 5 Desenvolupament del projecte

SEMIVARIOGRAMA DE LA MOSTRA

model exponencial

12

= r 07 -- ca E E ca O)

02

o 2 4 6 8 10 12

Ihl

Figura 541 Semivariograma experimental amb un model exponencial

Aquest model obtingut a ull teacute els seguumlents parametres abast=7

meseta=1 05

Aplicant aquest valors al model general obtenim la formulacioacute per a les nostres dades

46

middotCapiacutetol 5 Desenvolupament del projecte

MODEL ESFERIC La formulacioacute general eacutes

sih a

sih gt a

on a eacutes Iabast i c la meseta

SEMIVARIOGRAMA DE LA MOSTRA

model esferic

12

---shyro E 07 E ro Ol

02

o 2 4 6 8 10 12

Ihl

Figura 54 2 Semivariograma experimental amb un model esfeacuterico

Aquest model Ihem obtingut de la mateixa manera que Ianterior a ull i els seus

parametres que tambeacute aplicarem a la forma general soacuten abast=6 i meseta=1

47

Capiacutetol 5 Desenvolupament del projecte

Finalment pode m representar la superfiacutecie que hem estimat a partir del krigeat

lognormal utilitzant un grafic de superfiacutecie (Figura 54 5)

6

5

Krig Logn 3

2

o

20 eix y

Figura 545 Grafic de superfiacutecie pel krigeat lognormal

50

Capiacutetol 6Comparacioacute deis resultats obtinguts

61 Regressioacute lineal

Per tal de dur a terme la compara cioacute entre els dos meacutetodes destimacioacute i les dades que

simulen la realitat hem expressat els resultats obtinguts graficament mitjancant els

grafics de punts ajustant en cada cas la recta de regressioacute i dibuixant la bisectriu Cal

tenir en compte que per augmentar la claredat i per a simplificar la interpretacioacute deis

resultat hem transformat les dades a una N(O1) encara que el nostre estudi es basi en

un model lognormal

Passem a continuacioacute a analitzar els grafics

En primer lIoc (Figura 611) tenim el grafic de punts entre les dades obtingudes amb el

primer meacutetode destimacioacute el krigeat lognormal i les dades provinents de la simula cioacute

de la realitat

Regression Plot y =3a1E -02jo O6lt40216X

R-Sq = 594

_0 ro

ro EID o middot Ole

~~ -2

-3

- -3 -2 -1

redade regresioacute

Bisectriu

realitat simulada

Figura 611 Recta de regressioacute entre el krigeat lognormal i la simulacioacute de la realitat

Si mirem aquest grafic podem observar que el valor de Iestimacioacute realitzada

sobreestima els valors petits de la simulacioacute i en canvi en els valors grans subestima

El coeficient de correlacioacute es del 594 eacutes a dir que el meacutetode del krigeat lognormal

explica un 594 de la realitat

52

Capiacutetol 6Comparacioacute deis resultats obtinguts

Passem ara a realitzar el gratic entre el segon meto de destimacioacute el krigeat indicador

i la realitat simulada (Figura 612)

0 _O

m~ 0)-- o

~~ -1

-2

-3

Regression Plot y = -23E-02 + 0711 615X

R-Sq 526

bull bull

-3 -2 -1

realitat simulada

recta de regresi oacute

I Bisectriu

Figura 612 Recta de regressioacute entre el krigeat indicador i la simulacioacute de la realitat

Podem observar que el gratic obtingut eacutes molt semblant a Ianterior i que ens trobem

amb el mateix problema de sobreestimacioacute deis valors petits i subestimacioacute deis valors

grans de la simulacioacute

El valor del coeticient de correlacioacute tambeacute eacutes torga semblant 52 6 Aixiacute doncs la

realitat eacutes explicada en un 526 pel krigeat indicador

53

Capiacutetol 6Comparacioacute deis resultats obtinguts

Finalment i per tenir una idea de la relacioacute que hi ha entre els dos meacutetodes emprats en

el projecte realitzarem un uacuteltim grafic comparatiu (Figura 613) que representa els dos

meacutetodes destimacioacute el krigeat lognormal i el krigeat indicador

Regression Plot y = -7 SE-02 + 105401X

R-Sq 796

middot2

middot3

recta de regresi6

bull Bisectriu

middot 4 middot3 middot2 -1

krigeat lognormal

Figura 613 Recta de regressioacute entre el krigeat lognormal i el krigeat indicador

En aquest cas podem observar que la recta de regressioacute coincideix gairebeacute a la

perfeccioacute amb la bisectriu cosa que vol dir que els dos meacutetodes soacuten molt semblants

entre siacute i que per tant eacutes normal que Iaproximacioacute de cada un dells a la realitat sigui

semblant

El valor de la regressioacute eacutes meacutes gran que en els altres dos casos 796 eacutes a dir que

els dos meacutetodes no donen resultats significativament diferents entre si

Podem observar un conjunt de dades que prenen valors especialment elevats en

Iestimacioacute per krigeat indicador Si analitzem aquests punts podem comprovar que

soacuten punts que tenen una probabilitat de ser meacutes grans que el cinqueacute cut-off (percentil

097) igual a 1 Per tant aquest tipus de punts no shan de tenir en compte en el

moment dextreure conclusions De fet aixo ja es sospitava en el grafic anterior pero

en que en aquell hi ha una elevada dispersioacute i per tant Iefecte queda dissimulat

54

Capiacutetol2 Nocions de geoestadiacutestica

23 Simulacioacute sequumlencial gaussiana

La simulacioacute sequumlencial gaussiana es basa en la simulacioacute de dades a partir duna variable

continua de distribucioacute normal que a meacutes ha de ser estandarditzada En geoestadiacutestica

susa la simulacioacute per tal de poder coneacuteixer el valors de la variable en estudi en punts no

mostrejats En el nostre cas Ihem usat per tal de poder tenir dades a partir de les quals fer

Iestudi Per tant nomeacutes detallarem la seva mecanica

1 Determinar la funcioacute de distribucioacute Fz(z) que representa tota Iarea destudi i no norneacutes

els punts mostrejats

2 Transformar Fz(z) en una distribucioacute Normal (01)

3 Comprovar que realment la nova variable (Y) es distribueix normalment En el cas que

no shagi pogut conservar el model gaussia considerar models aHematius com ara una

barreja de poblacions gaussianes o beacute plantejar-se fer un altre tipus de simulacioacute

estocastica

4 A partir daquiacute ja podem usar meacutetodes computacionals que actuen de la seguumlent

manera

41 Es crea una ruta que consisteix en la visita una sola vegada de cada node (u) de la

xarxa De cada node visitat es reteacute un nombre maxim de nodes veins per tal de

poder fer simulacioacute condicionada

42 Escollir un tipus de krigeat i un tipus de semivariograma per tal de poder determinar

la mitjana i la variancia de la funcioacute de distribucioacute condicionada Y(u) en la localitzacioacute

u

43 Treure un valor simulat yP)(u) de la funcioacute de distribucioacute condicionada

44 Afegir el valor simulat y(I)(U) al conjunt de dades

5 Continuar amb el seguumlent node fins que es simuli el darrer

FLUXOGRAMA DEL DESENVOLUPAMENT DEL PROJECTE

Simulem 625 dades (25x25) duna N(01) amb un variograma

exponencial SGSIM

Fem Iexponencial de les dades per obtenir una distribucioacute lognormai

Prenem una mostra r-1-----i aleatoria de 100 dades r------- ~ MINITAB

Decidim 5 cut-offs a partir

deis percentils MINITAB

Obtenim els variogrames per a cada cut-off i hi aproximem un modelo

GEO-EAS EXCEL

Realitzem el Krigeado indicador simultani per

cada cut-off IK3D

j Realitzem la

interpolacioacute de la mediana

POSTIK

Fem els logaritmes Obtenim el model

de variograma per la mostra GEO-EAS

EXCEL

Realitzem el Krigeado ordinario

KB2D

Realitzem la transformacioacute de les

dades per obtenir una xarxa amb distribucioacute

Iqgnormai

1------1-~ Apliquem la funcioacute ~

logaritme a les dades L-___________-I~ per tal de poder-les 1--___-

comparar

Comparem els dos meacutetodes destimacioacute entre si i amb les dades simulades Calculem ISTRESS i grafiquem els

1 CONCLUSIOacute I resultats FORTRAN MINITA8

Capiacutetol 5 Desenvolupament del projecte

Tot estudi geoestadiacutestic segueix un guioacute de treball

bull Determinacioacute i analisi de Iestructura espaial

bull Modelitzacioacute de la variabilitat espaial

bull Estimacioacute de punts no mostrejats

bull Simulacioacute

bull Conclusions i descripcioacute de la zona estudiada

En el nostre cas malgrat no teniacuter dades reals i que el nostre objectiu no sia el coneixement

de la variable regionalitzada sinoacute el comparar dos metodes destimacioacute el proceacutes sera el

mateix Luacutenica diferencia eacutes que nosaltres fem una simulacioacute per tal dobtenir una base de

realitat a partir de la qual comenyar a treballar i no per tenir realitzacions de punts no

mostrejats Per tant en el nostre cas la simulacioacute esdeveacute el primer pas a realitzar

Capitol 5 Desenvolupament del projecte

51 La simulacioacute

Per tal de tenir una regi6 en la que poder treballar construim una xarxa de 25x25x1 eacutes a

dir treballem a R2bull

Volem obtenir una realitzaci6 en cada un deis nodes de la xarxa per tant realitzem una

simulaci6 de 625 dades Figura 511

Ix= o 1 2 23 24

~ yslz= 004 J

l

~] iexcllo

-t yrnn==O

-- xsiz== 004T-Eshy

o 11

~

Figura 511 Xarxa sobre la que es treballa i punts mostrejats

En el camp de la geologiacutea eacutes molt difiacutecil obtenir gaires mostres duna regi6 per aix6 els

meacutetodes de simulaci6 i destimaci6 s6n tant importants en geoestadiacutestica Com que a

nosaltres ens interesa tenir una xarxa complerta (perqueacute el que ens interessa eacutes veure quin

deis dos meacutetodes destimaci6 eacutes millor i no el saber com eacutes la regi6) el que fem eacutes simular

realitzacions duna N(O1) amb semiacutevariograma exponencial de meseta unitat en tots els

nodes de la nostre xarxa Sha escollit aquest tipus de semivariograma per ser el meacutes

habitual en el camp de la geologiacutea [ref 2]

En aquestes dad es els hi apliquem exponencials i per tant la nostra realitat segueix una

distribuci6 lognormal de mitjana unitat

El fet de treballar sobre dades lognormals ve justificat perque hi ha molts fenomens naturals

que segueixen aquesta distribuci6 [ref 11] (cerca de determinat mineral bosses de petrali

quantitat de sediments exploracions geoquimiques )

Per tant la nostre realitat eacutes aquesta eacutes a dir la distribuci6 lognormal de la variable

regionalitzada La N(O1) tant sois la fem servir per ser facil de maniobrar

computacionalment [ref 16]

Capiacutetol5 Desenvolupament del projecte

Per tal dassegurant-se que la nostre realitat eacutes mes o menys exacta mirem la seguumlent taula

Variable N Mean Median StDev SE Mean Hin 121 123

exp(siacutem) 625 10546 07742 10075 00403 00250 95965 03934 13721

Taula 511 Descriptiva de la variable regionalitzada exp(sim)

Amb els seguumlents grafics comprovem que realment les nostres dades segueixen una

distribucioacute lognormal

-200

() e Q) J CT 100 ~

IJ -

o

o 5 10 exp(sim)

Figura 512 Histograma de la realitat

Jo

Capiacutetol 5 Desenvolupament del projecte

Lognormal Probablllty Plot tor exp(sim)

Ml Estimates

l ocatiolt -0325300

Scale 0910009

99

95 90

80 70

e 60 (lJ 50 Uuml 40 shy 30 (lJ 20 a

10

5

001 010 100 1000

Data

Figura 513 Lognormal probability plot de la variable regionalitzada exp(sim)

exp(sim)

10

B

7

6 5

4

2

20

Figura 514 Surface plot de la variable exp(sim)

Capiacutetol 5 Desenvolupament del projecte

El surface plot eacutes una eina molt uacutetil ja que ens doacutena una visioacute de com es la nostra realitat a

Iespai A meacutes un cop haguem fet les dues estimacions tambeacute podrem fer el surface plot i

amb un cop dull podrem treure una primera impressioacute de si les estimacions han estat bones

o no

Capiacutetol 5 Desenvolupament del projecte

52 La mostra

A partir de les dades que hem obtingut amb la simulacioacute prenem una mostra aleatoria

de 100 dades a partir de la qual realitzarem les dues estimacions de la realitat Cal

tenir en compte que a partir daquest moment es treballara sobre la mostra i no sobre

les dades simulades que en Iexperimentacioacute real soacuten desconegudes

La mostra sha pres de forma que constitueixi una bona representacioacute del total de la

xarxa La figura 521 mostra la localitzacioacute de cada una de les dades que formen part

de la mostra sobre la xarxa inicial de 25x25 nodes

20 shy

gt x middotcv 10 _

o shy

middot o

bull It bullbullbullbullbullbull bull middot 4 bull bull bull bullbullbull bullbullbullbull bull bull bullbullbullbullbull bull bull bull bull bull bullbullbullbullbull bull bull bullbullbull -Jf bull middot middot middot bull middot 1t bullbullbullbull bullbullbullmiddot o bull bull bull bull bullbull bull bull bull bullbull II JI Jt bull bullbullbull lttt bullbullbull bullbullbull bullbull bull bull bull bullbull bull shy ~ ~ ~ ~ ~ It bull bull bullbullbull bull bull bullbullbull bullbull bull bullbullbullbull bullbull bull bull bull bullbullbullbullbullbull ti bull bull -41 bull bull bull bull bull bull jf middot bull bullbullbull -If bull bull bull 1( bull bullbull bull middot middot - bullbullbullbullbull bull bullbull bullbullbullbullbullbull bull bull bull bullbullbullbull bullbull bull

o 10 20

eix x

Figura 521 Distribucioacute de la mostra dins la xarxa real

La mostra obtinguda conserva les propietats de les dades provinents de la simulacioacute

daquesta manera podem afirmar que eacutes una bona extrapolacioacute de la realitat Vegem a

continuacioacute la descriptiva (Taula 52 1) i Ihistograma de la mostra (Figura 522) amb el

grafic de probabilitats (Figura 52 3) Podem observar que segueix efectivament una

distribucioacute lognormal

Variable N Mean Median TrMean StDev SE Mean rnos tra 1 00 1 0552 0 8330 0 9458 0 9566 0 0957

Variable Minimum Maximum Ql Q3 rnost ra 0 0250 441 85 0 328 1 1 3714

Taula 521 Descriptiva de la mostra

33

Capiacutetol 5 Desenvoluparnent del proiecte

30

gtshyo 20c Q) J oshy~

LL 10

-

1--

- --r--

n I Io

o 2 3 4 5 mostra

Figura 522 Histograma de la mostra

Lognormal Probability Plot for mostra

99

I 95

_ 90 - l -~80 70c jIQ) 60

50e 40Q) 30a 20

10 5

bull

~

001 010 100 1000

Data

MLEstimaacutee5

LocaIion -0341481

Scaacutee 0946372

Figura 523 Plot de probabilitat lognormal

34

Capiacutetol 5 Desenvolupament del projecte

La superfiacutecie descrita per la mostra podem representar-la tambeacute graficament (Figura

524)

mostra

45

40

3 5

30

25

20 15

10

05

00

eixy 20

Figura 524 Superfiacutecie definida per la mostra

35

Capiacutetol 5 Desenvolupament del projecte

53 Lestimacioacute per krigeat indicador

Per tal de realitzar el krigeat indicador definim 5 punts de tall o cut-off Aquests punts de tall

els escollim de forma que guardin simetria respecte el percentil del 50 tal i com mostra la

taula 531

Categoria Percentil Percentatge

1 90 009952

2 300 037637

3 500 073142

4 700 127046

5 910 254092

Taula 531 Els cinc punts de tall escollits

Un cop decidides les categories o punts de tall necessitem saber el semivariograma que

segueixen cada una delles per a poder dur a terme el krigeat indicador ja que Iestimacioacute

realitzada a partir daquest rneacutetode requereix una modelitzacioacute deis cinc semivariogrames

experimentals

El procediment eacutes el seguumlent

Partim de la mostra de 100 dades que segueix una distribucioacute 10gnormaL

Per cada una de les categories creem una columna de O i 1 de manera que si aquell

punt concret eacutes per sota del punt de tall el valor que pren la variable dicotoacutemica eacutes 1 i si eacutes

per sobre pren el valor O

Els semivariogrames els creem amb aquestes cinc columnes de zeros i uns

Per cada semivariograma provem dajustar un model esfeacuteric i un dexponencial Aquests dos

tipus de models els anirem ajustant a ull movent el valor del rang i de Iabast Partim

daquests models per ser els meacutes habituals en la realitat i ens quedarem amb el que ajusti millor deis dos [ref 2]

A continuacioacute presentem els resultats daquests ajustaments per a cada punt de tall

Capiacutetol 5 Desenvolupament del proiecte

Categoriacutea 1 y(h)

Model Exponencial Abast =8 Model Esferic Abast = 75

Meseta =003 Meseta = 003

VARIOGRANlA CATEGORIA 1

005

004 sectr bull ESF= ro E 003 E ro O)

002

001

000

o 2 4 6 8 10 12

Ihl

Figura 531 Model de semivariograma esfeacuteric i exponencial per la categoria 1

)1

Capiacutetol 5 Desenvolupament del projecte

Categoria 2

Model Exponencial Abast = 4 Model Esferic Abast = 4

Meseta = 022 Meseta = 022

VARIOGRAMA CATEGORIA 2

025

--

c bull ESF- sectro 020

E E ro Ogt

015

010

8 10 12

Figura 532 Model de semivariograma esferic i exponencial per la categoria 2

o 2 4 6

Ihl

Capitol 5 Desenvolupament del projecte

Categoriacutea 3

ModeJ Exponencial Abast =7 ModeJ Esferic Abast =6

Meseta =027 Meseta = 0265

VARIOGRAMA CATEGORIA 3

03

~ c (1] ~E 02E (1]

Ogt

01

o 2 4 6

Ihl

Figura 533 Model de semivariograma esfeacuteric i exponencial per la categoria 3

8 10 12

)9

Capiacutetol 5 Desenvolupament del projecte

Categoria 4

Model Exponencial Abast = 5 Model Esfeacuteric Abast = 4

Meseta = 02 Meseta = 02

VARIOGRAMA CATEGORIA 4

03

~ ~ -- ro E ~

02 E ro Ogt

01

deg 2 4 6

Ihl

Figura 534 Model de semivariograma esfeacuteric i exponencial per la categoria 4

8 10 12

Capiacutetol 5 Desenvolupament del projecte

Categoriacutea 5

Model Exponencial Abast =4 Model Esferic Abast = 3

Meseta =006 Meseta = 006

VARIOGRAMA CATEGORIA 5

008

= sect~ 007-shy ESFro E E 006 ro Ol

005

004

003

o 2 4 6 8 10 12

Ihl

Figura 535 Model de semivariograma esfeacuteric i exponencial per la categoria 5

Capiacutetol5 Desenvolupament del projecte

Mirant els cinc grafics veiem que el model que ajusta millor eacutes Iesferic en tots els casos

encara que no hi ha diferencies massa significatives respecte el model exponencial A meacutes

observem una certa simetria pel que fa a la meseta i abast de cada un deis models esferics

de cada categoria Taula 532

Cat 1 Cat2 Cat3 Cat4 Cat5

Meseta 003 022 0265 02 006

Abast 75 4 6 4 3

Taula 532 Meseta i abast per cada categoria

Aquesta simetria sobserva sobretot per les categories 2 3 i 4

Els models corresponents a les categories 1 i 5 no ajusten del tot beacute degut a que soacuten les

categories deis extrems i per tant la gran majoria de mostres si no totes estaran per sobre o

per sota respectivament

Ara ja podem fer Iestimacioacute per krigeat indicador Al programa ik3d li introduim els cinc

models de semivariogrames per tal que ens calculi Iestimacioacute

El resultat que obtenim soacuten cinc columnes de 625 dades on els valors van de O a 1

Concretament ens calcula la probabilitat de que el valor atorgat a cada punt sigui inferior al

daquell cut-off

El que es preteacuten ara eacutes a partir daquest conjunt de probabilitats interpolar la mediana per a

cada un deis punts de la xarxa per tant el que fem eacutes executar el programa postik en Iopcioacute

3 de manera que ens tregui Iestimacioacute de la mediana

A continuacioacute passem a detallar en que consisteix el postik Per tal de poder-ho expressar

millor ens centrare m en un punt concret de la xarxa el (30)

- - - - -

Capiacutetol 5 Desenvolupament del projecte

Els tercer valor de cada una de les 5 columnes obtingudes amb el krigeat indicador eacutes a dir

els valors corresponents a la mostra situada en el node (30) representen la probabilitat de

que el valor de la variable en aquest punt sigui major que cada un deis cut-off

respectivament aixiacute podem afirmar que

P(Xiexcl lt el ) = P(x(3Q) lt 00995) =00000

P(xiexcl lt e2) = P(X(3 Q) lt 03764) =00397

P(xiexcl lt c3) = P(X(30) lt 07314) = 00409

P(xiexcl lt e4) = P(X(30) lt 12705) = 02079

P(xiexcl lt e5) = P(X(3 0) lt 25402) =10000

Si ara grafiquem aquests 5 valors obtenim una estimacioacute de la probabilitat que teacute el punt

estudiat (30) de ser meacutes petit que qualsevol valor eacutes a dir Iestimacioacute de la funcioacute de

probabilitat en aquest punt Com que el que es preteacuten estimar en el nostre estudi eacutes la

mediana mirarem quin valor aproxima per la probabilitat del 05 eacutes a dir

m tal que P(X(30) lt m) = 05

Per aixoacute tracem una liacutenia a Ialcada 05 i daquesta manera obtenim el valor estimat de la

mediana Aquest valor correspon al valor que obtenim amb el POSTIK que eacutes per aquesta

primera observacioacute 06983

10

x v 6 68 05 o

00

Figura 536 Els 5 cut-off aplicats al punt (30)

Capiacutetol 5 Desenvolupament del projecte

Laplicacioacute del POSTIK realitza aquesta estimacioacute per a cada un deis punts obtinguts (625)

i daquesta manera podem obten ir una interpolacioacute de la mediana per cada un deis valors a

estimar

Capiacutetol 5 Desenvolupament del projecte

SEMIVARIOGRAMA DE LA MOSTRA

model exponencial

12

= r 07 -- ca E E ca O)

02

o 2 4 6 8 10 12

Ihl

Figura 541 Semivariograma experimental amb un model exponencial

Aquest model obtingut a ull teacute els seguumlents parametres abast=7

meseta=1 05

Aplicant aquest valors al model general obtenim la formulacioacute per a les nostres dades

46

middotCapiacutetol 5 Desenvolupament del projecte

MODEL ESFERIC La formulacioacute general eacutes

sih a

sih gt a

on a eacutes Iabast i c la meseta

SEMIVARIOGRAMA DE LA MOSTRA

model esferic

12

---shyro E 07 E ro Ol

02

o 2 4 6 8 10 12

Ihl

Figura 54 2 Semivariograma experimental amb un model esfeacuterico

Aquest model Ihem obtingut de la mateixa manera que Ianterior a ull i els seus

parametres que tambeacute aplicarem a la forma general soacuten abast=6 i meseta=1

47

Capiacutetol 5 Desenvolupament del projecte

Finalment pode m representar la superfiacutecie que hem estimat a partir del krigeat

lognormal utilitzant un grafic de superfiacutecie (Figura 54 5)

6

5

Krig Logn 3

2

o

20 eix y

Figura 545 Grafic de superfiacutecie pel krigeat lognormal

50

Capiacutetol 6Comparacioacute deis resultats obtinguts

61 Regressioacute lineal

Per tal de dur a terme la compara cioacute entre els dos meacutetodes destimacioacute i les dades que

simulen la realitat hem expressat els resultats obtinguts graficament mitjancant els

grafics de punts ajustant en cada cas la recta de regressioacute i dibuixant la bisectriu Cal

tenir en compte que per augmentar la claredat i per a simplificar la interpretacioacute deis

resultat hem transformat les dades a una N(O1) encara que el nostre estudi es basi en

un model lognormal

Passem a continuacioacute a analitzar els grafics

En primer lIoc (Figura 611) tenim el grafic de punts entre les dades obtingudes amb el

primer meacutetode destimacioacute el krigeat lognormal i les dades provinents de la simula cioacute

de la realitat

Regression Plot y =3a1E -02jo O6lt40216X

R-Sq = 594

_0 ro

ro EID o middot Ole

~~ -2

-3

- -3 -2 -1

redade regresioacute

Bisectriu

realitat simulada

Figura 611 Recta de regressioacute entre el krigeat lognormal i la simulacioacute de la realitat

Si mirem aquest grafic podem observar que el valor de Iestimacioacute realitzada

sobreestima els valors petits de la simulacioacute i en canvi en els valors grans subestima

El coeficient de correlacioacute es del 594 eacutes a dir que el meacutetode del krigeat lognormal

explica un 594 de la realitat

52

Capiacutetol 6Comparacioacute deis resultats obtinguts

Passem ara a realitzar el gratic entre el segon meto de destimacioacute el krigeat indicador

i la realitat simulada (Figura 612)

0 _O

m~ 0)-- o

~~ -1

-2

-3

Regression Plot y = -23E-02 + 0711 615X

R-Sq 526

bull bull

-3 -2 -1

realitat simulada

recta de regresi oacute

I Bisectriu

Figura 612 Recta de regressioacute entre el krigeat indicador i la simulacioacute de la realitat

Podem observar que el gratic obtingut eacutes molt semblant a Ianterior i que ens trobem

amb el mateix problema de sobreestimacioacute deis valors petits i subestimacioacute deis valors

grans de la simulacioacute

El valor del coeticient de correlacioacute tambeacute eacutes torga semblant 52 6 Aixiacute doncs la

realitat eacutes explicada en un 526 pel krigeat indicador

53

Capiacutetol 6Comparacioacute deis resultats obtinguts

Finalment i per tenir una idea de la relacioacute que hi ha entre els dos meacutetodes emprats en

el projecte realitzarem un uacuteltim grafic comparatiu (Figura 613) que representa els dos

meacutetodes destimacioacute el krigeat lognormal i el krigeat indicador

Regression Plot y = -7 SE-02 + 105401X

R-Sq 796

middot2

middot3

recta de regresi6

bull Bisectriu

middot 4 middot3 middot2 -1

krigeat lognormal

Figura 613 Recta de regressioacute entre el krigeat lognormal i el krigeat indicador

En aquest cas podem observar que la recta de regressioacute coincideix gairebeacute a la

perfeccioacute amb la bisectriu cosa que vol dir que els dos meacutetodes soacuten molt semblants

entre siacute i que per tant eacutes normal que Iaproximacioacute de cada un dells a la realitat sigui

semblant

El valor de la regressioacute eacutes meacutes gran que en els altres dos casos 796 eacutes a dir que

els dos meacutetodes no donen resultats significativament diferents entre si

Podem observar un conjunt de dades que prenen valors especialment elevats en

Iestimacioacute per krigeat indicador Si analitzem aquests punts podem comprovar que

soacuten punts que tenen una probabilitat de ser meacutes grans que el cinqueacute cut-off (percentil

097) igual a 1 Per tant aquest tipus de punts no shan de tenir en compte en el

moment dextreure conclusions De fet aixo ja es sospitava en el grafic anterior pero

en que en aquell hi ha una elevada dispersioacute i per tant Iefecte queda dissimulat

54

FLUXOGRAMA DEL DESENVOLUPAMENT DEL PROJECTE

Simulem 625 dades (25x25) duna N(01) amb un variograma

exponencial SGSIM

Fem Iexponencial de les dades per obtenir una distribucioacute lognormai

Prenem una mostra r-1-----i aleatoria de 100 dades r------- ~ MINITAB

Decidim 5 cut-offs a partir

deis percentils MINITAB

Obtenim els variogrames per a cada cut-off i hi aproximem un modelo

GEO-EAS EXCEL

Realitzem el Krigeado indicador simultani per

cada cut-off IK3D

j Realitzem la

interpolacioacute de la mediana

POSTIK

Fem els logaritmes Obtenim el model

de variograma per la mostra GEO-EAS

EXCEL

Realitzem el Krigeado ordinario

KB2D

Realitzem la transformacioacute de les

dades per obtenir una xarxa amb distribucioacute

Iqgnormai

1------1-~ Apliquem la funcioacute ~

logaritme a les dades L-___________-I~ per tal de poder-les 1--___-

comparar

Comparem els dos meacutetodes destimacioacute entre si i amb les dades simulades Calculem ISTRESS i grafiquem els

1 CONCLUSIOacute I resultats FORTRAN MINITA8

Capiacutetol 5 Desenvolupament del projecte

Tot estudi geoestadiacutestic segueix un guioacute de treball

bull Determinacioacute i analisi de Iestructura espaial

bull Modelitzacioacute de la variabilitat espaial

bull Estimacioacute de punts no mostrejats

bull Simulacioacute

bull Conclusions i descripcioacute de la zona estudiada

En el nostre cas malgrat no teniacuter dades reals i que el nostre objectiu no sia el coneixement

de la variable regionalitzada sinoacute el comparar dos metodes destimacioacute el proceacutes sera el

mateix Luacutenica diferencia eacutes que nosaltres fem una simulacioacute per tal dobtenir una base de

realitat a partir de la qual comenyar a treballar i no per tenir realitzacions de punts no

mostrejats Per tant en el nostre cas la simulacioacute esdeveacute el primer pas a realitzar

Capitol 5 Desenvolupament del projecte

51 La simulacioacute

Per tal de tenir una regi6 en la que poder treballar construim una xarxa de 25x25x1 eacutes a

dir treballem a R2bull

Volem obtenir una realitzaci6 en cada un deis nodes de la xarxa per tant realitzem una

simulaci6 de 625 dades Figura 511

Ix= o 1 2 23 24

~ yslz= 004 J

l

~] iexcllo

-t yrnn==O

-- xsiz== 004T-Eshy

o 11

~

Figura 511 Xarxa sobre la que es treballa i punts mostrejats

En el camp de la geologiacutea eacutes molt difiacutecil obtenir gaires mostres duna regi6 per aix6 els

meacutetodes de simulaci6 i destimaci6 s6n tant importants en geoestadiacutestica Com que a

nosaltres ens interesa tenir una xarxa complerta (perqueacute el que ens interessa eacutes veure quin

deis dos meacutetodes destimaci6 eacutes millor i no el saber com eacutes la regi6) el que fem eacutes simular

realitzacions duna N(O1) amb semiacutevariograma exponencial de meseta unitat en tots els

nodes de la nostre xarxa Sha escollit aquest tipus de semivariograma per ser el meacutes

habitual en el camp de la geologiacutea [ref 2]

En aquestes dad es els hi apliquem exponencials i per tant la nostra realitat segueix una

distribuci6 lognormal de mitjana unitat

El fet de treballar sobre dades lognormals ve justificat perque hi ha molts fenomens naturals

que segueixen aquesta distribuci6 [ref 11] (cerca de determinat mineral bosses de petrali

quantitat de sediments exploracions geoquimiques )

Per tant la nostre realitat eacutes aquesta eacutes a dir la distribuci6 lognormal de la variable

regionalitzada La N(O1) tant sois la fem servir per ser facil de maniobrar

computacionalment [ref 16]

Capiacutetol5 Desenvolupament del projecte

Per tal dassegurant-se que la nostre realitat eacutes mes o menys exacta mirem la seguumlent taula

Variable N Mean Median StDev SE Mean Hin 121 123

exp(siacutem) 625 10546 07742 10075 00403 00250 95965 03934 13721

Taula 511 Descriptiva de la variable regionalitzada exp(sim)

Amb els seguumlents grafics comprovem que realment les nostres dades segueixen una

distribucioacute lognormal

-200

() e Q) J CT 100 ~

IJ -

o

o 5 10 exp(sim)

Figura 512 Histograma de la realitat

Jo

Capiacutetol 5 Desenvolupament del projecte

Lognormal Probablllty Plot tor exp(sim)

Ml Estimates

l ocatiolt -0325300

Scale 0910009

99

95 90

80 70

e 60 (lJ 50 Uuml 40 shy 30 (lJ 20 a

10

5

001 010 100 1000

Data

Figura 513 Lognormal probability plot de la variable regionalitzada exp(sim)

exp(sim)

10

B

7

6 5

4

2

20

Figura 514 Surface plot de la variable exp(sim)

Capiacutetol 5 Desenvolupament del projecte

El surface plot eacutes una eina molt uacutetil ja que ens doacutena una visioacute de com es la nostra realitat a

Iespai A meacutes un cop haguem fet les dues estimacions tambeacute podrem fer el surface plot i

amb un cop dull podrem treure una primera impressioacute de si les estimacions han estat bones

o no

Capiacutetol 5 Desenvolupament del projecte

52 La mostra

A partir de les dades que hem obtingut amb la simulacioacute prenem una mostra aleatoria

de 100 dades a partir de la qual realitzarem les dues estimacions de la realitat Cal

tenir en compte que a partir daquest moment es treballara sobre la mostra i no sobre

les dades simulades que en Iexperimentacioacute real soacuten desconegudes

La mostra sha pres de forma que constitueixi una bona representacioacute del total de la

xarxa La figura 521 mostra la localitzacioacute de cada una de les dades que formen part

de la mostra sobre la xarxa inicial de 25x25 nodes

20 shy

gt x middotcv 10 _

o shy

middot o

bull It bullbullbullbullbullbull bull middot 4 bull bull bull bullbullbull bullbullbullbull bull bull bullbullbullbullbull bull bull bull bull bull bullbullbullbullbull bull bull bullbullbull -Jf bull middot middot middot bull middot 1t bullbullbullbull bullbullbullmiddot o bull bull bull bull bullbull bull bull bull bullbull II JI Jt bull bullbullbull lttt bullbullbull bullbullbull bullbull bull bull bull bullbull bull shy ~ ~ ~ ~ ~ It bull bull bullbullbull bull bull bullbullbull bullbull bull bullbullbullbull bullbull bull bull bull bullbullbullbullbullbull ti bull bull -41 bull bull bull bull bull bull jf middot bull bullbullbull -If bull bull bull 1( bull bullbull bull middot middot - bullbullbullbullbull bull bullbull bullbullbullbullbullbull bull bull bull bullbullbullbull bullbull bull

o 10 20

eix x

Figura 521 Distribucioacute de la mostra dins la xarxa real

La mostra obtinguda conserva les propietats de les dades provinents de la simulacioacute

daquesta manera podem afirmar que eacutes una bona extrapolacioacute de la realitat Vegem a

continuacioacute la descriptiva (Taula 52 1) i Ihistograma de la mostra (Figura 522) amb el

grafic de probabilitats (Figura 52 3) Podem observar que segueix efectivament una

distribucioacute lognormal

Variable N Mean Median TrMean StDev SE Mean rnos tra 1 00 1 0552 0 8330 0 9458 0 9566 0 0957

Variable Minimum Maximum Ql Q3 rnost ra 0 0250 441 85 0 328 1 1 3714

Taula 521 Descriptiva de la mostra

33

Capiacutetol 5 Desenvoluparnent del proiecte

30

gtshyo 20c Q) J oshy~

LL 10

-

1--

- --r--

n I Io

o 2 3 4 5 mostra

Figura 522 Histograma de la mostra

Lognormal Probability Plot for mostra

99

I 95

_ 90 - l -~80 70c jIQ) 60

50e 40Q) 30a 20

10 5

bull

~

001 010 100 1000

Data

MLEstimaacutee5

LocaIion -0341481

Scaacutee 0946372

Figura 523 Plot de probabilitat lognormal

34

Capiacutetol 5 Desenvolupament del projecte

La superfiacutecie descrita per la mostra podem representar-la tambeacute graficament (Figura

524)

mostra

45

40

3 5

30

25

20 15

10

05

00

eixy 20

Figura 524 Superfiacutecie definida per la mostra

35

Capiacutetol 5 Desenvolupament del projecte

53 Lestimacioacute per krigeat indicador

Per tal de realitzar el krigeat indicador definim 5 punts de tall o cut-off Aquests punts de tall

els escollim de forma que guardin simetria respecte el percentil del 50 tal i com mostra la

taula 531

Categoria Percentil Percentatge

1 90 009952

2 300 037637

3 500 073142

4 700 127046

5 910 254092

Taula 531 Els cinc punts de tall escollits

Un cop decidides les categories o punts de tall necessitem saber el semivariograma que

segueixen cada una delles per a poder dur a terme el krigeat indicador ja que Iestimacioacute

realitzada a partir daquest rneacutetode requereix una modelitzacioacute deis cinc semivariogrames

experimentals

El procediment eacutes el seguumlent

Partim de la mostra de 100 dades que segueix una distribucioacute 10gnormaL

Per cada una de les categories creem una columna de O i 1 de manera que si aquell

punt concret eacutes per sota del punt de tall el valor que pren la variable dicotoacutemica eacutes 1 i si eacutes

per sobre pren el valor O

Els semivariogrames els creem amb aquestes cinc columnes de zeros i uns

Per cada semivariograma provem dajustar un model esfeacuteric i un dexponencial Aquests dos

tipus de models els anirem ajustant a ull movent el valor del rang i de Iabast Partim

daquests models per ser els meacutes habituals en la realitat i ens quedarem amb el que ajusti millor deis dos [ref 2]

A continuacioacute presentem els resultats daquests ajustaments per a cada punt de tall

Capiacutetol 5 Desenvolupament del proiecte

Categoriacutea 1 y(h)

Model Exponencial Abast =8 Model Esferic Abast = 75

Meseta =003 Meseta = 003

VARIOGRANlA CATEGORIA 1

005

004 sectr bull ESF= ro E 003 E ro O)

002

001

000

o 2 4 6 8 10 12

Ihl

Figura 531 Model de semivariograma esfeacuteric i exponencial per la categoria 1

)1

Capiacutetol 5 Desenvolupament del projecte

Categoria 2

Model Exponencial Abast = 4 Model Esferic Abast = 4

Meseta = 022 Meseta = 022

VARIOGRAMA CATEGORIA 2

025

--

c bull ESF- sectro 020

E E ro Ogt

015

010

8 10 12

Figura 532 Model de semivariograma esferic i exponencial per la categoria 2

o 2 4 6

Ihl

Capitol 5 Desenvolupament del projecte

Categoriacutea 3

ModeJ Exponencial Abast =7 ModeJ Esferic Abast =6

Meseta =027 Meseta = 0265

VARIOGRAMA CATEGORIA 3

03

~ c (1] ~E 02E (1]

Ogt

01

o 2 4 6

Ihl

Figura 533 Model de semivariograma esfeacuteric i exponencial per la categoria 3

8 10 12

)9

Capiacutetol 5 Desenvolupament del projecte

Categoria 4

Model Exponencial Abast = 5 Model Esfeacuteric Abast = 4

Meseta = 02 Meseta = 02

VARIOGRAMA CATEGORIA 4

03

~ ~ -- ro E ~

02 E ro Ogt

01

deg 2 4 6

Ihl

Figura 534 Model de semivariograma esfeacuteric i exponencial per la categoria 4

8 10 12

Capiacutetol 5 Desenvolupament del projecte

Categoriacutea 5

Model Exponencial Abast =4 Model Esferic Abast = 3

Meseta =006 Meseta = 006

VARIOGRAMA CATEGORIA 5

008

= sect~ 007-shy ESFro E E 006 ro Ol

005

004

003

o 2 4 6 8 10 12

Ihl

Figura 535 Model de semivariograma esfeacuteric i exponencial per la categoria 5

Capiacutetol5 Desenvolupament del projecte

Mirant els cinc grafics veiem que el model que ajusta millor eacutes Iesferic en tots els casos

encara que no hi ha diferencies massa significatives respecte el model exponencial A meacutes

observem una certa simetria pel que fa a la meseta i abast de cada un deis models esferics

de cada categoria Taula 532

Cat 1 Cat2 Cat3 Cat4 Cat5

Meseta 003 022 0265 02 006

Abast 75 4 6 4 3

Taula 532 Meseta i abast per cada categoria

Aquesta simetria sobserva sobretot per les categories 2 3 i 4

Els models corresponents a les categories 1 i 5 no ajusten del tot beacute degut a que soacuten les

categories deis extrems i per tant la gran majoria de mostres si no totes estaran per sobre o

per sota respectivament

Ara ja podem fer Iestimacioacute per krigeat indicador Al programa ik3d li introduim els cinc

models de semivariogrames per tal que ens calculi Iestimacioacute

El resultat que obtenim soacuten cinc columnes de 625 dades on els valors van de O a 1

Concretament ens calcula la probabilitat de que el valor atorgat a cada punt sigui inferior al

daquell cut-off

El que es preteacuten ara eacutes a partir daquest conjunt de probabilitats interpolar la mediana per a

cada un deis punts de la xarxa per tant el que fem eacutes executar el programa postik en Iopcioacute

3 de manera que ens tregui Iestimacioacute de la mediana

A continuacioacute passem a detallar en que consisteix el postik Per tal de poder-ho expressar

millor ens centrare m en un punt concret de la xarxa el (30)

- - - - -

Capiacutetol 5 Desenvolupament del projecte

Els tercer valor de cada una de les 5 columnes obtingudes amb el krigeat indicador eacutes a dir

els valors corresponents a la mostra situada en el node (30) representen la probabilitat de

que el valor de la variable en aquest punt sigui major que cada un deis cut-off

respectivament aixiacute podem afirmar que

P(Xiexcl lt el ) = P(x(3Q) lt 00995) =00000

P(xiexcl lt e2) = P(X(3 Q) lt 03764) =00397

P(xiexcl lt c3) = P(X(30) lt 07314) = 00409

P(xiexcl lt e4) = P(X(30) lt 12705) = 02079

P(xiexcl lt e5) = P(X(3 0) lt 25402) =10000

Si ara grafiquem aquests 5 valors obtenim una estimacioacute de la probabilitat que teacute el punt

estudiat (30) de ser meacutes petit que qualsevol valor eacutes a dir Iestimacioacute de la funcioacute de

probabilitat en aquest punt Com que el que es preteacuten estimar en el nostre estudi eacutes la

mediana mirarem quin valor aproxima per la probabilitat del 05 eacutes a dir

m tal que P(X(30) lt m) = 05

Per aixoacute tracem una liacutenia a Ialcada 05 i daquesta manera obtenim el valor estimat de la

mediana Aquest valor correspon al valor que obtenim amb el POSTIK que eacutes per aquesta

primera observacioacute 06983

10

x v 6 68 05 o

00

Figura 536 Els 5 cut-off aplicats al punt (30)

Capiacutetol 5 Desenvolupament del projecte

Laplicacioacute del POSTIK realitza aquesta estimacioacute per a cada un deis punts obtinguts (625)

i daquesta manera podem obten ir una interpolacioacute de la mediana per cada un deis valors a

estimar

Capiacutetol 5 Desenvolupament del projecte

SEMIVARIOGRAMA DE LA MOSTRA

model exponencial

12

= r 07 -- ca E E ca O)

02

o 2 4 6 8 10 12

Ihl

Figura 541 Semivariograma experimental amb un model exponencial

Aquest model obtingut a ull teacute els seguumlents parametres abast=7

meseta=1 05

Aplicant aquest valors al model general obtenim la formulacioacute per a les nostres dades

46

middotCapiacutetol 5 Desenvolupament del projecte

MODEL ESFERIC La formulacioacute general eacutes

sih a

sih gt a

on a eacutes Iabast i c la meseta

SEMIVARIOGRAMA DE LA MOSTRA

model esferic

12

---shyro E 07 E ro Ol

02

o 2 4 6 8 10 12

Ihl

Figura 54 2 Semivariograma experimental amb un model esfeacuterico

Aquest model Ihem obtingut de la mateixa manera que Ianterior a ull i els seus

parametres que tambeacute aplicarem a la forma general soacuten abast=6 i meseta=1

47

Capiacutetol 5 Desenvolupament del projecte

Finalment pode m representar la superfiacutecie que hem estimat a partir del krigeat

lognormal utilitzant un grafic de superfiacutecie (Figura 54 5)

6

5

Krig Logn 3

2

o

20 eix y

Figura 545 Grafic de superfiacutecie pel krigeat lognormal

50

Capiacutetol 6Comparacioacute deis resultats obtinguts

61 Regressioacute lineal

Per tal de dur a terme la compara cioacute entre els dos meacutetodes destimacioacute i les dades que

simulen la realitat hem expressat els resultats obtinguts graficament mitjancant els

grafics de punts ajustant en cada cas la recta de regressioacute i dibuixant la bisectriu Cal

tenir en compte que per augmentar la claredat i per a simplificar la interpretacioacute deis

resultat hem transformat les dades a una N(O1) encara que el nostre estudi es basi en

un model lognormal

Passem a continuacioacute a analitzar els grafics

En primer lIoc (Figura 611) tenim el grafic de punts entre les dades obtingudes amb el

primer meacutetode destimacioacute el krigeat lognormal i les dades provinents de la simula cioacute

de la realitat

Regression Plot y =3a1E -02jo O6lt40216X

R-Sq = 594

_0 ro

ro EID o middot Ole

~~ -2

-3

- -3 -2 -1

redade regresioacute

Bisectriu

realitat simulada

Figura 611 Recta de regressioacute entre el krigeat lognormal i la simulacioacute de la realitat

Si mirem aquest grafic podem observar que el valor de Iestimacioacute realitzada

sobreestima els valors petits de la simulacioacute i en canvi en els valors grans subestima

El coeficient de correlacioacute es del 594 eacutes a dir que el meacutetode del krigeat lognormal

explica un 594 de la realitat

52

Capiacutetol 6Comparacioacute deis resultats obtinguts

Passem ara a realitzar el gratic entre el segon meto de destimacioacute el krigeat indicador

i la realitat simulada (Figura 612)

0 _O

m~ 0)-- o

~~ -1

-2

-3

Regression Plot y = -23E-02 + 0711 615X

R-Sq 526

bull bull

-3 -2 -1

realitat simulada

recta de regresi oacute

I Bisectriu

Figura 612 Recta de regressioacute entre el krigeat indicador i la simulacioacute de la realitat

Podem observar que el gratic obtingut eacutes molt semblant a Ianterior i que ens trobem

amb el mateix problema de sobreestimacioacute deis valors petits i subestimacioacute deis valors

grans de la simulacioacute

El valor del coeticient de correlacioacute tambeacute eacutes torga semblant 52 6 Aixiacute doncs la

realitat eacutes explicada en un 526 pel krigeat indicador

53

Capiacutetol 6Comparacioacute deis resultats obtinguts

Finalment i per tenir una idea de la relacioacute que hi ha entre els dos meacutetodes emprats en

el projecte realitzarem un uacuteltim grafic comparatiu (Figura 613) que representa els dos

meacutetodes destimacioacute el krigeat lognormal i el krigeat indicador

Regression Plot y = -7 SE-02 + 105401X

R-Sq 796

middot2

middot3

recta de regresi6

bull Bisectriu

middot 4 middot3 middot2 -1

krigeat lognormal

Figura 613 Recta de regressioacute entre el krigeat lognormal i el krigeat indicador

En aquest cas podem observar que la recta de regressioacute coincideix gairebeacute a la

perfeccioacute amb la bisectriu cosa que vol dir que els dos meacutetodes soacuten molt semblants

entre siacute i que per tant eacutes normal que Iaproximacioacute de cada un dells a la realitat sigui

semblant

El valor de la regressioacute eacutes meacutes gran que en els altres dos casos 796 eacutes a dir que

els dos meacutetodes no donen resultats significativament diferents entre si

Podem observar un conjunt de dades que prenen valors especialment elevats en

Iestimacioacute per krigeat indicador Si analitzem aquests punts podem comprovar que

soacuten punts que tenen una probabilitat de ser meacutes grans que el cinqueacute cut-off (percentil

097) igual a 1 Per tant aquest tipus de punts no shan de tenir en compte en el

moment dextreure conclusions De fet aixo ja es sospitava en el grafic anterior pero

en que en aquell hi ha una elevada dispersioacute i per tant Iefecte queda dissimulat

54

Capiacutetol 5 Desenvolupament del projecte

Tot estudi geoestadiacutestic segueix un guioacute de treball

bull Determinacioacute i analisi de Iestructura espaial

bull Modelitzacioacute de la variabilitat espaial

bull Estimacioacute de punts no mostrejats

bull Simulacioacute

bull Conclusions i descripcioacute de la zona estudiada

En el nostre cas malgrat no teniacuter dades reals i que el nostre objectiu no sia el coneixement

de la variable regionalitzada sinoacute el comparar dos metodes destimacioacute el proceacutes sera el

mateix Luacutenica diferencia eacutes que nosaltres fem una simulacioacute per tal dobtenir una base de

realitat a partir de la qual comenyar a treballar i no per tenir realitzacions de punts no

mostrejats Per tant en el nostre cas la simulacioacute esdeveacute el primer pas a realitzar

Capitol 5 Desenvolupament del projecte

51 La simulacioacute

Per tal de tenir una regi6 en la que poder treballar construim una xarxa de 25x25x1 eacutes a

dir treballem a R2bull

Volem obtenir una realitzaci6 en cada un deis nodes de la xarxa per tant realitzem una

simulaci6 de 625 dades Figura 511

Ix= o 1 2 23 24

~ yslz= 004 J

l

~] iexcllo

-t yrnn==O

-- xsiz== 004T-Eshy

o 11

~

Figura 511 Xarxa sobre la que es treballa i punts mostrejats

En el camp de la geologiacutea eacutes molt difiacutecil obtenir gaires mostres duna regi6 per aix6 els

meacutetodes de simulaci6 i destimaci6 s6n tant importants en geoestadiacutestica Com que a

nosaltres ens interesa tenir una xarxa complerta (perqueacute el que ens interessa eacutes veure quin

deis dos meacutetodes destimaci6 eacutes millor i no el saber com eacutes la regi6) el que fem eacutes simular

realitzacions duna N(O1) amb semiacutevariograma exponencial de meseta unitat en tots els

nodes de la nostre xarxa Sha escollit aquest tipus de semivariograma per ser el meacutes

habitual en el camp de la geologiacutea [ref 2]

En aquestes dad es els hi apliquem exponencials i per tant la nostra realitat segueix una

distribuci6 lognormal de mitjana unitat

El fet de treballar sobre dades lognormals ve justificat perque hi ha molts fenomens naturals

que segueixen aquesta distribuci6 [ref 11] (cerca de determinat mineral bosses de petrali

quantitat de sediments exploracions geoquimiques )

Per tant la nostre realitat eacutes aquesta eacutes a dir la distribuci6 lognormal de la variable

regionalitzada La N(O1) tant sois la fem servir per ser facil de maniobrar

computacionalment [ref 16]

Capiacutetol5 Desenvolupament del projecte

Per tal dassegurant-se que la nostre realitat eacutes mes o menys exacta mirem la seguumlent taula

Variable N Mean Median StDev SE Mean Hin 121 123

exp(siacutem) 625 10546 07742 10075 00403 00250 95965 03934 13721

Taula 511 Descriptiva de la variable regionalitzada exp(sim)

Amb els seguumlents grafics comprovem que realment les nostres dades segueixen una

distribucioacute lognormal

-200

() e Q) J CT 100 ~

IJ -

o

o 5 10 exp(sim)

Figura 512 Histograma de la realitat

Jo

Capiacutetol 5 Desenvolupament del projecte

Lognormal Probablllty Plot tor exp(sim)

Ml Estimates

l ocatiolt -0325300

Scale 0910009

99

95 90

80 70

e 60 (lJ 50 Uuml 40 shy 30 (lJ 20 a

10

5

001 010 100 1000

Data

Figura 513 Lognormal probability plot de la variable regionalitzada exp(sim)

exp(sim)

10

B

7

6 5

4

2

20

Figura 514 Surface plot de la variable exp(sim)

Capiacutetol 5 Desenvolupament del projecte

El surface plot eacutes una eina molt uacutetil ja que ens doacutena una visioacute de com es la nostra realitat a

Iespai A meacutes un cop haguem fet les dues estimacions tambeacute podrem fer el surface plot i

amb un cop dull podrem treure una primera impressioacute de si les estimacions han estat bones

o no

Capiacutetol 5 Desenvolupament del projecte

52 La mostra

A partir de les dades que hem obtingut amb la simulacioacute prenem una mostra aleatoria

de 100 dades a partir de la qual realitzarem les dues estimacions de la realitat Cal

tenir en compte que a partir daquest moment es treballara sobre la mostra i no sobre

les dades simulades que en Iexperimentacioacute real soacuten desconegudes

La mostra sha pres de forma que constitueixi una bona representacioacute del total de la

xarxa La figura 521 mostra la localitzacioacute de cada una de les dades que formen part

de la mostra sobre la xarxa inicial de 25x25 nodes

20 shy

gt x middotcv 10 _

o shy

middot o

bull It bullbullbullbullbullbull bull middot 4 bull bull bull bullbullbull bullbullbullbull bull bull bullbullbullbullbull bull bull bull bull bull bullbullbullbullbull bull bull bullbullbull -Jf bull middot middot middot bull middot 1t bullbullbullbull bullbullbullmiddot o bull bull bull bull bullbull bull bull bull bullbull II JI Jt bull bullbullbull lttt bullbullbull bullbullbull bullbull bull bull bull bullbull bull shy ~ ~ ~ ~ ~ It bull bull bullbullbull bull bull bullbullbull bullbull bull bullbullbullbull bullbull bull bull bull bullbullbullbullbullbull ti bull bull -41 bull bull bull bull bull bull jf middot bull bullbullbull -If bull bull bull 1( bull bullbull bull middot middot - bullbullbullbullbull bull bullbull bullbullbullbullbullbull bull bull bull bullbullbullbull bullbull bull

o 10 20

eix x

Figura 521 Distribucioacute de la mostra dins la xarxa real

La mostra obtinguda conserva les propietats de les dades provinents de la simulacioacute

daquesta manera podem afirmar que eacutes una bona extrapolacioacute de la realitat Vegem a

continuacioacute la descriptiva (Taula 52 1) i Ihistograma de la mostra (Figura 522) amb el

grafic de probabilitats (Figura 52 3) Podem observar que segueix efectivament una

distribucioacute lognormal

Variable N Mean Median TrMean StDev SE Mean rnos tra 1 00 1 0552 0 8330 0 9458 0 9566 0 0957

Variable Minimum Maximum Ql Q3 rnost ra 0 0250 441 85 0 328 1 1 3714

Taula 521 Descriptiva de la mostra

33

Capiacutetol 5 Desenvoluparnent del proiecte

30

gtshyo 20c Q) J oshy~

LL 10

-

1--

- --r--

n I Io

o 2 3 4 5 mostra

Figura 522 Histograma de la mostra

Lognormal Probability Plot for mostra

99

I 95

_ 90 - l -~80 70c jIQ) 60

50e 40Q) 30a 20

10 5

bull

~

001 010 100 1000

Data

MLEstimaacutee5

LocaIion -0341481

Scaacutee 0946372

Figura 523 Plot de probabilitat lognormal

34

Capiacutetol 5 Desenvolupament del projecte

La superfiacutecie descrita per la mostra podem representar-la tambeacute graficament (Figura

524)

mostra

45

40

3 5

30

25

20 15

10

05

00

eixy 20

Figura 524 Superfiacutecie definida per la mostra

35

Capiacutetol 5 Desenvolupament del projecte

53 Lestimacioacute per krigeat indicador

Per tal de realitzar el krigeat indicador definim 5 punts de tall o cut-off Aquests punts de tall

els escollim de forma que guardin simetria respecte el percentil del 50 tal i com mostra la

taula 531

Categoria Percentil Percentatge

1 90 009952

2 300 037637

3 500 073142

4 700 127046

5 910 254092

Taula 531 Els cinc punts de tall escollits

Un cop decidides les categories o punts de tall necessitem saber el semivariograma que

segueixen cada una delles per a poder dur a terme el krigeat indicador ja que Iestimacioacute

realitzada a partir daquest rneacutetode requereix una modelitzacioacute deis cinc semivariogrames

experimentals

El procediment eacutes el seguumlent

Partim de la mostra de 100 dades que segueix una distribucioacute 10gnormaL

Per cada una de les categories creem una columna de O i 1 de manera que si aquell

punt concret eacutes per sota del punt de tall el valor que pren la variable dicotoacutemica eacutes 1 i si eacutes

per sobre pren el valor O

Els semivariogrames els creem amb aquestes cinc columnes de zeros i uns

Per cada semivariograma provem dajustar un model esfeacuteric i un dexponencial Aquests dos

tipus de models els anirem ajustant a ull movent el valor del rang i de Iabast Partim

daquests models per ser els meacutes habituals en la realitat i ens quedarem amb el que ajusti millor deis dos [ref 2]

A continuacioacute presentem els resultats daquests ajustaments per a cada punt de tall

Capiacutetol 5 Desenvolupament del proiecte

Categoriacutea 1 y(h)

Model Exponencial Abast =8 Model Esferic Abast = 75

Meseta =003 Meseta = 003

VARIOGRANlA CATEGORIA 1

005

004 sectr bull ESF= ro E 003 E ro O)

002

001

000

o 2 4 6 8 10 12

Ihl

Figura 531 Model de semivariograma esfeacuteric i exponencial per la categoria 1

)1

Capiacutetol 5 Desenvolupament del projecte

Categoria 2

Model Exponencial Abast = 4 Model Esferic Abast = 4

Meseta = 022 Meseta = 022

VARIOGRAMA CATEGORIA 2

025

--

c bull ESF- sectro 020

E E ro Ogt

015

010

8 10 12

Figura 532 Model de semivariograma esferic i exponencial per la categoria 2

o 2 4 6

Ihl

Capitol 5 Desenvolupament del projecte

Categoriacutea 3

ModeJ Exponencial Abast =7 ModeJ Esferic Abast =6

Meseta =027 Meseta = 0265

VARIOGRAMA CATEGORIA 3

03

~ c (1] ~E 02E (1]

Ogt

01

o 2 4 6

Ihl

Figura 533 Model de semivariograma esfeacuteric i exponencial per la categoria 3

8 10 12

)9

Capiacutetol 5 Desenvolupament del projecte

Categoria 4

Model Exponencial Abast = 5 Model Esfeacuteric Abast = 4

Meseta = 02 Meseta = 02

VARIOGRAMA CATEGORIA 4

03

~ ~ -- ro E ~

02 E ro Ogt

01

deg 2 4 6

Ihl

Figura 534 Model de semivariograma esfeacuteric i exponencial per la categoria 4

8 10 12

Capiacutetol 5 Desenvolupament del projecte

Categoriacutea 5

Model Exponencial Abast =4 Model Esferic Abast = 3

Meseta =006 Meseta = 006

VARIOGRAMA CATEGORIA 5

008

= sect~ 007-shy ESFro E E 006 ro Ol

005

004

003

o 2 4 6 8 10 12

Ihl

Figura 535 Model de semivariograma esfeacuteric i exponencial per la categoria 5

Capiacutetol5 Desenvolupament del projecte

Mirant els cinc grafics veiem que el model que ajusta millor eacutes Iesferic en tots els casos

encara que no hi ha diferencies massa significatives respecte el model exponencial A meacutes

observem una certa simetria pel que fa a la meseta i abast de cada un deis models esferics

de cada categoria Taula 532

Cat 1 Cat2 Cat3 Cat4 Cat5

Meseta 003 022 0265 02 006

Abast 75 4 6 4 3

Taula 532 Meseta i abast per cada categoria

Aquesta simetria sobserva sobretot per les categories 2 3 i 4

Els models corresponents a les categories 1 i 5 no ajusten del tot beacute degut a que soacuten les

categories deis extrems i per tant la gran majoria de mostres si no totes estaran per sobre o

per sota respectivament

Ara ja podem fer Iestimacioacute per krigeat indicador Al programa ik3d li introduim els cinc

models de semivariogrames per tal que ens calculi Iestimacioacute

El resultat que obtenim soacuten cinc columnes de 625 dades on els valors van de O a 1

Concretament ens calcula la probabilitat de que el valor atorgat a cada punt sigui inferior al

daquell cut-off

El que es preteacuten ara eacutes a partir daquest conjunt de probabilitats interpolar la mediana per a

cada un deis punts de la xarxa per tant el que fem eacutes executar el programa postik en Iopcioacute

3 de manera que ens tregui Iestimacioacute de la mediana

A continuacioacute passem a detallar en que consisteix el postik Per tal de poder-ho expressar

millor ens centrare m en un punt concret de la xarxa el (30)

- - - - -

Capiacutetol 5 Desenvolupament del projecte

Els tercer valor de cada una de les 5 columnes obtingudes amb el krigeat indicador eacutes a dir

els valors corresponents a la mostra situada en el node (30) representen la probabilitat de

que el valor de la variable en aquest punt sigui major que cada un deis cut-off

respectivament aixiacute podem afirmar que

P(Xiexcl lt el ) = P(x(3Q) lt 00995) =00000

P(xiexcl lt e2) = P(X(3 Q) lt 03764) =00397

P(xiexcl lt c3) = P(X(30) lt 07314) = 00409

P(xiexcl lt e4) = P(X(30) lt 12705) = 02079

P(xiexcl lt e5) = P(X(3 0) lt 25402) =10000

Si ara grafiquem aquests 5 valors obtenim una estimacioacute de la probabilitat que teacute el punt

estudiat (30) de ser meacutes petit que qualsevol valor eacutes a dir Iestimacioacute de la funcioacute de

probabilitat en aquest punt Com que el que es preteacuten estimar en el nostre estudi eacutes la

mediana mirarem quin valor aproxima per la probabilitat del 05 eacutes a dir

m tal que P(X(30) lt m) = 05

Per aixoacute tracem una liacutenia a Ialcada 05 i daquesta manera obtenim el valor estimat de la

mediana Aquest valor correspon al valor que obtenim amb el POSTIK que eacutes per aquesta

primera observacioacute 06983

10

x v 6 68 05 o

00

Figura 536 Els 5 cut-off aplicats al punt (30)

Capiacutetol 5 Desenvolupament del projecte

Laplicacioacute del POSTIK realitza aquesta estimacioacute per a cada un deis punts obtinguts (625)

i daquesta manera podem obten ir una interpolacioacute de la mediana per cada un deis valors a

estimar

Capiacutetol 5 Desenvolupament del projecte

SEMIVARIOGRAMA DE LA MOSTRA

model exponencial

12

= r 07 -- ca E E ca O)

02

o 2 4 6 8 10 12

Ihl

Figura 541 Semivariograma experimental amb un model exponencial

Aquest model obtingut a ull teacute els seguumlents parametres abast=7

meseta=1 05

Aplicant aquest valors al model general obtenim la formulacioacute per a les nostres dades

46

middotCapiacutetol 5 Desenvolupament del projecte

MODEL ESFERIC La formulacioacute general eacutes

sih a

sih gt a

on a eacutes Iabast i c la meseta

SEMIVARIOGRAMA DE LA MOSTRA

model esferic

12

---shyro E 07 E ro Ol

02

o 2 4 6 8 10 12

Ihl

Figura 54 2 Semivariograma experimental amb un model esfeacuterico

Aquest model Ihem obtingut de la mateixa manera que Ianterior a ull i els seus

parametres que tambeacute aplicarem a la forma general soacuten abast=6 i meseta=1

47

Capiacutetol 5 Desenvolupament del projecte

Finalment pode m representar la superfiacutecie que hem estimat a partir del krigeat

lognormal utilitzant un grafic de superfiacutecie (Figura 54 5)

6

5

Krig Logn 3

2

o

20 eix y

Figura 545 Grafic de superfiacutecie pel krigeat lognormal

50

Capiacutetol 6Comparacioacute deis resultats obtinguts

61 Regressioacute lineal

Per tal de dur a terme la compara cioacute entre els dos meacutetodes destimacioacute i les dades que

simulen la realitat hem expressat els resultats obtinguts graficament mitjancant els

grafics de punts ajustant en cada cas la recta de regressioacute i dibuixant la bisectriu Cal

tenir en compte que per augmentar la claredat i per a simplificar la interpretacioacute deis

resultat hem transformat les dades a una N(O1) encara que el nostre estudi es basi en

un model lognormal

Passem a continuacioacute a analitzar els grafics

En primer lIoc (Figura 611) tenim el grafic de punts entre les dades obtingudes amb el

primer meacutetode destimacioacute el krigeat lognormal i les dades provinents de la simula cioacute

de la realitat

Regression Plot y =3a1E -02jo O6lt40216X

R-Sq = 594

_0 ro

ro EID o middot Ole

~~ -2

-3

- -3 -2 -1

redade regresioacute

Bisectriu

realitat simulada

Figura 611 Recta de regressioacute entre el krigeat lognormal i la simulacioacute de la realitat

Si mirem aquest grafic podem observar que el valor de Iestimacioacute realitzada

sobreestima els valors petits de la simulacioacute i en canvi en els valors grans subestima

El coeficient de correlacioacute es del 594 eacutes a dir que el meacutetode del krigeat lognormal

explica un 594 de la realitat

52

Capiacutetol 6Comparacioacute deis resultats obtinguts

Passem ara a realitzar el gratic entre el segon meto de destimacioacute el krigeat indicador

i la realitat simulada (Figura 612)

0 _O

m~ 0)-- o

~~ -1

-2

-3

Regression Plot y = -23E-02 + 0711 615X

R-Sq 526

bull bull

-3 -2 -1

realitat simulada

recta de regresi oacute

I Bisectriu

Figura 612 Recta de regressioacute entre el krigeat indicador i la simulacioacute de la realitat

Podem observar que el gratic obtingut eacutes molt semblant a Ianterior i que ens trobem

amb el mateix problema de sobreestimacioacute deis valors petits i subestimacioacute deis valors

grans de la simulacioacute

El valor del coeticient de correlacioacute tambeacute eacutes torga semblant 52 6 Aixiacute doncs la

realitat eacutes explicada en un 526 pel krigeat indicador

53

Capiacutetol 6Comparacioacute deis resultats obtinguts

Finalment i per tenir una idea de la relacioacute que hi ha entre els dos meacutetodes emprats en

el projecte realitzarem un uacuteltim grafic comparatiu (Figura 613) que representa els dos

meacutetodes destimacioacute el krigeat lognormal i el krigeat indicador

Regression Plot y = -7 SE-02 + 105401X

R-Sq 796

middot2

middot3

recta de regresi6

bull Bisectriu

middot 4 middot3 middot2 -1

krigeat lognormal

Figura 613 Recta de regressioacute entre el krigeat lognormal i el krigeat indicador

En aquest cas podem observar que la recta de regressioacute coincideix gairebeacute a la

perfeccioacute amb la bisectriu cosa que vol dir que els dos meacutetodes soacuten molt semblants

entre siacute i que per tant eacutes normal que Iaproximacioacute de cada un dells a la realitat sigui

semblant

El valor de la regressioacute eacutes meacutes gran que en els altres dos casos 796 eacutes a dir que

els dos meacutetodes no donen resultats significativament diferents entre si

Podem observar un conjunt de dades que prenen valors especialment elevats en

Iestimacioacute per krigeat indicador Si analitzem aquests punts podem comprovar que

soacuten punts que tenen una probabilitat de ser meacutes grans que el cinqueacute cut-off (percentil

097) igual a 1 Per tant aquest tipus de punts no shan de tenir en compte en el

moment dextreure conclusions De fet aixo ja es sospitava en el grafic anterior pero

en que en aquell hi ha una elevada dispersioacute i per tant Iefecte queda dissimulat

54

Capitol 5 Desenvolupament del projecte

51 La simulacioacute

Per tal de tenir una regi6 en la que poder treballar construim una xarxa de 25x25x1 eacutes a

dir treballem a R2bull

Volem obtenir una realitzaci6 en cada un deis nodes de la xarxa per tant realitzem una

simulaci6 de 625 dades Figura 511

Ix= o 1 2 23 24

~ yslz= 004 J

l

~] iexcllo

-t yrnn==O

-- xsiz== 004T-Eshy

o 11

~

Figura 511 Xarxa sobre la que es treballa i punts mostrejats

En el camp de la geologiacutea eacutes molt difiacutecil obtenir gaires mostres duna regi6 per aix6 els

meacutetodes de simulaci6 i destimaci6 s6n tant importants en geoestadiacutestica Com que a

nosaltres ens interesa tenir una xarxa complerta (perqueacute el que ens interessa eacutes veure quin

deis dos meacutetodes destimaci6 eacutes millor i no el saber com eacutes la regi6) el que fem eacutes simular

realitzacions duna N(O1) amb semiacutevariograma exponencial de meseta unitat en tots els

nodes de la nostre xarxa Sha escollit aquest tipus de semivariograma per ser el meacutes

habitual en el camp de la geologiacutea [ref 2]

En aquestes dad es els hi apliquem exponencials i per tant la nostra realitat segueix una

distribuci6 lognormal de mitjana unitat

El fet de treballar sobre dades lognormals ve justificat perque hi ha molts fenomens naturals

que segueixen aquesta distribuci6 [ref 11] (cerca de determinat mineral bosses de petrali

quantitat de sediments exploracions geoquimiques )

Per tant la nostre realitat eacutes aquesta eacutes a dir la distribuci6 lognormal de la variable

regionalitzada La N(O1) tant sois la fem servir per ser facil de maniobrar

computacionalment [ref 16]

Capiacutetol5 Desenvolupament del projecte

Per tal dassegurant-se que la nostre realitat eacutes mes o menys exacta mirem la seguumlent taula

Variable N Mean Median StDev SE Mean Hin 121 123

exp(siacutem) 625 10546 07742 10075 00403 00250 95965 03934 13721

Taula 511 Descriptiva de la variable regionalitzada exp(sim)

Amb els seguumlents grafics comprovem que realment les nostres dades segueixen una

distribucioacute lognormal

-200

() e Q) J CT 100 ~

IJ -

o

o 5 10 exp(sim)

Figura 512 Histograma de la realitat

Jo

Capiacutetol 5 Desenvolupament del projecte

Lognormal Probablllty Plot tor exp(sim)

Ml Estimates

l ocatiolt -0325300

Scale 0910009

99

95 90

80 70

e 60 (lJ 50 Uuml 40 shy 30 (lJ 20 a

10

5

001 010 100 1000

Data

Figura 513 Lognormal probability plot de la variable regionalitzada exp(sim)

exp(sim)

10

B

7

6 5

4

2

20

Figura 514 Surface plot de la variable exp(sim)

Capiacutetol 5 Desenvolupament del projecte

El surface plot eacutes una eina molt uacutetil ja que ens doacutena una visioacute de com es la nostra realitat a

Iespai A meacutes un cop haguem fet les dues estimacions tambeacute podrem fer el surface plot i

amb un cop dull podrem treure una primera impressioacute de si les estimacions han estat bones

o no

Capiacutetol 5 Desenvolupament del projecte

52 La mostra

A partir de les dades que hem obtingut amb la simulacioacute prenem una mostra aleatoria

de 100 dades a partir de la qual realitzarem les dues estimacions de la realitat Cal

tenir en compte que a partir daquest moment es treballara sobre la mostra i no sobre

les dades simulades que en Iexperimentacioacute real soacuten desconegudes

La mostra sha pres de forma que constitueixi una bona representacioacute del total de la

xarxa La figura 521 mostra la localitzacioacute de cada una de les dades que formen part

de la mostra sobre la xarxa inicial de 25x25 nodes

20 shy

gt x middotcv 10 _

o shy

middot o

bull It bullbullbullbullbullbull bull middot 4 bull bull bull bullbullbull bullbullbullbull bull bull bullbullbullbullbull bull bull bull bull bull bullbullbullbullbull bull bull bullbullbull -Jf bull middot middot middot bull middot 1t bullbullbullbull bullbullbullmiddot o bull bull bull bull bullbull bull bull bull bullbull II JI Jt bull bullbullbull lttt bullbullbull bullbullbull bullbull bull bull bull bullbull bull shy ~ ~ ~ ~ ~ It bull bull bullbullbull bull bull bullbullbull bullbull bull bullbullbullbull bullbull bull bull bull bullbullbullbullbullbull ti bull bull -41 bull bull bull bull bull bull jf middot bull bullbullbull -If bull bull bull 1( bull bullbull bull middot middot - bullbullbullbullbull bull bullbull bullbullbullbullbullbull bull bull bull bullbullbullbull bullbull bull

o 10 20

eix x

Figura 521 Distribucioacute de la mostra dins la xarxa real

La mostra obtinguda conserva les propietats de les dades provinents de la simulacioacute

daquesta manera podem afirmar que eacutes una bona extrapolacioacute de la realitat Vegem a

continuacioacute la descriptiva (Taula 52 1) i Ihistograma de la mostra (Figura 522) amb el

grafic de probabilitats (Figura 52 3) Podem observar que segueix efectivament una

distribucioacute lognormal

Variable N Mean Median TrMean StDev SE Mean rnos tra 1 00 1 0552 0 8330 0 9458 0 9566 0 0957

Variable Minimum Maximum Ql Q3 rnost ra 0 0250 441 85 0 328 1 1 3714

Taula 521 Descriptiva de la mostra

33

Capiacutetol 5 Desenvoluparnent del proiecte

30

gtshyo 20c Q) J oshy~

LL 10

-

1--

- --r--

n I Io

o 2 3 4 5 mostra

Figura 522 Histograma de la mostra

Lognormal Probability Plot for mostra

99

I 95

_ 90 - l -~80 70c jIQ) 60

50e 40Q) 30a 20

10 5

bull

~

001 010 100 1000

Data

MLEstimaacutee5

LocaIion -0341481

Scaacutee 0946372

Figura 523 Plot de probabilitat lognormal

34

Capiacutetol 5 Desenvolupament del projecte

La superfiacutecie descrita per la mostra podem representar-la tambeacute graficament (Figura

524)

mostra

45

40

3 5

30

25

20 15

10

05

00

eixy 20

Figura 524 Superfiacutecie definida per la mostra

35

Capiacutetol 5 Desenvolupament del projecte

53 Lestimacioacute per krigeat indicador

Per tal de realitzar el krigeat indicador definim 5 punts de tall o cut-off Aquests punts de tall

els escollim de forma que guardin simetria respecte el percentil del 50 tal i com mostra la

taula 531

Categoria Percentil Percentatge

1 90 009952

2 300 037637

3 500 073142

4 700 127046

5 910 254092

Taula 531 Els cinc punts de tall escollits

Un cop decidides les categories o punts de tall necessitem saber el semivariograma que

segueixen cada una delles per a poder dur a terme el krigeat indicador ja que Iestimacioacute

realitzada a partir daquest rneacutetode requereix una modelitzacioacute deis cinc semivariogrames

experimentals

El procediment eacutes el seguumlent

Partim de la mostra de 100 dades que segueix una distribucioacute 10gnormaL

Per cada una de les categories creem una columna de O i 1 de manera que si aquell

punt concret eacutes per sota del punt de tall el valor que pren la variable dicotoacutemica eacutes 1 i si eacutes

per sobre pren el valor O

Els semivariogrames els creem amb aquestes cinc columnes de zeros i uns

Per cada semivariograma provem dajustar un model esfeacuteric i un dexponencial Aquests dos

tipus de models els anirem ajustant a ull movent el valor del rang i de Iabast Partim

daquests models per ser els meacutes habituals en la realitat i ens quedarem amb el que ajusti millor deis dos [ref 2]

A continuacioacute presentem els resultats daquests ajustaments per a cada punt de tall

Capiacutetol 5 Desenvolupament del proiecte

Categoriacutea 1 y(h)

Model Exponencial Abast =8 Model Esferic Abast = 75

Meseta =003 Meseta = 003

VARIOGRANlA CATEGORIA 1

005

004 sectr bull ESF= ro E 003 E ro O)

002

001

000

o 2 4 6 8 10 12

Ihl

Figura 531 Model de semivariograma esfeacuteric i exponencial per la categoria 1

)1

Capiacutetol 5 Desenvolupament del projecte

Categoria 2

Model Exponencial Abast = 4 Model Esferic Abast = 4

Meseta = 022 Meseta = 022

VARIOGRAMA CATEGORIA 2

025

--

c bull ESF- sectro 020

E E ro Ogt

015

010

8 10 12

Figura 532 Model de semivariograma esferic i exponencial per la categoria 2

o 2 4 6

Ihl

Capitol 5 Desenvolupament del projecte

Categoriacutea 3

ModeJ Exponencial Abast =7 ModeJ Esferic Abast =6

Meseta =027 Meseta = 0265

VARIOGRAMA CATEGORIA 3

03

~ c (1] ~E 02E (1]

Ogt

01

o 2 4 6

Ihl

Figura 533 Model de semivariograma esfeacuteric i exponencial per la categoria 3

8 10 12

)9

Capiacutetol 5 Desenvolupament del projecte

Categoria 4

Model Exponencial Abast = 5 Model Esfeacuteric Abast = 4

Meseta = 02 Meseta = 02

VARIOGRAMA CATEGORIA 4

03

~ ~ -- ro E ~

02 E ro Ogt

01

deg 2 4 6

Ihl

Figura 534 Model de semivariograma esfeacuteric i exponencial per la categoria 4

8 10 12

Capiacutetol 5 Desenvolupament del projecte

Categoriacutea 5

Model Exponencial Abast =4 Model Esferic Abast = 3

Meseta =006 Meseta = 006

VARIOGRAMA CATEGORIA 5

008

= sect~ 007-shy ESFro E E 006 ro Ol

005

004

003

o 2 4 6 8 10 12

Ihl

Figura 535 Model de semivariograma esfeacuteric i exponencial per la categoria 5

Capiacutetol5 Desenvolupament del projecte

Mirant els cinc grafics veiem que el model que ajusta millor eacutes Iesferic en tots els casos

encara que no hi ha diferencies massa significatives respecte el model exponencial A meacutes

observem una certa simetria pel que fa a la meseta i abast de cada un deis models esferics

de cada categoria Taula 532

Cat 1 Cat2 Cat3 Cat4 Cat5

Meseta 003 022 0265 02 006

Abast 75 4 6 4 3

Taula 532 Meseta i abast per cada categoria

Aquesta simetria sobserva sobretot per les categories 2 3 i 4

Els models corresponents a les categories 1 i 5 no ajusten del tot beacute degut a que soacuten les

categories deis extrems i per tant la gran majoria de mostres si no totes estaran per sobre o

per sota respectivament

Ara ja podem fer Iestimacioacute per krigeat indicador Al programa ik3d li introduim els cinc

models de semivariogrames per tal que ens calculi Iestimacioacute

El resultat que obtenim soacuten cinc columnes de 625 dades on els valors van de O a 1

Concretament ens calcula la probabilitat de que el valor atorgat a cada punt sigui inferior al

daquell cut-off

El que es preteacuten ara eacutes a partir daquest conjunt de probabilitats interpolar la mediana per a

cada un deis punts de la xarxa per tant el que fem eacutes executar el programa postik en Iopcioacute

3 de manera que ens tregui Iestimacioacute de la mediana

A continuacioacute passem a detallar en que consisteix el postik Per tal de poder-ho expressar

millor ens centrare m en un punt concret de la xarxa el (30)

- - - - -

Capiacutetol 5 Desenvolupament del projecte

Els tercer valor de cada una de les 5 columnes obtingudes amb el krigeat indicador eacutes a dir

els valors corresponents a la mostra situada en el node (30) representen la probabilitat de

que el valor de la variable en aquest punt sigui major que cada un deis cut-off

respectivament aixiacute podem afirmar que

P(Xiexcl lt el ) = P(x(3Q) lt 00995) =00000

P(xiexcl lt e2) = P(X(3 Q) lt 03764) =00397

P(xiexcl lt c3) = P(X(30) lt 07314) = 00409

P(xiexcl lt e4) = P(X(30) lt 12705) = 02079

P(xiexcl lt e5) = P(X(3 0) lt 25402) =10000

Si ara grafiquem aquests 5 valors obtenim una estimacioacute de la probabilitat que teacute el punt

estudiat (30) de ser meacutes petit que qualsevol valor eacutes a dir Iestimacioacute de la funcioacute de

probabilitat en aquest punt Com que el que es preteacuten estimar en el nostre estudi eacutes la

mediana mirarem quin valor aproxima per la probabilitat del 05 eacutes a dir

m tal que P(X(30) lt m) = 05

Per aixoacute tracem una liacutenia a Ialcada 05 i daquesta manera obtenim el valor estimat de la

mediana Aquest valor correspon al valor que obtenim amb el POSTIK que eacutes per aquesta

primera observacioacute 06983

10

x v 6 68 05 o

00

Figura 536 Els 5 cut-off aplicats al punt (30)

Capiacutetol 5 Desenvolupament del projecte

Laplicacioacute del POSTIK realitza aquesta estimacioacute per a cada un deis punts obtinguts (625)

i daquesta manera podem obten ir una interpolacioacute de la mediana per cada un deis valors a

estimar

Capiacutetol 5 Desenvolupament del projecte

SEMIVARIOGRAMA DE LA MOSTRA

model exponencial

12

= r 07 -- ca E E ca O)

02

o 2 4 6 8 10 12

Ihl

Figura 541 Semivariograma experimental amb un model exponencial

Aquest model obtingut a ull teacute els seguumlents parametres abast=7

meseta=1 05

Aplicant aquest valors al model general obtenim la formulacioacute per a les nostres dades

46

middotCapiacutetol 5 Desenvolupament del projecte

MODEL ESFERIC La formulacioacute general eacutes

sih a

sih gt a

on a eacutes Iabast i c la meseta

SEMIVARIOGRAMA DE LA MOSTRA

model esferic

12

---shyro E 07 E ro Ol

02

o 2 4 6 8 10 12

Ihl

Figura 54 2 Semivariograma experimental amb un model esfeacuterico

Aquest model Ihem obtingut de la mateixa manera que Ianterior a ull i els seus

parametres que tambeacute aplicarem a la forma general soacuten abast=6 i meseta=1

47

Capiacutetol 5 Desenvolupament del projecte

Finalment pode m representar la superfiacutecie que hem estimat a partir del krigeat

lognormal utilitzant un grafic de superfiacutecie (Figura 54 5)

6

5

Krig Logn 3

2

o

20 eix y

Figura 545 Grafic de superfiacutecie pel krigeat lognormal

50

Capiacutetol 6Comparacioacute deis resultats obtinguts

61 Regressioacute lineal

Per tal de dur a terme la compara cioacute entre els dos meacutetodes destimacioacute i les dades que

simulen la realitat hem expressat els resultats obtinguts graficament mitjancant els

grafics de punts ajustant en cada cas la recta de regressioacute i dibuixant la bisectriu Cal

tenir en compte que per augmentar la claredat i per a simplificar la interpretacioacute deis

resultat hem transformat les dades a una N(O1) encara que el nostre estudi es basi en

un model lognormal

Passem a continuacioacute a analitzar els grafics

En primer lIoc (Figura 611) tenim el grafic de punts entre les dades obtingudes amb el

primer meacutetode destimacioacute el krigeat lognormal i les dades provinents de la simula cioacute

de la realitat

Regression Plot y =3a1E -02jo O6lt40216X

R-Sq = 594

_0 ro

ro EID o middot Ole

~~ -2

-3

- -3 -2 -1

redade regresioacute

Bisectriu

realitat simulada

Figura 611 Recta de regressioacute entre el krigeat lognormal i la simulacioacute de la realitat

Si mirem aquest grafic podem observar que el valor de Iestimacioacute realitzada

sobreestima els valors petits de la simulacioacute i en canvi en els valors grans subestima

El coeficient de correlacioacute es del 594 eacutes a dir que el meacutetode del krigeat lognormal

explica un 594 de la realitat

52

Capiacutetol 6Comparacioacute deis resultats obtinguts

Passem ara a realitzar el gratic entre el segon meto de destimacioacute el krigeat indicador

i la realitat simulada (Figura 612)

0 _O

m~ 0)-- o

~~ -1

-2

-3

Regression Plot y = -23E-02 + 0711 615X

R-Sq 526

bull bull

-3 -2 -1

realitat simulada

recta de regresi oacute

I Bisectriu

Figura 612 Recta de regressioacute entre el krigeat indicador i la simulacioacute de la realitat

Podem observar que el gratic obtingut eacutes molt semblant a Ianterior i que ens trobem

amb el mateix problema de sobreestimacioacute deis valors petits i subestimacioacute deis valors

grans de la simulacioacute

El valor del coeticient de correlacioacute tambeacute eacutes torga semblant 52 6 Aixiacute doncs la

realitat eacutes explicada en un 526 pel krigeat indicador

53

Capiacutetol 6Comparacioacute deis resultats obtinguts

Finalment i per tenir una idea de la relacioacute que hi ha entre els dos meacutetodes emprats en

el projecte realitzarem un uacuteltim grafic comparatiu (Figura 613) que representa els dos

meacutetodes destimacioacute el krigeat lognormal i el krigeat indicador

Regression Plot y = -7 SE-02 + 105401X

R-Sq 796

middot2

middot3

recta de regresi6

bull Bisectriu

middot 4 middot3 middot2 -1

krigeat lognormal

Figura 613 Recta de regressioacute entre el krigeat lognormal i el krigeat indicador

En aquest cas podem observar que la recta de regressioacute coincideix gairebeacute a la

perfeccioacute amb la bisectriu cosa que vol dir que els dos meacutetodes soacuten molt semblants

entre siacute i que per tant eacutes normal que Iaproximacioacute de cada un dells a la realitat sigui

semblant

El valor de la regressioacute eacutes meacutes gran que en els altres dos casos 796 eacutes a dir que

els dos meacutetodes no donen resultats significativament diferents entre si

Podem observar un conjunt de dades que prenen valors especialment elevats en

Iestimacioacute per krigeat indicador Si analitzem aquests punts podem comprovar que

soacuten punts que tenen una probabilitat de ser meacutes grans que el cinqueacute cut-off (percentil

097) igual a 1 Per tant aquest tipus de punts no shan de tenir en compte en el

moment dextreure conclusions De fet aixo ja es sospitava en el grafic anterior pero

en que en aquell hi ha una elevada dispersioacute i per tant Iefecte queda dissimulat

54

Capiacutetol5 Desenvolupament del projecte

Per tal dassegurant-se que la nostre realitat eacutes mes o menys exacta mirem la seguumlent taula

Variable N Mean Median StDev SE Mean Hin 121 123

exp(siacutem) 625 10546 07742 10075 00403 00250 95965 03934 13721

Taula 511 Descriptiva de la variable regionalitzada exp(sim)

Amb els seguumlents grafics comprovem que realment les nostres dades segueixen una

distribucioacute lognormal

-200

() e Q) J CT 100 ~

IJ -

o

o 5 10 exp(sim)

Figura 512 Histograma de la realitat

Jo

Capiacutetol 5 Desenvolupament del projecte

Lognormal Probablllty Plot tor exp(sim)

Ml Estimates

l ocatiolt -0325300

Scale 0910009

99

95 90

80 70

e 60 (lJ 50 Uuml 40 shy 30 (lJ 20 a

10

5

001 010 100 1000

Data

Figura 513 Lognormal probability plot de la variable regionalitzada exp(sim)

exp(sim)

10

B

7

6 5

4

2

20

Figura 514 Surface plot de la variable exp(sim)

Capiacutetol 5 Desenvolupament del projecte

El surface plot eacutes una eina molt uacutetil ja que ens doacutena una visioacute de com es la nostra realitat a

Iespai A meacutes un cop haguem fet les dues estimacions tambeacute podrem fer el surface plot i

amb un cop dull podrem treure una primera impressioacute de si les estimacions han estat bones

o no

Capiacutetol 5 Desenvolupament del projecte

52 La mostra

A partir de les dades que hem obtingut amb la simulacioacute prenem una mostra aleatoria

de 100 dades a partir de la qual realitzarem les dues estimacions de la realitat Cal

tenir en compte que a partir daquest moment es treballara sobre la mostra i no sobre

les dades simulades que en Iexperimentacioacute real soacuten desconegudes

La mostra sha pres de forma que constitueixi una bona representacioacute del total de la

xarxa La figura 521 mostra la localitzacioacute de cada una de les dades que formen part

de la mostra sobre la xarxa inicial de 25x25 nodes

20 shy

gt x middotcv 10 _

o shy

middot o

bull It bullbullbullbullbullbull bull middot 4 bull bull bull bullbullbull bullbullbullbull bull bull bullbullbullbullbull bull bull bull bull bull bullbullbullbullbull bull bull bullbullbull -Jf bull middot middot middot bull middot 1t bullbullbullbull bullbullbullmiddot o bull bull bull bull bullbull bull bull bull bullbull II JI Jt bull bullbullbull lttt bullbullbull bullbullbull bullbull bull bull bull bullbull bull shy ~ ~ ~ ~ ~ It bull bull bullbullbull bull bull bullbullbull bullbull bull bullbullbullbull bullbull bull bull bull bullbullbullbullbullbull ti bull bull -41 bull bull bull bull bull bull jf middot bull bullbullbull -If bull bull bull 1( bull bullbull bull middot middot - bullbullbullbullbull bull bullbull bullbullbullbullbullbull bull bull bull bullbullbullbull bullbull bull

o 10 20

eix x

Figura 521 Distribucioacute de la mostra dins la xarxa real

La mostra obtinguda conserva les propietats de les dades provinents de la simulacioacute

daquesta manera podem afirmar que eacutes una bona extrapolacioacute de la realitat Vegem a

continuacioacute la descriptiva (Taula 52 1) i Ihistograma de la mostra (Figura 522) amb el

grafic de probabilitats (Figura 52 3) Podem observar que segueix efectivament una

distribucioacute lognormal

Variable N Mean Median TrMean StDev SE Mean rnos tra 1 00 1 0552 0 8330 0 9458 0 9566 0 0957

Variable Minimum Maximum Ql Q3 rnost ra 0 0250 441 85 0 328 1 1 3714

Taula 521 Descriptiva de la mostra

33

Capiacutetol 5 Desenvoluparnent del proiecte

30

gtshyo 20c Q) J oshy~

LL 10

-

1--

- --r--

n I Io

o 2 3 4 5 mostra

Figura 522 Histograma de la mostra

Lognormal Probability Plot for mostra

99

I 95

_ 90 - l -~80 70c jIQ) 60

50e 40Q) 30a 20

10 5

bull

~

001 010 100 1000

Data

MLEstimaacutee5

LocaIion -0341481

Scaacutee 0946372

Figura 523 Plot de probabilitat lognormal

34

Capiacutetol 5 Desenvolupament del projecte

La superfiacutecie descrita per la mostra podem representar-la tambeacute graficament (Figura

524)

mostra

45

40

3 5

30

25

20 15

10

05

00

eixy 20

Figura 524 Superfiacutecie definida per la mostra

35

Capiacutetol 5 Desenvolupament del projecte

53 Lestimacioacute per krigeat indicador

Per tal de realitzar el krigeat indicador definim 5 punts de tall o cut-off Aquests punts de tall

els escollim de forma que guardin simetria respecte el percentil del 50 tal i com mostra la

taula 531

Categoria Percentil Percentatge

1 90 009952

2 300 037637

3 500 073142

4 700 127046

5 910 254092

Taula 531 Els cinc punts de tall escollits

Un cop decidides les categories o punts de tall necessitem saber el semivariograma que

segueixen cada una delles per a poder dur a terme el krigeat indicador ja que Iestimacioacute

realitzada a partir daquest rneacutetode requereix una modelitzacioacute deis cinc semivariogrames

experimentals

El procediment eacutes el seguumlent

Partim de la mostra de 100 dades que segueix una distribucioacute 10gnormaL

Per cada una de les categories creem una columna de O i 1 de manera que si aquell

punt concret eacutes per sota del punt de tall el valor que pren la variable dicotoacutemica eacutes 1 i si eacutes

per sobre pren el valor O

Els semivariogrames els creem amb aquestes cinc columnes de zeros i uns

Per cada semivariograma provem dajustar un model esfeacuteric i un dexponencial Aquests dos

tipus de models els anirem ajustant a ull movent el valor del rang i de Iabast Partim

daquests models per ser els meacutes habituals en la realitat i ens quedarem amb el que ajusti millor deis dos [ref 2]

A continuacioacute presentem els resultats daquests ajustaments per a cada punt de tall

Capiacutetol 5 Desenvolupament del proiecte

Categoriacutea 1 y(h)

Model Exponencial Abast =8 Model Esferic Abast = 75

Meseta =003 Meseta = 003

VARIOGRANlA CATEGORIA 1

005

004 sectr bull ESF= ro E 003 E ro O)

002

001

000

o 2 4 6 8 10 12

Ihl

Figura 531 Model de semivariograma esfeacuteric i exponencial per la categoria 1

)1

Capiacutetol 5 Desenvolupament del projecte

Categoria 2

Model Exponencial Abast = 4 Model Esferic Abast = 4

Meseta = 022 Meseta = 022

VARIOGRAMA CATEGORIA 2

025

--

c bull ESF- sectro 020

E E ro Ogt

015

010

8 10 12

Figura 532 Model de semivariograma esferic i exponencial per la categoria 2

o 2 4 6

Ihl

Capitol 5 Desenvolupament del projecte

Categoriacutea 3

ModeJ Exponencial Abast =7 ModeJ Esferic Abast =6

Meseta =027 Meseta = 0265

VARIOGRAMA CATEGORIA 3

03

~ c (1] ~E 02E (1]

Ogt

01

o 2 4 6

Ihl

Figura 533 Model de semivariograma esfeacuteric i exponencial per la categoria 3

8 10 12

)9

Capiacutetol 5 Desenvolupament del projecte

Categoria 4

Model Exponencial Abast = 5 Model Esfeacuteric Abast = 4

Meseta = 02 Meseta = 02

VARIOGRAMA CATEGORIA 4

03

~ ~ -- ro E ~

02 E ro Ogt

01

deg 2 4 6

Ihl

Figura 534 Model de semivariograma esfeacuteric i exponencial per la categoria 4

8 10 12

Capiacutetol 5 Desenvolupament del projecte

Categoriacutea 5

Model Exponencial Abast =4 Model Esferic Abast = 3

Meseta =006 Meseta = 006

VARIOGRAMA CATEGORIA 5

008

= sect~ 007-shy ESFro E E 006 ro Ol

005

004

003

o 2 4 6 8 10 12

Ihl

Figura 535 Model de semivariograma esfeacuteric i exponencial per la categoria 5

Capiacutetol5 Desenvolupament del projecte

Mirant els cinc grafics veiem que el model que ajusta millor eacutes Iesferic en tots els casos

encara que no hi ha diferencies massa significatives respecte el model exponencial A meacutes

observem una certa simetria pel que fa a la meseta i abast de cada un deis models esferics

de cada categoria Taula 532

Cat 1 Cat2 Cat3 Cat4 Cat5

Meseta 003 022 0265 02 006

Abast 75 4 6 4 3

Taula 532 Meseta i abast per cada categoria

Aquesta simetria sobserva sobretot per les categories 2 3 i 4

Els models corresponents a les categories 1 i 5 no ajusten del tot beacute degut a que soacuten les

categories deis extrems i per tant la gran majoria de mostres si no totes estaran per sobre o

per sota respectivament

Ara ja podem fer Iestimacioacute per krigeat indicador Al programa ik3d li introduim els cinc

models de semivariogrames per tal que ens calculi Iestimacioacute

El resultat que obtenim soacuten cinc columnes de 625 dades on els valors van de O a 1

Concretament ens calcula la probabilitat de que el valor atorgat a cada punt sigui inferior al

daquell cut-off

El que es preteacuten ara eacutes a partir daquest conjunt de probabilitats interpolar la mediana per a

cada un deis punts de la xarxa per tant el que fem eacutes executar el programa postik en Iopcioacute

3 de manera que ens tregui Iestimacioacute de la mediana

A continuacioacute passem a detallar en que consisteix el postik Per tal de poder-ho expressar

millor ens centrare m en un punt concret de la xarxa el (30)

- - - - -

Capiacutetol 5 Desenvolupament del projecte

Els tercer valor de cada una de les 5 columnes obtingudes amb el krigeat indicador eacutes a dir

els valors corresponents a la mostra situada en el node (30) representen la probabilitat de

que el valor de la variable en aquest punt sigui major que cada un deis cut-off

respectivament aixiacute podem afirmar que

P(Xiexcl lt el ) = P(x(3Q) lt 00995) =00000

P(xiexcl lt e2) = P(X(3 Q) lt 03764) =00397

P(xiexcl lt c3) = P(X(30) lt 07314) = 00409

P(xiexcl lt e4) = P(X(30) lt 12705) = 02079

P(xiexcl lt e5) = P(X(3 0) lt 25402) =10000

Si ara grafiquem aquests 5 valors obtenim una estimacioacute de la probabilitat que teacute el punt

estudiat (30) de ser meacutes petit que qualsevol valor eacutes a dir Iestimacioacute de la funcioacute de

probabilitat en aquest punt Com que el que es preteacuten estimar en el nostre estudi eacutes la

mediana mirarem quin valor aproxima per la probabilitat del 05 eacutes a dir

m tal que P(X(30) lt m) = 05

Per aixoacute tracem una liacutenia a Ialcada 05 i daquesta manera obtenim el valor estimat de la

mediana Aquest valor correspon al valor que obtenim amb el POSTIK que eacutes per aquesta

primera observacioacute 06983

10

x v 6 68 05 o

00

Figura 536 Els 5 cut-off aplicats al punt (30)

Capiacutetol 5 Desenvolupament del projecte

Laplicacioacute del POSTIK realitza aquesta estimacioacute per a cada un deis punts obtinguts (625)

i daquesta manera podem obten ir una interpolacioacute de la mediana per cada un deis valors a

estimar

Capiacutetol 5 Desenvolupament del projecte

SEMIVARIOGRAMA DE LA MOSTRA

model exponencial

12

= r 07 -- ca E E ca O)

02

o 2 4 6 8 10 12

Ihl

Figura 541 Semivariograma experimental amb un model exponencial

Aquest model obtingut a ull teacute els seguumlents parametres abast=7

meseta=1 05

Aplicant aquest valors al model general obtenim la formulacioacute per a les nostres dades

46

middotCapiacutetol 5 Desenvolupament del projecte

MODEL ESFERIC La formulacioacute general eacutes

sih a

sih gt a

on a eacutes Iabast i c la meseta

SEMIVARIOGRAMA DE LA MOSTRA

model esferic

12

---shyro E 07 E ro Ol

02

o 2 4 6 8 10 12

Ihl

Figura 54 2 Semivariograma experimental amb un model esfeacuterico

Aquest model Ihem obtingut de la mateixa manera que Ianterior a ull i els seus

parametres que tambeacute aplicarem a la forma general soacuten abast=6 i meseta=1

47

Capiacutetol 5 Desenvolupament del projecte

Finalment pode m representar la superfiacutecie que hem estimat a partir del krigeat

lognormal utilitzant un grafic de superfiacutecie (Figura 54 5)

6

5

Krig Logn 3

2

o

20 eix y

Figura 545 Grafic de superfiacutecie pel krigeat lognormal

50

Capiacutetol 6Comparacioacute deis resultats obtinguts

61 Regressioacute lineal

Per tal de dur a terme la compara cioacute entre els dos meacutetodes destimacioacute i les dades que

simulen la realitat hem expressat els resultats obtinguts graficament mitjancant els

grafics de punts ajustant en cada cas la recta de regressioacute i dibuixant la bisectriu Cal

tenir en compte que per augmentar la claredat i per a simplificar la interpretacioacute deis

resultat hem transformat les dades a una N(O1) encara que el nostre estudi es basi en

un model lognormal

Passem a continuacioacute a analitzar els grafics

En primer lIoc (Figura 611) tenim el grafic de punts entre les dades obtingudes amb el

primer meacutetode destimacioacute el krigeat lognormal i les dades provinents de la simula cioacute

de la realitat

Regression Plot y =3a1E -02jo O6lt40216X

R-Sq = 594

_0 ro

ro EID o middot Ole

~~ -2

-3

- -3 -2 -1

redade regresioacute

Bisectriu

realitat simulada

Figura 611 Recta de regressioacute entre el krigeat lognormal i la simulacioacute de la realitat

Si mirem aquest grafic podem observar que el valor de Iestimacioacute realitzada

sobreestima els valors petits de la simulacioacute i en canvi en els valors grans subestima

El coeficient de correlacioacute es del 594 eacutes a dir que el meacutetode del krigeat lognormal

explica un 594 de la realitat

52

Capiacutetol 6Comparacioacute deis resultats obtinguts

Passem ara a realitzar el gratic entre el segon meto de destimacioacute el krigeat indicador

i la realitat simulada (Figura 612)

0 _O

m~ 0)-- o

~~ -1

-2

-3

Regression Plot y = -23E-02 + 0711 615X

R-Sq 526

bull bull

-3 -2 -1

realitat simulada

recta de regresi oacute

I Bisectriu

Figura 612 Recta de regressioacute entre el krigeat indicador i la simulacioacute de la realitat

Podem observar que el gratic obtingut eacutes molt semblant a Ianterior i que ens trobem

amb el mateix problema de sobreestimacioacute deis valors petits i subestimacioacute deis valors

grans de la simulacioacute

El valor del coeticient de correlacioacute tambeacute eacutes torga semblant 52 6 Aixiacute doncs la

realitat eacutes explicada en un 526 pel krigeat indicador

53

Capiacutetol 6Comparacioacute deis resultats obtinguts

Finalment i per tenir una idea de la relacioacute que hi ha entre els dos meacutetodes emprats en

el projecte realitzarem un uacuteltim grafic comparatiu (Figura 613) que representa els dos

meacutetodes destimacioacute el krigeat lognormal i el krigeat indicador

Regression Plot y = -7 SE-02 + 105401X

R-Sq 796

middot2

middot3

recta de regresi6

bull Bisectriu

middot 4 middot3 middot2 -1

krigeat lognormal

Figura 613 Recta de regressioacute entre el krigeat lognormal i el krigeat indicador

En aquest cas podem observar que la recta de regressioacute coincideix gairebeacute a la

perfeccioacute amb la bisectriu cosa que vol dir que els dos meacutetodes soacuten molt semblants

entre siacute i que per tant eacutes normal que Iaproximacioacute de cada un dells a la realitat sigui

semblant

El valor de la regressioacute eacutes meacutes gran que en els altres dos casos 796 eacutes a dir que

els dos meacutetodes no donen resultats significativament diferents entre si

Podem observar un conjunt de dades que prenen valors especialment elevats en

Iestimacioacute per krigeat indicador Si analitzem aquests punts podem comprovar que

soacuten punts que tenen una probabilitat de ser meacutes grans que el cinqueacute cut-off (percentil

097) igual a 1 Per tant aquest tipus de punts no shan de tenir en compte en el

moment dextreure conclusions De fet aixo ja es sospitava en el grafic anterior pero

en que en aquell hi ha una elevada dispersioacute i per tant Iefecte queda dissimulat

54

Capiacutetol 5 Desenvolupament del projecte

Lognormal Probablllty Plot tor exp(sim)

Ml Estimates

l ocatiolt -0325300

Scale 0910009

99

95 90

80 70

e 60 (lJ 50 Uuml 40 shy 30 (lJ 20 a

10

5

001 010 100 1000

Data

Figura 513 Lognormal probability plot de la variable regionalitzada exp(sim)

exp(sim)

10

B

7

6 5

4

2

20

Figura 514 Surface plot de la variable exp(sim)

Capiacutetol 5 Desenvolupament del projecte

El surface plot eacutes una eina molt uacutetil ja que ens doacutena una visioacute de com es la nostra realitat a

Iespai A meacutes un cop haguem fet les dues estimacions tambeacute podrem fer el surface plot i

amb un cop dull podrem treure una primera impressioacute de si les estimacions han estat bones

o no

Capiacutetol 5 Desenvolupament del projecte

52 La mostra

A partir de les dades que hem obtingut amb la simulacioacute prenem una mostra aleatoria

de 100 dades a partir de la qual realitzarem les dues estimacions de la realitat Cal

tenir en compte que a partir daquest moment es treballara sobre la mostra i no sobre

les dades simulades que en Iexperimentacioacute real soacuten desconegudes

La mostra sha pres de forma que constitueixi una bona representacioacute del total de la

xarxa La figura 521 mostra la localitzacioacute de cada una de les dades que formen part

de la mostra sobre la xarxa inicial de 25x25 nodes

20 shy

gt x middotcv 10 _

o shy

middot o

bull It bullbullbullbullbullbull bull middot 4 bull bull bull bullbullbull bullbullbullbull bull bull bullbullbullbullbull bull bull bull bull bull bullbullbullbullbull bull bull bullbullbull -Jf bull middot middot middot bull middot 1t bullbullbullbull bullbullbullmiddot o bull bull bull bull bullbull bull bull bull bullbull II JI Jt bull bullbullbull lttt bullbullbull bullbullbull bullbull bull bull bull bullbull bull shy ~ ~ ~ ~ ~ It bull bull bullbullbull bull bull bullbullbull bullbull bull bullbullbullbull bullbull bull bull bull bullbullbullbullbullbull ti bull bull -41 bull bull bull bull bull bull jf middot bull bullbullbull -If bull bull bull 1( bull bullbull bull middot middot - bullbullbullbullbull bull bullbull bullbullbullbullbullbull bull bull bull bullbullbullbull bullbull bull

o 10 20

eix x

Figura 521 Distribucioacute de la mostra dins la xarxa real

La mostra obtinguda conserva les propietats de les dades provinents de la simulacioacute

daquesta manera podem afirmar que eacutes una bona extrapolacioacute de la realitat Vegem a

continuacioacute la descriptiva (Taula 52 1) i Ihistograma de la mostra (Figura 522) amb el

grafic de probabilitats (Figura 52 3) Podem observar que segueix efectivament una

distribucioacute lognormal

Variable N Mean Median TrMean StDev SE Mean rnos tra 1 00 1 0552 0 8330 0 9458 0 9566 0 0957

Variable Minimum Maximum Ql Q3 rnost ra 0 0250 441 85 0 328 1 1 3714

Taula 521 Descriptiva de la mostra

33

Capiacutetol 5 Desenvoluparnent del proiecte

30

gtshyo 20c Q) J oshy~

LL 10

-

1--

- --r--

n I Io

o 2 3 4 5 mostra

Figura 522 Histograma de la mostra

Lognormal Probability Plot for mostra

99

I 95

_ 90 - l -~80 70c jIQ) 60

50e 40Q) 30a 20

10 5

bull

~

001 010 100 1000

Data

MLEstimaacutee5

LocaIion -0341481

Scaacutee 0946372

Figura 523 Plot de probabilitat lognormal

34

Capiacutetol 5 Desenvolupament del projecte

La superfiacutecie descrita per la mostra podem representar-la tambeacute graficament (Figura

524)

mostra

45

40

3 5

30

25

20 15

10

05

00

eixy 20

Figura 524 Superfiacutecie definida per la mostra

35

Capiacutetol 5 Desenvolupament del projecte

53 Lestimacioacute per krigeat indicador

Per tal de realitzar el krigeat indicador definim 5 punts de tall o cut-off Aquests punts de tall

els escollim de forma que guardin simetria respecte el percentil del 50 tal i com mostra la

taula 531

Categoria Percentil Percentatge

1 90 009952

2 300 037637

3 500 073142

4 700 127046

5 910 254092

Taula 531 Els cinc punts de tall escollits

Un cop decidides les categories o punts de tall necessitem saber el semivariograma que

segueixen cada una delles per a poder dur a terme el krigeat indicador ja que Iestimacioacute

realitzada a partir daquest rneacutetode requereix una modelitzacioacute deis cinc semivariogrames

experimentals

El procediment eacutes el seguumlent

Partim de la mostra de 100 dades que segueix una distribucioacute 10gnormaL

Per cada una de les categories creem una columna de O i 1 de manera que si aquell

punt concret eacutes per sota del punt de tall el valor que pren la variable dicotoacutemica eacutes 1 i si eacutes

per sobre pren el valor O

Els semivariogrames els creem amb aquestes cinc columnes de zeros i uns

Per cada semivariograma provem dajustar un model esfeacuteric i un dexponencial Aquests dos

tipus de models els anirem ajustant a ull movent el valor del rang i de Iabast Partim

daquests models per ser els meacutes habituals en la realitat i ens quedarem amb el que ajusti millor deis dos [ref 2]

A continuacioacute presentem els resultats daquests ajustaments per a cada punt de tall

Capiacutetol 5 Desenvolupament del proiecte

Categoriacutea 1 y(h)

Model Exponencial Abast =8 Model Esferic Abast = 75

Meseta =003 Meseta = 003

VARIOGRANlA CATEGORIA 1

005

004 sectr bull ESF= ro E 003 E ro O)

002

001

000

o 2 4 6 8 10 12

Ihl

Figura 531 Model de semivariograma esfeacuteric i exponencial per la categoria 1

)1

Capiacutetol 5 Desenvolupament del projecte

Categoria 2

Model Exponencial Abast = 4 Model Esferic Abast = 4

Meseta = 022 Meseta = 022

VARIOGRAMA CATEGORIA 2

025

--

c bull ESF- sectro 020

E E ro Ogt

015

010

8 10 12

Figura 532 Model de semivariograma esferic i exponencial per la categoria 2

o 2 4 6

Ihl

Capitol 5 Desenvolupament del projecte

Categoriacutea 3

ModeJ Exponencial Abast =7 ModeJ Esferic Abast =6

Meseta =027 Meseta = 0265

VARIOGRAMA CATEGORIA 3

03

~ c (1] ~E 02E (1]

Ogt

01

o 2 4 6

Ihl

Figura 533 Model de semivariograma esfeacuteric i exponencial per la categoria 3

8 10 12

)9

Capiacutetol 5 Desenvolupament del projecte

Categoria 4

Model Exponencial Abast = 5 Model Esfeacuteric Abast = 4

Meseta = 02 Meseta = 02

VARIOGRAMA CATEGORIA 4

03

~ ~ -- ro E ~

02 E ro Ogt

01

deg 2 4 6

Ihl

Figura 534 Model de semivariograma esfeacuteric i exponencial per la categoria 4

8 10 12

Capiacutetol 5 Desenvolupament del projecte

Categoriacutea 5

Model Exponencial Abast =4 Model Esferic Abast = 3

Meseta =006 Meseta = 006

VARIOGRAMA CATEGORIA 5

008

= sect~ 007-shy ESFro E E 006 ro Ol

005

004

003

o 2 4 6 8 10 12

Ihl

Figura 535 Model de semivariograma esfeacuteric i exponencial per la categoria 5

Capiacutetol5 Desenvolupament del projecte

Mirant els cinc grafics veiem que el model que ajusta millor eacutes Iesferic en tots els casos

encara que no hi ha diferencies massa significatives respecte el model exponencial A meacutes

observem una certa simetria pel que fa a la meseta i abast de cada un deis models esferics

de cada categoria Taula 532

Cat 1 Cat2 Cat3 Cat4 Cat5

Meseta 003 022 0265 02 006

Abast 75 4 6 4 3

Taula 532 Meseta i abast per cada categoria

Aquesta simetria sobserva sobretot per les categories 2 3 i 4

Els models corresponents a les categories 1 i 5 no ajusten del tot beacute degut a que soacuten les

categories deis extrems i per tant la gran majoria de mostres si no totes estaran per sobre o

per sota respectivament

Ara ja podem fer Iestimacioacute per krigeat indicador Al programa ik3d li introduim els cinc

models de semivariogrames per tal que ens calculi Iestimacioacute

El resultat que obtenim soacuten cinc columnes de 625 dades on els valors van de O a 1

Concretament ens calcula la probabilitat de que el valor atorgat a cada punt sigui inferior al

daquell cut-off

El que es preteacuten ara eacutes a partir daquest conjunt de probabilitats interpolar la mediana per a

cada un deis punts de la xarxa per tant el que fem eacutes executar el programa postik en Iopcioacute

3 de manera que ens tregui Iestimacioacute de la mediana

A continuacioacute passem a detallar en que consisteix el postik Per tal de poder-ho expressar

millor ens centrare m en un punt concret de la xarxa el (30)

- - - - -

Capiacutetol 5 Desenvolupament del projecte

Els tercer valor de cada una de les 5 columnes obtingudes amb el krigeat indicador eacutes a dir

els valors corresponents a la mostra situada en el node (30) representen la probabilitat de

que el valor de la variable en aquest punt sigui major que cada un deis cut-off

respectivament aixiacute podem afirmar que

P(Xiexcl lt el ) = P(x(3Q) lt 00995) =00000

P(xiexcl lt e2) = P(X(3 Q) lt 03764) =00397

P(xiexcl lt c3) = P(X(30) lt 07314) = 00409

P(xiexcl lt e4) = P(X(30) lt 12705) = 02079

P(xiexcl lt e5) = P(X(3 0) lt 25402) =10000

Si ara grafiquem aquests 5 valors obtenim una estimacioacute de la probabilitat que teacute el punt

estudiat (30) de ser meacutes petit que qualsevol valor eacutes a dir Iestimacioacute de la funcioacute de

probabilitat en aquest punt Com que el que es preteacuten estimar en el nostre estudi eacutes la

mediana mirarem quin valor aproxima per la probabilitat del 05 eacutes a dir

m tal que P(X(30) lt m) = 05

Per aixoacute tracem una liacutenia a Ialcada 05 i daquesta manera obtenim el valor estimat de la

mediana Aquest valor correspon al valor que obtenim amb el POSTIK que eacutes per aquesta

primera observacioacute 06983

10

x v 6 68 05 o

00

Figura 536 Els 5 cut-off aplicats al punt (30)

Capiacutetol 5 Desenvolupament del projecte

Laplicacioacute del POSTIK realitza aquesta estimacioacute per a cada un deis punts obtinguts (625)

i daquesta manera podem obten ir una interpolacioacute de la mediana per cada un deis valors a

estimar

Capiacutetol 5 Desenvolupament del projecte

SEMIVARIOGRAMA DE LA MOSTRA

model exponencial

12

= r 07 -- ca E E ca O)

02

o 2 4 6 8 10 12

Ihl

Figura 541 Semivariograma experimental amb un model exponencial

Aquest model obtingut a ull teacute els seguumlents parametres abast=7

meseta=1 05

Aplicant aquest valors al model general obtenim la formulacioacute per a les nostres dades

46

middotCapiacutetol 5 Desenvolupament del projecte

MODEL ESFERIC La formulacioacute general eacutes

sih a

sih gt a

on a eacutes Iabast i c la meseta

SEMIVARIOGRAMA DE LA MOSTRA

model esferic

12

---shyro E 07 E ro Ol

02

o 2 4 6 8 10 12

Ihl

Figura 54 2 Semivariograma experimental amb un model esfeacuterico

Aquest model Ihem obtingut de la mateixa manera que Ianterior a ull i els seus

parametres que tambeacute aplicarem a la forma general soacuten abast=6 i meseta=1

47

Capiacutetol 5 Desenvolupament del projecte

Finalment pode m representar la superfiacutecie que hem estimat a partir del krigeat

lognormal utilitzant un grafic de superfiacutecie (Figura 54 5)

6

5

Krig Logn 3

2

o

20 eix y

Figura 545 Grafic de superfiacutecie pel krigeat lognormal

50

Capiacutetol 6Comparacioacute deis resultats obtinguts

61 Regressioacute lineal

Per tal de dur a terme la compara cioacute entre els dos meacutetodes destimacioacute i les dades que

simulen la realitat hem expressat els resultats obtinguts graficament mitjancant els

grafics de punts ajustant en cada cas la recta de regressioacute i dibuixant la bisectriu Cal

tenir en compte que per augmentar la claredat i per a simplificar la interpretacioacute deis

resultat hem transformat les dades a una N(O1) encara que el nostre estudi es basi en

un model lognormal

Passem a continuacioacute a analitzar els grafics

En primer lIoc (Figura 611) tenim el grafic de punts entre les dades obtingudes amb el

primer meacutetode destimacioacute el krigeat lognormal i les dades provinents de la simula cioacute

de la realitat

Regression Plot y =3a1E -02jo O6lt40216X

R-Sq = 594

_0 ro

ro EID o middot Ole

~~ -2

-3

- -3 -2 -1

redade regresioacute

Bisectriu

realitat simulada

Figura 611 Recta de regressioacute entre el krigeat lognormal i la simulacioacute de la realitat

Si mirem aquest grafic podem observar que el valor de Iestimacioacute realitzada

sobreestima els valors petits de la simulacioacute i en canvi en els valors grans subestima

El coeficient de correlacioacute es del 594 eacutes a dir que el meacutetode del krigeat lognormal

explica un 594 de la realitat

52

Capiacutetol 6Comparacioacute deis resultats obtinguts

Passem ara a realitzar el gratic entre el segon meto de destimacioacute el krigeat indicador

i la realitat simulada (Figura 612)

0 _O

m~ 0)-- o

~~ -1

-2

-3

Regression Plot y = -23E-02 + 0711 615X

R-Sq 526

bull bull

-3 -2 -1

realitat simulada

recta de regresi oacute

I Bisectriu

Figura 612 Recta de regressioacute entre el krigeat indicador i la simulacioacute de la realitat

Podem observar que el gratic obtingut eacutes molt semblant a Ianterior i que ens trobem

amb el mateix problema de sobreestimacioacute deis valors petits i subestimacioacute deis valors

grans de la simulacioacute

El valor del coeticient de correlacioacute tambeacute eacutes torga semblant 52 6 Aixiacute doncs la

realitat eacutes explicada en un 526 pel krigeat indicador

53

Capiacutetol 6Comparacioacute deis resultats obtinguts

Finalment i per tenir una idea de la relacioacute que hi ha entre els dos meacutetodes emprats en

el projecte realitzarem un uacuteltim grafic comparatiu (Figura 613) que representa els dos

meacutetodes destimacioacute el krigeat lognormal i el krigeat indicador

Regression Plot y = -7 SE-02 + 105401X

R-Sq 796

middot2

middot3

recta de regresi6

bull Bisectriu

middot 4 middot3 middot2 -1

krigeat lognormal

Figura 613 Recta de regressioacute entre el krigeat lognormal i el krigeat indicador

En aquest cas podem observar que la recta de regressioacute coincideix gairebeacute a la

perfeccioacute amb la bisectriu cosa que vol dir que els dos meacutetodes soacuten molt semblants

entre siacute i que per tant eacutes normal que Iaproximacioacute de cada un dells a la realitat sigui

semblant

El valor de la regressioacute eacutes meacutes gran que en els altres dos casos 796 eacutes a dir que

els dos meacutetodes no donen resultats significativament diferents entre si

Podem observar un conjunt de dades que prenen valors especialment elevats en

Iestimacioacute per krigeat indicador Si analitzem aquests punts podem comprovar que

soacuten punts que tenen una probabilitat de ser meacutes grans que el cinqueacute cut-off (percentil

097) igual a 1 Per tant aquest tipus de punts no shan de tenir en compte en el

moment dextreure conclusions De fet aixo ja es sospitava en el grafic anterior pero

en que en aquell hi ha una elevada dispersioacute i per tant Iefecte queda dissimulat

54

Capiacutetol 5 Desenvolupament del projecte

El surface plot eacutes una eina molt uacutetil ja que ens doacutena una visioacute de com es la nostra realitat a

Iespai A meacutes un cop haguem fet les dues estimacions tambeacute podrem fer el surface plot i

amb un cop dull podrem treure una primera impressioacute de si les estimacions han estat bones

o no

Capiacutetol 5 Desenvolupament del projecte

52 La mostra

A partir de les dades que hem obtingut amb la simulacioacute prenem una mostra aleatoria

de 100 dades a partir de la qual realitzarem les dues estimacions de la realitat Cal

tenir en compte que a partir daquest moment es treballara sobre la mostra i no sobre

les dades simulades que en Iexperimentacioacute real soacuten desconegudes

La mostra sha pres de forma que constitueixi una bona representacioacute del total de la

xarxa La figura 521 mostra la localitzacioacute de cada una de les dades que formen part

de la mostra sobre la xarxa inicial de 25x25 nodes

20 shy

gt x middotcv 10 _

o shy

middot o

bull It bullbullbullbullbullbull bull middot 4 bull bull bull bullbullbull bullbullbullbull bull bull bullbullbullbullbull bull bull bull bull bull bullbullbullbullbull bull bull bullbullbull -Jf bull middot middot middot bull middot 1t bullbullbullbull bullbullbullmiddot o bull bull bull bull bullbull bull bull bull bullbull II JI Jt bull bullbullbull lttt bullbullbull bullbullbull bullbull bull bull bull bullbull bull shy ~ ~ ~ ~ ~ It bull bull bullbullbull bull bull bullbullbull bullbull bull bullbullbullbull bullbull bull bull bull bullbullbullbullbullbull ti bull bull -41 bull bull bull bull bull bull jf middot bull bullbullbull -If bull bull bull 1( bull bullbull bull middot middot - bullbullbullbullbull bull bullbull bullbullbullbullbullbull bull bull bull bullbullbullbull bullbull bull

o 10 20

eix x

Figura 521 Distribucioacute de la mostra dins la xarxa real

La mostra obtinguda conserva les propietats de les dades provinents de la simulacioacute

daquesta manera podem afirmar que eacutes una bona extrapolacioacute de la realitat Vegem a

continuacioacute la descriptiva (Taula 52 1) i Ihistograma de la mostra (Figura 522) amb el

grafic de probabilitats (Figura 52 3) Podem observar que segueix efectivament una

distribucioacute lognormal

Variable N Mean Median TrMean StDev SE Mean rnos tra 1 00 1 0552 0 8330 0 9458 0 9566 0 0957

Variable Minimum Maximum Ql Q3 rnost ra 0 0250 441 85 0 328 1 1 3714

Taula 521 Descriptiva de la mostra

33

Capiacutetol 5 Desenvoluparnent del proiecte

30

gtshyo 20c Q) J oshy~

LL 10

-

1--

- --r--

n I Io

o 2 3 4 5 mostra

Figura 522 Histograma de la mostra

Lognormal Probability Plot for mostra

99

I 95

_ 90 - l -~80 70c jIQ) 60

50e 40Q) 30a 20

10 5

bull

~

001 010 100 1000

Data

MLEstimaacutee5

LocaIion -0341481

Scaacutee 0946372

Figura 523 Plot de probabilitat lognormal

34

Capiacutetol 5 Desenvolupament del projecte

La superfiacutecie descrita per la mostra podem representar-la tambeacute graficament (Figura

524)

mostra

45

40

3 5

30

25

20 15

10

05

00

eixy 20

Figura 524 Superfiacutecie definida per la mostra

35

Capiacutetol 5 Desenvolupament del projecte

53 Lestimacioacute per krigeat indicador

Per tal de realitzar el krigeat indicador definim 5 punts de tall o cut-off Aquests punts de tall

els escollim de forma que guardin simetria respecte el percentil del 50 tal i com mostra la

taula 531

Categoria Percentil Percentatge

1 90 009952

2 300 037637

3 500 073142

4 700 127046

5 910 254092

Taula 531 Els cinc punts de tall escollits

Un cop decidides les categories o punts de tall necessitem saber el semivariograma que

segueixen cada una delles per a poder dur a terme el krigeat indicador ja que Iestimacioacute

realitzada a partir daquest rneacutetode requereix una modelitzacioacute deis cinc semivariogrames

experimentals

El procediment eacutes el seguumlent

Partim de la mostra de 100 dades que segueix una distribucioacute 10gnormaL

Per cada una de les categories creem una columna de O i 1 de manera que si aquell

punt concret eacutes per sota del punt de tall el valor que pren la variable dicotoacutemica eacutes 1 i si eacutes

per sobre pren el valor O

Els semivariogrames els creem amb aquestes cinc columnes de zeros i uns

Per cada semivariograma provem dajustar un model esfeacuteric i un dexponencial Aquests dos

tipus de models els anirem ajustant a ull movent el valor del rang i de Iabast Partim

daquests models per ser els meacutes habituals en la realitat i ens quedarem amb el que ajusti millor deis dos [ref 2]

A continuacioacute presentem els resultats daquests ajustaments per a cada punt de tall

Capiacutetol 5 Desenvolupament del proiecte

Categoriacutea 1 y(h)

Model Exponencial Abast =8 Model Esferic Abast = 75

Meseta =003 Meseta = 003

VARIOGRANlA CATEGORIA 1

005

004 sectr bull ESF= ro E 003 E ro O)

002

001

000

o 2 4 6 8 10 12

Ihl

Figura 531 Model de semivariograma esfeacuteric i exponencial per la categoria 1

)1

Capiacutetol 5 Desenvolupament del projecte

Categoria 2

Model Exponencial Abast = 4 Model Esferic Abast = 4

Meseta = 022 Meseta = 022

VARIOGRAMA CATEGORIA 2

025

--

c bull ESF- sectro 020

E E ro Ogt

015

010

8 10 12

Figura 532 Model de semivariograma esferic i exponencial per la categoria 2

o 2 4 6

Ihl

Capitol 5 Desenvolupament del projecte

Categoriacutea 3

ModeJ Exponencial Abast =7 ModeJ Esferic Abast =6

Meseta =027 Meseta = 0265

VARIOGRAMA CATEGORIA 3

03

~ c (1] ~E 02E (1]

Ogt

01

o 2 4 6

Ihl

Figura 533 Model de semivariograma esfeacuteric i exponencial per la categoria 3

8 10 12

)9

Capiacutetol 5 Desenvolupament del projecte

Categoria 4

Model Exponencial Abast = 5 Model Esfeacuteric Abast = 4

Meseta = 02 Meseta = 02

VARIOGRAMA CATEGORIA 4

03

~ ~ -- ro E ~

02 E ro Ogt

01

deg 2 4 6

Ihl

Figura 534 Model de semivariograma esfeacuteric i exponencial per la categoria 4

8 10 12

Capiacutetol 5 Desenvolupament del projecte

Categoriacutea 5

Model Exponencial Abast =4 Model Esferic Abast = 3

Meseta =006 Meseta = 006

VARIOGRAMA CATEGORIA 5

008

= sect~ 007-shy ESFro E E 006 ro Ol

005

004

003

o 2 4 6 8 10 12

Ihl

Figura 535 Model de semivariograma esfeacuteric i exponencial per la categoria 5

Capiacutetol5 Desenvolupament del projecte

Mirant els cinc grafics veiem que el model que ajusta millor eacutes Iesferic en tots els casos

encara que no hi ha diferencies massa significatives respecte el model exponencial A meacutes

observem una certa simetria pel que fa a la meseta i abast de cada un deis models esferics

de cada categoria Taula 532

Cat 1 Cat2 Cat3 Cat4 Cat5

Meseta 003 022 0265 02 006

Abast 75 4 6 4 3

Taula 532 Meseta i abast per cada categoria

Aquesta simetria sobserva sobretot per les categories 2 3 i 4

Els models corresponents a les categories 1 i 5 no ajusten del tot beacute degut a que soacuten les

categories deis extrems i per tant la gran majoria de mostres si no totes estaran per sobre o

per sota respectivament

Ara ja podem fer Iestimacioacute per krigeat indicador Al programa ik3d li introduim els cinc

models de semivariogrames per tal que ens calculi Iestimacioacute

El resultat que obtenim soacuten cinc columnes de 625 dades on els valors van de O a 1

Concretament ens calcula la probabilitat de que el valor atorgat a cada punt sigui inferior al

daquell cut-off

El que es preteacuten ara eacutes a partir daquest conjunt de probabilitats interpolar la mediana per a

cada un deis punts de la xarxa per tant el que fem eacutes executar el programa postik en Iopcioacute

3 de manera que ens tregui Iestimacioacute de la mediana

A continuacioacute passem a detallar en que consisteix el postik Per tal de poder-ho expressar

millor ens centrare m en un punt concret de la xarxa el (30)

- - - - -

Capiacutetol 5 Desenvolupament del projecte

Els tercer valor de cada una de les 5 columnes obtingudes amb el krigeat indicador eacutes a dir

els valors corresponents a la mostra situada en el node (30) representen la probabilitat de

que el valor de la variable en aquest punt sigui major que cada un deis cut-off

respectivament aixiacute podem afirmar que

P(Xiexcl lt el ) = P(x(3Q) lt 00995) =00000

P(xiexcl lt e2) = P(X(3 Q) lt 03764) =00397

P(xiexcl lt c3) = P(X(30) lt 07314) = 00409

P(xiexcl lt e4) = P(X(30) lt 12705) = 02079

P(xiexcl lt e5) = P(X(3 0) lt 25402) =10000

Si ara grafiquem aquests 5 valors obtenim una estimacioacute de la probabilitat que teacute el punt

estudiat (30) de ser meacutes petit que qualsevol valor eacutes a dir Iestimacioacute de la funcioacute de

probabilitat en aquest punt Com que el que es preteacuten estimar en el nostre estudi eacutes la

mediana mirarem quin valor aproxima per la probabilitat del 05 eacutes a dir

m tal que P(X(30) lt m) = 05

Per aixoacute tracem una liacutenia a Ialcada 05 i daquesta manera obtenim el valor estimat de la

mediana Aquest valor correspon al valor que obtenim amb el POSTIK que eacutes per aquesta

primera observacioacute 06983

10

x v 6 68 05 o

00

Figura 536 Els 5 cut-off aplicats al punt (30)

Capiacutetol 5 Desenvolupament del projecte

Laplicacioacute del POSTIK realitza aquesta estimacioacute per a cada un deis punts obtinguts (625)

i daquesta manera podem obten ir una interpolacioacute de la mediana per cada un deis valors a

estimar

Capiacutetol 5 Desenvolupament del projecte

SEMIVARIOGRAMA DE LA MOSTRA

model exponencial

12

= r 07 -- ca E E ca O)

02

o 2 4 6 8 10 12

Ihl

Figura 541 Semivariograma experimental amb un model exponencial

Aquest model obtingut a ull teacute els seguumlents parametres abast=7

meseta=1 05

Aplicant aquest valors al model general obtenim la formulacioacute per a les nostres dades

46

middotCapiacutetol 5 Desenvolupament del projecte

MODEL ESFERIC La formulacioacute general eacutes

sih a

sih gt a

on a eacutes Iabast i c la meseta

SEMIVARIOGRAMA DE LA MOSTRA

model esferic

12

---shyro E 07 E ro Ol

02

o 2 4 6 8 10 12

Ihl

Figura 54 2 Semivariograma experimental amb un model esfeacuterico

Aquest model Ihem obtingut de la mateixa manera que Ianterior a ull i els seus

parametres que tambeacute aplicarem a la forma general soacuten abast=6 i meseta=1

47

Capiacutetol 5 Desenvolupament del projecte

Finalment pode m representar la superfiacutecie que hem estimat a partir del krigeat

lognormal utilitzant un grafic de superfiacutecie (Figura 54 5)

6

5

Krig Logn 3

2

o

20 eix y

Figura 545 Grafic de superfiacutecie pel krigeat lognormal

50

Capiacutetol 6Comparacioacute deis resultats obtinguts

61 Regressioacute lineal

Per tal de dur a terme la compara cioacute entre els dos meacutetodes destimacioacute i les dades que

simulen la realitat hem expressat els resultats obtinguts graficament mitjancant els

grafics de punts ajustant en cada cas la recta de regressioacute i dibuixant la bisectriu Cal

tenir en compte que per augmentar la claredat i per a simplificar la interpretacioacute deis

resultat hem transformat les dades a una N(O1) encara que el nostre estudi es basi en

un model lognormal

Passem a continuacioacute a analitzar els grafics

En primer lIoc (Figura 611) tenim el grafic de punts entre les dades obtingudes amb el

primer meacutetode destimacioacute el krigeat lognormal i les dades provinents de la simula cioacute

de la realitat

Regression Plot y =3a1E -02jo O6lt40216X

R-Sq = 594

_0 ro

ro EID o middot Ole

~~ -2

-3

- -3 -2 -1

redade regresioacute

Bisectriu

realitat simulada

Figura 611 Recta de regressioacute entre el krigeat lognormal i la simulacioacute de la realitat

Si mirem aquest grafic podem observar que el valor de Iestimacioacute realitzada

sobreestima els valors petits de la simulacioacute i en canvi en els valors grans subestima

El coeficient de correlacioacute es del 594 eacutes a dir que el meacutetode del krigeat lognormal

explica un 594 de la realitat

52

Capiacutetol 6Comparacioacute deis resultats obtinguts

Passem ara a realitzar el gratic entre el segon meto de destimacioacute el krigeat indicador

i la realitat simulada (Figura 612)

0 _O

m~ 0)-- o

~~ -1

-2

-3

Regression Plot y = -23E-02 + 0711 615X

R-Sq 526

bull bull

-3 -2 -1

realitat simulada

recta de regresi oacute

I Bisectriu

Figura 612 Recta de regressioacute entre el krigeat indicador i la simulacioacute de la realitat

Podem observar que el gratic obtingut eacutes molt semblant a Ianterior i que ens trobem

amb el mateix problema de sobreestimacioacute deis valors petits i subestimacioacute deis valors

grans de la simulacioacute

El valor del coeticient de correlacioacute tambeacute eacutes torga semblant 52 6 Aixiacute doncs la

realitat eacutes explicada en un 526 pel krigeat indicador

53

Capiacutetol 6Comparacioacute deis resultats obtinguts

Finalment i per tenir una idea de la relacioacute que hi ha entre els dos meacutetodes emprats en

el projecte realitzarem un uacuteltim grafic comparatiu (Figura 613) que representa els dos

meacutetodes destimacioacute el krigeat lognormal i el krigeat indicador

Regression Plot y = -7 SE-02 + 105401X

R-Sq 796

middot2

middot3

recta de regresi6

bull Bisectriu

middot 4 middot3 middot2 -1

krigeat lognormal

Figura 613 Recta de regressioacute entre el krigeat lognormal i el krigeat indicador

En aquest cas podem observar que la recta de regressioacute coincideix gairebeacute a la

perfeccioacute amb la bisectriu cosa que vol dir que els dos meacutetodes soacuten molt semblants

entre siacute i que per tant eacutes normal que Iaproximacioacute de cada un dells a la realitat sigui

semblant

El valor de la regressioacute eacutes meacutes gran que en els altres dos casos 796 eacutes a dir que

els dos meacutetodes no donen resultats significativament diferents entre si

Podem observar un conjunt de dades que prenen valors especialment elevats en

Iestimacioacute per krigeat indicador Si analitzem aquests punts podem comprovar que

soacuten punts que tenen una probabilitat de ser meacutes grans que el cinqueacute cut-off (percentil

097) igual a 1 Per tant aquest tipus de punts no shan de tenir en compte en el

moment dextreure conclusions De fet aixo ja es sospitava en el grafic anterior pero

en que en aquell hi ha una elevada dispersioacute i per tant Iefecte queda dissimulat

54

Capiacutetol 5 Desenvolupament del projecte

52 La mostra

A partir de les dades que hem obtingut amb la simulacioacute prenem una mostra aleatoria

de 100 dades a partir de la qual realitzarem les dues estimacions de la realitat Cal

tenir en compte que a partir daquest moment es treballara sobre la mostra i no sobre

les dades simulades que en Iexperimentacioacute real soacuten desconegudes

La mostra sha pres de forma que constitueixi una bona representacioacute del total de la

xarxa La figura 521 mostra la localitzacioacute de cada una de les dades que formen part

de la mostra sobre la xarxa inicial de 25x25 nodes

20 shy

gt x middotcv 10 _

o shy

middot o

bull It bullbullbullbullbullbull bull middot 4 bull bull bull bullbullbull bullbullbullbull bull bull bullbullbullbullbull bull bull bull bull bull bullbullbullbullbull bull bull bullbullbull -Jf bull middot middot middot bull middot 1t bullbullbullbull bullbullbullmiddot o bull bull bull bull bullbull bull bull bull bullbull II JI Jt bull bullbullbull lttt bullbullbull bullbullbull bullbull bull bull bull bullbull bull shy ~ ~ ~ ~ ~ It bull bull bullbullbull bull bull bullbullbull bullbull bull bullbullbullbull bullbull bull bull bull bullbullbullbullbullbull ti bull bull -41 bull bull bull bull bull bull jf middot bull bullbullbull -If bull bull bull 1( bull bullbull bull middot middot - bullbullbullbullbull bull bullbull bullbullbullbullbullbull bull bull bull bullbullbullbull bullbull bull

o 10 20

eix x

Figura 521 Distribucioacute de la mostra dins la xarxa real

La mostra obtinguda conserva les propietats de les dades provinents de la simulacioacute

daquesta manera podem afirmar que eacutes una bona extrapolacioacute de la realitat Vegem a

continuacioacute la descriptiva (Taula 52 1) i Ihistograma de la mostra (Figura 522) amb el

grafic de probabilitats (Figura 52 3) Podem observar que segueix efectivament una

distribucioacute lognormal

Variable N Mean Median TrMean StDev SE Mean rnos tra 1 00 1 0552 0 8330 0 9458 0 9566 0 0957

Variable Minimum Maximum Ql Q3 rnost ra 0 0250 441 85 0 328 1 1 3714

Taula 521 Descriptiva de la mostra

33

Capiacutetol 5 Desenvoluparnent del proiecte

30

gtshyo 20c Q) J oshy~

LL 10

-

1--

- --r--

n I Io

o 2 3 4 5 mostra

Figura 522 Histograma de la mostra

Lognormal Probability Plot for mostra

99

I 95

_ 90 - l -~80 70c jIQ) 60

50e 40Q) 30a 20

10 5

bull

~

001 010 100 1000

Data

MLEstimaacutee5

LocaIion -0341481

Scaacutee 0946372

Figura 523 Plot de probabilitat lognormal

34

Capiacutetol 5 Desenvolupament del projecte

La superfiacutecie descrita per la mostra podem representar-la tambeacute graficament (Figura

524)

mostra

45

40

3 5

30

25

20 15

10

05

00

eixy 20

Figura 524 Superfiacutecie definida per la mostra

35

Capiacutetol 5 Desenvolupament del projecte

53 Lestimacioacute per krigeat indicador

Per tal de realitzar el krigeat indicador definim 5 punts de tall o cut-off Aquests punts de tall

els escollim de forma que guardin simetria respecte el percentil del 50 tal i com mostra la

taula 531

Categoria Percentil Percentatge

1 90 009952

2 300 037637

3 500 073142

4 700 127046

5 910 254092

Taula 531 Els cinc punts de tall escollits

Un cop decidides les categories o punts de tall necessitem saber el semivariograma que

segueixen cada una delles per a poder dur a terme el krigeat indicador ja que Iestimacioacute

realitzada a partir daquest rneacutetode requereix una modelitzacioacute deis cinc semivariogrames

experimentals

El procediment eacutes el seguumlent

Partim de la mostra de 100 dades que segueix una distribucioacute 10gnormaL

Per cada una de les categories creem una columna de O i 1 de manera que si aquell

punt concret eacutes per sota del punt de tall el valor que pren la variable dicotoacutemica eacutes 1 i si eacutes

per sobre pren el valor O

Els semivariogrames els creem amb aquestes cinc columnes de zeros i uns

Per cada semivariograma provem dajustar un model esfeacuteric i un dexponencial Aquests dos

tipus de models els anirem ajustant a ull movent el valor del rang i de Iabast Partim

daquests models per ser els meacutes habituals en la realitat i ens quedarem amb el que ajusti millor deis dos [ref 2]

A continuacioacute presentem els resultats daquests ajustaments per a cada punt de tall

Capiacutetol 5 Desenvolupament del proiecte

Categoriacutea 1 y(h)

Model Exponencial Abast =8 Model Esferic Abast = 75

Meseta =003 Meseta = 003

VARIOGRANlA CATEGORIA 1

005

004 sectr bull ESF= ro E 003 E ro O)

002

001

000

o 2 4 6 8 10 12

Ihl

Figura 531 Model de semivariograma esfeacuteric i exponencial per la categoria 1

)1

Capiacutetol 5 Desenvolupament del projecte

Categoria 2

Model Exponencial Abast = 4 Model Esferic Abast = 4

Meseta = 022 Meseta = 022

VARIOGRAMA CATEGORIA 2

025

--

c bull ESF- sectro 020

E E ro Ogt

015

010

8 10 12

Figura 532 Model de semivariograma esferic i exponencial per la categoria 2

o 2 4 6

Ihl

Capitol 5 Desenvolupament del projecte

Categoriacutea 3

ModeJ Exponencial Abast =7 ModeJ Esferic Abast =6

Meseta =027 Meseta = 0265

VARIOGRAMA CATEGORIA 3

03

~ c (1] ~E 02E (1]

Ogt

01

o 2 4 6

Ihl

Figura 533 Model de semivariograma esfeacuteric i exponencial per la categoria 3

8 10 12

)9

Capiacutetol 5 Desenvolupament del projecte

Categoria 4

Model Exponencial Abast = 5 Model Esfeacuteric Abast = 4

Meseta = 02 Meseta = 02

VARIOGRAMA CATEGORIA 4

03

~ ~ -- ro E ~

02 E ro Ogt

01

deg 2 4 6

Ihl

Figura 534 Model de semivariograma esfeacuteric i exponencial per la categoria 4

8 10 12

Capiacutetol 5 Desenvolupament del projecte

Categoriacutea 5

Model Exponencial Abast =4 Model Esferic Abast = 3

Meseta =006 Meseta = 006

VARIOGRAMA CATEGORIA 5

008

= sect~ 007-shy ESFro E E 006 ro Ol

005

004

003

o 2 4 6 8 10 12

Ihl

Figura 535 Model de semivariograma esfeacuteric i exponencial per la categoria 5

Capiacutetol5 Desenvolupament del projecte

Mirant els cinc grafics veiem que el model que ajusta millor eacutes Iesferic en tots els casos

encara que no hi ha diferencies massa significatives respecte el model exponencial A meacutes

observem una certa simetria pel que fa a la meseta i abast de cada un deis models esferics

de cada categoria Taula 532

Cat 1 Cat2 Cat3 Cat4 Cat5

Meseta 003 022 0265 02 006

Abast 75 4 6 4 3

Taula 532 Meseta i abast per cada categoria

Aquesta simetria sobserva sobretot per les categories 2 3 i 4

Els models corresponents a les categories 1 i 5 no ajusten del tot beacute degut a que soacuten les

categories deis extrems i per tant la gran majoria de mostres si no totes estaran per sobre o

per sota respectivament

Ara ja podem fer Iestimacioacute per krigeat indicador Al programa ik3d li introduim els cinc

models de semivariogrames per tal que ens calculi Iestimacioacute

El resultat que obtenim soacuten cinc columnes de 625 dades on els valors van de O a 1

Concretament ens calcula la probabilitat de que el valor atorgat a cada punt sigui inferior al

daquell cut-off

El que es preteacuten ara eacutes a partir daquest conjunt de probabilitats interpolar la mediana per a

cada un deis punts de la xarxa per tant el que fem eacutes executar el programa postik en Iopcioacute

3 de manera que ens tregui Iestimacioacute de la mediana

A continuacioacute passem a detallar en que consisteix el postik Per tal de poder-ho expressar

millor ens centrare m en un punt concret de la xarxa el (30)

- - - - -

Capiacutetol 5 Desenvolupament del projecte

Els tercer valor de cada una de les 5 columnes obtingudes amb el krigeat indicador eacutes a dir

els valors corresponents a la mostra situada en el node (30) representen la probabilitat de

que el valor de la variable en aquest punt sigui major que cada un deis cut-off

respectivament aixiacute podem afirmar que

P(Xiexcl lt el ) = P(x(3Q) lt 00995) =00000

P(xiexcl lt e2) = P(X(3 Q) lt 03764) =00397

P(xiexcl lt c3) = P(X(30) lt 07314) = 00409

P(xiexcl lt e4) = P(X(30) lt 12705) = 02079

P(xiexcl lt e5) = P(X(3 0) lt 25402) =10000

Si ara grafiquem aquests 5 valors obtenim una estimacioacute de la probabilitat que teacute el punt

estudiat (30) de ser meacutes petit que qualsevol valor eacutes a dir Iestimacioacute de la funcioacute de

probabilitat en aquest punt Com que el que es preteacuten estimar en el nostre estudi eacutes la

mediana mirarem quin valor aproxima per la probabilitat del 05 eacutes a dir

m tal que P(X(30) lt m) = 05

Per aixoacute tracem una liacutenia a Ialcada 05 i daquesta manera obtenim el valor estimat de la

mediana Aquest valor correspon al valor que obtenim amb el POSTIK que eacutes per aquesta

primera observacioacute 06983

10

x v 6 68 05 o

00

Figura 536 Els 5 cut-off aplicats al punt (30)

Capiacutetol 5 Desenvolupament del projecte

Laplicacioacute del POSTIK realitza aquesta estimacioacute per a cada un deis punts obtinguts (625)

i daquesta manera podem obten ir una interpolacioacute de la mediana per cada un deis valors a

estimar

Capiacutetol 5 Desenvolupament del projecte

SEMIVARIOGRAMA DE LA MOSTRA

model exponencial

12

= r 07 -- ca E E ca O)

02

o 2 4 6 8 10 12

Ihl

Figura 541 Semivariograma experimental amb un model exponencial

Aquest model obtingut a ull teacute els seguumlents parametres abast=7

meseta=1 05

Aplicant aquest valors al model general obtenim la formulacioacute per a les nostres dades

46

middotCapiacutetol 5 Desenvolupament del projecte

MODEL ESFERIC La formulacioacute general eacutes

sih a

sih gt a

on a eacutes Iabast i c la meseta

SEMIVARIOGRAMA DE LA MOSTRA

model esferic

12

---shyro E 07 E ro Ol

02

o 2 4 6 8 10 12

Ihl

Figura 54 2 Semivariograma experimental amb un model esfeacuterico

Aquest model Ihem obtingut de la mateixa manera que Ianterior a ull i els seus

parametres que tambeacute aplicarem a la forma general soacuten abast=6 i meseta=1

47

Capiacutetol 5 Desenvolupament del projecte

Finalment pode m representar la superfiacutecie que hem estimat a partir del krigeat

lognormal utilitzant un grafic de superfiacutecie (Figura 54 5)

6

5

Krig Logn 3

2

o

20 eix y

Figura 545 Grafic de superfiacutecie pel krigeat lognormal

50

Capiacutetol 6Comparacioacute deis resultats obtinguts

61 Regressioacute lineal

Per tal de dur a terme la compara cioacute entre els dos meacutetodes destimacioacute i les dades que

simulen la realitat hem expressat els resultats obtinguts graficament mitjancant els

grafics de punts ajustant en cada cas la recta de regressioacute i dibuixant la bisectriu Cal

tenir en compte que per augmentar la claredat i per a simplificar la interpretacioacute deis

resultat hem transformat les dades a una N(O1) encara que el nostre estudi es basi en

un model lognormal

Passem a continuacioacute a analitzar els grafics

En primer lIoc (Figura 611) tenim el grafic de punts entre les dades obtingudes amb el

primer meacutetode destimacioacute el krigeat lognormal i les dades provinents de la simula cioacute

de la realitat

Regression Plot y =3a1E -02jo O6lt40216X

R-Sq = 594

_0 ro

ro EID o middot Ole

~~ -2

-3

- -3 -2 -1

redade regresioacute

Bisectriu

realitat simulada

Figura 611 Recta de regressioacute entre el krigeat lognormal i la simulacioacute de la realitat

Si mirem aquest grafic podem observar que el valor de Iestimacioacute realitzada

sobreestima els valors petits de la simulacioacute i en canvi en els valors grans subestima

El coeficient de correlacioacute es del 594 eacutes a dir que el meacutetode del krigeat lognormal

explica un 594 de la realitat

52

Capiacutetol 6Comparacioacute deis resultats obtinguts

Passem ara a realitzar el gratic entre el segon meto de destimacioacute el krigeat indicador

i la realitat simulada (Figura 612)

0 _O

m~ 0)-- o

~~ -1

-2

-3

Regression Plot y = -23E-02 + 0711 615X

R-Sq 526

bull bull

-3 -2 -1

realitat simulada

recta de regresi oacute

I Bisectriu

Figura 612 Recta de regressioacute entre el krigeat indicador i la simulacioacute de la realitat

Podem observar que el gratic obtingut eacutes molt semblant a Ianterior i que ens trobem

amb el mateix problema de sobreestimacioacute deis valors petits i subestimacioacute deis valors

grans de la simulacioacute

El valor del coeticient de correlacioacute tambeacute eacutes torga semblant 52 6 Aixiacute doncs la

realitat eacutes explicada en un 526 pel krigeat indicador

53

Capiacutetol 6Comparacioacute deis resultats obtinguts

Finalment i per tenir una idea de la relacioacute que hi ha entre els dos meacutetodes emprats en

el projecte realitzarem un uacuteltim grafic comparatiu (Figura 613) que representa els dos

meacutetodes destimacioacute el krigeat lognormal i el krigeat indicador

Regression Plot y = -7 SE-02 + 105401X

R-Sq 796

middot2

middot3

recta de regresi6

bull Bisectriu

middot 4 middot3 middot2 -1

krigeat lognormal

Figura 613 Recta de regressioacute entre el krigeat lognormal i el krigeat indicador

En aquest cas podem observar que la recta de regressioacute coincideix gairebeacute a la

perfeccioacute amb la bisectriu cosa que vol dir que els dos meacutetodes soacuten molt semblants

entre siacute i que per tant eacutes normal que Iaproximacioacute de cada un dells a la realitat sigui

semblant

El valor de la regressioacute eacutes meacutes gran que en els altres dos casos 796 eacutes a dir que

els dos meacutetodes no donen resultats significativament diferents entre si

Podem observar un conjunt de dades que prenen valors especialment elevats en

Iestimacioacute per krigeat indicador Si analitzem aquests punts podem comprovar que

soacuten punts que tenen una probabilitat de ser meacutes grans que el cinqueacute cut-off (percentil

097) igual a 1 Per tant aquest tipus de punts no shan de tenir en compte en el

moment dextreure conclusions De fet aixo ja es sospitava en el grafic anterior pero

en que en aquell hi ha una elevada dispersioacute i per tant Iefecte queda dissimulat

54

Capiacutetol 5 Desenvoluparnent del proiecte

30

gtshyo 20c Q) J oshy~

LL 10

-

1--

- --r--

n I Io

o 2 3 4 5 mostra

Figura 522 Histograma de la mostra

Lognormal Probability Plot for mostra

99

I 95

_ 90 - l -~80 70c jIQ) 60

50e 40Q) 30a 20

10 5

bull

~

001 010 100 1000

Data

MLEstimaacutee5

LocaIion -0341481

Scaacutee 0946372

Figura 523 Plot de probabilitat lognormal

34

Capiacutetol 5 Desenvolupament del projecte

La superfiacutecie descrita per la mostra podem representar-la tambeacute graficament (Figura

524)

mostra

45

40

3 5

30

25

20 15

10

05

00

eixy 20

Figura 524 Superfiacutecie definida per la mostra

35

Capiacutetol 5 Desenvolupament del projecte

53 Lestimacioacute per krigeat indicador

Per tal de realitzar el krigeat indicador definim 5 punts de tall o cut-off Aquests punts de tall

els escollim de forma que guardin simetria respecte el percentil del 50 tal i com mostra la

taula 531

Categoria Percentil Percentatge

1 90 009952

2 300 037637

3 500 073142

4 700 127046

5 910 254092

Taula 531 Els cinc punts de tall escollits

Un cop decidides les categories o punts de tall necessitem saber el semivariograma que

segueixen cada una delles per a poder dur a terme el krigeat indicador ja que Iestimacioacute

realitzada a partir daquest rneacutetode requereix una modelitzacioacute deis cinc semivariogrames

experimentals

El procediment eacutes el seguumlent

Partim de la mostra de 100 dades que segueix una distribucioacute 10gnormaL

Per cada una de les categories creem una columna de O i 1 de manera que si aquell

punt concret eacutes per sota del punt de tall el valor que pren la variable dicotoacutemica eacutes 1 i si eacutes

per sobre pren el valor O

Els semivariogrames els creem amb aquestes cinc columnes de zeros i uns

Per cada semivariograma provem dajustar un model esfeacuteric i un dexponencial Aquests dos

tipus de models els anirem ajustant a ull movent el valor del rang i de Iabast Partim

daquests models per ser els meacutes habituals en la realitat i ens quedarem amb el que ajusti millor deis dos [ref 2]

A continuacioacute presentem els resultats daquests ajustaments per a cada punt de tall

Capiacutetol 5 Desenvolupament del proiecte

Categoriacutea 1 y(h)

Model Exponencial Abast =8 Model Esferic Abast = 75

Meseta =003 Meseta = 003

VARIOGRANlA CATEGORIA 1

005

004 sectr bull ESF= ro E 003 E ro O)

002

001

000

o 2 4 6 8 10 12

Ihl

Figura 531 Model de semivariograma esfeacuteric i exponencial per la categoria 1

)1

Capiacutetol 5 Desenvolupament del projecte

Categoria 2

Model Exponencial Abast = 4 Model Esferic Abast = 4

Meseta = 022 Meseta = 022

VARIOGRAMA CATEGORIA 2

025

--

c bull ESF- sectro 020

E E ro Ogt

015

010

8 10 12

Figura 532 Model de semivariograma esferic i exponencial per la categoria 2

o 2 4 6

Ihl

Capitol 5 Desenvolupament del projecte

Categoriacutea 3

ModeJ Exponencial Abast =7 ModeJ Esferic Abast =6

Meseta =027 Meseta = 0265

VARIOGRAMA CATEGORIA 3

03

~ c (1] ~E 02E (1]

Ogt

01

o 2 4 6

Ihl

Figura 533 Model de semivariograma esfeacuteric i exponencial per la categoria 3

8 10 12

)9

Capiacutetol 5 Desenvolupament del projecte

Categoria 4

Model Exponencial Abast = 5 Model Esfeacuteric Abast = 4

Meseta = 02 Meseta = 02

VARIOGRAMA CATEGORIA 4

03

~ ~ -- ro E ~

02 E ro Ogt

01

deg 2 4 6

Ihl

Figura 534 Model de semivariograma esfeacuteric i exponencial per la categoria 4

8 10 12

Capiacutetol 5 Desenvolupament del projecte

Categoriacutea 5

Model Exponencial Abast =4 Model Esferic Abast = 3

Meseta =006 Meseta = 006

VARIOGRAMA CATEGORIA 5

008

= sect~ 007-shy ESFro E E 006 ro Ol

005

004

003

o 2 4 6 8 10 12

Ihl

Figura 535 Model de semivariograma esfeacuteric i exponencial per la categoria 5

Capiacutetol5 Desenvolupament del projecte

Mirant els cinc grafics veiem que el model que ajusta millor eacutes Iesferic en tots els casos

encara que no hi ha diferencies massa significatives respecte el model exponencial A meacutes

observem una certa simetria pel que fa a la meseta i abast de cada un deis models esferics

de cada categoria Taula 532

Cat 1 Cat2 Cat3 Cat4 Cat5

Meseta 003 022 0265 02 006

Abast 75 4 6 4 3

Taula 532 Meseta i abast per cada categoria

Aquesta simetria sobserva sobretot per les categories 2 3 i 4

Els models corresponents a les categories 1 i 5 no ajusten del tot beacute degut a que soacuten les

categories deis extrems i per tant la gran majoria de mostres si no totes estaran per sobre o

per sota respectivament

Ara ja podem fer Iestimacioacute per krigeat indicador Al programa ik3d li introduim els cinc

models de semivariogrames per tal que ens calculi Iestimacioacute

El resultat que obtenim soacuten cinc columnes de 625 dades on els valors van de O a 1

Concretament ens calcula la probabilitat de que el valor atorgat a cada punt sigui inferior al

daquell cut-off

El que es preteacuten ara eacutes a partir daquest conjunt de probabilitats interpolar la mediana per a

cada un deis punts de la xarxa per tant el que fem eacutes executar el programa postik en Iopcioacute

3 de manera que ens tregui Iestimacioacute de la mediana

A continuacioacute passem a detallar en que consisteix el postik Per tal de poder-ho expressar

millor ens centrare m en un punt concret de la xarxa el (30)

- - - - -

Capiacutetol 5 Desenvolupament del projecte

Els tercer valor de cada una de les 5 columnes obtingudes amb el krigeat indicador eacutes a dir

els valors corresponents a la mostra situada en el node (30) representen la probabilitat de

que el valor de la variable en aquest punt sigui major que cada un deis cut-off

respectivament aixiacute podem afirmar que

P(Xiexcl lt el ) = P(x(3Q) lt 00995) =00000

P(xiexcl lt e2) = P(X(3 Q) lt 03764) =00397

P(xiexcl lt c3) = P(X(30) lt 07314) = 00409

P(xiexcl lt e4) = P(X(30) lt 12705) = 02079

P(xiexcl lt e5) = P(X(3 0) lt 25402) =10000

Si ara grafiquem aquests 5 valors obtenim una estimacioacute de la probabilitat que teacute el punt

estudiat (30) de ser meacutes petit que qualsevol valor eacutes a dir Iestimacioacute de la funcioacute de

probabilitat en aquest punt Com que el que es preteacuten estimar en el nostre estudi eacutes la

mediana mirarem quin valor aproxima per la probabilitat del 05 eacutes a dir

m tal que P(X(30) lt m) = 05

Per aixoacute tracem una liacutenia a Ialcada 05 i daquesta manera obtenim el valor estimat de la

mediana Aquest valor correspon al valor que obtenim amb el POSTIK que eacutes per aquesta

primera observacioacute 06983

10

x v 6 68 05 o

00

Figura 536 Els 5 cut-off aplicats al punt (30)

Capiacutetol 5 Desenvolupament del projecte

Laplicacioacute del POSTIK realitza aquesta estimacioacute per a cada un deis punts obtinguts (625)

i daquesta manera podem obten ir una interpolacioacute de la mediana per cada un deis valors a

estimar

Capiacutetol 5 Desenvolupament del projecte

SEMIVARIOGRAMA DE LA MOSTRA

model exponencial

12

= r 07 -- ca E E ca O)

02

o 2 4 6 8 10 12

Ihl

Figura 541 Semivariograma experimental amb un model exponencial

Aquest model obtingut a ull teacute els seguumlents parametres abast=7

meseta=1 05

Aplicant aquest valors al model general obtenim la formulacioacute per a les nostres dades

46

middotCapiacutetol 5 Desenvolupament del projecte

MODEL ESFERIC La formulacioacute general eacutes

sih a

sih gt a

on a eacutes Iabast i c la meseta

SEMIVARIOGRAMA DE LA MOSTRA

model esferic

12

---shyro E 07 E ro Ol

02

o 2 4 6 8 10 12

Ihl

Figura 54 2 Semivariograma experimental amb un model esfeacuterico

Aquest model Ihem obtingut de la mateixa manera que Ianterior a ull i els seus

parametres que tambeacute aplicarem a la forma general soacuten abast=6 i meseta=1

47

Capiacutetol 5 Desenvolupament del projecte

Finalment pode m representar la superfiacutecie que hem estimat a partir del krigeat

lognormal utilitzant un grafic de superfiacutecie (Figura 54 5)

6

5

Krig Logn 3

2

o

20 eix y

Figura 545 Grafic de superfiacutecie pel krigeat lognormal

50

Capiacutetol 6Comparacioacute deis resultats obtinguts

61 Regressioacute lineal

Per tal de dur a terme la compara cioacute entre els dos meacutetodes destimacioacute i les dades que

simulen la realitat hem expressat els resultats obtinguts graficament mitjancant els

grafics de punts ajustant en cada cas la recta de regressioacute i dibuixant la bisectriu Cal

tenir en compte que per augmentar la claredat i per a simplificar la interpretacioacute deis

resultat hem transformat les dades a una N(O1) encara que el nostre estudi es basi en

un model lognormal

Passem a continuacioacute a analitzar els grafics

En primer lIoc (Figura 611) tenim el grafic de punts entre les dades obtingudes amb el

primer meacutetode destimacioacute el krigeat lognormal i les dades provinents de la simula cioacute

de la realitat

Regression Plot y =3a1E -02jo O6lt40216X

R-Sq = 594

_0 ro

ro EID o middot Ole

~~ -2

-3

- -3 -2 -1

redade regresioacute

Bisectriu

realitat simulada

Figura 611 Recta de regressioacute entre el krigeat lognormal i la simulacioacute de la realitat

Si mirem aquest grafic podem observar que el valor de Iestimacioacute realitzada

sobreestima els valors petits de la simulacioacute i en canvi en els valors grans subestima

El coeficient de correlacioacute es del 594 eacutes a dir que el meacutetode del krigeat lognormal

explica un 594 de la realitat

52

Capiacutetol 6Comparacioacute deis resultats obtinguts

Passem ara a realitzar el gratic entre el segon meto de destimacioacute el krigeat indicador

i la realitat simulada (Figura 612)

0 _O

m~ 0)-- o

~~ -1

-2

-3

Regression Plot y = -23E-02 + 0711 615X

R-Sq 526

bull bull

-3 -2 -1

realitat simulada

recta de regresi oacute

I Bisectriu

Figura 612 Recta de regressioacute entre el krigeat indicador i la simulacioacute de la realitat

Podem observar que el gratic obtingut eacutes molt semblant a Ianterior i que ens trobem

amb el mateix problema de sobreestimacioacute deis valors petits i subestimacioacute deis valors

grans de la simulacioacute

El valor del coeticient de correlacioacute tambeacute eacutes torga semblant 52 6 Aixiacute doncs la

realitat eacutes explicada en un 526 pel krigeat indicador

53

Capiacutetol 6Comparacioacute deis resultats obtinguts

Finalment i per tenir una idea de la relacioacute que hi ha entre els dos meacutetodes emprats en

el projecte realitzarem un uacuteltim grafic comparatiu (Figura 613) que representa els dos

meacutetodes destimacioacute el krigeat lognormal i el krigeat indicador

Regression Plot y = -7 SE-02 + 105401X

R-Sq 796

middot2

middot3

recta de regresi6

bull Bisectriu

middot 4 middot3 middot2 -1

krigeat lognormal

Figura 613 Recta de regressioacute entre el krigeat lognormal i el krigeat indicador

En aquest cas podem observar que la recta de regressioacute coincideix gairebeacute a la

perfeccioacute amb la bisectriu cosa que vol dir que els dos meacutetodes soacuten molt semblants

entre siacute i que per tant eacutes normal que Iaproximacioacute de cada un dells a la realitat sigui

semblant

El valor de la regressioacute eacutes meacutes gran que en els altres dos casos 796 eacutes a dir que

els dos meacutetodes no donen resultats significativament diferents entre si

Podem observar un conjunt de dades que prenen valors especialment elevats en

Iestimacioacute per krigeat indicador Si analitzem aquests punts podem comprovar que

soacuten punts que tenen una probabilitat de ser meacutes grans que el cinqueacute cut-off (percentil

097) igual a 1 Per tant aquest tipus de punts no shan de tenir en compte en el

moment dextreure conclusions De fet aixo ja es sospitava en el grafic anterior pero

en que en aquell hi ha una elevada dispersioacute i per tant Iefecte queda dissimulat

54

Capiacutetol 5 Desenvolupament del projecte

La superfiacutecie descrita per la mostra podem representar-la tambeacute graficament (Figura

524)

mostra

45

40

3 5

30

25

20 15

10

05

00

eixy 20

Figura 524 Superfiacutecie definida per la mostra

35

Capiacutetol 5 Desenvolupament del projecte

53 Lestimacioacute per krigeat indicador

Per tal de realitzar el krigeat indicador definim 5 punts de tall o cut-off Aquests punts de tall

els escollim de forma que guardin simetria respecte el percentil del 50 tal i com mostra la

taula 531

Categoria Percentil Percentatge

1 90 009952

2 300 037637

3 500 073142

4 700 127046

5 910 254092

Taula 531 Els cinc punts de tall escollits

Un cop decidides les categories o punts de tall necessitem saber el semivariograma que

segueixen cada una delles per a poder dur a terme el krigeat indicador ja que Iestimacioacute

realitzada a partir daquest rneacutetode requereix una modelitzacioacute deis cinc semivariogrames

experimentals

El procediment eacutes el seguumlent

Partim de la mostra de 100 dades que segueix una distribucioacute 10gnormaL

Per cada una de les categories creem una columna de O i 1 de manera que si aquell

punt concret eacutes per sota del punt de tall el valor que pren la variable dicotoacutemica eacutes 1 i si eacutes

per sobre pren el valor O

Els semivariogrames els creem amb aquestes cinc columnes de zeros i uns

Per cada semivariograma provem dajustar un model esfeacuteric i un dexponencial Aquests dos

tipus de models els anirem ajustant a ull movent el valor del rang i de Iabast Partim

daquests models per ser els meacutes habituals en la realitat i ens quedarem amb el que ajusti millor deis dos [ref 2]

A continuacioacute presentem els resultats daquests ajustaments per a cada punt de tall

Capiacutetol 5 Desenvolupament del proiecte

Categoriacutea 1 y(h)

Model Exponencial Abast =8 Model Esferic Abast = 75

Meseta =003 Meseta = 003

VARIOGRANlA CATEGORIA 1

005

004 sectr bull ESF= ro E 003 E ro O)

002

001

000

o 2 4 6 8 10 12

Ihl

Figura 531 Model de semivariograma esfeacuteric i exponencial per la categoria 1

)1

Capiacutetol 5 Desenvolupament del projecte

Categoria 2

Model Exponencial Abast = 4 Model Esferic Abast = 4

Meseta = 022 Meseta = 022

VARIOGRAMA CATEGORIA 2

025

--

c bull ESF- sectro 020

E E ro Ogt

015

010

8 10 12

Figura 532 Model de semivariograma esferic i exponencial per la categoria 2

o 2 4 6

Ihl

Capitol 5 Desenvolupament del projecte

Categoriacutea 3

ModeJ Exponencial Abast =7 ModeJ Esferic Abast =6

Meseta =027 Meseta = 0265

VARIOGRAMA CATEGORIA 3

03

~ c (1] ~E 02E (1]

Ogt

01

o 2 4 6

Ihl

Figura 533 Model de semivariograma esfeacuteric i exponencial per la categoria 3

8 10 12

)9

Capiacutetol 5 Desenvolupament del projecte

Categoria 4

Model Exponencial Abast = 5 Model Esfeacuteric Abast = 4

Meseta = 02 Meseta = 02

VARIOGRAMA CATEGORIA 4

03

~ ~ -- ro E ~

02 E ro Ogt

01

deg 2 4 6

Ihl

Figura 534 Model de semivariograma esfeacuteric i exponencial per la categoria 4

8 10 12

Capiacutetol 5 Desenvolupament del projecte

Categoriacutea 5

Model Exponencial Abast =4 Model Esferic Abast = 3

Meseta =006 Meseta = 006

VARIOGRAMA CATEGORIA 5

008

= sect~ 007-shy ESFro E E 006 ro Ol

005

004

003

o 2 4 6 8 10 12

Ihl

Figura 535 Model de semivariograma esfeacuteric i exponencial per la categoria 5

Capiacutetol5 Desenvolupament del projecte

Mirant els cinc grafics veiem que el model que ajusta millor eacutes Iesferic en tots els casos

encara que no hi ha diferencies massa significatives respecte el model exponencial A meacutes

observem una certa simetria pel que fa a la meseta i abast de cada un deis models esferics

de cada categoria Taula 532

Cat 1 Cat2 Cat3 Cat4 Cat5

Meseta 003 022 0265 02 006

Abast 75 4 6 4 3

Taula 532 Meseta i abast per cada categoria

Aquesta simetria sobserva sobretot per les categories 2 3 i 4

Els models corresponents a les categories 1 i 5 no ajusten del tot beacute degut a que soacuten les

categories deis extrems i per tant la gran majoria de mostres si no totes estaran per sobre o

per sota respectivament

Ara ja podem fer Iestimacioacute per krigeat indicador Al programa ik3d li introduim els cinc

models de semivariogrames per tal que ens calculi Iestimacioacute

El resultat que obtenim soacuten cinc columnes de 625 dades on els valors van de O a 1

Concretament ens calcula la probabilitat de que el valor atorgat a cada punt sigui inferior al

daquell cut-off

El que es preteacuten ara eacutes a partir daquest conjunt de probabilitats interpolar la mediana per a

cada un deis punts de la xarxa per tant el que fem eacutes executar el programa postik en Iopcioacute

3 de manera que ens tregui Iestimacioacute de la mediana

A continuacioacute passem a detallar en que consisteix el postik Per tal de poder-ho expressar

millor ens centrare m en un punt concret de la xarxa el (30)

- - - - -

Capiacutetol 5 Desenvolupament del projecte

Els tercer valor de cada una de les 5 columnes obtingudes amb el krigeat indicador eacutes a dir

els valors corresponents a la mostra situada en el node (30) representen la probabilitat de

que el valor de la variable en aquest punt sigui major que cada un deis cut-off

respectivament aixiacute podem afirmar que

P(Xiexcl lt el ) = P(x(3Q) lt 00995) =00000

P(xiexcl lt e2) = P(X(3 Q) lt 03764) =00397

P(xiexcl lt c3) = P(X(30) lt 07314) = 00409

P(xiexcl lt e4) = P(X(30) lt 12705) = 02079

P(xiexcl lt e5) = P(X(3 0) lt 25402) =10000

Si ara grafiquem aquests 5 valors obtenim una estimacioacute de la probabilitat que teacute el punt

estudiat (30) de ser meacutes petit que qualsevol valor eacutes a dir Iestimacioacute de la funcioacute de

probabilitat en aquest punt Com que el que es preteacuten estimar en el nostre estudi eacutes la

mediana mirarem quin valor aproxima per la probabilitat del 05 eacutes a dir

m tal que P(X(30) lt m) = 05

Per aixoacute tracem una liacutenia a Ialcada 05 i daquesta manera obtenim el valor estimat de la

mediana Aquest valor correspon al valor que obtenim amb el POSTIK que eacutes per aquesta

primera observacioacute 06983

10

x v 6 68 05 o

00

Figura 536 Els 5 cut-off aplicats al punt (30)

Capiacutetol 5 Desenvolupament del projecte

Laplicacioacute del POSTIK realitza aquesta estimacioacute per a cada un deis punts obtinguts (625)

i daquesta manera podem obten ir una interpolacioacute de la mediana per cada un deis valors a

estimar

Capiacutetol 5 Desenvolupament del projecte

SEMIVARIOGRAMA DE LA MOSTRA

model exponencial

12

= r 07 -- ca E E ca O)

02

o 2 4 6 8 10 12

Ihl

Figura 541 Semivariograma experimental amb un model exponencial

Aquest model obtingut a ull teacute els seguumlents parametres abast=7

meseta=1 05

Aplicant aquest valors al model general obtenim la formulacioacute per a les nostres dades

46

middotCapiacutetol 5 Desenvolupament del projecte

MODEL ESFERIC La formulacioacute general eacutes

sih a

sih gt a

on a eacutes Iabast i c la meseta

SEMIVARIOGRAMA DE LA MOSTRA

model esferic

12

---shyro E 07 E ro Ol

02

o 2 4 6 8 10 12

Ihl

Figura 54 2 Semivariograma experimental amb un model esfeacuterico

Aquest model Ihem obtingut de la mateixa manera que Ianterior a ull i els seus

parametres que tambeacute aplicarem a la forma general soacuten abast=6 i meseta=1

47

Capiacutetol 5 Desenvolupament del projecte

Finalment pode m representar la superfiacutecie que hem estimat a partir del krigeat

lognormal utilitzant un grafic de superfiacutecie (Figura 54 5)

6

5

Krig Logn 3

2

o

20 eix y

Figura 545 Grafic de superfiacutecie pel krigeat lognormal

50

Capiacutetol 6Comparacioacute deis resultats obtinguts

61 Regressioacute lineal

Per tal de dur a terme la compara cioacute entre els dos meacutetodes destimacioacute i les dades que

simulen la realitat hem expressat els resultats obtinguts graficament mitjancant els

grafics de punts ajustant en cada cas la recta de regressioacute i dibuixant la bisectriu Cal

tenir en compte que per augmentar la claredat i per a simplificar la interpretacioacute deis

resultat hem transformat les dades a una N(O1) encara que el nostre estudi es basi en

un model lognormal

Passem a continuacioacute a analitzar els grafics

En primer lIoc (Figura 611) tenim el grafic de punts entre les dades obtingudes amb el

primer meacutetode destimacioacute el krigeat lognormal i les dades provinents de la simula cioacute

de la realitat

Regression Plot y =3a1E -02jo O6lt40216X

R-Sq = 594

_0 ro

ro EID o middot Ole

~~ -2

-3

- -3 -2 -1

redade regresioacute

Bisectriu

realitat simulada

Figura 611 Recta de regressioacute entre el krigeat lognormal i la simulacioacute de la realitat

Si mirem aquest grafic podem observar que el valor de Iestimacioacute realitzada

sobreestima els valors petits de la simulacioacute i en canvi en els valors grans subestima

El coeficient de correlacioacute es del 594 eacutes a dir que el meacutetode del krigeat lognormal

explica un 594 de la realitat

52

Capiacutetol 6Comparacioacute deis resultats obtinguts

Passem ara a realitzar el gratic entre el segon meto de destimacioacute el krigeat indicador

i la realitat simulada (Figura 612)

0 _O

m~ 0)-- o

~~ -1

-2

-3

Regression Plot y = -23E-02 + 0711 615X

R-Sq 526

bull bull

-3 -2 -1

realitat simulada

recta de regresi oacute

I Bisectriu

Figura 612 Recta de regressioacute entre el krigeat indicador i la simulacioacute de la realitat

Podem observar que el gratic obtingut eacutes molt semblant a Ianterior i que ens trobem

amb el mateix problema de sobreestimacioacute deis valors petits i subestimacioacute deis valors

grans de la simulacioacute

El valor del coeticient de correlacioacute tambeacute eacutes torga semblant 52 6 Aixiacute doncs la

realitat eacutes explicada en un 526 pel krigeat indicador

53

Capiacutetol 6Comparacioacute deis resultats obtinguts

Finalment i per tenir una idea de la relacioacute que hi ha entre els dos meacutetodes emprats en

el projecte realitzarem un uacuteltim grafic comparatiu (Figura 613) que representa els dos

meacutetodes destimacioacute el krigeat lognormal i el krigeat indicador

Regression Plot y = -7 SE-02 + 105401X

R-Sq 796

middot2

middot3

recta de regresi6

bull Bisectriu

middot 4 middot3 middot2 -1

krigeat lognormal

Figura 613 Recta de regressioacute entre el krigeat lognormal i el krigeat indicador

En aquest cas podem observar que la recta de regressioacute coincideix gairebeacute a la

perfeccioacute amb la bisectriu cosa que vol dir que els dos meacutetodes soacuten molt semblants

entre siacute i que per tant eacutes normal que Iaproximacioacute de cada un dells a la realitat sigui

semblant

El valor de la regressioacute eacutes meacutes gran que en els altres dos casos 796 eacutes a dir que

els dos meacutetodes no donen resultats significativament diferents entre si

Podem observar un conjunt de dades que prenen valors especialment elevats en

Iestimacioacute per krigeat indicador Si analitzem aquests punts podem comprovar que

soacuten punts que tenen una probabilitat de ser meacutes grans que el cinqueacute cut-off (percentil

097) igual a 1 Per tant aquest tipus de punts no shan de tenir en compte en el

moment dextreure conclusions De fet aixo ja es sospitava en el grafic anterior pero

en que en aquell hi ha una elevada dispersioacute i per tant Iefecte queda dissimulat

54

Capiacutetol 5 Desenvolupament del projecte

53 Lestimacioacute per krigeat indicador

Per tal de realitzar el krigeat indicador definim 5 punts de tall o cut-off Aquests punts de tall

els escollim de forma que guardin simetria respecte el percentil del 50 tal i com mostra la

taula 531

Categoria Percentil Percentatge

1 90 009952

2 300 037637

3 500 073142

4 700 127046

5 910 254092

Taula 531 Els cinc punts de tall escollits

Un cop decidides les categories o punts de tall necessitem saber el semivariograma que

segueixen cada una delles per a poder dur a terme el krigeat indicador ja que Iestimacioacute

realitzada a partir daquest rneacutetode requereix una modelitzacioacute deis cinc semivariogrames

experimentals

El procediment eacutes el seguumlent

Partim de la mostra de 100 dades que segueix una distribucioacute 10gnormaL

Per cada una de les categories creem una columna de O i 1 de manera que si aquell

punt concret eacutes per sota del punt de tall el valor que pren la variable dicotoacutemica eacutes 1 i si eacutes

per sobre pren el valor O

Els semivariogrames els creem amb aquestes cinc columnes de zeros i uns

Per cada semivariograma provem dajustar un model esfeacuteric i un dexponencial Aquests dos

tipus de models els anirem ajustant a ull movent el valor del rang i de Iabast Partim

daquests models per ser els meacutes habituals en la realitat i ens quedarem amb el que ajusti millor deis dos [ref 2]

A continuacioacute presentem els resultats daquests ajustaments per a cada punt de tall

Capiacutetol 5 Desenvolupament del proiecte

Categoriacutea 1 y(h)

Model Exponencial Abast =8 Model Esferic Abast = 75

Meseta =003 Meseta = 003

VARIOGRANlA CATEGORIA 1

005

004 sectr bull ESF= ro E 003 E ro O)

002

001

000

o 2 4 6 8 10 12

Ihl

Figura 531 Model de semivariograma esfeacuteric i exponencial per la categoria 1

)1

Capiacutetol 5 Desenvolupament del projecte

Categoria 2

Model Exponencial Abast = 4 Model Esferic Abast = 4

Meseta = 022 Meseta = 022

VARIOGRAMA CATEGORIA 2

025

--

c bull ESF- sectro 020

E E ro Ogt

015

010

8 10 12

Figura 532 Model de semivariograma esferic i exponencial per la categoria 2

o 2 4 6

Ihl

Capitol 5 Desenvolupament del projecte

Categoriacutea 3

ModeJ Exponencial Abast =7 ModeJ Esferic Abast =6

Meseta =027 Meseta = 0265

VARIOGRAMA CATEGORIA 3

03

~ c (1] ~E 02E (1]

Ogt

01

o 2 4 6

Ihl

Figura 533 Model de semivariograma esfeacuteric i exponencial per la categoria 3

8 10 12

)9

Capiacutetol 5 Desenvolupament del projecte

Categoria 4

Model Exponencial Abast = 5 Model Esfeacuteric Abast = 4

Meseta = 02 Meseta = 02

VARIOGRAMA CATEGORIA 4

03

~ ~ -- ro E ~

02 E ro Ogt

01

deg 2 4 6

Ihl

Figura 534 Model de semivariograma esfeacuteric i exponencial per la categoria 4

8 10 12

Capiacutetol 5 Desenvolupament del projecte

Categoriacutea 5

Model Exponencial Abast =4 Model Esferic Abast = 3

Meseta =006 Meseta = 006

VARIOGRAMA CATEGORIA 5

008

= sect~ 007-shy ESFro E E 006 ro Ol

005

004

003

o 2 4 6 8 10 12

Ihl

Figura 535 Model de semivariograma esfeacuteric i exponencial per la categoria 5

Capiacutetol5 Desenvolupament del projecte

Mirant els cinc grafics veiem que el model que ajusta millor eacutes Iesferic en tots els casos

encara que no hi ha diferencies massa significatives respecte el model exponencial A meacutes

observem una certa simetria pel que fa a la meseta i abast de cada un deis models esferics

de cada categoria Taula 532

Cat 1 Cat2 Cat3 Cat4 Cat5

Meseta 003 022 0265 02 006

Abast 75 4 6 4 3

Taula 532 Meseta i abast per cada categoria

Aquesta simetria sobserva sobretot per les categories 2 3 i 4

Els models corresponents a les categories 1 i 5 no ajusten del tot beacute degut a que soacuten les

categories deis extrems i per tant la gran majoria de mostres si no totes estaran per sobre o

per sota respectivament

Ara ja podem fer Iestimacioacute per krigeat indicador Al programa ik3d li introduim els cinc

models de semivariogrames per tal que ens calculi Iestimacioacute

El resultat que obtenim soacuten cinc columnes de 625 dades on els valors van de O a 1

Concretament ens calcula la probabilitat de que el valor atorgat a cada punt sigui inferior al

daquell cut-off

El que es preteacuten ara eacutes a partir daquest conjunt de probabilitats interpolar la mediana per a

cada un deis punts de la xarxa per tant el que fem eacutes executar el programa postik en Iopcioacute

3 de manera que ens tregui Iestimacioacute de la mediana

A continuacioacute passem a detallar en que consisteix el postik Per tal de poder-ho expressar

millor ens centrare m en un punt concret de la xarxa el (30)

- - - - -

Capiacutetol 5 Desenvolupament del projecte

Els tercer valor de cada una de les 5 columnes obtingudes amb el krigeat indicador eacutes a dir

els valors corresponents a la mostra situada en el node (30) representen la probabilitat de

que el valor de la variable en aquest punt sigui major que cada un deis cut-off

respectivament aixiacute podem afirmar que

P(Xiexcl lt el ) = P(x(3Q) lt 00995) =00000

P(xiexcl lt e2) = P(X(3 Q) lt 03764) =00397

P(xiexcl lt c3) = P(X(30) lt 07314) = 00409

P(xiexcl lt e4) = P(X(30) lt 12705) = 02079

P(xiexcl lt e5) = P(X(3 0) lt 25402) =10000

Si ara grafiquem aquests 5 valors obtenim una estimacioacute de la probabilitat que teacute el punt

estudiat (30) de ser meacutes petit que qualsevol valor eacutes a dir Iestimacioacute de la funcioacute de

probabilitat en aquest punt Com que el que es preteacuten estimar en el nostre estudi eacutes la

mediana mirarem quin valor aproxima per la probabilitat del 05 eacutes a dir

m tal que P(X(30) lt m) = 05

Per aixoacute tracem una liacutenia a Ialcada 05 i daquesta manera obtenim el valor estimat de la

mediana Aquest valor correspon al valor que obtenim amb el POSTIK que eacutes per aquesta

primera observacioacute 06983

10

x v 6 68 05 o

00

Figura 536 Els 5 cut-off aplicats al punt (30)

Capiacutetol 5 Desenvolupament del projecte

Laplicacioacute del POSTIK realitza aquesta estimacioacute per a cada un deis punts obtinguts (625)

i daquesta manera podem obten ir una interpolacioacute de la mediana per cada un deis valors a

estimar

Capiacutetol 5 Desenvolupament del projecte

SEMIVARIOGRAMA DE LA MOSTRA

model exponencial

12

= r 07 -- ca E E ca O)

02

o 2 4 6 8 10 12

Ihl

Figura 541 Semivariograma experimental amb un model exponencial

Aquest model obtingut a ull teacute els seguumlents parametres abast=7

meseta=1 05

Aplicant aquest valors al model general obtenim la formulacioacute per a les nostres dades

46

middotCapiacutetol 5 Desenvolupament del projecte

MODEL ESFERIC La formulacioacute general eacutes

sih a

sih gt a

on a eacutes Iabast i c la meseta

SEMIVARIOGRAMA DE LA MOSTRA

model esferic

12

---shyro E 07 E ro Ol

02

o 2 4 6 8 10 12

Ihl

Figura 54 2 Semivariograma experimental amb un model esfeacuterico

Aquest model Ihem obtingut de la mateixa manera que Ianterior a ull i els seus

parametres que tambeacute aplicarem a la forma general soacuten abast=6 i meseta=1

47

Capiacutetol 5 Desenvolupament del projecte

Finalment pode m representar la superfiacutecie que hem estimat a partir del krigeat

lognormal utilitzant un grafic de superfiacutecie (Figura 54 5)

6

5

Krig Logn 3

2

o

20 eix y

Figura 545 Grafic de superfiacutecie pel krigeat lognormal

50

Capiacutetol 6Comparacioacute deis resultats obtinguts

61 Regressioacute lineal

Per tal de dur a terme la compara cioacute entre els dos meacutetodes destimacioacute i les dades que

simulen la realitat hem expressat els resultats obtinguts graficament mitjancant els

grafics de punts ajustant en cada cas la recta de regressioacute i dibuixant la bisectriu Cal

tenir en compte que per augmentar la claredat i per a simplificar la interpretacioacute deis

resultat hem transformat les dades a una N(O1) encara que el nostre estudi es basi en

un model lognormal

Passem a continuacioacute a analitzar els grafics

En primer lIoc (Figura 611) tenim el grafic de punts entre les dades obtingudes amb el

primer meacutetode destimacioacute el krigeat lognormal i les dades provinents de la simula cioacute

de la realitat

Regression Plot y =3a1E -02jo O6lt40216X

R-Sq = 594

_0 ro

ro EID o middot Ole

~~ -2

-3

- -3 -2 -1

redade regresioacute

Bisectriu

realitat simulada

Figura 611 Recta de regressioacute entre el krigeat lognormal i la simulacioacute de la realitat

Si mirem aquest grafic podem observar que el valor de Iestimacioacute realitzada

sobreestima els valors petits de la simulacioacute i en canvi en els valors grans subestima

El coeficient de correlacioacute es del 594 eacutes a dir que el meacutetode del krigeat lognormal

explica un 594 de la realitat

52

Capiacutetol 6Comparacioacute deis resultats obtinguts

Passem ara a realitzar el gratic entre el segon meto de destimacioacute el krigeat indicador

i la realitat simulada (Figura 612)

0 _O

m~ 0)-- o

~~ -1

-2

-3

Regression Plot y = -23E-02 + 0711 615X

R-Sq 526

bull bull

-3 -2 -1

realitat simulada

recta de regresi oacute

I Bisectriu

Figura 612 Recta de regressioacute entre el krigeat indicador i la simulacioacute de la realitat

Podem observar que el gratic obtingut eacutes molt semblant a Ianterior i que ens trobem

amb el mateix problema de sobreestimacioacute deis valors petits i subestimacioacute deis valors

grans de la simulacioacute

El valor del coeticient de correlacioacute tambeacute eacutes torga semblant 52 6 Aixiacute doncs la

realitat eacutes explicada en un 526 pel krigeat indicador

53

Capiacutetol 6Comparacioacute deis resultats obtinguts

Finalment i per tenir una idea de la relacioacute que hi ha entre els dos meacutetodes emprats en

el projecte realitzarem un uacuteltim grafic comparatiu (Figura 613) que representa els dos

meacutetodes destimacioacute el krigeat lognormal i el krigeat indicador

Regression Plot y = -7 SE-02 + 105401X

R-Sq 796

middot2

middot3

recta de regresi6

bull Bisectriu

middot 4 middot3 middot2 -1

krigeat lognormal

Figura 613 Recta de regressioacute entre el krigeat lognormal i el krigeat indicador

En aquest cas podem observar que la recta de regressioacute coincideix gairebeacute a la

perfeccioacute amb la bisectriu cosa que vol dir que els dos meacutetodes soacuten molt semblants

entre siacute i que per tant eacutes normal que Iaproximacioacute de cada un dells a la realitat sigui

semblant

El valor de la regressioacute eacutes meacutes gran que en els altres dos casos 796 eacutes a dir que

els dos meacutetodes no donen resultats significativament diferents entre si

Podem observar un conjunt de dades que prenen valors especialment elevats en

Iestimacioacute per krigeat indicador Si analitzem aquests punts podem comprovar que

soacuten punts que tenen una probabilitat de ser meacutes grans que el cinqueacute cut-off (percentil

097) igual a 1 Per tant aquest tipus de punts no shan de tenir en compte en el

moment dextreure conclusions De fet aixo ja es sospitava en el grafic anterior pero

en que en aquell hi ha una elevada dispersioacute i per tant Iefecte queda dissimulat

54

Capiacutetol 5 Desenvolupament del proiecte

Categoriacutea 1 y(h)

Model Exponencial Abast =8 Model Esferic Abast = 75

Meseta =003 Meseta = 003

VARIOGRANlA CATEGORIA 1

005

004 sectr bull ESF= ro E 003 E ro O)

002

001

000

o 2 4 6 8 10 12

Ihl

Figura 531 Model de semivariograma esfeacuteric i exponencial per la categoria 1

)1

Capiacutetol 5 Desenvolupament del projecte

Categoria 2

Model Exponencial Abast = 4 Model Esferic Abast = 4

Meseta = 022 Meseta = 022

VARIOGRAMA CATEGORIA 2

025

--

c bull ESF- sectro 020

E E ro Ogt

015

010

8 10 12

Figura 532 Model de semivariograma esferic i exponencial per la categoria 2

o 2 4 6

Ihl

Capitol 5 Desenvolupament del projecte

Categoriacutea 3

ModeJ Exponencial Abast =7 ModeJ Esferic Abast =6

Meseta =027 Meseta = 0265

VARIOGRAMA CATEGORIA 3

03

~ c (1] ~E 02E (1]

Ogt

01

o 2 4 6

Ihl

Figura 533 Model de semivariograma esfeacuteric i exponencial per la categoria 3

8 10 12

)9

Capiacutetol 5 Desenvolupament del projecte

Categoria 4

Model Exponencial Abast = 5 Model Esfeacuteric Abast = 4

Meseta = 02 Meseta = 02

VARIOGRAMA CATEGORIA 4

03

~ ~ -- ro E ~

02 E ro Ogt

01

deg 2 4 6

Ihl

Figura 534 Model de semivariograma esfeacuteric i exponencial per la categoria 4

8 10 12

Capiacutetol 5 Desenvolupament del projecte

Categoriacutea 5

Model Exponencial Abast =4 Model Esferic Abast = 3

Meseta =006 Meseta = 006

VARIOGRAMA CATEGORIA 5

008

= sect~ 007-shy ESFro E E 006 ro Ol

005

004

003

o 2 4 6 8 10 12

Ihl

Figura 535 Model de semivariograma esfeacuteric i exponencial per la categoria 5

Capiacutetol5 Desenvolupament del projecte

Mirant els cinc grafics veiem que el model que ajusta millor eacutes Iesferic en tots els casos

encara que no hi ha diferencies massa significatives respecte el model exponencial A meacutes

observem una certa simetria pel que fa a la meseta i abast de cada un deis models esferics

de cada categoria Taula 532

Cat 1 Cat2 Cat3 Cat4 Cat5

Meseta 003 022 0265 02 006

Abast 75 4 6 4 3

Taula 532 Meseta i abast per cada categoria

Aquesta simetria sobserva sobretot per les categories 2 3 i 4

Els models corresponents a les categories 1 i 5 no ajusten del tot beacute degut a que soacuten les

categories deis extrems i per tant la gran majoria de mostres si no totes estaran per sobre o

per sota respectivament

Ara ja podem fer Iestimacioacute per krigeat indicador Al programa ik3d li introduim els cinc

models de semivariogrames per tal que ens calculi Iestimacioacute

El resultat que obtenim soacuten cinc columnes de 625 dades on els valors van de O a 1

Concretament ens calcula la probabilitat de que el valor atorgat a cada punt sigui inferior al

daquell cut-off

El que es preteacuten ara eacutes a partir daquest conjunt de probabilitats interpolar la mediana per a

cada un deis punts de la xarxa per tant el que fem eacutes executar el programa postik en Iopcioacute

3 de manera que ens tregui Iestimacioacute de la mediana

A continuacioacute passem a detallar en que consisteix el postik Per tal de poder-ho expressar

millor ens centrare m en un punt concret de la xarxa el (30)

- - - - -

Capiacutetol 5 Desenvolupament del projecte

Els tercer valor de cada una de les 5 columnes obtingudes amb el krigeat indicador eacutes a dir

els valors corresponents a la mostra situada en el node (30) representen la probabilitat de

que el valor de la variable en aquest punt sigui major que cada un deis cut-off

respectivament aixiacute podem afirmar que

P(Xiexcl lt el ) = P(x(3Q) lt 00995) =00000

P(xiexcl lt e2) = P(X(3 Q) lt 03764) =00397

P(xiexcl lt c3) = P(X(30) lt 07314) = 00409

P(xiexcl lt e4) = P(X(30) lt 12705) = 02079

P(xiexcl lt e5) = P(X(3 0) lt 25402) =10000

Si ara grafiquem aquests 5 valors obtenim una estimacioacute de la probabilitat que teacute el punt

estudiat (30) de ser meacutes petit que qualsevol valor eacutes a dir Iestimacioacute de la funcioacute de

probabilitat en aquest punt Com que el que es preteacuten estimar en el nostre estudi eacutes la

mediana mirarem quin valor aproxima per la probabilitat del 05 eacutes a dir

m tal que P(X(30) lt m) = 05

Per aixoacute tracem una liacutenia a Ialcada 05 i daquesta manera obtenim el valor estimat de la

mediana Aquest valor correspon al valor que obtenim amb el POSTIK que eacutes per aquesta

primera observacioacute 06983

10

x v 6 68 05 o

00

Figura 536 Els 5 cut-off aplicats al punt (30)

Capiacutetol 5 Desenvolupament del projecte

Laplicacioacute del POSTIK realitza aquesta estimacioacute per a cada un deis punts obtinguts (625)

i daquesta manera podem obten ir una interpolacioacute de la mediana per cada un deis valors a

estimar

Capiacutetol 5 Desenvolupament del projecte

SEMIVARIOGRAMA DE LA MOSTRA

model exponencial

12

= r 07 -- ca E E ca O)

02

o 2 4 6 8 10 12

Ihl

Figura 541 Semivariograma experimental amb un model exponencial

Aquest model obtingut a ull teacute els seguumlents parametres abast=7

meseta=1 05

Aplicant aquest valors al model general obtenim la formulacioacute per a les nostres dades

46

middotCapiacutetol 5 Desenvolupament del projecte

MODEL ESFERIC La formulacioacute general eacutes

sih a

sih gt a

on a eacutes Iabast i c la meseta

SEMIVARIOGRAMA DE LA MOSTRA

model esferic

12

---shyro E 07 E ro Ol

02

o 2 4 6 8 10 12

Ihl

Figura 54 2 Semivariograma experimental amb un model esfeacuterico

Aquest model Ihem obtingut de la mateixa manera que Ianterior a ull i els seus

parametres que tambeacute aplicarem a la forma general soacuten abast=6 i meseta=1

47

Capiacutetol 5 Desenvolupament del projecte

Finalment pode m representar la superfiacutecie que hem estimat a partir del krigeat

lognormal utilitzant un grafic de superfiacutecie (Figura 54 5)

6

5

Krig Logn 3

2

o

20 eix y

Figura 545 Grafic de superfiacutecie pel krigeat lognormal

50

Capiacutetol 6Comparacioacute deis resultats obtinguts

61 Regressioacute lineal

Per tal de dur a terme la compara cioacute entre els dos meacutetodes destimacioacute i les dades que

simulen la realitat hem expressat els resultats obtinguts graficament mitjancant els

grafics de punts ajustant en cada cas la recta de regressioacute i dibuixant la bisectriu Cal

tenir en compte que per augmentar la claredat i per a simplificar la interpretacioacute deis

resultat hem transformat les dades a una N(O1) encara que el nostre estudi es basi en

un model lognormal

Passem a continuacioacute a analitzar els grafics

En primer lIoc (Figura 611) tenim el grafic de punts entre les dades obtingudes amb el

primer meacutetode destimacioacute el krigeat lognormal i les dades provinents de la simula cioacute

de la realitat

Regression Plot y =3a1E -02jo O6lt40216X

R-Sq = 594

_0 ro

ro EID o middot Ole

~~ -2

-3

- -3 -2 -1

redade regresioacute

Bisectriu

realitat simulada

Figura 611 Recta de regressioacute entre el krigeat lognormal i la simulacioacute de la realitat

Si mirem aquest grafic podem observar que el valor de Iestimacioacute realitzada

sobreestima els valors petits de la simulacioacute i en canvi en els valors grans subestima

El coeficient de correlacioacute es del 594 eacutes a dir que el meacutetode del krigeat lognormal

explica un 594 de la realitat

52

Capiacutetol 6Comparacioacute deis resultats obtinguts

Passem ara a realitzar el gratic entre el segon meto de destimacioacute el krigeat indicador

i la realitat simulada (Figura 612)

0 _O

m~ 0)-- o

~~ -1

-2

-3

Regression Plot y = -23E-02 + 0711 615X

R-Sq 526

bull bull

-3 -2 -1

realitat simulada

recta de regresi oacute

I Bisectriu

Figura 612 Recta de regressioacute entre el krigeat indicador i la simulacioacute de la realitat

Podem observar que el gratic obtingut eacutes molt semblant a Ianterior i que ens trobem

amb el mateix problema de sobreestimacioacute deis valors petits i subestimacioacute deis valors

grans de la simulacioacute

El valor del coeticient de correlacioacute tambeacute eacutes torga semblant 52 6 Aixiacute doncs la

realitat eacutes explicada en un 526 pel krigeat indicador

53

Capiacutetol 6Comparacioacute deis resultats obtinguts

Finalment i per tenir una idea de la relacioacute que hi ha entre els dos meacutetodes emprats en

el projecte realitzarem un uacuteltim grafic comparatiu (Figura 613) que representa els dos

meacutetodes destimacioacute el krigeat lognormal i el krigeat indicador

Regression Plot y = -7 SE-02 + 105401X

R-Sq 796

middot2

middot3

recta de regresi6

bull Bisectriu

middot 4 middot3 middot2 -1

krigeat lognormal

Figura 613 Recta de regressioacute entre el krigeat lognormal i el krigeat indicador

En aquest cas podem observar que la recta de regressioacute coincideix gairebeacute a la

perfeccioacute amb la bisectriu cosa que vol dir que els dos meacutetodes soacuten molt semblants

entre siacute i que per tant eacutes normal que Iaproximacioacute de cada un dells a la realitat sigui

semblant

El valor de la regressioacute eacutes meacutes gran que en els altres dos casos 796 eacutes a dir que

els dos meacutetodes no donen resultats significativament diferents entre si

Podem observar un conjunt de dades que prenen valors especialment elevats en

Iestimacioacute per krigeat indicador Si analitzem aquests punts podem comprovar que

soacuten punts que tenen una probabilitat de ser meacutes grans que el cinqueacute cut-off (percentil

097) igual a 1 Per tant aquest tipus de punts no shan de tenir en compte en el

moment dextreure conclusions De fet aixo ja es sospitava en el grafic anterior pero

en que en aquell hi ha una elevada dispersioacute i per tant Iefecte queda dissimulat

54

Capiacutetol 5 Desenvolupament del projecte

Categoria 2

Model Exponencial Abast = 4 Model Esferic Abast = 4

Meseta = 022 Meseta = 022

VARIOGRAMA CATEGORIA 2

025

--

c bull ESF- sectro 020

E E ro Ogt

015

010

8 10 12

Figura 532 Model de semivariograma esferic i exponencial per la categoria 2

o 2 4 6

Ihl

Capitol 5 Desenvolupament del projecte

Categoriacutea 3

ModeJ Exponencial Abast =7 ModeJ Esferic Abast =6

Meseta =027 Meseta = 0265

VARIOGRAMA CATEGORIA 3

03

~ c (1] ~E 02E (1]

Ogt

01

o 2 4 6

Ihl

Figura 533 Model de semivariograma esfeacuteric i exponencial per la categoria 3

8 10 12

)9

Capiacutetol 5 Desenvolupament del projecte

Categoria 4

Model Exponencial Abast = 5 Model Esfeacuteric Abast = 4

Meseta = 02 Meseta = 02

VARIOGRAMA CATEGORIA 4

03

~ ~ -- ro E ~

02 E ro Ogt

01

deg 2 4 6

Ihl

Figura 534 Model de semivariograma esfeacuteric i exponencial per la categoria 4

8 10 12

Capiacutetol 5 Desenvolupament del projecte

Categoriacutea 5

Model Exponencial Abast =4 Model Esferic Abast = 3

Meseta =006 Meseta = 006

VARIOGRAMA CATEGORIA 5

008

= sect~ 007-shy ESFro E E 006 ro Ol

005

004

003

o 2 4 6 8 10 12

Ihl

Figura 535 Model de semivariograma esfeacuteric i exponencial per la categoria 5

Capiacutetol5 Desenvolupament del projecte

Mirant els cinc grafics veiem que el model que ajusta millor eacutes Iesferic en tots els casos

encara que no hi ha diferencies massa significatives respecte el model exponencial A meacutes

observem una certa simetria pel que fa a la meseta i abast de cada un deis models esferics

de cada categoria Taula 532

Cat 1 Cat2 Cat3 Cat4 Cat5

Meseta 003 022 0265 02 006

Abast 75 4 6 4 3

Taula 532 Meseta i abast per cada categoria

Aquesta simetria sobserva sobretot per les categories 2 3 i 4

Els models corresponents a les categories 1 i 5 no ajusten del tot beacute degut a que soacuten les

categories deis extrems i per tant la gran majoria de mostres si no totes estaran per sobre o

per sota respectivament

Ara ja podem fer Iestimacioacute per krigeat indicador Al programa ik3d li introduim els cinc

models de semivariogrames per tal que ens calculi Iestimacioacute

El resultat que obtenim soacuten cinc columnes de 625 dades on els valors van de O a 1

Concretament ens calcula la probabilitat de que el valor atorgat a cada punt sigui inferior al

daquell cut-off

El que es preteacuten ara eacutes a partir daquest conjunt de probabilitats interpolar la mediana per a

cada un deis punts de la xarxa per tant el que fem eacutes executar el programa postik en Iopcioacute

3 de manera que ens tregui Iestimacioacute de la mediana

A continuacioacute passem a detallar en que consisteix el postik Per tal de poder-ho expressar

millor ens centrare m en un punt concret de la xarxa el (30)

- - - - -

Capiacutetol 5 Desenvolupament del projecte

Els tercer valor de cada una de les 5 columnes obtingudes amb el krigeat indicador eacutes a dir

els valors corresponents a la mostra situada en el node (30) representen la probabilitat de

que el valor de la variable en aquest punt sigui major que cada un deis cut-off

respectivament aixiacute podem afirmar que

P(Xiexcl lt el ) = P(x(3Q) lt 00995) =00000

P(xiexcl lt e2) = P(X(3 Q) lt 03764) =00397

P(xiexcl lt c3) = P(X(30) lt 07314) = 00409

P(xiexcl lt e4) = P(X(30) lt 12705) = 02079

P(xiexcl lt e5) = P(X(3 0) lt 25402) =10000

Si ara grafiquem aquests 5 valors obtenim una estimacioacute de la probabilitat que teacute el punt

estudiat (30) de ser meacutes petit que qualsevol valor eacutes a dir Iestimacioacute de la funcioacute de

probabilitat en aquest punt Com que el que es preteacuten estimar en el nostre estudi eacutes la

mediana mirarem quin valor aproxima per la probabilitat del 05 eacutes a dir

m tal que P(X(30) lt m) = 05

Per aixoacute tracem una liacutenia a Ialcada 05 i daquesta manera obtenim el valor estimat de la

mediana Aquest valor correspon al valor que obtenim amb el POSTIK que eacutes per aquesta

primera observacioacute 06983

10

x v 6 68 05 o

00

Figura 536 Els 5 cut-off aplicats al punt (30)

Capiacutetol 5 Desenvolupament del projecte

Laplicacioacute del POSTIK realitza aquesta estimacioacute per a cada un deis punts obtinguts (625)

i daquesta manera podem obten ir una interpolacioacute de la mediana per cada un deis valors a

estimar

Capiacutetol 5 Desenvolupament del projecte

SEMIVARIOGRAMA DE LA MOSTRA

model exponencial

12

= r 07 -- ca E E ca O)

02

o 2 4 6 8 10 12

Ihl

Figura 541 Semivariograma experimental amb un model exponencial

Aquest model obtingut a ull teacute els seguumlents parametres abast=7

meseta=1 05

Aplicant aquest valors al model general obtenim la formulacioacute per a les nostres dades

46

middotCapiacutetol 5 Desenvolupament del projecte

MODEL ESFERIC La formulacioacute general eacutes

sih a

sih gt a

on a eacutes Iabast i c la meseta

SEMIVARIOGRAMA DE LA MOSTRA

model esferic

12

---shyro E 07 E ro Ol

02

o 2 4 6 8 10 12

Ihl

Figura 54 2 Semivariograma experimental amb un model esfeacuterico

Aquest model Ihem obtingut de la mateixa manera que Ianterior a ull i els seus

parametres que tambeacute aplicarem a la forma general soacuten abast=6 i meseta=1

47

Capiacutetol 5 Desenvolupament del projecte

Finalment pode m representar la superfiacutecie que hem estimat a partir del krigeat

lognormal utilitzant un grafic de superfiacutecie (Figura 54 5)

6

5

Krig Logn 3

2

o

20 eix y

Figura 545 Grafic de superfiacutecie pel krigeat lognormal

50

Capiacutetol 6Comparacioacute deis resultats obtinguts

61 Regressioacute lineal

Per tal de dur a terme la compara cioacute entre els dos meacutetodes destimacioacute i les dades que

simulen la realitat hem expressat els resultats obtinguts graficament mitjancant els

grafics de punts ajustant en cada cas la recta de regressioacute i dibuixant la bisectriu Cal

tenir en compte que per augmentar la claredat i per a simplificar la interpretacioacute deis

resultat hem transformat les dades a una N(O1) encara que el nostre estudi es basi en

un model lognormal

Passem a continuacioacute a analitzar els grafics

En primer lIoc (Figura 611) tenim el grafic de punts entre les dades obtingudes amb el

primer meacutetode destimacioacute el krigeat lognormal i les dades provinents de la simula cioacute

de la realitat

Regression Plot y =3a1E -02jo O6lt40216X

R-Sq = 594

_0 ro

ro EID o middot Ole

~~ -2

-3

- -3 -2 -1

redade regresioacute

Bisectriu

realitat simulada

Figura 611 Recta de regressioacute entre el krigeat lognormal i la simulacioacute de la realitat

Si mirem aquest grafic podem observar que el valor de Iestimacioacute realitzada

sobreestima els valors petits de la simulacioacute i en canvi en els valors grans subestima

El coeficient de correlacioacute es del 594 eacutes a dir que el meacutetode del krigeat lognormal

explica un 594 de la realitat

52

Capiacutetol 6Comparacioacute deis resultats obtinguts

Passem ara a realitzar el gratic entre el segon meto de destimacioacute el krigeat indicador

i la realitat simulada (Figura 612)

0 _O

m~ 0)-- o

~~ -1

-2

-3

Regression Plot y = -23E-02 + 0711 615X

R-Sq 526

bull bull

-3 -2 -1

realitat simulada

recta de regresi oacute

I Bisectriu

Figura 612 Recta de regressioacute entre el krigeat indicador i la simulacioacute de la realitat

Podem observar que el gratic obtingut eacutes molt semblant a Ianterior i que ens trobem

amb el mateix problema de sobreestimacioacute deis valors petits i subestimacioacute deis valors

grans de la simulacioacute

El valor del coeticient de correlacioacute tambeacute eacutes torga semblant 52 6 Aixiacute doncs la

realitat eacutes explicada en un 526 pel krigeat indicador

53

Capiacutetol 6Comparacioacute deis resultats obtinguts

Finalment i per tenir una idea de la relacioacute que hi ha entre els dos meacutetodes emprats en

el projecte realitzarem un uacuteltim grafic comparatiu (Figura 613) que representa els dos

meacutetodes destimacioacute el krigeat lognormal i el krigeat indicador

Regression Plot y = -7 SE-02 + 105401X

R-Sq 796

middot2

middot3

recta de regresi6

bull Bisectriu

middot 4 middot3 middot2 -1

krigeat lognormal

Figura 613 Recta de regressioacute entre el krigeat lognormal i el krigeat indicador

En aquest cas podem observar que la recta de regressioacute coincideix gairebeacute a la

perfeccioacute amb la bisectriu cosa que vol dir que els dos meacutetodes soacuten molt semblants

entre siacute i que per tant eacutes normal que Iaproximacioacute de cada un dells a la realitat sigui

semblant

El valor de la regressioacute eacutes meacutes gran que en els altres dos casos 796 eacutes a dir que

els dos meacutetodes no donen resultats significativament diferents entre si

Podem observar un conjunt de dades que prenen valors especialment elevats en

Iestimacioacute per krigeat indicador Si analitzem aquests punts podem comprovar que

soacuten punts que tenen una probabilitat de ser meacutes grans que el cinqueacute cut-off (percentil

097) igual a 1 Per tant aquest tipus de punts no shan de tenir en compte en el

moment dextreure conclusions De fet aixo ja es sospitava en el grafic anterior pero

en que en aquell hi ha una elevada dispersioacute i per tant Iefecte queda dissimulat

54

Capitol 5 Desenvolupament del projecte

Categoriacutea 3

ModeJ Exponencial Abast =7 ModeJ Esferic Abast =6

Meseta =027 Meseta = 0265

VARIOGRAMA CATEGORIA 3

03

~ c (1] ~E 02E (1]

Ogt

01

o 2 4 6

Ihl

Figura 533 Model de semivariograma esfeacuteric i exponencial per la categoria 3

8 10 12

)9

Capiacutetol 5 Desenvolupament del projecte

Categoria 4

Model Exponencial Abast = 5 Model Esfeacuteric Abast = 4

Meseta = 02 Meseta = 02

VARIOGRAMA CATEGORIA 4

03

~ ~ -- ro E ~

02 E ro Ogt

01

deg 2 4 6

Ihl

Figura 534 Model de semivariograma esfeacuteric i exponencial per la categoria 4

8 10 12

Capiacutetol 5 Desenvolupament del projecte

Categoriacutea 5

Model Exponencial Abast =4 Model Esferic Abast = 3

Meseta =006 Meseta = 006

VARIOGRAMA CATEGORIA 5

008

= sect~ 007-shy ESFro E E 006 ro Ol

005

004

003

o 2 4 6 8 10 12

Ihl

Figura 535 Model de semivariograma esfeacuteric i exponencial per la categoria 5

Capiacutetol5 Desenvolupament del projecte

Mirant els cinc grafics veiem que el model que ajusta millor eacutes Iesferic en tots els casos

encara que no hi ha diferencies massa significatives respecte el model exponencial A meacutes

observem una certa simetria pel que fa a la meseta i abast de cada un deis models esferics

de cada categoria Taula 532

Cat 1 Cat2 Cat3 Cat4 Cat5

Meseta 003 022 0265 02 006

Abast 75 4 6 4 3

Taula 532 Meseta i abast per cada categoria

Aquesta simetria sobserva sobretot per les categories 2 3 i 4

Els models corresponents a les categories 1 i 5 no ajusten del tot beacute degut a que soacuten les

categories deis extrems i per tant la gran majoria de mostres si no totes estaran per sobre o

per sota respectivament

Ara ja podem fer Iestimacioacute per krigeat indicador Al programa ik3d li introduim els cinc

models de semivariogrames per tal que ens calculi Iestimacioacute

El resultat que obtenim soacuten cinc columnes de 625 dades on els valors van de O a 1

Concretament ens calcula la probabilitat de que el valor atorgat a cada punt sigui inferior al

daquell cut-off

El que es preteacuten ara eacutes a partir daquest conjunt de probabilitats interpolar la mediana per a

cada un deis punts de la xarxa per tant el que fem eacutes executar el programa postik en Iopcioacute

3 de manera que ens tregui Iestimacioacute de la mediana

A continuacioacute passem a detallar en que consisteix el postik Per tal de poder-ho expressar

millor ens centrare m en un punt concret de la xarxa el (30)

- - - - -

Capiacutetol 5 Desenvolupament del projecte

Els tercer valor de cada una de les 5 columnes obtingudes amb el krigeat indicador eacutes a dir

els valors corresponents a la mostra situada en el node (30) representen la probabilitat de

que el valor de la variable en aquest punt sigui major que cada un deis cut-off

respectivament aixiacute podem afirmar que

P(Xiexcl lt el ) = P(x(3Q) lt 00995) =00000

P(xiexcl lt e2) = P(X(3 Q) lt 03764) =00397

P(xiexcl lt c3) = P(X(30) lt 07314) = 00409

P(xiexcl lt e4) = P(X(30) lt 12705) = 02079

P(xiexcl lt e5) = P(X(3 0) lt 25402) =10000

Si ara grafiquem aquests 5 valors obtenim una estimacioacute de la probabilitat que teacute el punt

estudiat (30) de ser meacutes petit que qualsevol valor eacutes a dir Iestimacioacute de la funcioacute de

probabilitat en aquest punt Com que el que es preteacuten estimar en el nostre estudi eacutes la

mediana mirarem quin valor aproxima per la probabilitat del 05 eacutes a dir

m tal que P(X(30) lt m) = 05

Per aixoacute tracem una liacutenia a Ialcada 05 i daquesta manera obtenim el valor estimat de la

mediana Aquest valor correspon al valor que obtenim amb el POSTIK que eacutes per aquesta

primera observacioacute 06983

10

x v 6 68 05 o

00

Figura 536 Els 5 cut-off aplicats al punt (30)

Capiacutetol 5 Desenvolupament del projecte

Laplicacioacute del POSTIK realitza aquesta estimacioacute per a cada un deis punts obtinguts (625)

i daquesta manera podem obten ir una interpolacioacute de la mediana per cada un deis valors a

estimar

Capiacutetol 5 Desenvolupament del projecte

SEMIVARIOGRAMA DE LA MOSTRA

model exponencial

12

= r 07 -- ca E E ca O)

02

o 2 4 6 8 10 12

Ihl

Figura 541 Semivariograma experimental amb un model exponencial

Aquest model obtingut a ull teacute els seguumlents parametres abast=7

meseta=1 05

Aplicant aquest valors al model general obtenim la formulacioacute per a les nostres dades

46

middotCapiacutetol 5 Desenvolupament del projecte

MODEL ESFERIC La formulacioacute general eacutes

sih a

sih gt a

on a eacutes Iabast i c la meseta

SEMIVARIOGRAMA DE LA MOSTRA

model esferic

12

---shyro E 07 E ro Ol

02

o 2 4 6 8 10 12

Ihl

Figura 54 2 Semivariograma experimental amb un model esfeacuterico

Aquest model Ihem obtingut de la mateixa manera que Ianterior a ull i els seus

parametres que tambeacute aplicarem a la forma general soacuten abast=6 i meseta=1

47

Capiacutetol 5 Desenvolupament del projecte

Finalment pode m representar la superfiacutecie que hem estimat a partir del krigeat

lognormal utilitzant un grafic de superfiacutecie (Figura 54 5)

6

5

Krig Logn 3

2

o

20 eix y

Figura 545 Grafic de superfiacutecie pel krigeat lognormal

50

Capiacutetol 6Comparacioacute deis resultats obtinguts

61 Regressioacute lineal

Per tal de dur a terme la compara cioacute entre els dos meacutetodes destimacioacute i les dades que

simulen la realitat hem expressat els resultats obtinguts graficament mitjancant els

grafics de punts ajustant en cada cas la recta de regressioacute i dibuixant la bisectriu Cal

tenir en compte que per augmentar la claredat i per a simplificar la interpretacioacute deis

resultat hem transformat les dades a una N(O1) encara que el nostre estudi es basi en

un model lognormal

Passem a continuacioacute a analitzar els grafics

En primer lIoc (Figura 611) tenim el grafic de punts entre les dades obtingudes amb el

primer meacutetode destimacioacute el krigeat lognormal i les dades provinents de la simula cioacute

de la realitat

Regression Plot y =3a1E -02jo O6lt40216X

R-Sq = 594

_0 ro

ro EID o middot Ole

~~ -2

-3

- -3 -2 -1

redade regresioacute

Bisectriu

realitat simulada

Figura 611 Recta de regressioacute entre el krigeat lognormal i la simulacioacute de la realitat

Si mirem aquest grafic podem observar que el valor de Iestimacioacute realitzada

sobreestima els valors petits de la simulacioacute i en canvi en els valors grans subestima

El coeficient de correlacioacute es del 594 eacutes a dir que el meacutetode del krigeat lognormal

explica un 594 de la realitat

52

Capiacutetol 6Comparacioacute deis resultats obtinguts

Passem ara a realitzar el gratic entre el segon meto de destimacioacute el krigeat indicador

i la realitat simulada (Figura 612)

0 _O

m~ 0)-- o

~~ -1

-2

-3

Regression Plot y = -23E-02 + 0711 615X

R-Sq 526

bull bull

-3 -2 -1

realitat simulada

recta de regresi oacute

I Bisectriu

Figura 612 Recta de regressioacute entre el krigeat indicador i la simulacioacute de la realitat

Podem observar que el gratic obtingut eacutes molt semblant a Ianterior i que ens trobem

amb el mateix problema de sobreestimacioacute deis valors petits i subestimacioacute deis valors

grans de la simulacioacute

El valor del coeticient de correlacioacute tambeacute eacutes torga semblant 52 6 Aixiacute doncs la

realitat eacutes explicada en un 526 pel krigeat indicador

53

Capiacutetol 6Comparacioacute deis resultats obtinguts

Finalment i per tenir una idea de la relacioacute que hi ha entre els dos meacutetodes emprats en

el projecte realitzarem un uacuteltim grafic comparatiu (Figura 613) que representa els dos

meacutetodes destimacioacute el krigeat lognormal i el krigeat indicador

Regression Plot y = -7 SE-02 + 105401X

R-Sq 796

middot2

middot3

recta de regresi6

bull Bisectriu

middot 4 middot3 middot2 -1

krigeat lognormal

Figura 613 Recta de regressioacute entre el krigeat lognormal i el krigeat indicador

En aquest cas podem observar que la recta de regressioacute coincideix gairebeacute a la

perfeccioacute amb la bisectriu cosa que vol dir que els dos meacutetodes soacuten molt semblants

entre siacute i que per tant eacutes normal que Iaproximacioacute de cada un dells a la realitat sigui

semblant

El valor de la regressioacute eacutes meacutes gran que en els altres dos casos 796 eacutes a dir que

els dos meacutetodes no donen resultats significativament diferents entre si

Podem observar un conjunt de dades que prenen valors especialment elevats en

Iestimacioacute per krigeat indicador Si analitzem aquests punts podem comprovar que

soacuten punts que tenen una probabilitat de ser meacutes grans que el cinqueacute cut-off (percentil

097) igual a 1 Per tant aquest tipus de punts no shan de tenir en compte en el

moment dextreure conclusions De fet aixo ja es sospitava en el grafic anterior pero

en que en aquell hi ha una elevada dispersioacute i per tant Iefecte queda dissimulat

54

Capiacutetol 5 Desenvolupament del projecte

Categoria 4

Model Exponencial Abast = 5 Model Esfeacuteric Abast = 4

Meseta = 02 Meseta = 02

VARIOGRAMA CATEGORIA 4

03

~ ~ -- ro E ~

02 E ro Ogt

01

deg 2 4 6

Ihl

Figura 534 Model de semivariograma esfeacuteric i exponencial per la categoria 4

8 10 12

Capiacutetol 5 Desenvolupament del projecte

Categoriacutea 5

Model Exponencial Abast =4 Model Esferic Abast = 3

Meseta =006 Meseta = 006

VARIOGRAMA CATEGORIA 5

008

= sect~ 007-shy ESFro E E 006 ro Ol

005

004

003

o 2 4 6 8 10 12

Ihl

Figura 535 Model de semivariograma esfeacuteric i exponencial per la categoria 5

Capiacutetol5 Desenvolupament del projecte

Mirant els cinc grafics veiem que el model que ajusta millor eacutes Iesferic en tots els casos

encara que no hi ha diferencies massa significatives respecte el model exponencial A meacutes

observem una certa simetria pel que fa a la meseta i abast de cada un deis models esferics

de cada categoria Taula 532

Cat 1 Cat2 Cat3 Cat4 Cat5

Meseta 003 022 0265 02 006

Abast 75 4 6 4 3

Taula 532 Meseta i abast per cada categoria

Aquesta simetria sobserva sobretot per les categories 2 3 i 4

Els models corresponents a les categories 1 i 5 no ajusten del tot beacute degut a que soacuten les

categories deis extrems i per tant la gran majoria de mostres si no totes estaran per sobre o

per sota respectivament

Ara ja podem fer Iestimacioacute per krigeat indicador Al programa ik3d li introduim els cinc

models de semivariogrames per tal que ens calculi Iestimacioacute

El resultat que obtenim soacuten cinc columnes de 625 dades on els valors van de O a 1

Concretament ens calcula la probabilitat de que el valor atorgat a cada punt sigui inferior al

daquell cut-off

El que es preteacuten ara eacutes a partir daquest conjunt de probabilitats interpolar la mediana per a

cada un deis punts de la xarxa per tant el que fem eacutes executar el programa postik en Iopcioacute

3 de manera que ens tregui Iestimacioacute de la mediana

A continuacioacute passem a detallar en que consisteix el postik Per tal de poder-ho expressar

millor ens centrare m en un punt concret de la xarxa el (30)

- - - - -

Capiacutetol 5 Desenvolupament del projecte

Els tercer valor de cada una de les 5 columnes obtingudes amb el krigeat indicador eacutes a dir

els valors corresponents a la mostra situada en el node (30) representen la probabilitat de

que el valor de la variable en aquest punt sigui major que cada un deis cut-off

respectivament aixiacute podem afirmar que

P(Xiexcl lt el ) = P(x(3Q) lt 00995) =00000

P(xiexcl lt e2) = P(X(3 Q) lt 03764) =00397

P(xiexcl lt c3) = P(X(30) lt 07314) = 00409

P(xiexcl lt e4) = P(X(30) lt 12705) = 02079

P(xiexcl lt e5) = P(X(3 0) lt 25402) =10000

Si ara grafiquem aquests 5 valors obtenim una estimacioacute de la probabilitat que teacute el punt

estudiat (30) de ser meacutes petit que qualsevol valor eacutes a dir Iestimacioacute de la funcioacute de

probabilitat en aquest punt Com que el que es preteacuten estimar en el nostre estudi eacutes la

mediana mirarem quin valor aproxima per la probabilitat del 05 eacutes a dir

m tal que P(X(30) lt m) = 05

Per aixoacute tracem una liacutenia a Ialcada 05 i daquesta manera obtenim el valor estimat de la

mediana Aquest valor correspon al valor que obtenim amb el POSTIK que eacutes per aquesta

primera observacioacute 06983

10

x v 6 68 05 o

00

Figura 536 Els 5 cut-off aplicats al punt (30)

Capiacutetol 5 Desenvolupament del projecte

Laplicacioacute del POSTIK realitza aquesta estimacioacute per a cada un deis punts obtinguts (625)

i daquesta manera podem obten ir una interpolacioacute de la mediana per cada un deis valors a

estimar

Capiacutetol 5 Desenvolupament del projecte

SEMIVARIOGRAMA DE LA MOSTRA

model exponencial

12

= r 07 -- ca E E ca O)

02

o 2 4 6 8 10 12

Ihl

Figura 541 Semivariograma experimental amb un model exponencial

Aquest model obtingut a ull teacute els seguumlents parametres abast=7

meseta=1 05

Aplicant aquest valors al model general obtenim la formulacioacute per a les nostres dades

46

middotCapiacutetol 5 Desenvolupament del projecte

MODEL ESFERIC La formulacioacute general eacutes

sih a

sih gt a

on a eacutes Iabast i c la meseta

SEMIVARIOGRAMA DE LA MOSTRA

model esferic

12

---shyro E 07 E ro Ol

02

o 2 4 6 8 10 12

Ihl

Figura 54 2 Semivariograma experimental amb un model esfeacuterico

Aquest model Ihem obtingut de la mateixa manera que Ianterior a ull i els seus

parametres que tambeacute aplicarem a la forma general soacuten abast=6 i meseta=1

47

Capiacutetol 5 Desenvolupament del projecte

Finalment pode m representar la superfiacutecie que hem estimat a partir del krigeat

lognormal utilitzant un grafic de superfiacutecie (Figura 54 5)

6

5

Krig Logn 3

2

o

20 eix y

Figura 545 Grafic de superfiacutecie pel krigeat lognormal

50

Capiacutetol 6Comparacioacute deis resultats obtinguts

61 Regressioacute lineal

Per tal de dur a terme la compara cioacute entre els dos meacutetodes destimacioacute i les dades que

simulen la realitat hem expressat els resultats obtinguts graficament mitjancant els

grafics de punts ajustant en cada cas la recta de regressioacute i dibuixant la bisectriu Cal

tenir en compte que per augmentar la claredat i per a simplificar la interpretacioacute deis

resultat hem transformat les dades a una N(O1) encara que el nostre estudi es basi en

un model lognormal

Passem a continuacioacute a analitzar els grafics

En primer lIoc (Figura 611) tenim el grafic de punts entre les dades obtingudes amb el

primer meacutetode destimacioacute el krigeat lognormal i les dades provinents de la simula cioacute

de la realitat

Regression Plot y =3a1E -02jo O6lt40216X

R-Sq = 594

_0 ro

ro EID o middot Ole

~~ -2

-3

- -3 -2 -1

redade regresioacute

Bisectriu

realitat simulada

Figura 611 Recta de regressioacute entre el krigeat lognormal i la simulacioacute de la realitat

Si mirem aquest grafic podem observar que el valor de Iestimacioacute realitzada

sobreestima els valors petits de la simulacioacute i en canvi en els valors grans subestima

El coeficient de correlacioacute es del 594 eacutes a dir que el meacutetode del krigeat lognormal

explica un 594 de la realitat

52

Capiacutetol 6Comparacioacute deis resultats obtinguts

Passem ara a realitzar el gratic entre el segon meto de destimacioacute el krigeat indicador

i la realitat simulada (Figura 612)

0 _O

m~ 0)-- o

~~ -1

-2

-3

Regression Plot y = -23E-02 + 0711 615X

R-Sq 526

bull bull

-3 -2 -1

realitat simulada

recta de regresi oacute

I Bisectriu

Figura 612 Recta de regressioacute entre el krigeat indicador i la simulacioacute de la realitat

Podem observar que el gratic obtingut eacutes molt semblant a Ianterior i que ens trobem

amb el mateix problema de sobreestimacioacute deis valors petits i subestimacioacute deis valors

grans de la simulacioacute

El valor del coeticient de correlacioacute tambeacute eacutes torga semblant 52 6 Aixiacute doncs la

realitat eacutes explicada en un 526 pel krigeat indicador

53

Capiacutetol 6Comparacioacute deis resultats obtinguts

Finalment i per tenir una idea de la relacioacute que hi ha entre els dos meacutetodes emprats en

el projecte realitzarem un uacuteltim grafic comparatiu (Figura 613) que representa els dos

meacutetodes destimacioacute el krigeat lognormal i el krigeat indicador

Regression Plot y = -7 SE-02 + 105401X

R-Sq 796

middot2

middot3

recta de regresi6

bull Bisectriu

middot 4 middot3 middot2 -1

krigeat lognormal

Figura 613 Recta de regressioacute entre el krigeat lognormal i el krigeat indicador

En aquest cas podem observar que la recta de regressioacute coincideix gairebeacute a la

perfeccioacute amb la bisectriu cosa que vol dir que els dos meacutetodes soacuten molt semblants

entre siacute i que per tant eacutes normal que Iaproximacioacute de cada un dells a la realitat sigui

semblant

El valor de la regressioacute eacutes meacutes gran que en els altres dos casos 796 eacutes a dir que

els dos meacutetodes no donen resultats significativament diferents entre si

Podem observar un conjunt de dades que prenen valors especialment elevats en

Iestimacioacute per krigeat indicador Si analitzem aquests punts podem comprovar que

soacuten punts que tenen una probabilitat de ser meacutes grans que el cinqueacute cut-off (percentil

097) igual a 1 Per tant aquest tipus de punts no shan de tenir en compte en el

moment dextreure conclusions De fet aixo ja es sospitava en el grafic anterior pero

en que en aquell hi ha una elevada dispersioacute i per tant Iefecte queda dissimulat

54

Capiacutetol 5 Desenvolupament del projecte

Categoriacutea 5

Model Exponencial Abast =4 Model Esferic Abast = 3

Meseta =006 Meseta = 006

VARIOGRAMA CATEGORIA 5

008

= sect~ 007-shy ESFro E E 006 ro Ol

005

004

003

o 2 4 6 8 10 12

Ihl

Figura 535 Model de semivariograma esfeacuteric i exponencial per la categoria 5

Capiacutetol5 Desenvolupament del projecte

Mirant els cinc grafics veiem que el model que ajusta millor eacutes Iesferic en tots els casos

encara que no hi ha diferencies massa significatives respecte el model exponencial A meacutes

observem una certa simetria pel que fa a la meseta i abast de cada un deis models esferics

de cada categoria Taula 532

Cat 1 Cat2 Cat3 Cat4 Cat5

Meseta 003 022 0265 02 006

Abast 75 4 6 4 3

Taula 532 Meseta i abast per cada categoria

Aquesta simetria sobserva sobretot per les categories 2 3 i 4

Els models corresponents a les categories 1 i 5 no ajusten del tot beacute degut a que soacuten les

categories deis extrems i per tant la gran majoria de mostres si no totes estaran per sobre o

per sota respectivament

Ara ja podem fer Iestimacioacute per krigeat indicador Al programa ik3d li introduim els cinc

models de semivariogrames per tal que ens calculi Iestimacioacute

El resultat que obtenim soacuten cinc columnes de 625 dades on els valors van de O a 1

Concretament ens calcula la probabilitat de que el valor atorgat a cada punt sigui inferior al

daquell cut-off

El que es preteacuten ara eacutes a partir daquest conjunt de probabilitats interpolar la mediana per a

cada un deis punts de la xarxa per tant el que fem eacutes executar el programa postik en Iopcioacute

3 de manera que ens tregui Iestimacioacute de la mediana

A continuacioacute passem a detallar en que consisteix el postik Per tal de poder-ho expressar

millor ens centrare m en un punt concret de la xarxa el (30)

- - - - -

Capiacutetol 5 Desenvolupament del projecte

Els tercer valor de cada una de les 5 columnes obtingudes amb el krigeat indicador eacutes a dir

els valors corresponents a la mostra situada en el node (30) representen la probabilitat de

que el valor de la variable en aquest punt sigui major que cada un deis cut-off

respectivament aixiacute podem afirmar que

P(Xiexcl lt el ) = P(x(3Q) lt 00995) =00000

P(xiexcl lt e2) = P(X(3 Q) lt 03764) =00397

P(xiexcl lt c3) = P(X(30) lt 07314) = 00409

P(xiexcl lt e4) = P(X(30) lt 12705) = 02079

P(xiexcl lt e5) = P(X(3 0) lt 25402) =10000

Si ara grafiquem aquests 5 valors obtenim una estimacioacute de la probabilitat que teacute el punt

estudiat (30) de ser meacutes petit que qualsevol valor eacutes a dir Iestimacioacute de la funcioacute de

probabilitat en aquest punt Com que el que es preteacuten estimar en el nostre estudi eacutes la

mediana mirarem quin valor aproxima per la probabilitat del 05 eacutes a dir

m tal que P(X(30) lt m) = 05

Per aixoacute tracem una liacutenia a Ialcada 05 i daquesta manera obtenim el valor estimat de la

mediana Aquest valor correspon al valor que obtenim amb el POSTIK que eacutes per aquesta

primera observacioacute 06983

10

x v 6 68 05 o

00

Figura 536 Els 5 cut-off aplicats al punt (30)

Capiacutetol 5 Desenvolupament del projecte

Laplicacioacute del POSTIK realitza aquesta estimacioacute per a cada un deis punts obtinguts (625)

i daquesta manera podem obten ir una interpolacioacute de la mediana per cada un deis valors a

estimar

Capiacutetol 5 Desenvolupament del projecte

SEMIVARIOGRAMA DE LA MOSTRA

model exponencial

12

= r 07 -- ca E E ca O)

02

o 2 4 6 8 10 12

Ihl

Figura 541 Semivariograma experimental amb un model exponencial

Aquest model obtingut a ull teacute els seguumlents parametres abast=7

meseta=1 05

Aplicant aquest valors al model general obtenim la formulacioacute per a les nostres dades

46

middotCapiacutetol 5 Desenvolupament del projecte

MODEL ESFERIC La formulacioacute general eacutes

sih a

sih gt a

on a eacutes Iabast i c la meseta

SEMIVARIOGRAMA DE LA MOSTRA

model esferic

12

---shyro E 07 E ro Ol

02

o 2 4 6 8 10 12

Ihl

Figura 54 2 Semivariograma experimental amb un model esfeacuterico

Aquest model Ihem obtingut de la mateixa manera que Ianterior a ull i els seus

parametres que tambeacute aplicarem a la forma general soacuten abast=6 i meseta=1

47

Capiacutetol 5 Desenvolupament del projecte

Finalment pode m representar la superfiacutecie que hem estimat a partir del krigeat

lognormal utilitzant un grafic de superfiacutecie (Figura 54 5)

6

5

Krig Logn 3

2

o

20 eix y

Figura 545 Grafic de superfiacutecie pel krigeat lognormal

50

Capiacutetol 6Comparacioacute deis resultats obtinguts

61 Regressioacute lineal

Per tal de dur a terme la compara cioacute entre els dos meacutetodes destimacioacute i les dades que

simulen la realitat hem expressat els resultats obtinguts graficament mitjancant els

grafics de punts ajustant en cada cas la recta de regressioacute i dibuixant la bisectriu Cal

tenir en compte que per augmentar la claredat i per a simplificar la interpretacioacute deis

resultat hem transformat les dades a una N(O1) encara que el nostre estudi es basi en

un model lognormal

Passem a continuacioacute a analitzar els grafics

En primer lIoc (Figura 611) tenim el grafic de punts entre les dades obtingudes amb el

primer meacutetode destimacioacute el krigeat lognormal i les dades provinents de la simula cioacute

de la realitat

Regression Plot y =3a1E -02jo O6lt40216X

R-Sq = 594

_0 ro

ro EID o middot Ole

~~ -2

-3

- -3 -2 -1

redade regresioacute

Bisectriu

realitat simulada

Figura 611 Recta de regressioacute entre el krigeat lognormal i la simulacioacute de la realitat

Si mirem aquest grafic podem observar que el valor de Iestimacioacute realitzada

sobreestima els valors petits de la simulacioacute i en canvi en els valors grans subestima

El coeficient de correlacioacute es del 594 eacutes a dir que el meacutetode del krigeat lognormal

explica un 594 de la realitat

52

Capiacutetol 6Comparacioacute deis resultats obtinguts

Passem ara a realitzar el gratic entre el segon meto de destimacioacute el krigeat indicador

i la realitat simulada (Figura 612)

0 _O

m~ 0)-- o

~~ -1

-2

-3

Regression Plot y = -23E-02 + 0711 615X

R-Sq 526

bull bull

-3 -2 -1

realitat simulada

recta de regresi oacute

I Bisectriu

Figura 612 Recta de regressioacute entre el krigeat indicador i la simulacioacute de la realitat

Podem observar que el gratic obtingut eacutes molt semblant a Ianterior i que ens trobem

amb el mateix problema de sobreestimacioacute deis valors petits i subestimacioacute deis valors

grans de la simulacioacute

El valor del coeticient de correlacioacute tambeacute eacutes torga semblant 52 6 Aixiacute doncs la

realitat eacutes explicada en un 526 pel krigeat indicador

53

Capiacutetol 6Comparacioacute deis resultats obtinguts

Finalment i per tenir una idea de la relacioacute que hi ha entre els dos meacutetodes emprats en

el projecte realitzarem un uacuteltim grafic comparatiu (Figura 613) que representa els dos

meacutetodes destimacioacute el krigeat lognormal i el krigeat indicador

Regression Plot y = -7 SE-02 + 105401X

R-Sq 796

middot2

middot3

recta de regresi6

bull Bisectriu

middot 4 middot3 middot2 -1

krigeat lognormal

Figura 613 Recta de regressioacute entre el krigeat lognormal i el krigeat indicador

En aquest cas podem observar que la recta de regressioacute coincideix gairebeacute a la

perfeccioacute amb la bisectriu cosa que vol dir que els dos meacutetodes soacuten molt semblants

entre siacute i que per tant eacutes normal que Iaproximacioacute de cada un dells a la realitat sigui

semblant

El valor de la regressioacute eacutes meacutes gran que en els altres dos casos 796 eacutes a dir que

els dos meacutetodes no donen resultats significativament diferents entre si

Podem observar un conjunt de dades que prenen valors especialment elevats en

Iestimacioacute per krigeat indicador Si analitzem aquests punts podem comprovar que

soacuten punts que tenen una probabilitat de ser meacutes grans que el cinqueacute cut-off (percentil

097) igual a 1 Per tant aquest tipus de punts no shan de tenir en compte en el

moment dextreure conclusions De fet aixo ja es sospitava en el grafic anterior pero

en que en aquell hi ha una elevada dispersioacute i per tant Iefecte queda dissimulat

54

Capiacutetol5 Desenvolupament del projecte

Mirant els cinc grafics veiem que el model que ajusta millor eacutes Iesferic en tots els casos

encara que no hi ha diferencies massa significatives respecte el model exponencial A meacutes

observem una certa simetria pel que fa a la meseta i abast de cada un deis models esferics

de cada categoria Taula 532

Cat 1 Cat2 Cat3 Cat4 Cat5

Meseta 003 022 0265 02 006

Abast 75 4 6 4 3

Taula 532 Meseta i abast per cada categoria

Aquesta simetria sobserva sobretot per les categories 2 3 i 4

Els models corresponents a les categories 1 i 5 no ajusten del tot beacute degut a que soacuten les

categories deis extrems i per tant la gran majoria de mostres si no totes estaran per sobre o

per sota respectivament

Ara ja podem fer Iestimacioacute per krigeat indicador Al programa ik3d li introduim els cinc

models de semivariogrames per tal que ens calculi Iestimacioacute

El resultat que obtenim soacuten cinc columnes de 625 dades on els valors van de O a 1

Concretament ens calcula la probabilitat de que el valor atorgat a cada punt sigui inferior al

daquell cut-off

El que es preteacuten ara eacutes a partir daquest conjunt de probabilitats interpolar la mediana per a

cada un deis punts de la xarxa per tant el que fem eacutes executar el programa postik en Iopcioacute

3 de manera que ens tregui Iestimacioacute de la mediana

A continuacioacute passem a detallar en que consisteix el postik Per tal de poder-ho expressar

millor ens centrare m en un punt concret de la xarxa el (30)

- - - - -

Capiacutetol 5 Desenvolupament del projecte

Els tercer valor de cada una de les 5 columnes obtingudes amb el krigeat indicador eacutes a dir

els valors corresponents a la mostra situada en el node (30) representen la probabilitat de

que el valor de la variable en aquest punt sigui major que cada un deis cut-off

respectivament aixiacute podem afirmar que

P(Xiexcl lt el ) = P(x(3Q) lt 00995) =00000

P(xiexcl lt e2) = P(X(3 Q) lt 03764) =00397

P(xiexcl lt c3) = P(X(30) lt 07314) = 00409

P(xiexcl lt e4) = P(X(30) lt 12705) = 02079

P(xiexcl lt e5) = P(X(3 0) lt 25402) =10000

Si ara grafiquem aquests 5 valors obtenim una estimacioacute de la probabilitat que teacute el punt

estudiat (30) de ser meacutes petit que qualsevol valor eacutes a dir Iestimacioacute de la funcioacute de

probabilitat en aquest punt Com que el que es preteacuten estimar en el nostre estudi eacutes la

mediana mirarem quin valor aproxima per la probabilitat del 05 eacutes a dir

m tal que P(X(30) lt m) = 05

Per aixoacute tracem una liacutenia a Ialcada 05 i daquesta manera obtenim el valor estimat de la

mediana Aquest valor correspon al valor que obtenim amb el POSTIK que eacutes per aquesta

primera observacioacute 06983

10

x v 6 68 05 o

00

Figura 536 Els 5 cut-off aplicats al punt (30)

Capiacutetol 5 Desenvolupament del projecte

Laplicacioacute del POSTIK realitza aquesta estimacioacute per a cada un deis punts obtinguts (625)

i daquesta manera podem obten ir una interpolacioacute de la mediana per cada un deis valors a

estimar

Capiacutetol 5 Desenvolupament del projecte

SEMIVARIOGRAMA DE LA MOSTRA

model exponencial

12

= r 07 -- ca E E ca O)

02

o 2 4 6 8 10 12

Ihl

Figura 541 Semivariograma experimental amb un model exponencial

Aquest model obtingut a ull teacute els seguumlents parametres abast=7

meseta=1 05

Aplicant aquest valors al model general obtenim la formulacioacute per a les nostres dades

46

middotCapiacutetol 5 Desenvolupament del projecte

MODEL ESFERIC La formulacioacute general eacutes

sih a

sih gt a

on a eacutes Iabast i c la meseta

SEMIVARIOGRAMA DE LA MOSTRA

model esferic

12

---shyro E 07 E ro Ol

02

o 2 4 6 8 10 12

Ihl

Figura 54 2 Semivariograma experimental amb un model esfeacuterico

Aquest model Ihem obtingut de la mateixa manera que Ianterior a ull i els seus

parametres que tambeacute aplicarem a la forma general soacuten abast=6 i meseta=1

47

Capiacutetol 5 Desenvolupament del projecte

Finalment pode m representar la superfiacutecie que hem estimat a partir del krigeat

lognormal utilitzant un grafic de superfiacutecie (Figura 54 5)

6

5

Krig Logn 3

2

o

20 eix y

Figura 545 Grafic de superfiacutecie pel krigeat lognormal

50

Capiacutetol 6Comparacioacute deis resultats obtinguts

61 Regressioacute lineal

Per tal de dur a terme la compara cioacute entre els dos meacutetodes destimacioacute i les dades que

simulen la realitat hem expressat els resultats obtinguts graficament mitjancant els

grafics de punts ajustant en cada cas la recta de regressioacute i dibuixant la bisectriu Cal

tenir en compte que per augmentar la claredat i per a simplificar la interpretacioacute deis

resultat hem transformat les dades a una N(O1) encara que el nostre estudi es basi en

un model lognormal

Passem a continuacioacute a analitzar els grafics

En primer lIoc (Figura 611) tenim el grafic de punts entre les dades obtingudes amb el

primer meacutetode destimacioacute el krigeat lognormal i les dades provinents de la simula cioacute

de la realitat

Regression Plot y =3a1E -02jo O6lt40216X

R-Sq = 594

_0 ro

ro EID o middot Ole

~~ -2

-3

- -3 -2 -1

redade regresioacute

Bisectriu

realitat simulada

Figura 611 Recta de regressioacute entre el krigeat lognormal i la simulacioacute de la realitat

Si mirem aquest grafic podem observar que el valor de Iestimacioacute realitzada

sobreestima els valors petits de la simulacioacute i en canvi en els valors grans subestima

El coeficient de correlacioacute es del 594 eacutes a dir que el meacutetode del krigeat lognormal

explica un 594 de la realitat

52

Capiacutetol 6Comparacioacute deis resultats obtinguts

Passem ara a realitzar el gratic entre el segon meto de destimacioacute el krigeat indicador

i la realitat simulada (Figura 612)

0 _O

m~ 0)-- o

~~ -1

-2

-3

Regression Plot y = -23E-02 + 0711 615X

R-Sq 526

bull bull

-3 -2 -1

realitat simulada

recta de regresi oacute

I Bisectriu

Figura 612 Recta de regressioacute entre el krigeat indicador i la simulacioacute de la realitat

Podem observar que el gratic obtingut eacutes molt semblant a Ianterior i que ens trobem

amb el mateix problema de sobreestimacioacute deis valors petits i subestimacioacute deis valors

grans de la simulacioacute

El valor del coeticient de correlacioacute tambeacute eacutes torga semblant 52 6 Aixiacute doncs la

realitat eacutes explicada en un 526 pel krigeat indicador

53

Capiacutetol 6Comparacioacute deis resultats obtinguts

Finalment i per tenir una idea de la relacioacute que hi ha entre els dos meacutetodes emprats en

el projecte realitzarem un uacuteltim grafic comparatiu (Figura 613) que representa els dos

meacutetodes destimacioacute el krigeat lognormal i el krigeat indicador

Regression Plot y = -7 SE-02 + 105401X

R-Sq 796

middot2

middot3

recta de regresi6

bull Bisectriu

middot 4 middot3 middot2 -1

krigeat lognormal

Figura 613 Recta de regressioacute entre el krigeat lognormal i el krigeat indicador

En aquest cas podem observar que la recta de regressioacute coincideix gairebeacute a la

perfeccioacute amb la bisectriu cosa que vol dir que els dos meacutetodes soacuten molt semblants

entre siacute i que per tant eacutes normal que Iaproximacioacute de cada un dells a la realitat sigui

semblant

El valor de la regressioacute eacutes meacutes gran que en els altres dos casos 796 eacutes a dir que

els dos meacutetodes no donen resultats significativament diferents entre si

Podem observar un conjunt de dades que prenen valors especialment elevats en

Iestimacioacute per krigeat indicador Si analitzem aquests punts podem comprovar que

soacuten punts que tenen una probabilitat de ser meacutes grans que el cinqueacute cut-off (percentil

097) igual a 1 Per tant aquest tipus de punts no shan de tenir en compte en el

moment dextreure conclusions De fet aixo ja es sospitava en el grafic anterior pero

en que en aquell hi ha una elevada dispersioacute i per tant Iefecte queda dissimulat

54

- - - - -

Capiacutetol 5 Desenvolupament del projecte

Els tercer valor de cada una de les 5 columnes obtingudes amb el krigeat indicador eacutes a dir

els valors corresponents a la mostra situada en el node (30) representen la probabilitat de

que el valor de la variable en aquest punt sigui major que cada un deis cut-off

respectivament aixiacute podem afirmar que

P(Xiexcl lt el ) = P(x(3Q) lt 00995) =00000

P(xiexcl lt e2) = P(X(3 Q) lt 03764) =00397

P(xiexcl lt c3) = P(X(30) lt 07314) = 00409

P(xiexcl lt e4) = P(X(30) lt 12705) = 02079

P(xiexcl lt e5) = P(X(3 0) lt 25402) =10000

Si ara grafiquem aquests 5 valors obtenim una estimacioacute de la probabilitat que teacute el punt

estudiat (30) de ser meacutes petit que qualsevol valor eacutes a dir Iestimacioacute de la funcioacute de

probabilitat en aquest punt Com que el que es preteacuten estimar en el nostre estudi eacutes la

mediana mirarem quin valor aproxima per la probabilitat del 05 eacutes a dir

m tal que P(X(30) lt m) = 05

Per aixoacute tracem una liacutenia a Ialcada 05 i daquesta manera obtenim el valor estimat de la

mediana Aquest valor correspon al valor que obtenim amb el POSTIK que eacutes per aquesta

primera observacioacute 06983

10

x v 6 68 05 o

00

Figura 536 Els 5 cut-off aplicats al punt (30)

Capiacutetol 5 Desenvolupament del projecte

Laplicacioacute del POSTIK realitza aquesta estimacioacute per a cada un deis punts obtinguts (625)

i daquesta manera podem obten ir una interpolacioacute de la mediana per cada un deis valors a

estimar

Capiacutetol 5 Desenvolupament del projecte

SEMIVARIOGRAMA DE LA MOSTRA

model exponencial

12

= r 07 -- ca E E ca O)

02

o 2 4 6 8 10 12

Ihl

Figura 541 Semivariograma experimental amb un model exponencial

Aquest model obtingut a ull teacute els seguumlents parametres abast=7

meseta=1 05

Aplicant aquest valors al model general obtenim la formulacioacute per a les nostres dades

46

middotCapiacutetol 5 Desenvolupament del projecte

MODEL ESFERIC La formulacioacute general eacutes

sih a

sih gt a

on a eacutes Iabast i c la meseta

SEMIVARIOGRAMA DE LA MOSTRA

model esferic

12

---shyro E 07 E ro Ol

02

o 2 4 6 8 10 12

Ihl

Figura 54 2 Semivariograma experimental amb un model esfeacuterico

Aquest model Ihem obtingut de la mateixa manera que Ianterior a ull i els seus

parametres que tambeacute aplicarem a la forma general soacuten abast=6 i meseta=1

47

Capiacutetol 5 Desenvolupament del projecte

Finalment pode m representar la superfiacutecie que hem estimat a partir del krigeat

lognormal utilitzant un grafic de superfiacutecie (Figura 54 5)

6

5

Krig Logn 3

2

o

20 eix y

Figura 545 Grafic de superfiacutecie pel krigeat lognormal

50

Capiacutetol 6Comparacioacute deis resultats obtinguts

61 Regressioacute lineal

Per tal de dur a terme la compara cioacute entre els dos meacutetodes destimacioacute i les dades que

simulen la realitat hem expressat els resultats obtinguts graficament mitjancant els

grafics de punts ajustant en cada cas la recta de regressioacute i dibuixant la bisectriu Cal

tenir en compte que per augmentar la claredat i per a simplificar la interpretacioacute deis

resultat hem transformat les dades a una N(O1) encara que el nostre estudi es basi en

un model lognormal

Passem a continuacioacute a analitzar els grafics

En primer lIoc (Figura 611) tenim el grafic de punts entre les dades obtingudes amb el

primer meacutetode destimacioacute el krigeat lognormal i les dades provinents de la simula cioacute

de la realitat

Regression Plot y =3a1E -02jo O6lt40216X

R-Sq = 594

_0 ro

ro EID o middot Ole

~~ -2

-3

- -3 -2 -1

redade regresioacute

Bisectriu

realitat simulada

Figura 611 Recta de regressioacute entre el krigeat lognormal i la simulacioacute de la realitat

Si mirem aquest grafic podem observar que el valor de Iestimacioacute realitzada

sobreestima els valors petits de la simulacioacute i en canvi en els valors grans subestima

El coeficient de correlacioacute es del 594 eacutes a dir que el meacutetode del krigeat lognormal

explica un 594 de la realitat

52

Capiacutetol 6Comparacioacute deis resultats obtinguts

Passem ara a realitzar el gratic entre el segon meto de destimacioacute el krigeat indicador

i la realitat simulada (Figura 612)

0 _O

m~ 0)-- o

~~ -1

-2

-3

Regression Plot y = -23E-02 + 0711 615X

R-Sq 526

bull bull

-3 -2 -1

realitat simulada

recta de regresi oacute

I Bisectriu

Figura 612 Recta de regressioacute entre el krigeat indicador i la simulacioacute de la realitat

Podem observar que el gratic obtingut eacutes molt semblant a Ianterior i que ens trobem

amb el mateix problema de sobreestimacioacute deis valors petits i subestimacioacute deis valors

grans de la simulacioacute

El valor del coeticient de correlacioacute tambeacute eacutes torga semblant 52 6 Aixiacute doncs la

realitat eacutes explicada en un 526 pel krigeat indicador

53

Capiacutetol 6Comparacioacute deis resultats obtinguts

Finalment i per tenir una idea de la relacioacute que hi ha entre els dos meacutetodes emprats en

el projecte realitzarem un uacuteltim grafic comparatiu (Figura 613) que representa els dos

meacutetodes destimacioacute el krigeat lognormal i el krigeat indicador

Regression Plot y = -7 SE-02 + 105401X

R-Sq 796

middot2

middot3

recta de regresi6

bull Bisectriu

middot 4 middot3 middot2 -1

krigeat lognormal

Figura 613 Recta de regressioacute entre el krigeat lognormal i el krigeat indicador

En aquest cas podem observar que la recta de regressioacute coincideix gairebeacute a la

perfeccioacute amb la bisectriu cosa que vol dir que els dos meacutetodes soacuten molt semblants

entre siacute i que per tant eacutes normal que Iaproximacioacute de cada un dells a la realitat sigui

semblant

El valor de la regressioacute eacutes meacutes gran que en els altres dos casos 796 eacutes a dir que

els dos meacutetodes no donen resultats significativament diferents entre si

Podem observar un conjunt de dades que prenen valors especialment elevats en

Iestimacioacute per krigeat indicador Si analitzem aquests punts podem comprovar que

soacuten punts que tenen una probabilitat de ser meacutes grans que el cinqueacute cut-off (percentil

097) igual a 1 Per tant aquest tipus de punts no shan de tenir en compte en el

moment dextreure conclusions De fet aixo ja es sospitava en el grafic anterior pero

en que en aquell hi ha una elevada dispersioacute i per tant Iefecte queda dissimulat

54

Capiacutetol 5 Desenvolupament del projecte

Laplicacioacute del POSTIK realitza aquesta estimacioacute per a cada un deis punts obtinguts (625)

i daquesta manera podem obten ir una interpolacioacute de la mediana per cada un deis valors a

estimar

Capiacutetol 5 Desenvolupament del projecte

SEMIVARIOGRAMA DE LA MOSTRA

model exponencial

12

= r 07 -- ca E E ca O)

02

o 2 4 6 8 10 12

Ihl

Figura 541 Semivariograma experimental amb un model exponencial

Aquest model obtingut a ull teacute els seguumlents parametres abast=7

meseta=1 05

Aplicant aquest valors al model general obtenim la formulacioacute per a les nostres dades

46

middotCapiacutetol 5 Desenvolupament del projecte

MODEL ESFERIC La formulacioacute general eacutes

sih a

sih gt a

on a eacutes Iabast i c la meseta

SEMIVARIOGRAMA DE LA MOSTRA

model esferic

12

---shyro E 07 E ro Ol

02

o 2 4 6 8 10 12

Ihl

Figura 54 2 Semivariograma experimental amb un model esfeacuterico

Aquest model Ihem obtingut de la mateixa manera que Ianterior a ull i els seus

parametres que tambeacute aplicarem a la forma general soacuten abast=6 i meseta=1

47

Capiacutetol 5 Desenvolupament del projecte

Finalment pode m representar la superfiacutecie que hem estimat a partir del krigeat

lognormal utilitzant un grafic de superfiacutecie (Figura 54 5)

6

5

Krig Logn 3

2

o

20 eix y

Figura 545 Grafic de superfiacutecie pel krigeat lognormal

50

Capiacutetol 6Comparacioacute deis resultats obtinguts

61 Regressioacute lineal

Per tal de dur a terme la compara cioacute entre els dos meacutetodes destimacioacute i les dades que

simulen la realitat hem expressat els resultats obtinguts graficament mitjancant els

grafics de punts ajustant en cada cas la recta de regressioacute i dibuixant la bisectriu Cal

tenir en compte que per augmentar la claredat i per a simplificar la interpretacioacute deis

resultat hem transformat les dades a una N(O1) encara que el nostre estudi es basi en

un model lognormal

Passem a continuacioacute a analitzar els grafics

En primer lIoc (Figura 611) tenim el grafic de punts entre les dades obtingudes amb el

primer meacutetode destimacioacute el krigeat lognormal i les dades provinents de la simula cioacute

de la realitat

Regression Plot y =3a1E -02jo O6lt40216X

R-Sq = 594

_0 ro

ro EID o middot Ole

~~ -2

-3

- -3 -2 -1

redade regresioacute

Bisectriu

realitat simulada

Figura 611 Recta de regressioacute entre el krigeat lognormal i la simulacioacute de la realitat

Si mirem aquest grafic podem observar que el valor de Iestimacioacute realitzada

sobreestima els valors petits de la simulacioacute i en canvi en els valors grans subestima

El coeficient de correlacioacute es del 594 eacutes a dir que el meacutetode del krigeat lognormal

explica un 594 de la realitat

52

Capiacutetol 6Comparacioacute deis resultats obtinguts

Passem ara a realitzar el gratic entre el segon meto de destimacioacute el krigeat indicador

i la realitat simulada (Figura 612)

0 _O

m~ 0)-- o

~~ -1

-2

-3

Regression Plot y = -23E-02 + 0711 615X

R-Sq 526

bull bull

-3 -2 -1

realitat simulada

recta de regresi oacute

I Bisectriu

Figura 612 Recta de regressioacute entre el krigeat indicador i la simulacioacute de la realitat

Podem observar que el gratic obtingut eacutes molt semblant a Ianterior i que ens trobem

amb el mateix problema de sobreestimacioacute deis valors petits i subestimacioacute deis valors

grans de la simulacioacute

El valor del coeticient de correlacioacute tambeacute eacutes torga semblant 52 6 Aixiacute doncs la

realitat eacutes explicada en un 526 pel krigeat indicador

53

Capiacutetol 6Comparacioacute deis resultats obtinguts

Finalment i per tenir una idea de la relacioacute que hi ha entre els dos meacutetodes emprats en

el projecte realitzarem un uacuteltim grafic comparatiu (Figura 613) que representa els dos

meacutetodes destimacioacute el krigeat lognormal i el krigeat indicador

Regression Plot y = -7 SE-02 + 105401X

R-Sq 796

middot2

middot3

recta de regresi6

bull Bisectriu

middot 4 middot3 middot2 -1

krigeat lognormal

Figura 613 Recta de regressioacute entre el krigeat lognormal i el krigeat indicador

En aquest cas podem observar que la recta de regressioacute coincideix gairebeacute a la

perfeccioacute amb la bisectriu cosa que vol dir que els dos meacutetodes soacuten molt semblants

entre siacute i que per tant eacutes normal que Iaproximacioacute de cada un dells a la realitat sigui

semblant

El valor de la regressioacute eacutes meacutes gran que en els altres dos casos 796 eacutes a dir que

els dos meacutetodes no donen resultats significativament diferents entre si

Podem observar un conjunt de dades que prenen valors especialment elevats en

Iestimacioacute per krigeat indicador Si analitzem aquests punts podem comprovar que

soacuten punts que tenen una probabilitat de ser meacutes grans que el cinqueacute cut-off (percentil

097) igual a 1 Per tant aquest tipus de punts no shan de tenir en compte en el

moment dextreure conclusions De fet aixo ja es sospitava en el grafic anterior pero

en que en aquell hi ha una elevada dispersioacute i per tant Iefecte queda dissimulat

54

Capiacutetol 5 Desenvolupament del projecte

SEMIVARIOGRAMA DE LA MOSTRA

model exponencial

12

= r 07 -- ca E E ca O)

02

o 2 4 6 8 10 12

Ihl

Figura 541 Semivariograma experimental amb un model exponencial

Aquest model obtingut a ull teacute els seguumlents parametres abast=7

meseta=1 05

Aplicant aquest valors al model general obtenim la formulacioacute per a les nostres dades

46

middotCapiacutetol 5 Desenvolupament del projecte

MODEL ESFERIC La formulacioacute general eacutes

sih a

sih gt a

on a eacutes Iabast i c la meseta

SEMIVARIOGRAMA DE LA MOSTRA

model esferic

12

---shyro E 07 E ro Ol

02

o 2 4 6 8 10 12

Ihl

Figura 54 2 Semivariograma experimental amb un model esfeacuterico

Aquest model Ihem obtingut de la mateixa manera que Ianterior a ull i els seus

parametres que tambeacute aplicarem a la forma general soacuten abast=6 i meseta=1

47

Capiacutetol 5 Desenvolupament del projecte

Finalment pode m representar la superfiacutecie que hem estimat a partir del krigeat

lognormal utilitzant un grafic de superfiacutecie (Figura 54 5)

6

5

Krig Logn 3

2

o

20 eix y

Figura 545 Grafic de superfiacutecie pel krigeat lognormal

50

Capiacutetol 6Comparacioacute deis resultats obtinguts

61 Regressioacute lineal

Per tal de dur a terme la compara cioacute entre els dos meacutetodes destimacioacute i les dades que

simulen la realitat hem expressat els resultats obtinguts graficament mitjancant els

grafics de punts ajustant en cada cas la recta de regressioacute i dibuixant la bisectriu Cal

tenir en compte que per augmentar la claredat i per a simplificar la interpretacioacute deis

resultat hem transformat les dades a una N(O1) encara que el nostre estudi es basi en

un model lognormal

Passem a continuacioacute a analitzar els grafics

En primer lIoc (Figura 611) tenim el grafic de punts entre les dades obtingudes amb el

primer meacutetode destimacioacute el krigeat lognormal i les dades provinents de la simula cioacute

de la realitat

Regression Plot y =3a1E -02jo O6lt40216X

R-Sq = 594

_0 ro

ro EID o middot Ole

~~ -2

-3

- -3 -2 -1

redade regresioacute

Bisectriu

realitat simulada

Figura 611 Recta de regressioacute entre el krigeat lognormal i la simulacioacute de la realitat

Si mirem aquest grafic podem observar que el valor de Iestimacioacute realitzada

sobreestima els valors petits de la simulacioacute i en canvi en els valors grans subestima

El coeficient de correlacioacute es del 594 eacutes a dir que el meacutetode del krigeat lognormal

explica un 594 de la realitat

52

Capiacutetol 6Comparacioacute deis resultats obtinguts

Passem ara a realitzar el gratic entre el segon meto de destimacioacute el krigeat indicador

i la realitat simulada (Figura 612)

0 _O

m~ 0)-- o

~~ -1

-2

-3

Regression Plot y = -23E-02 + 0711 615X

R-Sq 526

bull bull

-3 -2 -1

realitat simulada

recta de regresi oacute

I Bisectriu

Figura 612 Recta de regressioacute entre el krigeat indicador i la simulacioacute de la realitat

Podem observar que el gratic obtingut eacutes molt semblant a Ianterior i que ens trobem

amb el mateix problema de sobreestimacioacute deis valors petits i subestimacioacute deis valors

grans de la simulacioacute

El valor del coeticient de correlacioacute tambeacute eacutes torga semblant 52 6 Aixiacute doncs la

realitat eacutes explicada en un 526 pel krigeat indicador

53

Capiacutetol 6Comparacioacute deis resultats obtinguts

Finalment i per tenir una idea de la relacioacute que hi ha entre els dos meacutetodes emprats en

el projecte realitzarem un uacuteltim grafic comparatiu (Figura 613) que representa els dos

meacutetodes destimacioacute el krigeat lognormal i el krigeat indicador

Regression Plot y = -7 SE-02 + 105401X

R-Sq 796

middot2

middot3

recta de regresi6

bull Bisectriu

middot 4 middot3 middot2 -1

krigeat lognormal

Figura 613 Recta de regressioacute entre el krigeat lognormal i el krigeat indicador

En aquest cas podem observar que la recta de regressioacute coincideix gairebeacute a la

perfeccioacute amb la bisectriu cosa que vol dir que els dos meacutetodes soacuten molt semblants

entre siacute i que per tant eacutes normal que Iaproximacioacute de cada un dells a la realitat sigui

semblant

El valor de la regressioacute eacutes meacutes gran que en els altres dos casos 796 eacutes a dir que

els dos meacutetodes no donen resultats significativament diferents entre si

Podem observar un conjunt de dades que prenen valors especialment elevats en

Iestimacioacute per krigeat indicador Si analitzem aquests punts podem comprovar que

soacuten punts que tenen una probabilitat de ser meacutes grans que el cinqueacute cut-off (percentil

097) igual a 1 Per tant aquest tipus de punts no shan de tenir en compte en el

moment dextreure conclusions De fet aixo ja es sospitava en el grafic anterior pero

en que en aquell hi ha una elevada dispersioacute i per tant Iefecte queda dissimulat

54

middotCapiacutetol 5 Desenvolupament del projecte

MODEL ESFERIC La formulacioacute general eacutes

sih a

sih gt a

on a eacutes Iabast i c la meseta

SEMIVARIOGRAMA DE LA MOSTRA

model esferic

12

---shyro E 07 E ro Ol

02

o 2 4 6 8 10 12

Ihl

Figura 54 2 Semivariograma experimental amb un model esfeacuterico

Aquest model Ihem obtingut de la mateixa manera que Ianterior a ull i els seus

parametres que tambeacute aplicarem a la forma general soacuten abast=6 i meseta=1

47

Capiacutetol 5 Desenvolupament del projecte

Finalment pode m representar la superfiacutecie que hem estimat a partir del krigeat

lognormal utilitzant un grafic de superfiacutecie (Figura 54 5)

6

5

Krig Logn 3

2

o

20 eix y

Figura 545 Grafic de superfiacutecie pel krigeat lognormal

50

Capiacutetol 6Comparacioacute deis resultats obtinguts

61 Regressioacute lineal

Per tal de dur a terme la compara cioacute entre els dos meacutetodes destimacioacute i les dades que

simulen la realitat hem expressat els resultats obtinguts graficament mitjancant els

grafics de punts ajustant en cada cas la recta de regressioacute i dibuixant la bisectriu Cal

tenir en compte que per augmentar la claredat i per a simplificar la interpretacioacute deis

resultat hem transformat les dades a una N(O1) encara que el nostre estudi es basi en

un model lognormal

Passem a continuacioacute a analitzar els grafics

En primer lIoc (Figura 611) tenim el grafic de punts entre les dades obtingudes amb el

primer meacutetode destimacioacute el krigeat lognormal i les dades provinents de la simula cioacute

de la realitat

Regression Plot y =3a1E -02jo O6lt40216X

R-Sq = 594

_0 ro

ro EID o middot Ole

~~ -2

-3

- -3 -2 -1

redade regresioacute

Bisectriu

realitat simulada

Figura 611 Recta de regressioacute entre el krigeat lognormal i la simulacioacute de la realitat

Si mirem aquest grafic podem observar que el valor de Iestimacioacute realitzada

sobreestima els valors petits de la simulacioacute i en canvi en els valors grans subestima

El coeficient de correlacioacute es del 594 eacutes a dir que el meacutetode del krigeat lognormal

explica un 594 de la realitat

52

Capiacutetol 6Comparacioacute deis resultats obtinguts

Passem ara a realitzar el gratic entre el segon meto de destimacioacute el krigeat indicador

i la realitat simulada (Figura 612)

0 _O

m~ 0)-- o

~~ -1

-2

-3

Regression Plot y = -23E-02 + 0711 615X

R-Sq 526

bull bull

-3 -2 -1

realitat simulada

recta de regresi oacute

I Bisectriu

Figura 612 Recta de regressioacute entre el krigeat indicador i la simulacioacute de la realitat

Podem observar que el gratic obtingut eacutes molt semblant a Ianterior i que ens trobem

amb el mateix problema de sobreestimacioacute deis valors petits i subestimacioacute deis valors

grans de la simulacioacute

El valor del coeticient de correlacioacute tambeacute eacutes torga semblant 52 6 Aixiacute doncs la

realitat eacutes explicada en un 526 pel krigeat indicador

53

Capiacutetol 6Comparacioacute deis resultats obtinguts

Finalment i per tenir una idea de la relacioacute que hi ha entre els dos meacutetodes emprats en

el projecte realitzarem un uacuteltim grafic comparatiu (Figura 613) que representa els dos

meacutetodes destimacioacute el krigeat lognormal i el krigeat indicador

Regression Plot y = -7 SE-02 + 105401X

R-Sq 796

middot2

middot3

recta de regresi6

bull Bisectriu

middot 4 middot3 middot2 -1

krigeat lognormal

Figura 613 Recta de regressioacute entre el krigeat lognormal i el krigeat indicador

En aquest cas podem observar que la recta de regressioacute coincideix gairebeacute a la

perfeccioacute amb la bisectriu cosa que vol dir que els dos meacutetodes soacuten molt semblants

entre siacute i que per tant eacutes normal que Iaproximacioacute de cada un dells a la realitat sigui

semblant

El valor de la regressioacute eacutes meacutes gran que en els altres dos casos 796 eacutes a dir que

els dos meacutetodes no donen resultats significativament diferents entre si

Podem observar un conjunt de dades que prenen valors especialment elevats en

Iestimacioacute per krigeat indicador Si analitzem aquests punts podem comprovar que

soacuten punts que tenen una probabilitat de ser meacutes grans que el cinqueacute cut-off (percentil

097) igual a 1 Per tant aquest tipus de punts no shan de tenir en compte en el

moment dextreure conclusions De fet aixo ja es sospitava en el grafic anterior pero

en que en aquell hi ha una elevada dispersioacute i per tant Iefecte queda dissimulat

54

Capiacutetol 5 Desenvolupament del projecte

Finalment pode m representar la superfiacutecie que hem estimat a partir del krigeat

lognormal utilitzant un grafic de superfiacutecie (Figura 54 5)

6

5

Krig Logn 3

2

o

20 eix y

Figura 545 Grafic de superfiacutecie pel krigeat lognormal

50

Capiacutetol 6Comparacioacute deis resultats obtinguts

61 Regressioacute lineal

Per tal de dur a terme la compara cioacute entre els dos meacutetodes destimacioacute i les dades que

simulen la realitat hem expressat els resultats obtinguts graficament mitjancant els

grafics de punts ajustant en cada cas la recta de regressioacute i dibuixant la bisectriu Cal

tenir en compte que per augmentar la claredat i per a simplificar la interpretacioacute deis

resultat hem transformat les dades a una N(O1) encara que el nostre estudi es basi en

un model lognormal

Passem a continuacioacute a analitzar els grafics

En primer lIoc (Figura 611) tenim el grafic de punts entre les dades obtingudes amb el

primer meacutetode destimacioacute el krigeat lognormal i les dades provinents de la simula cioacute

de la realitat

Regression Plot y =3a1E -02jo O6lt40216X

R-Sq = 594

_0 ro

ro EID o middot Ole

~~ -2

-3

- -3 -2 -1

redade regresioacute

Bisectriu

realitat simulada

Figura 611 Recta de regressioacute entre el krigeat lognormal i la simulacioacute de la realitat

Si mirem aquest grafic podem observar que el valor de Iestimacioacute realitzada

sobreestima els valors petits de la simulacioacute i en canvi en els valors grans subestima

El coeficient de correlacioacute es del 594 eacutes a dir que el meacutetode del krigeat lognormal

explica un 594 de la realitat

52

Capiacutetol 6Comparacioacute deis resultats obtinguts

Passem ara a realitzar el gratic entre el segon meto de destimacioacute el krigeat indicador

i la realitat simulada (Figura 612)

0 _O

m~ 0)-- o

~~ -1

-2

-3

Regression Plot y = -23E-02 + 0711 615X

R-Sq 526

bull bull

-3 -2 -1

realitat simulada

recta de regresi oacute

I Bisectriu

Figura 612 Recta de regressioacute entre el krigeat indicador i la simulacioacute de la realitat

Podem observar que el gratic obtingut eacutes molt semblant a Ianterior i que ens trobem

amb el mateix problema de sobreestimacioacute deis valors petits i subestimacioacute deis valors

grans de la simulacioacute

El valor del coeticient de correlacioacute tambeacute eacutes torga semblant 52 6 Aixiacute doncs la

realitat eacutes explicada en un 526 pel krigeat indicador

53

Capiacutetol 6Comparacioacute deis resultats obtinguts

Finalment i per tenir una idea de la relacioacute que hi ha entre els dos meacutetodes emprats en

el projecte realitzarem un uacuteltim grafic comparatiu (Figura 613) que representa els dos

meacutetodes destimacioacute el krigeat lognormal i el krigeat indicador

Regression Plot y = -7 SE-02 + 105401X

R-Sq 796

middot2

middot3

recta de regresi6

bull Bisectriu

middot 4 middot3 middot2 -1

krigeat lognormal

Figura 613 Recta de regressioacute entre el krigeat lognormal i el krigeat indicador

En aquest cas podem observar que la recta de regressioacute coincideix gairebeacute a la

perfeccioacute amb la bisectriu cosa que vol dir que els dos meacutetodes soacuten molt semblants

entre siacute i que per tant eacutes normal que Iaproximacioacute de cada un dells a la realitat sigui

semblant

El valor de la regressioacute eacutes meacutes gran que en els altres dos casos 796 eacutes a dir que

els dos meacutetodes no donen resultats significativament diferents entre si

Podem observar un conjunt de dades que prenen valors especialment elevats en

Iestimacioacute per krigeat indicador Si analitzem aquests punts podem comprovar que

soacuten punts que tenen una probabilitat de ser meacutes grans que el cinqueacute cut-off (percentil

097) igual a 1 Per tant aquest tipus de punts no shan de tenir en compte en el

moment dextreure conclusions De fet aixo ja es sospitava en el grafic anterior pero

en que en aquell hi ha una elevada dispersioacute i per tant Iefecte queda dissimulat

54

Capiacutetol 6Comparacioacute deis resultats obtinguts

61 Regressioacute lineal

Per tal de dur a terme la compara cioacute entre els dos meacutetodes destimacioacute i les dades que

simulen la realitat hem expressat els resultats obtinguts graficament mitjancant els

grafics de punts ajustant en cada cas la recta de regressioacute i dibuixant la bisectriu Cal

tenir en compte que per augmentar la claredat i per a simplificar la interpretacioacute deis

resultat hem transformat les dades a una N(O1) encara que el nostre estudi es basi en

un model lognormal

Passem a continuacioacute a analitzar els grafics

En primer lIoc (Figura 611) tenim el grafic de punts entre les dades obtingudes amb el

primer meacutetode destimacioacute el krigeat lognormal i les dades provinents de la simula cioacute

de la realitat

Regression Plot y =3a1E -02jo O6lt40216X

R-Sq = 594

_0 ro

ro EID o middot Ole

~~ -2

-3

- -3 -2 -1

redade regresioacute

Bisectriu

realitat simulada

Figura 611 Recta de regressioacute entre el krigeat lognormal i la simulacioacute de la realitat

Si mirem aquest grafic podem observar que el valor de Iestimacioacute realitzada

sobreestima els valors petits de la simulacioacute i en canvi en els valors grans subestima

El coeficient de correlacioacute es del 594 eacutes a dir que el meacutetode del krigeat lognormal

explica un 594 de la realitat

52

Capiacutetol 6Comparacioacute deis resultats obtinguts

Passem ara a realitzar el gratic entre el segon meto de destimacioacute el krigeat indicador

i la realitat simulada (Figura 612)

0 _O

m~ 0)-- o

~~ -1

-2

-3

Regression Plot y = -23E-02 + 0711 615X

R-Sq 526

bull bull

-3 -2 -1

realitat simulada

recta de regresi oacute

I Bisectriu

Figura 612 Recta de regressioacute entre el krigeat indicador i la simulacioacute de la realitat

Podem observar que el gratic obtingut eacutes molt semblant a Ianterior i que ens trobem

amb el mateix problema de sobreestimacioacute deis valors petits i subestimacioacute deis valors

grans de la simulacioacute

El valor del coeticient de correlacioacute tambeacute eacutes torga semblant 52 6 Aixiacute doncs la

realitat eacutes explicada en un 526 pel krigeat indicador

53

Capiacutetol 6Comparacioacute deis resultats obtinguts

Finalment i per tenir una idea de la relacioacute que hi ha entre els dos meacutetodes emprats en

el projecte realitzarem un uacuteltim grafic comparatiu (Figura 613) que representa els dos

meacutetodes destimacioacute el krigeat lognormal i el krigeat indicador

Regression Plot y = -7 SE-02 + 105401X

R-Sq 796

middot2

middot3

recta de regresi6

bull Bisectriu

middot 4 middot3 middot2 -1

krigeat lognormal

Figura 613 Recta de regressioacute entre el krigeat lognormal i el krigeat indicador

En aquest cas podem observar que la recta de regressioacute coincideix gairebeacute a la

perfeccioacute amb la bisectriu cosa que vol dir que els dos meacutetodes soacuten molt semblants

entre siacute i que per tant eacutes normal que Iaproximacioacute de cada un dells a la realitat sigui

semblant

El valor de la regressioacute eacutes meacutes gran que en els altres dos casos 796 eacutes a dir que

els dos meacutetodes no donen resultats significativament diferents entre si

Podem observar un conjunt de dades que prenen valors especialment elevats en

Iestimacioacute per krigeat indicador Si analitzem aquests punts podem comprovar que

soacuten punts que tenen una probabilitat de ser meacutes grans que el cinqueacute cut-off (percentil

097) igual a 1 Per tant aquest tipus de punts no shan de tenir en compte en el

moment dextreure conclusions De fet aixo ja es sospitava en el grafic anterior pero

en que en aquell hi ha una elevada dispersioacute i per tant Iefecte queda dissimulat

54

Capiacutetol 6Comparacioacute deis resultats obtinguts

Passem ara a realitzar el gratic entre el segon meto de destimacioacute el krigeat indicador

i la realitat simulada (Figura 612)

0 _O

m~ 0)-- o

~~ -1

-2

-3

Regression Plot y = -23E-02 + 0711 615X

R-Sq 526

bull bull

-3 -2 -1

realitat simulada

recta de regresi oacute

I Bisectriu

Figura 612 Recta de regressioacute entre el krigeat indicador i la simulacioacute de la realitat

Podem observar que el gratic obtingut eacutes molt semblant a Ianterior i que ens trobem

amb el mateix problema de sobreestimacioacute deis valors petits i subestimacioacute deis valors

grans de la simulacioacute

El valor del coeticient de correlacioacute tambeacute eacutes torga semblant 52 6 Aixiacute doncs la

realitat eacutes explicada en un 526 pel krigeat indicador

53

Capiacutetol 6Comparacioacute deis resultats obtinguts

Finalment i per tenir una idea de la relacioacute que hi ha entre els dos meacutetodes emprats en

el projecte realitzarem un uacuteltim grafic comparatiu (Figura 613) que representa els dos

meacutetodes destimacioacute el krigeat lognormal i el krigeat indicador

Regression Plot y = -7 SE-02 + 105401X

R-Sq 796

middot2

middot3

recta de regresi6

bull Bisectriu

middot 4 middot3 middot2 -1

krigeat lognormal

Figura 613 Recta de regressioacute entre el krigeat lognormal i el krigeat indicador

En aquest cas podem observar que la recta de regressioacute coincideix gairebeacute a la

perfeccioacute amb la bisectriu cosa que vol dir que els dos meacutetodes soacuten molt semblants

entre siacute i que per tant eacutes normal que Iaproximacioacute de cada un dells a la realitat sigui

semblant

El valor de la regressioacute eacutes meacutes gran que en els altres dos casos 796 eacutes a dir que

els dos meacutetodes no donen resultats significativament diferents entre si

Podem observar un conjunt de dades que prenen valors especialment elevats en

Iestimacioacute per krigeat indicador Si analitzem aquests punts podem comprovar que

soacuten punts que tenen una probabilitat de ser meacutes grans que el cinqueacute cut-off (percentil

097) igual a 1 Per tant aquest tipus de punts no shan de tenir en compte en el

moment dextreure conclusions De fet aixo ja es sospitava en el grafic anterior pero

en que en aquell hi ha una elevada dispersioacute i per tant Iefecte queda dissimulat

54

Capiacutetol 6Comparacioacute deis resultats obtinguts

Finalment i per tenir una idea de la relacioacute que hi ha entre els dos meacutetodes emprats en

el projecte realitzarem un uacuteltim grafic comparatiu (Figura 613) que representa els dos

meacutetodes destimacioacute el krigeat lognormal i el krigeat indicador

Regression Plot y = -7 SE-02 + 105401X

R-Sq 796

middot2

middot3

recta de regresi6

bull Bisectriu

middot 4 middot3 middot2 -1

krigeat lognormal

Figura 613 Recta de regressioacute entre el krigeat lognormal i el krigeat indicador

En aquest cas podem observar que la recta de regressioacute coincideix gairebeacute a la

perfeccioacute amb la bisectriu cosa que vol dir que els dos meacutetodes soacuten molt semblants

entre siacute i que per tant eacutes normal que Iaproximacioacute de cada un dells a la realitat sigui

semblant

El valor de la regressioacute eacutes meacutes gran que en els altres dos casos 796 eacutes a dir que

els dos meacutetodes no donen resultats significativament diferents entre si

Podem observar un conjunt de dades que prenen valors especialment elevats en

Iestimacioacute per krigeat indicador Si analitzem aquests punts podem comprovar que

soacuten punts que tenen una probabilitat de ser meacutes grans que el cinqueacute cut-off (percentil

097) igual a 1 Per tant aquest tipus de punts no shan de tenir en compte en el

moment dextreure conclusions De fet aixo ja es sospitava en el grafic anterior pero

en que en aquell hi ha una elevada dispersioacute i per tant Iefecte queda dissimulat

54