Chi Cuadrado

12
TRABAJO: CHI CUADRADO 2014 NOMBRES: Solano Jara, Carlos Enrique TRABAJO: CHI CUADRADO CURSO: GEOESTADISTICA II PROFESOR: Ing. TEVES, AUGUSTO

description

geoestadistica

Transcript of Chi Cuadrado

Page 1: Chi Cuadrado

2014TRABAJO: CHI CUADRADO

TRABAJO: CHI CUADRADO

CURSO: GEOESTADISTICA IIPROFESOR: Ing. TEVES, AUGUSTO

Page 2: Chi Cuadrado

INDICE:

OBJETIVOS…………………………………………………………………………..…….…..…2

RESUMEN……………………………………………………………………………………....…3

INTRODUCCION……………………………………………………………………………….…4

ALCANCE…………………………………………………………………………………….……5

ANALISIS DE RESULTADOS...…………………………………………..………………….…7

CONCLUSIONES…………………………………………………………………………………10

BIBLIOGRAFIA………………………………………………………………………………...…10

GEOESTADÍSTICA II Página 1

2014TRABAJO: CHI CUADRADO

Page 3: Chi Cuadrado

OBJETIVOS:

El estudio de varias cuestiones en relación con v.a. cualitativas ó cuantitativas cuyos datos están recogidos en forma de tabla de frecuencias. El denominador común a todas ellas es que su tratamiento estadístico está basado en la misma distribución teórica: la distribución χ2 (chi-cuadrado ó ji-cuadrado).

Analizar y estudiar las hipótesis con los valores esperados. Obtener a través de números random los datos para el chi cuadrado. Interpretar los gráficos de la tabla chi cuadrado. Notar las diferencias en cada valor porcentual. Entender el significado del chi cuadrado.

El teorema debe de tener un valor de confianza real para poder aplicarlo en la minería.

GEOESTADÍSTICA II Página 2

2014TRABAJO: CHI CUADRADO

Page 4: Chi Cuadrado

RESUMEN:

En los ordenadores personales es fácil simular la generación de números aleatorios, mediante mecanismos de generación de números seudoaleatorios (n número pseudo-aleatorio es un número generado en un proceso que parece producir números al azar, pero no lo hace realmente. Las secuencias de números pseudo-aleatorios no muestran ningún patrón o regularidad aparente desde un punto de vista estadístico, a pesar de haber sido generadas por un algoritmo completamente determinista, en el que las mismas condiciones iniciales producen siempre el mismo resultado)

A partir de esta aclaración siempre que nos refiramos a un número aleatorio estaremos hablando de un número perteneciente a una serie aleatoria. Ya sé por medios matemáticos (manuales), estadísticos o por medios de los Microsoft (Excel), incluso también se puede obtener mediante lenguajes de programación como por ejemplo Visual Basic, Visual C++, macros, java y otros.

Una vez obtenidos los números aleatorios, dichos números aleatorios deben estar en un rango de ]0,1[ (lo obtenemos con la función =aleatorio() ) y como en este informe vamos a obtener números aleatorios en el intervalo de ]2,5[ que serán las leyes del mineral en %

Con el código =ALEATORIO()*3+2

Una vez obtenido los 20 datos random procedemos hallar la media y la desviación estándar.

GEOESTADÍSTICA II Página 3

2014TRABAJO: CHI CUADRADO

Page 5: Chi Cuadrado

INTRODUCCION:

En muestras de tamaño n, tomadas de una población en la que la regularidad estadística no sigue una distribución normal (puede ser de cualquier forma), que tiene una media poblacional y varianza poblacional, entonces si n es grande, el proceso de tomar muchas muestras y en cada una de ellas tomar su media, el promedio muestral produce una regularidad estadística de los valores de la media que se modela con la distribución normal con media y varianza.

La chi- cuadrada es adecuada para analizar este tipo de datos. Puede usarse para probar la existencia de una diferencia significativa entre un número observado de objetos o respuesta de cada categoría y un número esperado, basado en la hipótesis de nulidad.

Importante, esta prueba nos indica si existe o no relación entre las variables, pero no indica el grado o el tipo de relación: es decir, no indica el porcentaje de influencia de una variable sobre la otra o la variable que causa la influencia

Cuando los datos puntualizan a las variables cualitativa (nominal u ordinal).

Poblaciones pequeñas.

Cuando se desconocen los parámetros media, moda, etc.

Cuando se quiere contrastar o comparar hipótesis.

Investigaciones de tipo social - muestras pequeñas no representativas >5.

Población > a 5 y < a 20

Planteamos las hipótesis

Hipótesis alterna (Ha). Habrá diferencia significativa entre la cantidad .

Hipótesis nula (Ho). No Habrá diferencia significativa entre la cantidad.

GEOESTADÍSTICA II Página 4

2014TRABAJO: CHI CUADRADO

Page 6: Chi Cuadrado

ALCANCE:

• Muestra: Parte de una población que se toma cuando es imposible acceder a toda ella. La elección de la muestra se hace con la intención de, a partir de la información que ella proporciona, extender sus resultados a toda la población a la que representa.

• Muestra aleatoria: (Muestra elegida al azar) Aquella muestra tomada de la población en la que todo individuo tiene la misma probabilidad de resultar elegido para ella, y esto con independencia entre individuos.

• Función de Distribución: Función que hace corresponder a cada uno de los valores de una variable aleatoria la probabilidad de que tal variable aleatoria tome un valor igual o inferior al dado.

• Función de Probabilidad: Función que hace corresponder a cada uno de los valores de la variable aleatoria discreta su probabilidad.

• Contraste de hipótesis: Conjunto de reglas tendentes a decidir cuál de dos hipótesis –la nula ó la alternativa- debe aceptarse en base al resultado obtenido en una muestra. Es de dos colas cuando la alternativa es la negación de la nula. De una cola en caso contrario. Variable aleatoria: Toda función que toma diversos valores numéricos, dependiente de los resultados de un fenómeno aleatorio, con distintas probabilidades.

• Variable aleatoria discreta. Las variables aleatorias discretas son aquellas que presentan un número finito de valores, constituyen una sucesión numerable.

• Variable aleatoria continua. Las variables aleatorias continuas pueden tomar un número infinito de valores en un intervalo determinado.

• Variable categórica. Una variable categórica es una variable que clasifica cada individuo de una población en una de las varias clases mutuamente excluyentes en que ésta se divide.

• Variable numérica. Corresponde a los datos expresados en una escala continua numérica.

Supongamos que tenemos un número k de clases en las cuales se han ido registrado un total de n observaciones (n será pues el tamaño muestral). Denotaremos las frecuencias observadas en cada clase por

O1, O2, ..., O k (Oi es el número de valores en la clase Ai).

Se cumplirá:

O1 + O2 + ... + O k = n

Lo que queremos es comparar las frecuencias observadas con las frecuencias esperadas (teóricas), a las que denotaremos por E1, E2, ..., E k .

GEOESTADÍSTICA II Página 5

2014TRABAJO: CHI CUADRADO

Page 7: Chi Cuadrado

Se cumplirá:

E1 + E2 + ... + E k = n

Se tratará ahora de decidir si las frecuencias observadas están o no en concordancia con las frecuencias esperadas (es decir, si el número de resultados observados en cada clase corresponde aproximadamente al número esperado). Para comprobarlo, haremos uso de un contraste de hipótesis usando la distribución Chi-cuadrado: El estadístico de contraste será

Observar que este valor será la suma de k números no negativos. El numerador de cada término es la diferencia entre la frecuencia observada y la frecuencia esperada. Por tanto, cuanto más cerca estén entre sí ambos valores más pequeño será el numerador, y viceversa. El denominador permite relativizar el tamaño del numerador.

Las ideas anteriores sugieren que, cuanto menor sean el valor del estadístico ∗ χ2 , más coherentes serán las observaciones obtenidas con los valores esperados. Por el contrario, valores grandes de este estadístico indicarán falta de concordancia entre las observaciones y lo esperado. En este tipo de contraste se suele rechazar la hipótesis nula (los valores observados son coherentes con los esperados) cuando el estadístico es mayor que un determinado valor crítico.

Notas:

(1) El valor del estadístico ∗ χ2 se podrá aproximar por una distribución Chi-cuadrado cuando el tamaño muestral n sea grande (n > 30), y todas las frecuencias esperadas sean iguales o mayores a 5 (en ocasiones deberemos agrupar varias categorías a fin de que se cumpla este requisito).

(2) Las observaciones son obtenidas mediante muestreo aleatorio a partir de una población particionada en categorías.

ANALISIS DE RESULTADOS

Generamos números aleatorios de varias formas, pero en este informe generamos en Microsoft Excel, una vez obtenidos los números aleatorios:

GEOESTADÍSTICA II Página 6

2014TRABAJO: CHI CUADRADO

Page 8: Chi Cuadrado

En este caso hemos generado diferentes valores de random como lo son las leyes

Generamos 1200 datos.

Ojo: Cada randoms equivale a un dato, es decir que los valores random cambian para cada dato elaborado en nuestro trabajo

Lo cual este nos dará el significado de una distribución normal cosa que no podemos aplicar en los casos de leyes. Es importante tener en cuenta esto ya que no todos los problemas tendrán una distribución normal que se relacione con la realidad

Lo cual hallamos las media, varianza y desviación estándar

Y pasamos a graficar el histograma

Graficas de los histogramas

K = 1200

0.000241219997406006

0.0590341722264009

0.117827124455396

0.176620076684391

0.235413028913386

0.294205981142381

0.352998933371376

0.411791885600371

0.470584837829365

0.52937779005836

0.588170742287355

0.64696369451635

0.705756646745345

0.76454959897434

0.823342551203335

0.88213550343233

0.940928455661325

0.999721407890320

0.005

0.01

0.015

0.02

0.025

0.03

0.035

0.04

0.045

GEOESTADÍSTICA II Página 7

2014TRABAJO: CHI CUADRADO

Page 9: Chi Cuadrado

El valor en la tabla chi cuadrado para 1199 grados de libertad y (1-α)=95%

GEOESTADÍSTICA II Página 8

0

0.4

0.8

1.2

1.6

2014TRABAJO: CHI CUADRADO

MEDIA 0,49244992

VARIANZA 0,07922623

DESVIACIÓN 0,28147155

Clase Frecuencia

Frecuenciarelativa

Distribucion

normal

Chi-cuadrado

0,00024122

1 0,00083333

0,307221355

0,305556949

0,0296377 22 0,01833333

0,366774146

0,331023878

0,05903417

43 0,03583333

0,433120763

0,364418691

0,08843065

36 0,03 0,505920484

0,44769942

0,11782712

34 0,02833333

0,584545738

0,529252407

0,1472236 25 0,02083333

0,66806344 0,627046454

0,17662008

38 0,03166667

0,755231135

0,693225578

0,20601655

30 0,025 0,844510473

0,795250546

0,23541303

39 0,0325 0,934099557

0,870230325

0,26480951

42 0,035 1,021984398

0,953183047

0,29420598

39 0,0325 1,106008179

1,04196319

0,32360246

37 0,03083333

1,183955515

1,12309183

0,35299893

40 0,03333333

1,253647399

1,187867035

0,38239541

42 0,035 1,313041329

1,243974278

0,41179189

44 0,03666667

1,360330268

1,287985257

0,44118836

49 0,04083333

1,394033787

1,31356319

0,47058484

35 0,02916667

1,413074995

1,355343678

0,49998131

27 0,0225 1,416837673

1,372194983

0,52937779

35 0,02916667

1,405199394

1,347471451

0,55877427

38 0,03166667

1,378538135

1,315932223

0,58817074

38 0,03166667

1,337711895

1,275128183

0,61756722

39 0,0325 1,284012838

1,219835454

0,64696369

35 0,02916667

1,219099396

1,161463868

0,67636017

28 0,02333333

1,144911294

1,098720162

0,70575665

36 0,03 1,063573569

1,004419773

0,73515312

28 0,02333333

0,97729619 0,931186616

0,7645496 32 0,02666667

0,888275837

0,835743055

0,7939460 41 0,0341666 0,79860580 0,73173422

Page 10: Chi Cuadrado

Es 43.8 y en el valor experimental hallado es 29.75795361

Al ser menor se asegura que dentro de ese intervalo de confianza se puede aceptar que ese conjundo de datos tiene una distribución normal.

CONCLUSIONES:

Obtener a través de números random los datos para usar el chi cuadrado que serán los números random

Estudiar los valores de confianza que se aplican en la tabla chi cuadrado

El estudio de varias cuestiones en relación con v.a. cualitativas ó cuantitativas cuyos datos están recogidos en forma de tabla de frecuencias. El denominador común a todas ellas es que su tratamiento estadístico está basado en la misma distribución teórica: la distribución χ2 (chi-cuadrado ó ji-cuadrado.

Analizar y estudiar las hipótesis con los valores esperados.

Entender el significado del chi cuadrado.

Observamos que a menor valor de confianza se extenderá los intervalos o mejor dicho se harán más abiertos donde el intervalo será mayor.

GEOESTADÍSTICA II Página 9

2014TRABAJO: CHI CUADRADO

Page 11: Chi Cuadrado

Lo ideal es tener un valor de confianza realista para poder aproximar las leyes promedios

BIBLIOGRAFIA:

o http://sameens.dia.uned.es/Trabajos13/Trab_Publicos/Trab_5/Viton_Asenjo_5/files/tablaschi.pdf

o http://es.wikipedia.org/wiki/Prueba_%CF%87%C2%B2

o http://www.ub.edu/aplica_infor/spss/cap5-2.htm

GEOESTADÍSTICA II Página 10

2014TRABAJO: CHI CUADRADO