Tablas de Contingencia

18
Coeficientes de Correlación III: Coeficientes para variables categóricas Universidad de Chile Asignatura: Estadística II Profesor: Andrés Antivilo Bruna Año Académico 2015

description

cont

Transcript of Tablas de Contingencia

Coeficientes de Correlación III:

Coeficientes para variables categóricas

Universidad de Chile Asignatura: Estadística II

Profesor: Andrés Antivilo Bruna Año Académico 2015

2

El calculo de un Coeficiente de correlación depende del nivel de medición de las variables:

ESTADÍSTICA II,. 2015. Académico: Andrés Antivilo Bruna

UNIVERSIDAD DE CHILE

3

Coeficientes para Variables Categóricas Todo análisis relacional debería ser precedido por el

correspondiente análisis descriptivo. ¿Cómo se pueden describir variables categóricas? Son variables “de las que únicamente es posible obtener una

medida de tipo nominal (u ordinal con pocos valores)” (Pardo, Ruiz y san Martín, 2009, pag.282)

En investigación clínica se pueden encontrar variables del tipo “Padecer o no un determinado síntoma” o se puede clasificar a los pacientes como “Tratados/No tratados” o “Recuperados/No Recuperados”.

En investigación social las respuestas de los sujetos se pueden clasificar por la Actitud que manifiestas (desde totalmente favorable hasta totalmente desfavorable), o analizarlas en función del Estado Civil, Sexo, Raza, Profesión, etc.

ESTADÍSTICA II, 2015. Académico: Andrés Antivilo Bruna

UNIVERSIDAD DE CHILE

4

Al trabajar con variables categóricas -al mismo tiempo- hay que abordar dos procedimientos (Pardo et al, 2009):

1. Describir el comportamiento conjunto de ambas variables 2. Determinar si existe relación entre ellas. Para describir solo una variable categórica se ha utilizado

un técnica específica de resumen llamada Tabla de Frecuencias.

Para describir dos variables categóricas simultáneamente se construye una Tabla de frecuencias conjuntas, la que combina las categorías de ambas variables: Tabla de Contingencia.

Tablas de Contingencia

ESTADÍSTICA II, 2015. Académico: Andrés Antivilo Bruna

UNIVERSIDAD DE CHILE

5

Ejemplo: Tablas de Frecuencia para Sexo y Tabaquismo.

Sexo ni

Hombre 94

Mujer 106

Total 200

Tabaquismo ni

Fumador 60

Exfumador 13

No Fumador 127

Total 200

ESTADÍSTICA II, 2015. Académico: Andrés Antivilo Bruna

UNIVERSIDAD DE CHILE

6

Ejemplo: Porcentajes para Sexo y Tabaquismo.

Sexo %

Hombre 47%

Mujer 53%

Total 100%

Tabaquismo %

Fumador 30%

Exfumador 6,5%

No Fumador 63,5%

Total 100%

ESTADÍSTICA II, 2015. Académico: Andrés Antivilo Bruna

UNIVERSIDAD DE CHILE

7

TABLA 1: Tabla de Contingencia de Sexo por Tabaquismo:

Tabaquismo

Sexo Fumador Exfumador No Fumador Total

Hombres 18 7 69 94

Mujeres 42 6 58 106

Total 60 13 127 200

ESTADÍSTICA II, 2015. Académico: Andrés Antivilo Bruna

UNIVERSIDAD DE CHILE

8

TABLA 2: Tabla de Contingencia de Sexo por Tabaquismo: Se destacan las FRECUENCIAS ABSOLUTAS CONJUNTAS

Tabaquismo

Sexo Fumador Exfumador No Fumador Total

Hombres 18 7 69 94

Mujeres 42 6 58 106

Total 60 13 127 200

ESTADÍSTICA II, 2015. Académico: Andrés Antivilo Bruna

UNIVERSIDAD DE CHILE

9

TABLA 3: Tabla de Contingencia de Sexo por Tabaquismo: Se destacan los TOTALES MARGINALES

Tabaquismo

Sexo Fumador Exfumador No Fumador Total

Hombres 18 7 69 94

Mujeres 42 6 58 106

Total 60 13 127 200

ESTADÍSTICA II, 2015. Académico: Andrés Antivilo Bruna

UNIVERSIDAD DE CHILE

10

Tabla de Contingencia de Sexo por Tabaquismo: CALCULE el Porcentaje para las COLUMNAS

Tabaquismo

Sexo Fumador Exfumador No Fumador Total

Hombres

Mujeres

Total 100%

ESTADÍSTICA II, 2015. Académico: Andrés Antivilo Bruna

UNIVERSIDAD DE CHILE

11

Tabla de Contingencia de Sexo por Tabaquismo: Porcentaje para las COLUMNAS

Tabaquismo

Sexo Fumador Exfumador No Fumador Total

Hombres 30.0% 53.8% 54.3% 47%

Mujeres 70.0% 46.2% 45.7% 53%

Total 100% 100% 100% 100%

ESTADÍSTICA II, 2015. Académico: Andrés Antivilo Bruna

UNIVERSIDAD DE CHILE

12

El principal objetivo de combinar dos variables en una tabla de contingencia es “evaluar si tienen algo que ver entre si o no”, es decir, examinar si están relacionadas.

En este contexto solo existen dos posibles resultados: 1. Las variables son independientes. 2. Las variables están asociadas. “Dos variables son Independientes cuando el

comportamiento de una de ellas NO se ve alterada por la presencia de la otra” (Pardo et al, 2009, pag 288).

Correlación en Tablas de Contingencia

ESTADÍSTICA II, 2015. Académico: Andrés Antivilo Bruna

UNIVERSIDAD DE CHILE

13

Correlación en Tablas de Contingencia Si se asume que las variables X e Y son

independientes, la probabilidad de encontrar una observación cualquiera en una casilla determinada es igual al producto de las probabilidades marginales de esa casilla.

En la práctica, lo que se calculan son las Frecuencias Esperadas, considerando las frecuencias marginales asociadas a cada casilla y el número total de casos:

ˆ i iij

n nmn

+ +⋅=

ESTADÍSTICA II, 2015. Académico: Andrés Antivilo Bruna

UNIVERSIDAD DE CHILE

14

Estadístico Chi Cuadrado Por lo tanto, si se asume independencia, las

Frecuencias Esperadas de cada casilla pueden estimarse multiplicando sus correspondientes frecuencias marginales y dividiendo ese producto entre el número total de casos.

Para contrastar la hipótesis solo falta comparar los pronósticos teóricos (Frecuencias Esperadas) con los datos realmente obtenidos (Frecuencias Observadas).

Pearson (1911) generó el estadístico chi cuadrado. Fluctúa entre 0 e infinito.

ESTADÍSTICA II, 2015.

Académico: Andrés Antivilo Bruna UNIVERSIDAD DE CHILE

15

Estadístico Chi Cuadrado Fórmula: Cuando se cumple la hipótesis de independencia, las diferencias

entre las frecuencias observadas y las correspondientes frecuencias esperadas valen cero; por lo tanto, el estadístico chi cuadrado también valdrá cero.

( )2

2

1 1

ˆ1

ˆ

I Jij ij

Obsi j ij

n mm

χ= =

−=∑∑

ESTADÍSTICA II, 2015. Académico: Andrés Antivilo Bruna

UNIVERSIDAD DE CHILE

16

Cálculo de las Frecuencias Esperadas

1194 60ˆ 28.2

200i in nm

n+ +⋅ ⋅

= = =

21106 60ˆ 31.8

200i in nm

n+ +⋅ ⋅

= = =

ESTADÍSTICA II, 2015. Académico: Andrés Antivilo Bruna

UNIVERSIDAD DE CHILE

17

Tabla de Contingencia de Sexo por Tabaquismo: FRECUENCIAS OBSERVADAS Y ESPERADAS

Tabaquismo

Sexo Fumador Exfumador No Fumador Total

Hombres 18 (28.2) 7 (6.1) 69 (59.7) 94

Mujeres 42 (31.8) 6 (6.9) 58 (67.3) 106

Total 60 13 127 200

ESTADÍSTICA II, 2015. Académico: Andrés Antivilo Bruna

UNIVERSIDAD DE CHILE

18

Tabla de Contingencia de Sexo por Tabaquismo: FRECUENCIAS OBSERVADAS Y ESPERADAS

Tabaquismo Sexo Fumador Exfumador No Fumador Total

Hombres 18 (28.2) 7 (6.1) 69 (59.7) 94 Mujeres 42 (31.8) 6 (6.9) 58 (67.3) 106

Total 60 13 127 200

ESTADÍSTICA II, 2015. Académico: Andrés Antivilo Bruna

UNIVERSIDAD DE CHILE

Se concluye que el hecho de ser mujer se vincula a fumar, mientras que ser hombres se vincula a la categoría No fumador.