Estadística Económica 2007-2008. Sara Mateo. Capítulo 6 Distribuciones de frecuencias...

16
Estadística Económ ica 2007-2008. Sar a Mateo. Capítulo 6 Capítulo 6 Distribuciones de frecuencias bidimensionales Contenidos: Distribución bidimensional de frecuencias Representaciones gráficas Momentos en distribuciones bidimensionales Método reducido para el cálculo de varianzas y covarianza Valor de la covarianza en caso de independencia estadísti Coeficiente de correlación lineal Coeficientes de Asociación para variables nominales: Chi- y C de contingencia

Transcript of Estadística Económica 2007-2008. Sara Mateo. Capítulo 6 Distribuciones de frecuencias...

Page 1: Estadística Económica 2007-2008. Sara Mateo. Capítulo 6 Distribuciones de frecuencias bidimensionales Contenidos: Distribución bidimensional de frecuencias.

Estadística Económica 2007-2008. Sara Mateo.

Capítulo 6Capítulo 6

Distribuciones de frecuencias bidimensionales

Contenidos:

Distribución bidimensional de frecuencias Representaciones gráficas Momentos en distribuciones bidimensionales Método reducido para el cálculo de varianzas y covarianzas Valor de la covarianza en caso de independencia estadística Coeficiente de correlación lineal Coeficientes de Asociación para variables nominales: Chi-Cuadrado y C de contingencia

Page 2: Estadística Económica 2007-2008. Sara Mateo. Capítulo 6 Distribuciones de frecuencias bidimensionales Contenidos: Distribución bidimensional de frecuencias.

Estadística Económica 2007-2008. Sara Mateo.

Tabla de Correlación o Contingencia (atributos) (al final del capítulo)(al final del capítulo)

Page 3: Estadística Económica 2007-2008. Sara Mateo. Capítulo 6 Distribuciones de frecuencias bidimensionales Contenidos: Distribución bidimensional de frecuencias.

Estadística Económica 2007-2008. Sara Mateo.

Tabla de Correlación o ContingenciaTabla de Correlación o Contingencia

Permite ayudarnos a determinar si existe relación de interdependencia interdependencia entre 2 variables, es decir, si se influyen mutuamente.

Así, una tabla de contingencia es una una tabla de doble entrada, donde en cada casilla figurará el número de casos

o individuos que poseen un nivel de una de las características analizadas y otro nivel de la otra

característica.

donde nij nij es el número de observaciones que presentan simultáneamente las características i, j de las variables A y B, respectivamente.

Page 4: Estadística Económica 2007-2008. Sara Mateo. Capítulo 6 Distribuciones de frecuencias bidimensionales Contenidos: Distribución bidimensional de frecuencias.

Estadística Económica 2007-2008. Sara Mateo.

Al analizar una distribución bidimensional, uno puede centrar su estudio en el comportamiento de una de las variables, con independencia de como se comporta la otra. Estaríamos así en el análisis de una distribución marginal.

Distribución marginal de A

Ai ni.

A1 n1.

A2 n2.

… …

An-1 nn-1.

An nn.

Distribución marginal de B

Bj n.j

B1 n.1

B2 n.2

… …

Bm-1 n.m-1

Bm n.m

Page 5: Estadística Económica 2007-2008. Sara Mateo. Capítulo 6 Distribuciones de frecuencias bidimensionales Contenidos: Distribución bidimensional de frecuencias.

Estadística Económica 2007-2008. Sara Mateo.

son las frecuencias absolutas marginales de las variables A y B, respectivamente.

Definimos:

son las frecuencias relativas marginales de las variables A y B, respectivamente.

Distribuciones marginalesDistribuciones marginales

J

j

iji n

nf

1

I

i

ijj n

nf

1

J

jiji nn

1

I

iijj nn

1

1 1 1 1

h k h k

i j iji j i j

n n n N

1 2 31

... ...k

i i i i ij ik ijj

n n n n n n n

1 2 3

1

... ...h

j j j j ij hj iji

n n n n n n n

Page 6: Estadística Económica 2007-2008. Sara Mateo. Capítulo 6 Distribuciones de frecuencias bidimensionales Contenidos: Distribución bidimensional de frecuencias.

Estadística Económica 2007-2008. Sara Mateo.

En las tablas de contingencia:

a) Distribuciones marginales

b) Distribuciones de frecuencias relativas

Page 7: Estadística Económica 2007-2008. Sara Mateo. Capítulo 6 Distribuciones de frecuencias bidimensionales Contenidos: Distribución bidimensional de frecuencias.

Estadística Económica 2007-2008. Sara Mateo.

c) Perfiles fila

d) Perfiles columna

Del total de individuos con la característica “A1” que porcentaje comparte a su vez la “B1”

Cómo es lógico, el porcentaje de individuos con “A1” que, o bien comparten B1 o B2 y hasta Bj será el 100% = 1

Page 8: Estadística Económica 2007-2008. Sara Mateo. Capítulo 6 Distribuciones de frecuencias bidimensionales Contenidos: Distribución bidimensional de frecuencias.

Estadística Económica 2007-2008. Sara Mateo.

Distribución de una de las variables siempre que la otra cumpla una condición específica.

xi ni.

(Frecuencia cuando y=valor específico)

x1 n1.

x2 n2.

… …

xn-1 nn-1.

xn nn.

X: Gasto en material escolar

Y: Número de hijos

Distrib. Condicionada: Por ejemplo, gasto en material escolar cuando el número de hijos es <3. También podría ser simplemente cuando y=número, sólo sería coger esa columna sin sumar nada.

0 5

50 8

100 5

150 8

200 4

Suma de frecuencias cuando y=0, y=1, y= 2. Que tienen un gasto de 50.

Page 9: Estadística Económica 2007-2008. Sara Mateo. Capítulo 6 Distribuciones de frecuencias bidimensionales Contenidos: Distribución bidimensional de frecuencias.

Estadística Económica 2007-2008. Sara Mateo.

Averias 0 1 2 3 Marginal de leves

0 0,2308 0,0385 0,0077 0,0000 0,27691 0,1692 0,0615 0,0231 0,0077 0,26152 0,0769 0,0385 0,0154 0,0154 0,14623 0,0923 0,0615 0,0077 0,0154 0,17694 0,0615 0,0308 0,0000 0,0077 0,10005 0,0308 0,0077 0,0000 0,0000 0,0385

0,6615 0,2385 0,0538 0,0462 1

Graves Y

Leves X

Marginal de Graves

ijn

N

.in

N

. jn

N

.. ji ijnSi i IndepjN

enn

dencian

N N

Representación gráfica: Nube de puntos o diagrama de dispersión

Page 10: Estadística Económica 2007-2008. Sara Mateo. Capítulo 6 Distribuciones de frecuencias bidimensionales Contenidos: Distribución bidimensional de frecuencias.

Estadística Económica 2007-2008. Sara Mateo.

2

21

( )( )

h

i ii

X

x x nVar X S

N

2

1 2

( )

( )

k

j jj

Y

y y n

Var Y SN

1 1

( )( )

( , )

h k

i j iji j

XY

x x y y n

Cov X Y SN

Varianza de X

Varianza de Y

Covarianza entre X e Y

Mide si existe asociación lineallineal entre X e Y. Positiva o negativa

pero no la intensidad

Page 11: Estadística Económica 2007-2008. Sara Mateo. Capítulo 6 Distribuciones de frecuencias bidimensionales Contenidos: Distribución bidimensional de frecuencias.

Estadística Económica 2007-2008. Sara Mateo.

1 1

h kr si j ij

i jrs

x y n

aN

1 1

( ) ( )h k

r si j ij

i jrs

x x y y n

mN

Momento rs con respecto origen:

Momento rs con respecto a las medias:

Page 12: Estadística Económica 2007-2008. Sara Mateo. Capítulo 6 Distribuciones de frecuencias bidimensionales Contenidos: Distribución bidimensional de frecuencias.

Estadística Económica 2007-2008. Sara Mateo.

1 1

2 2

'

'i i

j j

x c p x

y c p y

1 1

2 2

'

'

x c p x

y c p y

2 2 21

2 2 22

( ')

( ')

X X

Y Y

S p S

S p S

1 2'XY XYS p p S

Se efectúa la transformación:

Resultado de las Medias de las nuevas variables

De las nuevas varianzas:

De la nueva covarianza:

Page 13: Estadística Económica 2007-2008. Sara Mateo. Capítulo 6 Distribuciones de frecuencias bidimensionales Contenidos: Distribución bidimensional de frecuencias.

Estadística Económica 2007-2008. Sara Mateo.

Coeficiente de correlación lineal

xyr

El valor de la covarianza dependerá de los valores de las variables, por tanto de sus unidades. Para poder eliminar las unidades y tener una medida adimensional utilizamos el COEFICIENTE DE CORRELACIÓN LINEAL )( xyr

yx

xyxy SS

Sr

siendo invariante frente a transformaciones lineales (cambio de origen y escala) de las variable.

•Es un coeficiente adimensional• -1 r 1•Si hay relación lineal positiva r > 0 y próximo a 1•Si hay relación lineal negativa r < 0 y próximo a -1•Si no hay relación lineal r se aproxima a 0•Si X e Y son independientes Sxy = 0 y por tanto r = 0

Si las dos variables son independientes, su covarianza vale cero. No podemos asegurar lo mismo en sentido contrario. Si dos variables tienen covarianza cero, no significa que sean independientes. Linealmente NO tienen relación. Pero pueden pueden ser dependientes.

Importante:

Propiedades:

Page 14: Estadística Económica 2007-2008. Sara Mateo. Capítulo 6 Distribuciones de frecuencias bidimensionales Contenidos: Distribución bidimensional de frecuencias.

Estadística Económica 2007-2008. Sara Mateo.

1) Coeficiente de Asociación Chi-Cuadrado (χ2):

I

i

J

jij

ijij

e

en

1 1

22

Frecuencia observadaijn

n

nne

jiij

Frecuencia esperada

Si ≈ 0 no habrá asociación inexistencia de asociación

Problema:Problema: no tiene límite superior por lo que no permite conocer el grado de asociación.

2

Como solución:

VARIABLES CUALITATIVASVARIABLES CUALITATIVAS

Page 15: Estadística Económica 2007-2008. Sara Mateo. Capítulo 6 Distribuciones de frecuencias bidimensionales Contenidos: Distribución bidimensional de frecuencias.

Estadística Económica 2007-2008. Sara Mateo.

2) Coeficiente “C” de contingencia de Karl Pearson:

nC

2

2

),min(

11_

JImáximolímite

Si C ≈0 inexistencia de asociación Si C ≈1 perfecta asociación entre las variables

Nunca superior a uno

Page 16: Estadística Económica 2007-2008. Sara Mateo. Capítulo 6 Distribuciones de frecuencias bidimensionales Contenidos: Distribución bidimensional de frecuencias.

Estadística Económica 2007-2008. Sara Mateo.

Coeficiente de Correlación por Rangos de Spearman:

• El Coeficiente de Correlación por Rangos de Spearman permite determinar la correlación de datos de carácter ordinal midiendo la concordancia o discordancia entre las clasificaciones.

• Formulación: Si no hay empates

• Interpretación:

Si ρ= 1: Correlación por rangos perfecta y positiva. La concordancia entre los rangos es perfectaSi ρ = -1: Correlación por rangos perfecta y negativa. La concordancia entre los rangos es perfectaSi ρ = 0: Correlación por rangos nula. No hay concordancia entre los rangosSi 0 < ρ < 1: Correlación por rangos positiva y si -1 < ρ <0: Correlación por rangos negativa

D: diferencia de valores para las dos variables.

EJEMPLOS EN CLASEEJEMPLOS EN CLASE