Distribución Conjunta de Dos Variables

13
Distribución Conjunta de Dos Variables © Asturias Corporación Universitaria

Transcript of Distribución Conjunta de Dos Variables

Page 1: Distribución Conjunta de Dos Variables

1

Distribución Conjunta de Dos Variables —

© Asturias Corporación Universitaria

Page 2: Distribución Conjunta de Dos Variables

Distribución Conjunta de Dos Variables

02 ASTURIAS CORPORACIÓN UNIVERSITARIA® Nota Técnica preparada por Asturias Corporación Universitar ia. Su difusión, reproducción o uso total o parcial para cualquier otro propósito queda prohibida. Todos los derechos reservados.

Índice 1 Introducción ............................................................................................................................................................ 3

2 Distribuciones Marginales .............................................................................................................................. 3

3 Distribuciones Condicionadas ...................................................................................................................... 4

4 Términos Relacionados para Tablas de Doble Entrada................................................................ 5

4.1 Frecuencia Absoluta ............................................................................................................................. 5

4.2 Frecuencia Relativa ............................................................................................................................... 5

4.3 Frecuencia Absoluta Acumulada .................................................................................................. 5

4.4 Frecuencia Relativa Acumulada .................................................................................................... 5

5 Independencia..................................................................................................................................................... 11

6 Medidas de Dependencia............................................................................................................................. 12

7 Resumen ................................................................................................................................................................. 12

8 Referencias Bibliográficas ............................................................................................................................ 12

Page 3: Distribución Conjunta de Dos Variables

Distribución Conjunta de Dos Variables

03 ASTURIAS CORPORACIÓN UNIVERSITARIA® Nota Técnica preparada por Asturias Corporación Universitar ia. Su difusión, reproducción o uso total o parcial para cualquier otro propósito queda prohibida. Todos los derechos reservados.

Objetivos

Objetivo: Conocer las distintas distribuciones y medidas de dependencia e independencia existentes en estadística.

1 Introducción

Cuando el investigador está interesado en el estudio de dos variables de una población, se obtienen dos observaciones para cada individuo, que se recogen en forma de pares de valores, que deben ser organizados en función de la naturaleza de dichas variables.

Al igual que en el caso unidimensional, es interesante organizar los datos en forma de tabla de frecuencias, sin embargo, al tener que especificar los valores que toman ambos caracteres, la tabla debe ser de doble entrada o bidimensional como sigue:

𝑋, 𝑌 𝑦1 ⋯ 𝑦𝑗 ⋯ 𝑦𝑠

𝑥1 𝑛11 ⋯ 𝑛1𝑗 ⋯ 𝑛1𝑠

⋮ ⋮ ⋱ ⋮ ⋱ ⋮

𝑥𝑖 𝑛𝑖1 ⋯ 𝑛𝑖𝑗 ⋯ 𝑛𝑖𝑠

⋮ ⋮ ⋱ ⋮ ⋱ ⋮

𝑥𝑟 𝑛𝑟1 ⋯ 𝑛𝑟𝑗 ⋯ 𝑛𝑟𝑠

Tabla 1: Distribuciones conjuntas y marginales de (𝑋, 𝑌 )

Esta distribución se denomina distribución conjunta de (𝑋, 𝑌).

2 Distribuciones Marginales

En la tabla anterior se pueden sumar las frecuencias que aparecen en cada una de las filas y columnas, colocándose los resultados en los márgenes, como sigue:

Page 4: Distribución Conjunta de Dos Variables

Distribución Conjunta de Dos Variables

04 ASTURIAS CORPORACIÓN UNIVERSITARIA® Nota Técnica preparada por Asturias Corporación Universitar ia. Su difusión, reproducción o uso total o parcial para cualquier otro propósito queda prohibida. Todos los derechos reservados.

𝑋, 𝑌 𝑦1 ⋯ 𝑦𝑗 ⋯ 𝑦𝑠

𝑥1 𝑛11 ⋯ 𝑛1𝑗 ⋯ 𝑛1𝑠 𝑛1.

⋮ ⋮ ⋱ ⋮ ⋱ ⋮ ⋮

𝑥𝑖 𝑛𝑖1 ⋯ 𝑛𝑖𝑗 ⋯ 𝑛𝑖𝑠 𝑛𝑖.

⋮ ⋮ ⋱ ⋮ ⋱ ⋮ ⋮

𝑥𝑟 𝑛𝑟1 ⋯ 𝑛𝑟𝑗 ⋯ 𝑛𝑟𝑠 𝑛𝑟.

𝑛.1 ⋯ 𝑛.𝑗 ⋯ 𝑛.𝑠 𝑛

Tabla 2: Distribuciones marginales.

Donde:

𝒏.𝒋 = ∑ 𝒏𝒊𝒋

𝒓

𝒊=𝟏

𝒏𝒊. = ∑ 𝒏𝒊𝒋

𝒔

𝒋=𝟏

𝒏 = 𝒏.. = ∑ ∑ 𝒏

𝒔

𝒋=𝟏 𝒊𝒋

𝒓

𝒊=𝟏

De tal forma que, la primera y última columna de la tabla, constituyen la distribución marginal de 𝑋, y la primera y última fila la distribución marginal de 𝑌.

3 Distribuciones Condicionadas

Cuando se posee información previa de una de las variables en estudio, ésta puede modificar la información disponible de la otra. En particular, cuando se considera la distribución de una variable para un valor fijo de la otra, se obtiene la distribución condicionada. Más concretamente, las frecuencias condicionadas son:

𝑓𝑖|𝑗=

𝑛𝑖𝑗

𝑛.𝑗, 𝑝𝑎𝑟𝑎 𝑡𝑜𝑑𝑜 𝑖 = 1,2, … , 𝑟

𝑓𝑗|𝑖=

𝑛𝑖𝑗

𝑛.𝑖, 𝑝𝑎𝑟𝑎 𝑡𝑜𝑑𝑜 𝑗 = 1,2, … , 𝑠

“Distribuciones condicionadas: cuando se

considera la distribución de una variable

para un valor fijo de la otra”

Page 5: Distribución Conjunta de Dos Variables

Distribución Conjunta de Dos Variables

05 ASTURIAS CORPORACIÓN UNIVERSITARIA® Nota Técnica preparada por Asturias Corporación Universitar ia. Su difusión, reproducción o uso total o parcial para cualquier otro propósito queda prohibida. Todos los derechos reservados.

Que son, respectivamente, la condicionada de 𝑋 para el valor 𝑦𝑗 de 𝑌, para 𝑗 = 1, 2,· · · , 𝑠, y la condicionada de 𝑌 para el valor 𝑥𝑖 de 𝑋, para 𝑖 = 1, 2,· · · , 𝑟”1.

4 Términos Relacionados para Tablas de Doble Entrada

4.1 Frecuencia Absoluta

Sea 𝑋 que toma 𝑟 valores distintos 𝑥1 , 𝑥2 , … , 𝑥𝑟, e 𝑌 que toma 𝑠 valores distintos 𝑦1 , 𝑦2 , … , 𝑦𝑠. Se define la frecuencia absoluta del par (𝑥𝑖 , 𝑦𝑗), denotada por 𝑛𝑖𝑗, como el número de veces que se observa dicho par de valores.

Observaciones

1. Se verifica que ∑ ∑ 𝑛𝑖𝑗𝑠𝑗=1

𝑟𝑖=1 = 𝑛.

2. Si la distribución es de atributos, la tabla se llama de contingencia. 3. Si la distribución es de variables se denomina de correlación.

4.2 Frecuencia Relativa

Sea 𝑋 que toma 𝑟 valores distintos 𝑥1 , 𝑥2 , … , 𝑥𝑟, e 𝑌 que toma 𝑠 valores distintos 𝑦1 , 𝑦2 , … , 𝑦𝑠. Se define la frecuencia relativa del par (𝑥𝑖 , 𝑦𝑗), denotada por ℎ𝑖𝑗, como el cociente entre las frecuencias absolutas y el

tamaño de la muestra. Así, las frecuencias relativas vienen dadas por:

ℎ𝑖𝑗 =𝑛𝑖𝑗

𝑛 frecuencia relativa

ℎ𝑖. =𝑛𝑖.

𝑛 frecuencia relativa de la marginal de 𝑋

ℎ.𝑗 =𝑛.𝑗

𝑛 frecuencia relativa de la marginal de 𝑌

4.3 Frecuencia Absoluta Acumulada

Sea 𝑋 que toma 𝑟 valores distintos 𝑥1 , 𝑥2 , … , 𝑥𝑟, e 𝑌 que toma 𝑠 valores distintos 𝑦1 , 𝑦2 , … , 𝑦𝑠. Se define la frecuencia absoluta acumulada del par (𝑥𝑖 , 𝑦𝑗), denotada por 𝑁𝑖𝑗, como el número cuya característica 𝑋 es menor o igual que 𝑥, y su característica 𝑌 es menor o igual que 𝑦.

4.4 Frecuencia Relativa Acumulada

Sea 𝑋 que toma 𝑟 valores distintos 𝑥1 , 𝑥2 , … , 𝑥𝑟, e 𝑌 que toma 𝑠 valores distintos 𝑦1 , 𝑦2 , … , 𝑦𝑠. Se define la frecuencia relativa acumulada del par (𝑥𝑖 , 𝑦𝑗), denotada por 𝐻𝑖𝑗, como el número del cociente relativo cuya característica 𝑋 es menor o igual que 𝑥, y su característica 𝑌 es menor o igual que 𝑦.

1 Espejo Miranda, I., Fernández Palacín, F., López Sánchez, M., Muñoz Márquez, M., Rodríguez Chía, A. S., & Valero Franco, C. (2006). Estadística Descriptiva y Probabilidad. Cádiz: Servicio de Publicaciones de la Universidad de Cádiz.p.53-56

“Frecuencia Absoluta Acumulada: el nº cuya

característica X es menor o igual que x, y su

característica Y es menor o igual que y”

“Frecuencia Relativa Acumulada: el nº del

cociente cuya característica X es menor o

igual que x, y su característica Y es menor o

igual que y”

Page 6: Distribución Conjunta de Dos Variables

Distribución Conjunta de Dos Variables

06 ASTURIAS CORPORACIÓN UNIVERSITARIA® Nota Técnica preparada por Asturias Corporación Universitar ia. Su difusión, reproducción o uso total o parcial para cualquier otro propósito queda prohibida. Todos los derechos reservados.

Ejemplo 1: De cierta población en estudio una muestra de 50 familias fue extraída con el propósito de observar las variables: número de personas que conforman la familia (𝑋) y número de personas que producen algún tipo de ingreso (𝑌). Los datos recolectados fueron los siguientes:

(6,1) (1,1) (2,1) (4,2) (6,1) (1,1) (3,1) (4,2) (5,2) (5,1) (5,4) (6,1) (2,1) (3,2) (4,3) (6,2) (2,1) (3,2) (4,2) (3,2) (4,2) (4,3) (3,3) (4,3) (4,4) (4,4) (4,4) (4,2) (2,1) (6,2) (6,3) (4,4) (2,1) (5,1) (5,5) (4,4) (3,2) (2,2) (6,4) (6,5) (6,4) (6,2) (6,3) (6,2) (6,2) (5,2) (5,4) (5,1) (6,4) (5,4)

Así la distribución conjunta de (𝑋, 𝑌) y sus respectivas marginales vendrían dadas por

(𝑋, 𝑌) 1 2 3 4 5

1 2 0 0 0 0 2

2 4 1 0 0 0 5

3 2 4 1 0 0 7

4 0 5 3 5 0 13

5 3 2 0 4 1 10

6 3 5 2 2 1 13

14 17 6 11 2 50

Tabla 3: Ejemplo 1, Distribución conjunta y marginales.

Es de notar, que a pesar de que se puede perfectamente organizar la información, se pierde precisión en el resumen de ésta. Efectivamente, utilizando la tabla de doble entrada lo único que se puede decir, por ejemplo, es que:

Existen 5 familias que tienen 6 personas en el hogar, de las cuales 2 de ellas producen algún tipo de ingreso.

De las marginales de 𝑋 se tiene por ejemplo: que hay 13 familias con 4 personas en el hogar

De las marginales de 𝑌 se tiene por ejemplo: Hay 17 familias en las cuales solo 2 personas producen algún tipo de ingreso.

Page 7: Distribución Conjunta de Dos Variables

Distribución Conjunta de Dos Variables

07 ASTURIAS CORPORACIÓN UNIVERSITARIA® Nota Técnica preparada por Asturias Corporación Universitar ia. Su difusión, reproducción o uso total o parcial para cualquier otro propósito queda prohibida. Todos los derechos reservados.

Ahora la distribución conjunta de frecuencias relativas viene dada por

(𝑋, 𝑌) 1 2 3 4 5

1 0.04 0.00 0.00 0.00 0.00 0.04

2 0.08 0,02 0.00 0.00 0.00 0.10

3 0.04 0.08 0.02 0.00 0.00 0.14

4 0.00 0.10 0.06 0.10 0.00 0.26

5 0.06 0.04 0.00 0.08 0.02 0.20

6 0.06 0.10 0.04 0.04 0.02 0.26

0.28 0.34 0.12 0.22 0.04 1

Tabla 4: Distribución conjunta de frecuencias relativas.

Así por ejemplo, es fácil ver en términos porcentuales que:

1. Que el 2% de la familias observadas tienen 3 miembros y todos 3 producen ingresos

2. Que el 34% de las familias tienen 2 personas que producen ingresos.

La distribución conjunta de frecuencias absolutas acumuladas viene dada por

(𝑋, 𝑌) 1 2 3 4 5

1 2 2 2 2 2

2 6 7 7 7 7

3 8 13 14 14 14

4 8 18 22 27 27

5 11 23 37 36 37

6 14 31 37 48 50

Tabla 5: Distribución conjunta de frecuencias absolutas acumuladas.

Page 8: Distribución Conjunta de Dos Variables

Distribución Conjunta de Dos Variables

08 ASTURIAS CORPORACIÓN UNIVERSITARIA® Nota Técnica preparada por Asturias Corporación Universitar ia. Su difusión, reproducción o uso total o parcial para cualquier otro propósito queda prohibida. Todos los derechos reservados.

La distribución conjunta de frecuencias relativas acumuladas viene dada por

(𝑋, 𝑌) 1 2 3 4 5

1 0.04 0.04 0.04 0.04 0.04

2 0.12 0.14 0.14 0.14 0.14

3 0.16 0.26 0.28 0.28 0.28

4 0.16 0.36 0.44 0.54 0.54

5 0.22 0.46 0.54 0.72 0.74

6 0.28 0.62 0.74 0.96 1

Tabla 6: Frecuencias relativas acumuladas.

Page 9: Distribución Conjunta de Dos Variables

Distribución Conjunta de Dos Variables

09 ASTURIAS CORPORACIÓN UNIVERSITARIA® Nota Técnica preparada por Asturias Corporación Universitar ia. Su difusión, reproducción o uso total o parcial para cualquier otro propósito queda prohibida. Todos los derechos reservados.

Ejemplo 2: Ahora veamos un caso donde ambas variables son de tipo continuo, así con las siguientes tablas dadas construimos la distribución conjunta de (𝑋, 𝑌)

𝑦𝑖 𝐿𝑖 𝐿𝑠 𝑛𝑖

1 6.15 8.75 7

2 8.75 11.35 8

3 11.35 13.95 9

4 13.95 16.55 2

5 16.55 19.15 2

6 19.15 21.75 2

𝑥𝑖 𝐿𝑖 𝐿𝑠 𝑛𝑖

1 5.55 7.15 4

2 7.15 8.75 6

3 8.75 10.35 11

4 10.35 11.95 2

5 11.95 13.55 5

6 13.55 15.15 2

Page 10: Distribución Conjunta de Dos Variables

Distribución Conjunta de Dos Variables

010 ASTURIAS CORPORACIÓN UNIVERSITARIA® Nota Técnica preparada por Asturias Corporación Universitar ia. Su difusión, reproducción o uso total o parcial para cualquier otro propósito queda prohibida. Todos los derechos reservados.

Luego la tabla de frecuencias absolutas de la distribución conjunta es:

Así, la tabla de frecuencias relativas de la distribución conjunta es:

(𝒀|𝑿)

[𝟔. 𝟏𝟓, −𝟖. 𝟕𝟓)

[𝟖. 𝟕𝟓 − 𝟏𝟏. 𝟑𝟓)

[𝟏𝟏. 𝟑𝟓 − 𝟏𝟑. 𝟗𝟓)

[𝟏𝟑. 𝟗𝟓 − 𝟏𝟔. 𝟓𝟓)

[𝟏𝟔. 𝟓𝟓 − 𝟏𝟗. 𝟏𝟓)

[𝟏𝟗. 𝟏𝟓 − 𝟐𝟏. 𝟕𝟓)

[5.55

− 7.15)

[7.15

− 8.75)

[8.75

− 10.35)

[10.35

− 11.95)

[11.95

− 13.55)

[13.55

− 15.15)

0 1 5 0 0 1

2 4 0 0 2 0

2 1 3 0 2

0 0 1 0 1 0

0 0 2 0 0 0

0 0 0 2 0 0

Page 11: Distribución Conjunta de Dos Variables

Distribución Conjunta de Dos Variables

011 ASTURIAS CORPORACIÓN UNIVERSITARIA® Nota Técnica preparada por Asturias Corporación Universitar ia. Su difusión, reproducción o uso total o parcial para cualquier otro propósito queda prohibida. Todos los derechos reservados.

Las tablas de frecuencias acumuladas se dejan como ejercicios para el lector.

Ejemplo 3: Dados los datos del ejemplo 1 calculemos algunas frecuencias condicionales.

𝒇(𝒚 = 𝟑/𝒙 = 𝟒) =𝒇(𝒚=𝟑 ⋀ 𝒙=𝟒)

𝒇(𝒙=𝟒)=

𝟑

𝟏𝟑= 𝟎. 𝟐𝟑.

Indica que el 23% de las familias que tienen 3 personas produciendo están compuestas por 4 miembros.

𝒇(𝒚 = 𝟐/𝒙 = 𝟔) =𝒇(𝒚=𝟐 ⋀ 𝒙=𝟔)

𝒇(𝒙=𝟔)=

𝟓

𝟏𝟕= 𝟎. 𝟐𝟗.

Indica que el 23% de las familias que tienen 3 personas produciendo están compuestas por 4 miembros.

5 Independencia

La independencia viene a medir la información que arroja sobre una de las variables el conocimiento que se tiene de la otra variable. Así, una información total implica dependencia funcional, la nula información independencia, y una información parcial dependencia estadística. Formalmente, se dice que 𝑋 es independiente de 𝑌 si se verifica que:

𝑓𝑖|𝑗= 𝑓𝑖 , 𝑝𝑎𝑟𝑎 𝑡𝑜𝑑𝑜 𝑖 = 1,2, … , 𝑟; 𝑗 = 1,2, … , 𝑠

(𝑌|𝑋) [5.55

− 7.15)

[7.15

− 8.75)

[8.75

− 10.35)

[10.35

− 11.95)

[11.95

− 13.55)

[13.55

− 15.15)

[6.15, −8.75) 0 0.033 0.166 0 0 0.033

[8.75

− 11.35) 0.066 0.133 0 0 0.066 0

[11.35

− 13.95) 0.066 0.033 0.1 0 0.066

[13.95

− 16.55) 0 0 0.033 0 0.066 0

[16.55

− 19.15) 0 0 0.066 0 0 0

[19.15

− 21.75) 0 0 0 0.066 0 0

“Información total: dependencia funcional.

Nula información: independencia

Información parcial: dependencia estadística”

Page 12: Distribución Conjunta de Dos Variables

Distribución Conjunta de Dos Variables

012 ASTURIAS CORPORACIÓN UNIVERSITARIA® Nota Técnica preparada por Asturias Corporación Universitar ia. Su difusión, reproducción o uso total o parcial para cualquier otro propósito queda prohibida. Todos los derechos reservados.

Es decir, si la frecuencia condicionada coincide con la marginal. De la misma forma se define la independencia de 𝑌 respecto de 𝑋. La definición de distribución condicionada da una expresión alternativa para la independencia, y así 𝑋 e 𝑌 son independientes si:

𝑓𝑖𝑗 = 𝑓𝑖 ∙ 𝑓𝑖 , 𝑝𝑎𝑟𝑎 𝑡𝑜𝑑𝑜 𝑖, 𝑗.

𝑋 depende funcionalmente de 𝑌, puesto que conocido el valor de 𝑌 queda determinado el de 𝑋, pero el recíproco no se da, puesto que si 𝑋 toma el valor 𝑥1, 𝑌 puede tomar el valor 𝑦1 o 𝑦3.

6 Medidas de Dependencia

Los términos asociación, correlación, contingencia, concordancia y otros similares, se suelen utilizar como equivalentes muy a menudo. No obstante, haciendo un uso más correcto de la terminología estadística, aún con significado semejante, se puede considerar:

Correlación de variables propiamente dichas, o sea, medidas en escala de intervalo.

Concordancia de ordenaciones, entendiéndose como tales las denominadas variables ordinales.

Asociación o contingencia de variables nominales o atributos. Así, para clasificar los coeficientes que detectan y miden el grado de relación, o

dependencia estadística, se tiene en cuenta el tipo y la naturaleza de las variables sometidas a estudio”

7 Resumen

Distribuciones condicionadas: cuando se considera la distribución de una variable para un valor fijo de la otra.

La frecuencia absoluta es el número de veces que se observa dicho par de valores.

La frecuencia relativa el cociente entre las frecuencias absolutas y el tamaño de la muestra.

8 Referencias Bibliográficas

Montgomery, D. C y Runger, R. (2008). Probabilidad y Estadística Aplicadas a la Ingeniería. 2da. Edición. Limusa Wiley. Mexico.

Page 13: Distribución Conjunta de Dos Variables

Distribución Conjunta de Dos Variables

013 ASTURIAS CORPORACIÓN UNIVERSITARIA® Nota Técnica preparada por Asturias Corporación Universitar ia. Su difusión, reproducción o uso total o parcial para cualquier otro propósito queda prohibida. Todos los derechos reservados.

Rincón. L. (2010). Curso Elemental de Probabilidad y Estadística. 1ra Edición. Circuito Exterior de CU. México D.F.

Walpole, R. E., Myers, R. H., Myers,S. L. y Ye, K. (2007). Probabilidad y Estadística para Ingeniería y Ciencias. 8va. Edición. Pearson. Mexico

I. Espejo Miranda, F. Fernández Palacín, M. A. López Sánchez, M. Muñoz Márquez, A. M. Rodríguez Chía, A. Sánchez Navas, C. Valero Franco. (2006). Estadística Descriptiva y Probabilidad. 3ra. Edición. Servicio de Publicaciones de la Universidad de Cádiz.

Devore, J. (2008). Probabilidad y Estadística para Ingeniería y Ciencias. 7ma. Edición. Cengace Learning Editores. México

Canavos, G. Probabilidad y Estadística. Métodos y Aplicaciones.

Daniel, W. (2009). Bioestadística. Base para el análisis de las ciencias de la salud. Cuarta edición. Limusa Wiley. México.

Mendenhall, W., Wackerly, D. y Scheaffer, R. (1994). Estadística Matemática con Aplicaciones. Grupo Editorial Iberoamericana. México.