Ejercicios Resueltos Coeficiente de Correlacion

13
10.2 Ejercicios de estadística, covarianza, correlación y recta de regresión Ejercicios de estadística, problemas de distribuciones bidimensionales. Covarianza, coeficiente de correlación entre las variables y ecuación de las recta de regresión. Ejercicios resueltos 1. Una compañía de seguros considera que el número de vehículos (y) que circulan por una determinada autopista a más de 120 km/h , puede ponerse en función del número de accidentes (x) que ocurren en ella. Durante 5 días obtuvo los siguientes resultados: Ejercicios estadística Accidentes x i 5 7 2 1 9 Vehículos y i 15 18 10 8 20 a) Calcula el coeficiente de correlación lineal. b) Si ayer se produjeron 6 accidentes, ¿cuántos vehículos podemos suponer que circulaban por la autopista a más de 120 km / h? c) ¿Es buena la predicción? Construimos una tabla con las columnas necesarias Vemos las fórmulas que tenemos que aplicar para saber las columnas que necesitamos, a continuación se explica la forma de hacer esto.

description

Practica

Transcript of Ejercicios Resueltos Coeficiente de Correlacion

Page 1: Ejercicios Resueltos Coeficiente de Correlacion

10.2  Ejercicios de estadística, covarianza, correlación y recta de regresión

Ejercicios de estadística, problemas de distribuciones bidimensionales. Covarianza, coeficiente de correlación entre las variables y ecuación de las recta de regresión.

Ejercicios resueltos

1. Una compañía de seguros considera que el número de vehículos (y) que circulan por una determinada autopista a más de 120 km/h , puede ponerse en función del número de accidentes (x) que ocurren en ella. Durante 5 días obtuvo los siguientes resultados:

Ejercicios estadísticaAccidentes xi 5 7 2 1 9Vehículos yi 15 18 10 8 20

a) Calcula el coeficiente de correlación lineal.b) Si ayer se produjeron 6 accidentes, ¿cuántos vehículos podemos suponer que circulaban por la autopista a más de 120 km / h?c) ¿Es buena la predicción?

Construimos una tabla con las columnas necesarias

Vemos las fórmulas que tenemos que aplicar para saber las columnas que necesitamos, a continuación se explica la forma de hacer esto.

Page 2: Ejercicios Resueltos Coeficiente de Correlacion
Page 3: Ejercicios Resueltos Coeficiente de Correlacion

2. Las calificaciones de 40 alumnos en psicología evolutiva y en estadística han sido las de la tabla adjunta.

Psicología xi 3 4 5 6 6 7 7 8 10Estadística yi 2 5 5 6 7 6 7 9 10

Nº de alumnos fi 4 6 12 4 5 4 2 1 2

a) Obtener la ecuación de la recta de regresión de calificaciones de estadística respecto de las calificaciones de psicología.b) ¿Cuál será la nota esperada en estadística para un alumno que obtuvo un 4,5 en psicología?

Page 4: Ejercicios Resueltos Coeficiente de Correlacion

Construimos una tabla con las columnas necesarias

Page 5: Ejercicios Resueltos Coeficiente de Correlacion

3. Las notas obtenidas por 10 alumnos en Matemáticas y en Música son:Matemáticas xi 6 4 8 5 3,5 7 5 10 5 4

Música yi 6,5 4,5 7 5 4 8 7 10 6 5

•  Calcula la covarianza y el coeficiente de correlación.•  ¿Existe correlación entre las dos variables?•  ¿Cuál será la nota esperada en Música para un alumno que hubiese obtenido un 8,3 en Matemáticas?

Page 6: Ejercicios Resueltos Coeficiente de Correlacion

Ejemplo 2.- Se representa por X el número de hijos de 100 familias y por Y el número de hijas:

  nº hijas (Y) 0 1 2 3

nº hijos (X) ----------- -- -- -- --

0 ----------- 10 15 15 3

1 ---------- 10 12 7 2

2 ---------- 8 4 3 1

3 ---------- 3 2 1 0

4 ---------- 2 1 1 0

La lectura de esta tabla es sencilla. Por ejemplo: habría 7 familias que tendrían 1 hijo y 2 hijas y ninguna familia tendría 3 hijos y 3 hijas.

En realidad la tabla de doble entrada anterior se convertiría en una tabla simple si escribiéramos los 100 pares de valores iguales o repetidos en una tabla simple.

Los ejemplos con que vamos a trabajar este tema serán del primer tipo por razones de limitación a la hora de visualizar más número de valores en las escenas. Esto no limita las posibilidades de estudiar el tema y entender los conceptos básicos.

Page 7: Ejercicios Resueltos Coeficiente de Correlacion

Para el ejemplo del grafico (año base 1990 = 0)La tabla indica cuanto se gasto en comprar medicinas en una Farmacia por año.

Años (X) 0 1 2 3 4 5 6 7 8 9Gasto (Y) 489.2

5475.24 495.72 585.

2565.78 630.22 624.92 482.27 590.27 834.67

Conoce qué indica cada valor aparecido en los resultados de un hemograma, y qué significa si sus niveles son altos, bajos o normales:

HEMATÍESMás conocidos como glóbulos rojos, son las células sanguíneas más importantes, ya que se encargan de transportar el oxígeno al resto de las células del organismo.

Niveles normales: 4.500.000-5.900.000 /ml en varones                             4.000.000-5.200.000/ml en mujeres

Niveles bajos: el número de hematíes desciende de forma importante cuando hay hemorragias (por ejemplo a causa de menstruaciones abundantes), y esto hace que no llegue suficiente oxígeno a las demás células del cuerpo, que es lo que se conoce como anemia. Todas las células sanguíneas se producen en la médula ósea, por lo que los fallos del recuento celular pueden reflejar una alteración a este nivel.

Niveles altos: un aumento del número de hematíes se conoce comopoliglobulia; este proceso hace que la sangre sea más espesa de lo normal, lo que facilita la formación de trombos en el interior de los vasos sanguíneos. Puede ser de causa desconocida o bien deberse a una hiperfunción excesiva de la médula ósea.El consumo de tabaco reduce la cantidad de oxígeno presente en la sangre, y esto tiene como consecuencia un incremento de la producción de glóbulos rojos, por lo que un número elevado de hematíes puede también estar relacionado con eltabaquismo.En general, ante una disminución del oxígeno en la sangre, el organismo suele responder elaborando más glóbulos rojos, por lo que las personas que viven en zonas muy elevadas pueden presentar un mayor número de hematíes sin que esto signifique que padezcan alguna enfermedad.

Volver arriba

HEMOGLOBINA (Hb)Es una proteína formada de hierro, que se encuentra en el interior del hematíe, y que es la causante del color rojo de la sangre. Cada hematíe suele contener entre 200 y 300 moléculas de hemoglobina. Es gracias a la hemoglobina que el oxígeno y los nutrientes llegan al resto de los tejidos del cuerpo. También transporta el dióxido de carbono a los pulmones para que se exhalado.

Niveles normales: 13,5-17,5 g/dl en hombres.                             12-16 g/dl en mujeres.

Niveles bajos: como la cantidad de hemoglobina es proporcional al número de glóbulos rojos (hematíes), un descenso de esta proteína se refleja en una ineficacia de la función de los hematíes, lo que viene a llamarse anemia.

Niveles altos: la elevación de esta proteína puede contribuir a la aparición de poliglobulia, un aumento de la cantidad de hematíes que puede provocar trombos. También pueden aparecer niveles elevados en personas con cardiopatías, problemas pulmonares crónicos o gente que vive en zonas de mucha altitud.

Volver arriba

HEMATOCRITO (Hto)Es el volumen de hematíes en sangre expresado como un porcentaje sobre el volumen sanguíneo total.

Niveles normales: 41-53% en hombres                             36-46% en mujeres

Page 8: Ejercicios Resueltos Coeficiente de Correlacion

Niveles bajos: debido a que, en realidad, este parámetro indica el número de hematíes, la causa principal de un descenso del hematocrito es la anemia. Otros motivos pueden ser: hemorragias, embarazo, problemas en la médula ósea,leucemia, hipertiroidismo...

Niveles altos: un incremento del nivel de hematocrito puede estar producido porproblemas cardiacos, falta de hidratación, enfermedades pulmonares crónicas...

Volver arriba

Volumen corpuscular medio (VCM)Este índice determina el tamaño medio de los hematíes. De este modo, se pueden clasificar las anemias en: macrocíticas o microcíticas, dependiendo de si el tamaño del hematíe es mayor o menor de lo habitual.

Niveles normales: 88-100 fL (femtolitros por hematíe). Niveles altos: el VCM alto (glóbulos rojos grandes) puede tener su origen en un déficit

de vitamina B12   o de ácido fólico, trastornos del hígado o consumo de alcohol, y no permanece constante a lo largo de toda la vida; en los recién nacidos es más elevado.

Niveles bajos: pueden estar originados por anemias o incluso talasemias(alteración de la hemoglobina).

Volver arriba

HCM (hemoglobina corpuscular media)Este parámetro indica la cantidad media de hemoglobina que contiene cada hematíe o glóbulo rojo.

Gracias a este parámetro se pueden clasificar las anemias de otra forma diferente: lashipocrómicas son las que cursan con un bajo nivel de HCM, y las hipercrómicas las que tienen un alto nivel de HCM.

Niveles normales: entre 27 y 33 pc (picogramos). Niveles bajos: lo más común es que exista anemia por falta de hemoglobina (normalmente

por déficit de hierro). Niveles altos: son raros los casos de anemias hipercrómicas. Pueden alertar de un déficit

de vitamina B12 o ácido fólico.Volver arriba

LEUCOCITOSSe llaman también glóbulos blancos, y desempeñan una función de defensa del organismo frente a las agresiones externas. Debido a esta función, un nivel bajo de leucocitos predispone al paciente a padecer infecciones.Existen varios tipos diferentes de leucocitos, que se explican a continuación:Linfocitos: es un tipo de leucocito que carece de gránulos. Son células muy importantes en el sistema inmune, ya que son capaces de responder ante agentes desconocidos para el organismo.

Niveles normales: 1.300-4.000 /ml Niveles altos: el aumento del número de linfocitos se denomina linfocitosis. Aparece en

procesos infecciosos agudos, crónicos, alergias farmacológicas y procesos linfoproliferativos como la leucemia.

Niveles bajos: la disminución del número de linfocitos se llama linfopenia, y es habitual encontrarla en personas cuyo sistema inmune es defectuoso o están siguiendo un tratamiento inmunosupresor (quimioterapia).

Neutrófilos: es un tipo de leucocito que contiene gránulos y que se tiñe fácilmente con colorantes neutros. Se encargan de destruir bacterias, restos celulares y partículas sólidas.

Niveles normales: 2.000-7.500 /ml Niveles altos: el número elevado de neutrófilos (neutrofilia) aparece ante infecciones, procesos

inflamatorios, quemaduras, hemorragias agudas,tabaquismo, y golpe de calor. Se puede asociar también a procesos en los que se produce la muerte de las células de algún tejido, como el infarto de miocardio.

Niveles bajos: se denomina neutropenia al descenso de la cifra de neutrófilos, que hace que el paciente tenga una especial vulnerabilidad para contraer infecciones, incluso las más insignificantes.

Eosinófilos: es un tipo de leucocito que presenta gran número de gránulos en su interior y que se tiñen con tinciones ácidas.

Niveles normales: 50-500 /ml Niveles altos: la eosinofilia (aumento del número de estas células) puede indicar la presencia

de alergias, asma, parásitos e infecciones. También se asocia a enfermedades intestinales como Crohn y celiaquía, y a enfermedades pulmonares (Löffler).

Niveles bajos: el descenso del número de eosinófilos es raro.

Page 9: Ejercicios Resueltos Coeficiente de Correlacion

Volver arriba

PLAQUETASSon los elementos más pequeños de la sangre, y resultan esenciales para la coagulación sanguínea, ya que se encargan de cerrar los vasos sanguíneos, haciendo que la sangre se coagule para taponar las lesiones cuando se produce una herida.

Niveles normales: entre 150.000-400.000/ mm3. Niveles bajos: el recuento plaquetario inferior a lo normal es lo que se conoce

como trombocitopenia. Puede deberse a un acúmulo anormal de plaquetas en el bazo o a una mala función de la médula ósea. Tiene como consecuencia la mala coagulación sanguínea, lo que dará lugar a hemorragias (nasales, de encías, hematomas en la piel, sangre en orina y en heces…). Existe una enfermedad del sistema inmunitario, la púrpura trombocitopénica idiopática, que se caracteriza por la formación de anticuerpos que destruyen las plaquetas, al no reconocerlas el organismo como propias.

Niveles altos: el número elevado de plaquetas en sangre, se denomina trombocitosis, y puede originar la formación de trombos dentro de las arterias. Puede aparecer sin causa justificada, como reacción ante una hemorragia aguda o ciertas enfermedades, o bien debido a un mal funcionamiento medular.

Volver arriba

Velocidad de segmentacion globular (VSG)Este parámetro mide la velocidad a la que sedimentan los glóbulos rojos de la sangre en un tiempo determinado (1-2 horas).

Niveles normales: entre 0 y 10 mm/hora en hombres y entre 0 y 20 mm/h en mujeres. Niveles altos: son muchos los procesos que pueden cursar con un aumento del VSG, como el

mieloma, los linfomas, las leucemias, y los procesos inflamatorios crónicos como la artritis reumatoide o el lupus. Pero su elevación no indica necesariamente una patología, ya que también se eleva en algunos procesos fisiológicos como el embarazo, la menstruación o en los ancianos.

Niveles bajos: la VSG raramente suele estar disminuida. Sin embargo, es dato útil en el seguimiento de pacientes, ya que si la VSG se reduce sugiere que el tratamiento impuesto está siendo eficaz.

El número de peruanos (en miles) ocupados en Farmacias para los años que se indican, es:Año base 2007

Año 0 1 2 3 4 5 6 7

Ocupados 2,1 2,04 1,96 1,74 1,69 1,49 1,25 1,16

Hallar el coeficiente de correlación.

Durante su primer año de vida han pesado a un paciente cada mes. En la tabla siguiente se dan sus pesos:

X 1 2 3 4 5 6 7 8 9 10 11 12Y 3,2 3,7 4,2 5,3 5,7 6,5 6,8 7,2 7,9 7,7 8 8,5 En esta tabla, X representa la edad en meses e Y el peso en kilogramos.Hallar el coeficiente de correlación.

Page 10: Ejercicios Resueltos Coeficiente de Correlacion

La altura, en cm, de 8 padres y del mayor de sus hijos varones son:

Padre 170 173 178 167 171 169 184 168 172 174 175

Hijo 172 177 175 170 178 169 180 171 173 186 187

Hallar el coeficiente de correlación

EJEMPLO: A continuación se desarrollara un ejemplo práctico que se irá explicando a través de los tópicos de regresión y correlación a tratarse. Los datos de la siguiente tabla representan las alturas (X) y los pesos (Y) de varios hombres. Se escogieron las alturas de antemano y se observaron los pesos de un grupo de hombres al azar que tenian las alturas escogidas, resultando:

X(cm) 152 155 152 155 157 152 157 165 162 178 183 178 Y(kg) 50 61.5 54.5 57.5 63.5 59 61 72 66 72 84 82 Se asume que existe una relación funcional entre X e Y, obtener la ecuación de regresión.

Los datos de la siguiente tabla representan las estaturas (X, cm) y los pesos (Y, kg) de una muestra de 12 hombres adultos. Para cada estatura fijada previamente se observó el peso de una persona seleccionada de entre el grupo con dicha estatura, resultando:

X 152 155 152 155 157 152 157 165 162 178 183 178

Y 50 61.5

54.5

57.5

63.5

59 61 72 66 72 84 82

Con estos datos vamos a plantear una ecuación de regresión simple que nos permita pronosticar los pesos conociendo las tallas. Utilizaremos a = 0.05, y contrastaremos nuestra hipótesis con la prueba F.

Problema 01En la siguiente tabla se recogen las alturas y los pesos de diez alumnos de un instituto:

X=Peso 74 62 84 64 80 78 80 80 58 73

Y=Altura 1.93 1.80 1.72 1.75 1.90 1.82 1.93 1.85 1.63 1.70

i) Calcula el coeficiente de correlación e interprétalo

Page 11: Ejercicios Resueltos Coeficiente de Correlacion