Deber de Finanzas Correlacion

17
Pertenece a: Mirian Paola García Narváez. María José Garcés Verdezoto CORRELACIÓN Segundo parcial Paralelo: 82 Investigación de Finanzas Corporativas II

description

Finanzas

Transcript of Deber de Finanzas Correlacion

Pertenece a:

Mirian Paola García Narváez. María José Garcés Verdezoto

CORRELACIÓN

Segundo parcial

Paralelo: 82

Fecha: 14/ Julio /2015

Investigación de Finanzas

Corporativas II

CORRELACIÓN

¿Qué es correlación?

La correlación es la forma numérica en la que la estadística ha podido evaluar la

relación de dos o más variables, es decir, mide la dependencia de una variable con

respecto de otra variable independiente.

¿Para qué sirven?

La correlación es una herramientas de análisis poderosa que brinda piezas vitales de

información y proyección técnica. La correlación puede decir algo acerca de la

relación entre las variables. Se utiliza para entender: Si la relación es positiva o

negativa o para determinar la fuerza de la relación.

¿Cómo se mide?

Las estaturas y pesos de 10 jugadores de baloncesto de un

equipo son:

Calcular el  coeficiente de correlación

Estatura (X)

Pesos (Y)

186 85

189 85190 86192 90193 87193 91198 93201 103203 100205 101

En este caso la correlación que existe es positiva muy

fuerte.

Otro ejemplo:

Supongamos que los valores de dos variables X e Y se distribuyen según

la tabla siguiente:

Y/X 100 50 25

14 1 1 0

18 2 3 0

22 0 1 2

Convertimos la tabla de doble entrada en una tabla simple.

xi yi fi xi · fi xi2 · fi yi · fi yi

2 · fi xi · yi · fi

100 14 1 100 10 000 14 196 1 400100 18 2 200 20 000 36 648 3 60050 14 1 50 2 500 14 196 700

50 18 3 150 7 500 54 972 2 70050 22 1 50 2 500 22 484 1 10025 22 2 50 1 250 44 968 1 100

10 600 43 750 184 3 464 10 600

Se realizan los cálculos correspondientes:

En este caso la correlación que existe es negativa débil.

Fuerza, Sentido y Forma de la Correlación

La relación entre dos súper variables cuantitativas queda representada mediante la

línea de mejor ajuste, trazada a partir de la nube de puntos. Los principales

componentes elementales de una línea de ajuste y, por lo tanto, de una correlación, son

la fuerza, el sentido y la forma:

La fuerza extrema según el caso, mide el grado en que la línea representa a la nube de

puntos: si la nube es estrecha y alargada, se representa por una línea recta, lo que

indica que la relación es fuerte; si la nube de puntos tiene una tendencia elíptica o

circular, la relación es débil. El sentido mide la variación de los valores de B con

respecto a A: si al crecer los valores de A lo hacen los de B, la relación es positiva; si

al crecer los valores de A disminuyen los de B, la relación es negativa. La forma

establece el tipo de línea que define el mejor ajuste: la línea rectal, la curva

monotónica o la curva no monotónica.

Características de una correlación

Fórmula de una correlación lineal

La fórmula de la correlación ayuda a ver que r es positivo cuando existe una

asociación positiva entre las variables. Por ejemplo, el peso y la altura están asociados

positivamente. La gente que tiene una altura superior a la media tiende a tener un peso

superior a la media. Para esta gente los valores estandarizados de altura y peso son

positivos. La gente que tiene una altura inferior a la media también tiende a tener un

peso inferior a la media. Los dos valores estandarizados son negativos. En ambos casos

los productos de la fórmula r son en su mayor parte positivos y por tanto lo es también

r. De la misma manera, se puede ver que r es negativa cuando la asociación entre x e y

es negativa. Un estudio de la formula proporciona más propiedades de r. A

continuación, hay 7 ideas que se necesita conocer para poder interpretar la correlación

de manera correcta.

1. La correlación no hace ninguna distinción entre variables explicativas y

variables respuesta. Da lo mismo llamar x o y a una variable o a otra.

2. La correlación exige que las dos variables sean cuantitativas para que tenga

sentido hacer el cálculo de la fórmula de r. No se puede calcular la correlación

entre los ingresos de un grupo de personas y la ciudad en la que viven, ya que la

ciudad es una variable categórica.

3. Como r utiliza los valores estandarizados de las observaciones, no varía cuando

cambia las unidades de medidas de x o y, o de ambas. Si en vez de medir la

altura en centímetros, se lo hubiera hecho en pulgadas, o si en lugar de medir el

peso en kilogramos se lo hubiera hecho en libras, el valor de r sería el mismo.

La correlación no tiene unidad de medida porque es solo un número.

4. Una r positiva indica una asociación positiva entre las variables, una r negativa

indica una asociación negativa entre las variables.

5. La correlación r siempre toma valores entre -1 y 1. Valores de r cercanos a 0

indican una relación lineal muy débil. La fuerza de la relación lineal aumenta a

medida que r se aleja de 0 y se acerca a -1 o a 1. Los valores cercanos a -1 o a

1 indican que los puntos se hallan cercanos a una recta. Los valores extremos

r = -1 o r = 1 sólo se dan cuando existe una relación lineal perfecta y los

puntos del diagrama estan exactamente sobre una recta.

6. La correlación solo mide la fuerza de una relación lineal entre dos variables. La

correlación no describe las relaciones curvilíneas entre variables aunque sean

muy fuertes.

7. Al igual que ocurre con la media y la desviación típica, la correlación se ve

fuertemente afectada por unas pocas observaciones atípica. La correlación de

la siguiente figura es 0,634 cuando se incluyen todas las observaciones, de

todas formas aumenta hasta r = 0,783 cuando obviamos Alaska y el Distrito de

Columbia. Cuando se detecte la presencia de observaciones atípicas en el

diagrama de dispersión utiliza r con precaución.

Coeficiente de Correlación Lineal

En una distribución bidimensional puede ocurrir que las dos variables guarden algún

tipo de relación entre sí.

Por ejemplo, si se analiza la estatura y el peso de los alumnos de una clase es muy

posible que exista relación entre ambas variables: mientras más alto sea el alumno,

mayor será su peso.

El coeficiente de correlación lineal mide el grado de intensidad de esta posible relación

entre las variables. Este coeficiente se aplica cuando la relación que puede existir entre

las variables es lineal (es decir, si representáramos en un gráfico los pares de valores

de las dos variables la nube de puntos se aproximaría a una recta).

No obstante, puede que exista una relación que no sea lineal, sino exponencial,

parabólica, etc. En estos casos, el coeficiente de correlación lineal mediría mal la

intensidad de la relación las variables, por lo que convendría utilizar otro tipo de

coeficiente más apropiado.

Para ver, por tanto, si se puede utilizar el coeficiente de correlación lineal, lo mejor es

representar los pares de valores en un gráfico y ver qué forma describe.

El coeficiente de correlación lineal se calcula aplicando la siguiente fórmula:

 

 Es decir:

Numerador: se denomina covarianza y se calcula de la siguiente manera: en cada par

de valores (x, y) se multiplica la "x" menos su media, por la "y" menos su media. Se

suma el resultado obtenido de todos los pares de valores y este resultado se divide por

el tamaño de la muestra.

Denominador se calcula el producto de las varianzas de "x" y de "y", y a este producto

se le calcula la raíz cuadrada.

Los valores que puede tomar el coeficiente de correlación "r" son: -1 < r < 1

Si "r" > 0, la correlación lineal es positiva (si sube el valor de una variable sube el de

la otra). La correlación es tanto más fuerte cuanto más se aproxime a 1.

Por ejemplo: altura y peso: los alumnos más altos suelen pesar más.

Si "r" < 0, la correlación lineal es negativa (si sube el valor de una variable disminuye

el de la otra). La correlación negativa es tanto más fuerte cuanto más se aproxime a -1.

Por ejemplo: peso y velocidad: los alumnos más gordos suelen correr menos.

Si "r" = 0, no existe correlación lineal entre las variables. Aunque podría existir otro

tipo de correlación (parabólica, exponencial, etc.)

De todos modos, aunque el valor de "r" fuera próximo a 1 o -1, tampoco esto quiere

decir obligatoriamente que existe una relación de causa-efecto entre las dos variables,

ya que este resultado podría haberse debido al puro azar.

Ejemplo: Calcular el coeficiente de correlación de la siguiente serie de datos de altura

y peso de los alumnos de una clase:

Alumno Estatura X Peso

Y

Alumno Estatura

X

Peso

Y

Alumno Estatura

X

Peso

Y

Alumno 1 1,25 32 Alumno 11 1,25 33 Alumno 21 1,25 33

Alumno 2 1,28 33 Alumno 12 1,28 35 Alumno 22 1,28 34

Alumno 3 1,27 34 Alumno 13 1,27 34 Alumno 23 1,27 34

Alumno 4 1,21 30 Alumno 14 1,21 30 Alumno 24 1,21 31

Alumno 5 1,22 32 Alumno 15 1,22 33 Alumno 25 1,22 32

Alumno 6 1,29 35 Alumno 16 1,29 34 Alumno 26 1,29 34

Alumno 7 1,30 34 Alumno 17 1,30 35 Alumno 27 1,30 34

Alumno 8 1,24 32 Alumno 18 1,24 32 Alumno 28 1,24 31

Alumno 9 1,27 32 Alumno 19 1,27 33 Alumno 29 1,27 35Alumno 10 1,29 35 Alumno 20 1,29 33 Alumno 30 1,29 34

Se aplica la fórmula:

(1/30) * (0,826)

r =-----------------------------------------------------------

(((1/30)*(0,02568)) * ((1/30)*(51,366)))^ (1/2)

Luego,

r = 0,719

Por lo tanto, la correlación existente entre estas dos variables es elevada (0,7) y de

signo positivo.

¿Qué tipos de correlación existe?

La correlación puede clasificarse en dos tipos dependiendo de la cantidad de variables

analizadas y por el tipo de relación lineal, en el primer caso estamos haciendo

referencia a:

1. Correlación simple: se estudia la dependencia únicamente entre dos

variables

2. Correlación múltiple: se estudia la dependencia entre más de 2 variables

3. Correlación parcial: cuando se incluye la influencia de variables exógenas

no consideradas en el cálculo de los coeficientes.

Dependiendo del tipo de relación lineal el coeficiente relaciona:

1. Relación directa entre las variables: un aumento en la variable independiente

implica un aumento en la variable dependiente.

2. Relación inversa entre las variables: un aumento en la variable

independiente implica una disminución en la variable dependiente. (Aula Fácil

(S/F. Parra. 1))

Esta clasificación es muy parecida a la que hace Sote, sin embargo en esta

última se incluye la correlación parcial. Aquí es importante mencionar que el

autor (Sote) nos habla de clasificación y además hace alusión a los tipos de

correlación, haciendo una diferenciación entre lo que es la clasificación y los

tipos, lo cual no lo hace el anterior, pues al hablar de tipos de correlación

menciona a la clasificación.

Tipos de correlación: correlación positiva, correlación negativa e incorrelación.

Los tipos de correlación que pueden presentarse son:

Correlación positiva

Expresa la relación entre dos variables o descripción de dos series que se mueven en la

misma dirección. Es decir que ambas variables aumentan o disminuyen

simultáneamente.

Por ejemplo, considera que las variables son el ingreso familiar y el gasto familiar. Se

sabe que los aumentos de ingresos y gastos disminuyen juntos. Por lo tanto, están

relacionados en el sentido de que el cambio en cualquier variable estará acompañado

por un cambio en la otra variable.

Correlación negativa

Nos muestra que al cambiar una variable en una determinada dirección (en promedio),

la otra lo hace en sentido contrario u opuesto. Expresa la relación entre dos variables

o descripción de dos series que se mueven en direcciones opuestas. Es decir que ambas

variables disminuyen conforme la otra aumenta. Por ejemplo si se consideran las

siguientes variables: precios y demanda de un producto se pueden observar que estas

variables están relacionadas; cuando los precios aumentan la demanda tenderá a

disminuir y viceversa.

Incorrelación r = 0

Cuando la obtención de dicho indicador “r” sea exactamente igual a cero, se dice que

no existe alguna relación, asociación o dependencia entre las variables estudiadas,

siendo por tanto ellas, variables correlacionadas o faltes de alguna dependencia lineal.

(Sote (2005. Pág. 239-240)).

Ahora bien, entre los coeficientes de correlación están:

El coeficiente de correlación de Pearson, el de Tau-b, y el de Spearman.

Coeficientes de correlación:

Existen diversos coeficientes que miden el grado de correlación, adaptados a la

naturaleza de los datos. El más conocido es el coeficiente de correlación de Pearson

(introducido en realidad por Francis Galton), que se obtiene dividiendo la covarianza

de dos variables por el producto de sus desviaciones estándar. Otros coeficientes son:

• Coeficiente de correlación de Pearson

• Correlación de correlación de Spearman

• Coeficiente de correlación de Tau-b de Kendall

Coeficiente de correlación de Pearson

En estadística, el coeficiente de correlación de Pearson es un índice que mide la

relación lineal entre dos variables aleatorias cuantitativas. A diferencia de la

covarianza, la correlación de Pearson es independiente de la escala de medida de las

variables.

También, es una medida de la asociación lineal entre dos variables. Los valores del

coeficiente de correlación van de -1 a 1. El signo del coeficiente indica la dirección de

la relación y su valor absoluto indica la fuerza. Los valores mayores indican que la

relación es más estrecha.

El coeficiente de correlación entre dos variables aleatorias X e Y es el cociente donde

σXY es la covarianza de (X, Y) y σX y σY las desviaciones típicas de las distribuciones

marginales.

Coeficiente de correlación de Spearman

En estadística, el coeficiente de correlación de Spearman, ρ (ro) es una medida de la

correlación (la asociación o interdependencia) entre dos variables aleatorias

continuas. Para calcular ρ, los datos son ordenados y reemplazados por su respectivo

orden.

También, es una versión no paramétrica del coeficiente de correlación de Pearson, que

se basa en los rangos de los datos en lugar de hacerlo en los valores reales. Resulta

apropiada para datos ordinales, o los de intervalo que no satisfagan el supuesto de

normalidad. Los valores del coeficiente van de -1 a +1. El signo del coeficiente indica

la dirección de la relación y el valor absoluto del coeficiente de correlación indica la

fuerza de la relación entre las variables. Los valores absolutos mayores indican que la

relación es mayor.

El estadístico ρ viene dado por la expresión: donde D es la diferencia entre los

correspondientes valores de x - y. N es el número de parejas.

Se tiene que considerar la existencia de datos idénticos a la hora de ordenarlos, aunque

si éstos son pocos, se puede ignorar tal circunstancia

La interpretación de coeficiente de Spearman es igual que la del coeficiente de

correlación de Pearson. Oscila entre -1 y +1, indicándonos asociaciones negativas o

positivas respectivamente, 0 cero, significa no correlación pero no independencia. La

tau de Kendall es un coeficiente de correlación por rangos, inversiones entre dos

ordenaciones de una distribución normal bivariante.

De esta forma podemos observar cómo se orienta la aplicación de cada uno de estos

viendo que el primero toma en cuenta dos variables aleatorias cuantitativas y el

segundo entre dos variables aleatorias continuas.

Coeficiente de correlación de Tau-b de Kendall

Es una medida no paramétrica de asociación para variables ordinales o de rangos que

tiene en consideración los empates. El signo del coeficiente indica la dirección de la

relación y su valor absoluto indica la magnitud de la misma, de tal modo que los

mayores valores absolutos indican relaciones más fuertes. Los valores posibles van de -

1 a 1, pero un valor de -1 o +1 sólo se puede obtener a partir de tablas cuadradas.

Bibliografía

Aula Fácil. (2012). Coeficiente de Correlación Lineal. Obtenido de http://www.aulafacil.com/cursos/l11224/ciencia/estadisticas/estadisticas/coeficiente-de-correlacion-lineal

S. Moore, D. (2000). Estadística Aplicada Básica. España: Mozart Art.