TRABAJO.pptx

29
 CORRELACION Y REGRESION SIMPLE ATALAYA VARGAS, David. GUERRERO MAR TINEZ, Jeiner . SANCHEZ PEÑA, Adriana.

Transcript of TRABAJO.pptx

REGRESIN SIMPLE Y CORRELACIN

CORRELACION Y REGRESION SIMPLEATALAYA VARGAS, David.GUERRERO MARTINEZ, Jeiner.SANCHEZ PEA, Adriana.INTRODUCCIN:El trmino regresin fue utilizado por primera vez como un concepto estadstico en 1877 por sir Francis Galton, quien llev a cabo un estudio que mostr que la estatura de los nios nacidos de padres altos tiende a retroceder o regresar hacia la estatura media de la poblacin. Design la palabra regresin como el nombre del proceso general de predecir una variable (la estatura de los nios) a partir de otra (la estatura del padre o de la madre). Ms tarde, los estadsticos acuaron el trmino regresin mltiple para describir el proceso mediante el cual se utilizan varias variables para predecir otra.En el anlisis de regresin, desarrollaremos una ecuacin de estimacin, esto es, una frmula matemtica que relaciona las variables conocidas con la variable desconocida. Despus de conocer el patrn de esta relacin, podremos aplicar el anlisis de correlacin para determinar el grado en el que las variables se relacionan. El anlisis de correlacin, entonces, nos indica qu tan bien la ecuacin de estimacin describe realmente la relacin.2OBJETIVOS:Cmo determinar la relacin entre variables.Utilizar diagramas de dispersin para visualizar la relacin entre dos variables.Emplear el anlisis de regresin para estimar la relacin entre dos variables.Aprender cmo el anlisis de correlacin describe el grado en el cual dos variables estn relacionadas linealmente entre s.Comprender el coeficiente de determinacin como una medida de la fuerza de la relacin entre dos variables.Conocer las limitaciones de la regresin y del anlisis de correlacin y las advertencias sobre su uso.

CONCEPTOS:REGRESIN: En el anlisis de regresin, desarrollaremos una ecuacin de estimacin, esto es, una frmula matemtica que relaciona las variables conocidas con la variable desconocida.CORRELACIN: El anlisis de correlacin es para determinar el grado en elque las variables se relacionan. El anlisis de correlacin, entonces, nos indica qu tan bien la ecuacin de estimacin describe realmente la relacin. Los anlisis de regresin y de correlacin se basan en la relacin, o asociacin, entre dos (o ms) variables. La variable (o variables) conocida(s) se llaman variable(s) independiente(s); la que tratamos de predecir es la variable dependiente.ANLISIS DE CORRELACINEl anlisis de correlacin es un grupo de tcnicas estadsticas usadas para medir la fuerza de la asociacin entre dos variables.Un diagrama de dispersin es una grfica que representa la relacin entre dos variables.La variable dependiente es la variable que se predice o calcula.La variable independiente proporciona las bases para el clculo. Es la variable de prediccin.

12-3el coeficiente de correlacin, r El coeficiente de correlacin (r) es una medida de la intensidad de la relacin lineal entre dos variables.Requiere datos de nivel de razn.Puede tomar cualquier valor de -1.00 a 1.00.Los valores de -1.00 o 1.00 indican la correlacin perfecta y fuerte.Los valores cerca de 0.0 indican la correlacin dbil.Los valores negativos indican una relacin inversa y los valores positivos indican una relacin directa.Correlacin negativa perfecta10 9 8 7 6 5 4 3 2 1 0 0 1 2 3 4 5 6 7 8 9 10 X YCorrelacin positiva perfecta10 9 8 7 6 5 4 3 2 1 0 0 1 2 3 4 5 6 7 8 9 10 X YCorrelacin cero10 9 8 7 6 5 4 3 2 1 0 0 1 2 3 4 5 6 7 8 9 10 Y XCorrelacin positiva fuerte Y X10 9 8 7 6 5 4 3 2 1 0 0 1 2 3 4 5 6 7 8 9 10Frmula para rCalculamos el coeficiente de correlacin de las frmulas siguientes.

COEFICIENTE DE DETERMINACIN, (r2) El coeficiente de determinacin (r2) es la proporcin de la variacin total en la variable dependiente (y) que se explica por la variacin en la variable independiente (x).Es el cuadrado del coeficiente de correlacin.Su rango es de 0 a 1.No da ninguna informacin sobre la direccin de la relacin entre las variables.

Ejemplo 1David, presidente de la sociedad de alumnos de la Universidad Nacional de Cajamarca, se ocupa de estudiar el costo de los libros de texto. l cree que hay una relacin entre el nmero de pginas en el texto y el precio de venta del libro. Para proporcionar una prueba, selecciona una muestra de ocho libros de texto actualmente en venta en la librera. Dibuje un diagrama de dispersin. Compruebe el coeficiente de correlacin.Ejemplo 1 (Continuacin) Libro Pginas Precio ($)Intr. a la Historia50084lgebra 70075Intr.a la Psicologa 80099Intr. a la Sociologa 60072Estatica 40069Intr. a la Biologa50081Dinamica 60063Analisis estructural 80093Ejemplo 1 (Continuacin)

Ejemplo 1 (Continuacin)Libro Pginas Precio ($) X Y XY X2Y2Intr. a la Historia 500 84 42,000 250,000 7,056lgebra 700 75 52,500 490,000 5,625Intr. a la Psicologa 800 99 79,200 640,000 9,801Intr. a la Sociologa 600 72 43,200 360,000 5,184Estatica 400 69 27,600 160,000 4,761Intr. a la Biologa 500 81 40,500 250,000 6,561Dinamica 600 63 37,800 360,000 3,969Analisis estructural 800 93 74,400 640,000 8,649 Total 4,900 636 397,200 3,150,000 51,606

Ejemplo 1 (Continuacin)

Ejemplo 1 (Continuacin)La correlacin entre el nmero de pginas y el precio de venta del libro es 0.614. Esto indica una asociacin moderada entre las variables. Pruebe la hiptesis de que no hay correlacin en la poblacin. Utilice un nivel de la significancia del .02.Paso 1: H0: La correlacin en la poblacin es cero. H1: La correlacin en la poblacin no es cero.Paso 2: H0 es rechazada si t>3.143 o si t