Regresión lineal 41A22

16
Regresión lineal PROBABILIDAD Y ESTADÍSTICA

Transcript of Regresión lineal 41A22

Regresión linealPROBABILIDAD Y ESTADÍSTICA

Análisis de regresión

Técnica estadística para estudiar la relación entre una variable dependiente y unao más independientes.

Genera una ecuación para describir la relación estadística entre uno o máspredictores y la variable de respuesta.

Usualmente, es útil para predecir nuevas observaciones.

Generalmente, utiliza el método de estimación de mínimos cuadradosordinarios, del cual se obtiene la ecuación al minimizar la suma de los residuoscuadrados.

¿Cuál es la variable respuesta?• Grosor de una torta, tiempo de horneado, temperatura del horno.

• Género, hábito de consumo de bebidas alcohólicas.

• Humedad del suelo, Toneladas de café para exportar.

• Género, horas de estudio a la semana, nota del parcial.

Diagrama de dispersión

Fuente: http://support.minitab.com

Relación lineal

Relación lineal positiva Relación lineal negativa

Fuente: http://support.minitab.com

Análisis de regresión lineal

SIMPLE

Examina la relación lineal entre dos variablescontinuas: una respuesta (Y) y un predictor (X).

Cuando las dos variables están relacionadas,es posible predecir un valor de respuesta apartir de un valor predictor con mayorexactitud.

Simple = Una variable independiente.

MÚLTIPLE

La regresión lineal múltiple examina lasrelaciones lineales entre una respuestacontinua y dos o más predictores.

Ejemplo 1A continuación se muestran las estaturas encentímetros de 10 estudiantes de Probabilidady Estadística y su peso en kilogramos.

1. ¿Cuál es la variable respuesta?

2. Hallar la ecuación de la recta de regresiónde la estatura sobre el peso.

3. ¿Cuál sería el peso aproximado de unaestudiante que mida 172 cm?

Estatura Peso

162 50

160 50

158 48

168 55

170 56

165 52

160 51

162 51

168 56

164 52

Ejemplo 2En la tabla se muestra el número de horastrabajadas de seguido por un empleado y elnúmero de piezas producidas en determinadotaller de confecciones.

1. ¿Cuál es la variable respuesta?

2. Hallar la ecuación de la recta de regresión.

3. ¿Cuántas piezas produciría aproximadamenteun empleado que trabaje 5 horas seguidas?

No. Horas No. Piezas

2 12

3 20

2 10

4 25

2 12

2 11

3 18

3 20

4 24

4 25

Ejercicio (1)Identifique la variable independiente y la variable dependiente en lossiguientes casos:

El tiempo que tarda un equipo de trabajo en la elaboración del proyecto final yla nota obtenida.

La estatura del hijo y la estatura del padre.

La edad de una mujer y el costo de la medicina prepagada.

El precio de un producto de catálogo y el número de unidades vendidas.

La demanda de un producto y el número de consumidores en el mercado.

Ejercicio (2)Una aerolínea muestra a continuación el dinero invertido en publicidad en 15 mesesobservados y el número de pasajeros. Los datos se muestran en miles de dólares y enmiles de personas respectivamente.

Publicidad Pasajeros Publicidad Pasajeros

10 15 14 20

12 17 19 24

8 13 10 17

17 23 11 16

10 16 13 18

15 21 16 23

10 14 10 15

12 16 - -

1. Identifique la variable dependientey la variable independiente.

2. Hallar la ecuación de la recta deregresión.

3. ¿Cuántos pasajeros espera tener lacompañía si realiza una inversiónde US$9500 en el próximo mes?

Coeficiente de Correlación

La función de este coeficiente es obtener una medida de fuerza de la relación que existe entre las variables, desarrollado por Carl Pearson.

Representado por r, el coeficiente de correlación puede asumir cualquier valor entre -1 y +1; es decir :

−𝟏 ≤ 𝒓 ≤ +𝟏

Un valor de r=-1 indica una relación negativa perfecta entre X y Y

r=+1 indica una relación positiva perfecta entre X y Y

|r| ≈ 1 indica una relación fuerte pero menos perfecta entre X y Y

|r|≈ 0 indica muy poco o ninguna relación entre X y Y

Posibles valores para el coeficiente de correlación r…

Coeficiente de determinaciónProporciona una medida de bondad de ajuste porque revela qué porcentaje del cambio en Y seexplica por un cambio en X.

Se representa por 𝑟2 y se obtiene elevando al cuadrado el coeficiente de correlación dePearson.

Ejemplo En el caso de las variables pasajeros y cantidad de dinero invertido en finespublicitarios nos arroja los siguientes datos:

𝑟 = 0.9683𝑟2 = 0.9683 2 = 0.94

Estos nos indica una relación fuerte entre los pasajeros y la cantidad de dineroinvertido en fines publicitarios; y que el 94% del cambio en el número depasajeros se explica mediante un cambio en la publicidad.

Ejercicio (1)En el caso de las variables estatura y peso de los estudiantes de Probabilidad yestadística.

Calcule e interprete los coeficientes de correlación y determinación.

Ejercicio (2)En el caso de las variables horas trabajadas y número de piezas producidas porun empleado.

Calcule e interprete los coeficientes de correlación y determinación.