Estadistica Estudiantes Espol 2010

37
ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico Escuela Superior Politécnica del Litoral Instituto de Ciencias Matemáticas Ingeniería Electrónica y Telecomunicaciones Estadística (Ing)(B) Elaborado por: Andrés Sacoto Castro ([email protected]) Carlos Vélez Altamirano ([email protected]) Michael Azúa Gutiérrez ([email protected]) Guayaquil Ecuador Septiembre del 2010

Transcript of Estadistica Estudiantes Espol 2010

Page 1: Estadistica Estudiantes Espol 2010

ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico

ESPOL, Algunas Características de los Estudiantes de

Estadística para Ingenierías: Un Análisis Estadístico

Escuela Superior Politécnica del Litoral

Instituto de Ciencias Matemáticas

Ingeniería Electrónica y Telecomunicaciones

Estadística (Ing)(B)

Elaborado por:

Andrés Sacoto Castro ([email protected])

Carlos Vélez Altamirano ([email protected])

Michael Azúa Gutiérrez ([email protected])

Guayaquil – Ecuador

Septiembre del 2010

Page 2: Estadistica Estudiantes Espol 2010

ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico

Escuela Superior Politécnica del Litoral

Instituto de Ciencias Matemáticas

Ingeniería Electrónica y Telecomunicaciones

Estadística (Ing)(B)

Septiembre del 2010

Page 3: Estadistica Estudiantes Espol 2010

ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico

ESPOL, Algunas Características de los Estudiantes de

Estadística para Ingenierías: Un Análisis Estadístico

Elaborado por:

Andrés Sacoto Castro

Carlos Vélez Altamirano

Michael Azúa Gutiérrez

Dirigido por:

Ing. Sandra García

Guayaquil – Ecuador

Septiembre del 2010

Page 4: Estadistica Estudiantes Espol 2010

ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico

ESPOL, Algunas Características de los Estudiantes de Estadística para

Ingenierías: Un Análisis Estadístico

INDICE GENERAL

Contenido 1. Introducción............................................................................................................................... 5

2. Análisis Estadístico Univariado ................................................................................................... 5

3. Análisis Estadístico Bivariado .................................................................................................... 12

4. Estadística Inferencial............................................................................................................... 15

4.1. Bondad de Ajuste .............................................................................................................. 15

4.2. Intervalos de Confianza ..................................................................................................... 16

4.3. Pruebas de Hipótesis ......................................................................................................... 20

4.4. Análisis de Contingencia .................................................................................................... 21

4.5. Regresión Lineal ................................................................................................................ 22

5. Conclusiones ............................................................................................................................ 23

7. Referencias Bibliográficas y Electrónicas................................................................................... 23

8. Anexos ..................................................................................................................................... 24

Page 5: Estadistica Estudiantes Espol 2010

ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico

1. Introducción

Este proyecto consiste en el análisis de datos proporcionados por los estudiantes de la

ESPOL que estaban tomando la materia de estadística en el primer término 2010, los cuales

fueron obtenidos mediante encuesta a aproximadamente 300 alumnos durante el primer parcial.

Este trabajo está basado en una muestra de 100 datos (ver tabla X en anexo), a los cuales

realizamos un análisis individual por variables, así como un análisis en grupo a fin de comprobar

las relaciones que pueden existir entre estos datos (análisis bivariado), además nos apoyamos en

la estadística inferencial a fin de conocer, mediante los datos de la muestra, el comportamiento

general de las variables teniendo en cuenta que existe un cierto nivel de significancia en las

proyecciones que realizamos.

2. Análisis Estadístico Univariado

Estadística Descriptiva de la variable Género Genero 17%F 83%M

En el Gráfico 1 podemos observar la relación que existe en el género de los estudiantes que

tomaron la materia de estadística en el primer término del 2010.

Genero

Masculino

Femenino

Page 6: Estadistica Estudiantes Espol 2010

ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico

Estadística Descriptiva de la variable Internet

Internet 25%NO 75%SI

En el Gráfico2 podemos observar la relación que existe entre los alumnos que tienen fácil

acceso a internet y los que no.

Estadística Descriptiva de la variable Facebook

Facebook 11%NO 89%SI

En el Gráfico3 podemos observar la relación que existe entre los alumnos que tienen

cuenta en la página web http://www.facebook.com y los que no poseen una.

Internet

Si

No

Facebook

Si

No

Page 7: Estadistica Estudiantes Espol 2010

ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico

Estadística Descriptiva de la variable Twitter

Twitter 84%NO 16%SI

En el Gráfico4 podemos observar la relación que existe entre los alumnos que tienen

cuenta en la página http://www.twitter.com y los que no poseen una.

Estadística Descriptiva de la variable Hi5

Hi5 37%NO 63%SI

En el Gráfico5 podemos observar la relación que existe entre los alumnos que tienen

cuenta en la página http://www.hi5.com y los que no poseen una.

Twitter

Si

No

Hi5

Si

No

Page 8: Estadistica Estudiantes Espol 2010

ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico

Estadística Descriptiva de la variable Edad

Media 21,39

Desv. Est. 2,14

Varianza 4,59

Coef. Var. 10,01

Mínimo 18

Q1 20

Mediana 21

Q3 22

Máximo 30

Rango 12

Moda 28

Sesgo 1,35

Kurtosis 2,22

Según la encuesta hecha a un curso de Estadística se tiene una media de edad de 21 años, con un error casi de 0,215, además se tiene una mediana de 21 años, que es el valor que se encuentra justo en el centro de la tabla de datos ordenados. Se tiene un varianza de

4,588 años cuadrados, que

es la dispersión con

respecto a su media y una

desviación estándar de

2,142 años, el valor mínimo de edad de nuestra muestra tomada fue de 18 años.

El primer cuartíl de la variable Edad representa que no más del 25% de las observaciones de la

muestra toman valores menores o igual a 20 años, el tercer cuartíl indica que hasta el 75% de las

observaciones toman valores menores o igual a 22 años.

IB3: Rango Intercuartíl, según nuestra información tenemos 2 datos aberrantes, es decir que se

encuentran fuera de los límites inferiores y superiores.

Page 9: Estadistica Estudiantes Espol 2010

ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico

Estadística Descriptiva de la variable Mes de Nacimiento Media 6,18

Desv. Est. 3,08

Varianza 9,46

Coef. Var. 49,77

Mínimo 1

Q1 4

Mediana 6

Q3 9

Máximo 12

Rango 11

Moda 19

Sesgo 0,18

Kurtosis -0,91

Según la encuesta

hecha a un curso de

Estadística se tiene una

media de Mes de

Nacimiento de 6,18,

además se tiene una

mediana de 6, que es el

valor que se encuentra

justo en el centro de la

tabla de datos ordenados.

Se tiene un varianza de

9,46, que es la dispersión

con respecto a su media y

una desviación estándar de 3,08, el valor mínimo de edad de nuestra muestra tomada fue de 1 y

máximo de 12.

El primer cuartíl de la variable Edad representa que no más del 25% de las observaciones de la

muestra toman valores menores o igual a 4, el tercer cuartíl indica que hasta el 75% de las

observaciones toman valores menores o igual a 9.

Page 10: Estadistica Estudiantes Espol 2010

ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico

Estadística Descriptiva de la variable Estatura Media 169,47

Desv. Est. 8,62

Varianza 74,31

Coef. Var. 5,09

Mínimo 130

Q1 165

Mediana 170

Q3 175

Máximo 187

Rango 57

Moda 14

Sesgo -1,14

Kurtosis 3,64

Según la encuesta

hecha a un curso de

Estadística se tiene una

media de estatura de 169

metros, además se tiene

una mediana de 170

metros, que es el valor que

se encuentra justo en el

centro de la tabla de datos

ordenados.

Se tiene un varianza de 74

metros cuadrados, que es

la dispersión con respecto a

su media y una desviación estándar de 8,62 metros, el valor mínimo de edad de nuestra muestra

tomada fue de 130 metros y el máximo es de 187 metros.

El primer cuartíl de la variable Edad representa que no más del 25% de las observaciones de la

muestra toman valores menores o igual a 165 metros, el tercer cuartíl indica que hasta el 75% de

las observaciones toman valores menores o igual a 175 metros.

También se puede observar que el valor que más se repite es 14.

Page 11: Estadistica Estudiantes Espol 2010

ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico

Estadística Descriptiva de la variable Digito al Azar Media 5,31

Desv. Est. 2,54

Varianza 6,44

Coef. Var. 47,77

Mínimo 0

Q1 3

Mediana 6

Q3 8

Máximo 9

Rango 9

Moda 20

Sesgo -0,4

Kurtosis -1,09

Según la encuesta

hecha a un curso de

Estadística se tiene una

media de dígitos al azar de

5, además se tiene una

mediana de 6, que es el

valor que se encuentra

justo en el centro de la

tabla de datos ordenados.

Se tiene un varianza de

6,44, que es la dispersión

con respecto a su media y

una desviación estándar de

2,54, el valor mínimo de edad de nuestra muestra tomada fue de 0 y el máximo es de 9.

El primer cuartíl de la variable Edad representa que no más del 25% de las observaciones de la

muestra toman valores menores o igual a 3, el tercer cuartíl indica que hasta el 75% de las

observaciones toman valores menores o igual a 8.

También se puede observar que el valor que más se repite es 20.

Page 12: Estadistica Estudiantes Espol 2010

ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico

3. Análisis Estadístico Bivariado

Edad – Estatura Como podemos ver, el coeficiente de correlación lineal es cercano a cero, por lo que no podemos afirmar que existe una relación lineal entre las variables analizadas.

𝑆𝑥𝑦 = (𝑥𝑖 − 𝑥)(𝑦𝑖 − 𝑦)

99

100

𝑖=1

= 2,91𝑟𝑥𝑦 =𝑆𝑥𝑦

𝑆𝑥𝑆𝑦= 0,16

Edad – Materias Tomadas Como podemos ver, el coeficiente de correlación lineal es cercano a cero, por lo que no podemos afirmar que existe una relación lineal entre las variables analizadas.

𝑆𝑥𝑦 = (𝑥𝑖 − 𝑥)(𝑦𝑖 − 𝑦)

99

100

𝑖=1

= −0,85𝑟𝑥𝑦 =𝑆𝑥𝑦

𝑆𝑥𝑆𝑦= −0,30

Edad - Horas Computador Como podemos ver, el coeficiente de correlación lineal es cercano a cero, por lo que no podemos afirmar que existe una relación lineal entre las variables analizadas.

𝑆𝑥𝑦 = (𝑥𝑖 − 𝑥)(𝑦𝑖 − 𝑦)

99

100

𝑖=1

= 1,52𝑟𝑥𝑦 =𝑆𝑥𝑦

𝑆𝑥𝑆𝑦= 0,32

Edad – Horas Internet Como podemos ver, el coeficiente de correlación lineal es cercano a cero, por lo que no podemos afirmar que existe una relación lineal entre las variables analizadas.

𝑆𝑥𝑦 = (𝑥𝑖 − 𝑥)(𝑦𝑖 − 𝑦)

99

100

𝑖=1

= 4,54𝑟𝑥𝑦 =𝑆𝑥𝑦

𝑆𝑥𝑆𝑦= 0,15

Page 13: Estadistica Estudiantes Espol 2010

ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico

Edad – Horas Tv Como podemos ver, el coeficiente de correlación lineal es cercano a cero, por lo que no podemos afirmar que existe una relación lineal entre las variables analizadas.

𝑆𝑥𝑦 = (𝑥𝑖 − 𝑥)(𝑦𝑖 − 𝑦)

99

100

𝑖=1

= −6,12𝑟𝑥𝑦 =𝑆𝑥𝑦

𝑆𝑥𝑆𝑦= −0,25

Materias Tomadas – Horas Computado Como podemos ver, el coeficiente de correlación lineal es cercano a cero, por lo que no podemos afirmar que existe una relación lineal entre las variables analizadas.

r𝑆𝑥𝑦 = (𝑥𝑖−𝑥)(𝑦 𝑖−𝑦)

99

100𝑖=1 = −0,40 𝑟𝑥𝑦 =

𝑆𝑥𝑦

𝑆𝑥𝑆𝑦= −0,14

Materias Tomadas – Horas Internet Como podemos ver, el coeficiente de correlación lineal es cercano a cero, por lo que no podemos afirmar que existe una relación lineal entre las variables analizadas.

𝑆𝑥𝑦 = (𝑥𝑖 − 𝑥)(𝑦𝑖 − 𝑦)

99

100

𝑖=1

= −2,71𝑟𝑥𝑦 =𝑆𝑥𝑦

𝑆𝑥𝑆𝑦= −0,15

Materias Tomadas – Horas Tv Como podemos ver, el coeficiente de correlación lineal es cercano a cero, por lo que no podemos afirmar que existe una relación lineal entre las variables analizadas.

𝑆𝑥𝑦 = (𝑥𝑖 − 𝑥)(𝑦𝑖 − 𝑦)

99

100

𝑖=1

= 1,51𝑟𝑥𝑦 =𝑆𝑥𝑦

𝑆𝑥𝑆𝑦= 0,097

Page 14: Estadistica Estudiantes Espol 2010

ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico

Matriz de Covarianzas Esta matriz la formamos con los datos obtenidos anteriormente para poder observar de una manera más ordenada la relación de las varianzas de cada variable.

Edad Materias

Tomadas

Horas

Computadora

Horas

Internet

Horas

TV

Edad 4,59

-0,85 1,52

4,54

-6,12

Materias Tomadas -0,85 1,77 -0,40

-2,71

1,51

Horas

Computadora

1,52

-0,40

4,65

24,35

3,39

Horas Internet 4,54

-2,71

24,35

191,02

21,75

Horas TV -6,12

1,51

3,39

21,75

136,89

Matriz de Correlación Esta matriz la formamos con los datos obtenidos anteriormente para poder observar de una manera más ordenada la correlación lineal de las variables entre sí.

Edad Materias

Tomadas

Horas

Computador

Horas

Internet

Horas

TV

Edad 1,00 -0,30 0,33 0,15

-0,25

Materias

Tomadas

-0,30 1,00 -0,14

-0,15

0,10

Horas

Computador

0,33 -0,14

1,00 0,81

0,14

Horas Internet 0,15

-0,15 0,81

1,00 0,14

Horas TV -0,25

0,10

0,14

0,14

1,00

Page 15: Estadistica Estudiantes Espol 2010

ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico

4. Estadística Inferencial

4.1. Bondad de Ajuste

Prueba chi-cuadrada de bondad de ajuste para conteos observados en variable: Edad

Categoría Observado Proporción de prueba

Esperado Contribución a Chi-cuad.

18 – 21 42 0,33 33,33 2,25

21 – 24 43 0,33 33,33 2,80

24 – 30 15 0,33 33,33 10,08

N GL Chi-cuad. Valor P

100 2 15,14 0,001

Podemos darnos cuenta que el valor P obtenido es muy pequeño así que con esto

podemos rechazar Ho; en otras palabras la variable edad no tiene distribución normal.

Prueba chi-cuadrada de bondad de ajuste para conteos observados en variable: Estatura Categoría Observado Proporción de

prueba Esperado Contribución a

Chi-cuad.

130 – 165 21 0,33 33,33 4,56

165 – 175 51 0,33 33,33 9,36

175 – 187 28 0,33 33,33 0,85

N GL Chi-cuad. Valor P

100 2 14,78 0,001

Al igual que ocurrió con la variable edad, el valor P de la variable estatura podemos ver

que nos permite rechazar Ho; por tanto podemos decir que no tiene distribución normal.

Page 16: Estadistica Estudiantes Espol 2010

ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico

4.2. Intervalos de Confianza

Para:

Media de Edad (𝛼 = 5%)

(20,97 - 21,81)

Con esta prueba, podemos afirmar con un nivel de significancia del 5% que la

media poblacional de la edad se encuentra entre el rango obtenido.

Varianza de Edad (𝛼 = 5%)

(3,14 - 7,15)

Con esta prueba, podemos afirmar con un nivel de significancia del 5% que la

varianza poblacional de la edad se encuentra entre el rango obtenido.

Proporción de Género masculino (𝛼 = 5%)

(0,74 - 0,90)

Con esta prueba, podemos afirmar con un nivel de significancia del 5% que la

proporción poblacional del género masculino se encuentra entre el rango obtenido.

Media de Estatura (𝛼 = 5%)

(167,90 - 171,05)

Con esta prueba, podemos afirmar con un nivel de significancia del 5% que la

media poblacional de la estatura se encuentra entre el rango obtenido.

Varianza de Estatura (𝛼 = 5%)

(57,20 - 100,40)

Con esta prueba, podemos afirmar con un nivel de significancia del 5% que la

varianza poblacional de la estatura se encuentra entre el rango obtenido.

Page 17: Estadistica Estudiantes Espol 2010

ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico

Proporción de tenerFacebook (𝛼 = 5%)

(0,81 - 0,94)

Con esta prueba, podemos afirmar con un nivel de significancia del 5% que la

proporción de tener Facebook se encuentra entre el rango obtenido.

Proporción de tenerTwitter 𝛼 = 10%

0,16 − 1,645 0,16 𝑥 0,84

100< 𝑃 < 0,16 + 1,645

0,16 𝑥 0,84

100

(0,10 - 0,22)

Con esta prueba, podemos afirmar con un nivel de significancia del 10% que la

proporción de tener twitter se encuentra entre el rango obtenido.

Media de Materias Tomadas (𝛼 = 5%)

(4,80 - 5,31)

Con esta prueba, podemos afirmar con un nivel de significancia del 5% que la

media poblacional de las materias tomadas se encuentra entre el rango obtenido.

Varianza de Materias Tomadas (𝛼 = 5%)

(1,35 - 2,40)

Con esta prueba, podemos afirmar con un nivel de significancia del 5% que la

varianza poblacional de las materias tomadas se encuentra entre el rango obtenido.

Media de Materias Aprobadas (𝛼 = 5%)

(21,72 - 25,20)

Con esta prueba, podemos afirmar con un nivel de significancia del 5% que la

media poblacional de las materias aprobadas encuentra entre el rango obtenido.

Page 18: Estadistica Estudiantes Espol 2010

ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico

Varianza de Materias Aprobadas (𝛼 = 5%)

(53,90 - 112,40)

Con esta prueba, podemos afirmar con un nivel de significancia del 5% que la

varianza poblacional de las materias aprobadas se encuentra entre el rango obtenido.

Media de Horas en Computador 𝛼 = 10%

3,39 – 1,6452,15

10< 𝜇 < 3,39 + 1,645

2,15

10

(3,04 - 3,74)

Con esta prueba, podemos afirmar con un nivel de significancia del 10% que la

media poblacional de las horas en el computador se encuentra entre el rango obtenido.

Varianza de Horas en Computador (𝛼 = 10%)

(2,75 - 9,60)

Con esta prueba, podemos afirmar con un nivel de significancia del 10% que la

varianza poblacional de las horas en el computador se encuentra entre el rango obtenido.

Media de Horas en Internet (𝛼 = 10%)

16,52 – 1,64513,68

10< 𝜇 < 16,52 + 1,645

13,68

10

(14,27 - 18,77)

Con esta prueba, podemos afirmar con un nivel de significancia del 10% que la

media poblacional de las horas en internet se encuentra entre el rango obtenido.

Varianza de Horas en Internet (𝛼 = 10%)

(131 - 294)

Page 19: Estadistica Estudiantes Espol 2010

ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico

Con esta prueba, podemos afirmar con un nivel de significancia del 10% que la

varianza poblacional de las horas en internet se encuentra entre el rango obtenido.

Media de Horas de TV (𝛼 = 10%)

12,72 – 1,64511,70

10< 𝜇 < 12,72 + 1,645

11,70

10

(10,80 - 14,64)

Con esta prueba, podemos afirmar con un nivel de significancia del 10% que la

media poblacional de las horas de tv se encuentra entre el rango obtenido.

Varianza de Horas de TV (𝛼 = 10%)

(96 - 215)

Con esta prueba, podemos afirmar con un nivel de significancia del 10% que la

varianza poblacional de las horas de tv se encuentra entre el rango obtenido.

Page 20: Estadistica Estudiantes Espol 2010

ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico

4.3. Pruebas de Hipótesis

Prueba para la Media de Edad

Ho: μ=21 VS. Ha: μ>21

Variable N Media Desv. Est. Z P

Edad 100 21,39 2,13 1,83 0.03

Dado que el valor P es menor a 0,05 podemos rechazar Ho.

Prueba para la Varianza de Edad Ho: 𝜎2 = 4,6 VS. Ha: 𝜎2 < 4,6

Variable Metodo Chi-cuadrada GL Valor P

Edad Estándar 97,78 99,00 0.48

Dado que el valor P es mayor a 0,05 no es posible rechazar la hipótesis Ho.

Prueba para la Proporción de Género masculino

Ho: P = 0,9 VS. Ha: P ≠ 0,9

Variable X N Muestra P Valor P exacto

Género 83 100 0,83 0,04

Rechazamos Ho.

Prueba para Media de Estatura

Ho: μ=170 VS. Ha: μ<170

Variable N Media Desv. Est. Z P

Estatura 100 169,47 8,58 -0,66 0,25

No podemos rechazar Ho.

Page 21: Estadistica Estudiantes Espol 2010

ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico

4.4. Análisis de Contingencia

Ho: Edad y estatura son independientes entre si

H1: ¬Ho

Estatura

Edad 130-167 168-170 171-187 Total

18-20 13 12 17 42

21-22 6 6 11 23 23-30 12 7 16 35

Total 31 25 44 100

𝑋2 = (𝑛𝑖𝑗 − 𝑒𝑖𝑗 )2

𝑒𝑖𝑗=

𝑐

𝑗=1

1.0912

𝑟

𝑖=1

0,75 < 𝑣𝑎𝑙𝑜𝑟 𝑃 < 0,9

Debido a que el valor P es mucho mayor a 0,01, no podemos rechazar Ho; así que resulta

que edad y estatura si son independientes entre sí.

Page 22: Estadistica Estudiantes Espol 2010

ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico

4.5. Regresión Lineal

Análisis de regresión: Estatura vs. Edad

La ecuación de regresión es

Estatura = 156 + 0,620 Edad

Predictor Coef. Coef. De EE T P

Constante 156,22 8,63 18,10 0,00 Edad 0,62 0,40 1,54 0,13

S = 8,51784 R-cuad. = 2,4% R-cuad.(ajustado) = 1,4%

Análisis de varianza

Fuente GL SC MC F P

Regresión 1 172,65 172,65 2,38 0,13 Error Residual 98 7110,26 72,55 Total 99 7282,91

Análisis de regresión: Horas TV vs. Horas Computadora

La ecuación de regresión es

Horas TV = 10,4 + 0,692 Horas Computadora

Predictor Coef. Coef. De EE T P

Constante 10,38 2,19 4,75 0,00 Edad 0,69 0,55 1,27 0,21

S = 11,6642 R-cuad. = 1,6% R-cuad.(ajustado) = 0,6%

Análisis de varianza

Page 23: Estadistica Estudiantes Espol 2010

ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico

Fuente GL SC MC F P

Regresión 1 218,30 218,30 1,60 0,21 Error Residual 98 13333,30 136,10 Total 99 13551,70

5. Conclusiones

Una vez realizado el análisis respectivo a las variables, pudimos obtener las siguientes

conclusiones:

En los cursos de estadística para ingeniería existen más hombres que mujeres.

La mayoría de los estudiantes tienen acceso a internet.

Sí existe una moda en la edad de los estudiantes, es decir que la mayoría tiene

aproximadamente la misma edad (20 años).

No existe moda alguna para las variables de mes de nacimiento y digito al azar, además

como era de esperarse la media de los dígitos al azar se aproxima a 5.

Entre las variables de edad, materias aprobadas y horas de tv no existe ninguna relación

lineal.

En cambio, entre las variables horas de computadora y horas de internet sí existe una

relación, la cual nos dice que la mayoría del tiempo que los alumnos usan las

computadoras es para estar en internet.

También pudimos determinar que existe una varianza muy alta en cuanto a las horas que

los estudiantes ven televisión así como en las horas que usan la computadora.

Gracias a la prueba de hipótesis pudimos determinar que la media poblacional es mayor

que 21.

Mediante el análisis de contingencia, tal como lo esperábamos, para edad y estatura

conocimos que estas variables son independientes entre sí.

Determinamos los intervalos de confianza para algunas variables con niveles de

significancia entre 5% y 10%.

7. Referencias Bibliográficas y Electrónicas

Software estadístico minitab 15

Page 24: Estadistica Estudiantes Espol 2010

ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico

Zurita Herrera, Gaudencio (2008), PROBABILIDAD Y ESTADISTICA – FUNDAMENTOS Y

APLICACIONES. Primera edición.

Walpole, Ronal. Myers, Raymond H. (1998), PROBABILIDAD Y ESTADISTICA PARA

INGENIERIA. Sexta edición.

http://www.mat.uda.cl/hgomez/Apuntes/Estad%C3%ADstica%20Descriptiva%20I.pdf

http://www.misrespuestas.com/

8. Anexos

ESCUELA SUPERIOR POLITÉCNICA DEL LITORAL Centro de Estudios e Investigaciones Estadísticas ICM-ESPOL

FORMULARIO DE ESTADÍSTICA PARA INGENIERÍAS

Formulario a ser administrado a estudiantes

Con el fin de disponer de un conjunto de datos reales que puedan ser utilizados en diversos ejercicios, se responderá de forma anónima a las siguientes preguntas.

1. DATOS GENERALES DEL INFORMANTE

1. Género: Masculino Femenino

2. Edad (en años):

3. Mes de Nacimiento (1 a 12):

4. Estatura (en centímetros):

5. Peso (en Kg, un Kg = 2.2 libras):

6. Número de hermanos:

7. Año de ingreso a la ESPOL: (Sin incluir Pre Politécnico)

8. Número de materias aprobadas: (Sin incluir Pre Politécnico)

9. Número de materias que toma el presente

semestre:

2. PARTICULARIDADES

1. Escriba un dígito al azar de 0 a 9:

2. Lugar de residencia (de lunes a viernes) en el presente semestre:

Hogar familiar en Guayaquil Residencia estudiantil Otra solución Hogar familiar fuera de Guayaquil Apartamento con compañeros en Guayaquil

3. ¿Tiene computadora personal en casa? Sí No

4. ¿Tiene usted Internet en casa? Sí No

5. En cuales de las siguientes redes sociales posee usted una cuenta (puede marcar más de una opción): Facebook Twitter Hi5 Otras__________________ Ninguna

(Especifique)

6. A cuál de las redes sociales le dedica más tiempo y atención:

Page 25: Estadistica Estudiantes Espol 2010

ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico

7. ¿Cómo llega usted habitualmente a la ESPOL? Vehículo propio A pie Transporte ESPOL En moto o bicicleta En el vehículo de un compañero Transporte Público

8. ¿Cuántos minutos ha empleado hoy en venir a la ESPOL?

9. ¿Cuál es su equipo de fútbol favorito? Ninguno

10. ¿Cuál fue el último libro no relacionado con sus estudios en la ESPOL, que leyó por iniciativa propia?

11. Número de horas diarias que usted pasa frente un computador:

12. Número de horas semanales que usted accede a Internet:

13. Número de horas semanales que usted emplea para ver televisión:

14. ¿Tiene usted instalado servicio de Internet en su teléfono?:

3. OPINIÓN

1. ¿Cuál de los siguientes problemas considera es el más importante en el Ecuador actual? (Elija sólo una)

Déficit Fiscal Pérdida de valores morales

Desigualdad social Problemas Internacionales Drogas Seguridad ciudadana Falta de empleo Otro____________________________

(Especifique)

Page 26: Estadistica Estudiantes Espol 2010

ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico

Estadística Descriptiva de la variable Computadora

Computadora 12%NO 88%SI

Según la encuesta hecha a un grupo de personas nos dimos cuenta que tuvimos un 12%

de usuarios que no tiene computadoras y un 88% que si tienen.

Estadística Descriptiva de la variable Otra Red Social Otra 88%NO 12%SI

Computadora

Si

No

Otra Red Social

Si

No

Page 27: Estadistica Estudiantes Espol 2010

ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico

Según nuestra encuesta hecha a un grupo de personas nos dimos cuenta que tuvimos un

88% de usuarios que no tiene otras redes sociales y un 12% que si tienen.

Estadística Descriptiva de la variable Ninguna Red Social Ninguno 93%NO 7%SI

Según nuestra encuesta hecha a un grupo de personas nos dimos cuenta que tuvimos un

93% de usuarios que no tiene ninguna red social y un 7% que si lo tienen.

Estadística Descriptiva de la variable Internet teléfono

Internet teléfono 81%NO 19%SI

Según nuestra encuesta hecha a un grupo de personas nos dimos cuenta que tuvimos un

81% de usuarios que no tiene Internet-Teléfono y un 19% que si lo tienen.

Ninguna Red Social

Si

No

Internet Teléfono

Si

No

Page 28: Estadistica Estudiantes Espol 2010

ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico

Estadística Descriptiva de la variable Hermanos Media 2,57

Desv. Est. 1,53

Varianza 2,33

Coef. Var. 59,49

Mínimo 0

Q1 1

Mediana 2

Q3 3

Máximo 8

Rango 8

Moda 32

Sesgo 0,98

Kurtosis 0,96

Según la encuesta

hecha a un curso de

Estadística se tiene una

media de hermanos

aproximadamente de 2,

además se tiene una

mediana de 2 hermanos,

que es el valor que se

encuentra justo en el

centro de la tabla de datos

ordenados.

Se tiene un varianza de

2,33 hermanos cuadrados,

Page 29: Estadistica Estudiantes Espol 2010

ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico

que es la dispersión con respecto a su media y una desviación estándar de 1,53 hermanos, el valor

mínimo de edad de nuestra muestra tomada fue de 0 y el máximo es de 8 hermanos.

El primer cuartíl de la variable Edad representa que no más del 25% de las observaciones de la

muestra toman valores menores o igual a 1 hermano, el tercer cuartíl indica que hasta el 75% de

las observaciones toman valores menores o igual a 3 hermanos.

También se puede observar que el valor que más se repite es 32.

Estadística Descriptiva de la variable Peso Media 70,36

Desv. Est. 12,58

Varianza 158,37

Coef. Var. 17,89

Mínimo 46,8

Q1 63

Mediana 68,18

Q3 79,5

Máximo 110

Rango 63,2

Moda 10

Sesgo 0,54

Kurtosis 0,19

Según la encuesta

hecha a un curso de

Estadística se tiene una

media de peso de 70,36

kilos, además se tiene una

mediana de 68,18 kilos,

que es el valor que se

encuentra justo en el

centro de la tabla de datos

ordenados.

Se tiene un varianza de

158,37 kilos cuadrados, que

es la dispersión con

Page 30: Estadistica Estudiantes Espol 2010

ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico

respecto a su media y una desviación estándar de 12,58 kilos, el valor mínimo de edad de nuestra

muestra tomada fue de 46,8 kilos y el máximo es de 110 kilos.

El primer cuartíl de la variable Edad representa que no más del 25% de las observaciones de la

muestra toman valores menores o igual a 63 kilos, el tercer cuartíl indica que hasta el 75% de las

observaciones toman valores menores o igual a 79,5 kilos.

También se puede observar que el valor que más se repite es 10 kilos.

Estadística Descriptiva de la variable Ingreso a la Espol Media 2006,5

Desv. Est. 1,81

Varianza 3,29

Coef. Var. 0,09

Mínimo 1999

Q1 2006

Mediana 2007

Q3 2008

Máximo 2009

Rango 10

Moda 38

Sesgo -1,57

Kurtosis 2,7

Según la encuesta

hecha a un curso de

Estadística se tiene una

media de ingreso a la espol

de 2006,5 estudiantes,

además se tiene una

mediana de 2007

estudiantes, que es el valor

que se encuentra justo en

el centro de la tabla de

datos ordenados.

Se tiene un varianza de

3,29 estudiantes

Page 31: Estadistica Estudiantes Espol 2010

ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico

cuadrados, que es la dispersión con respecto a su media y una desviación estándar de 1,81

estudiantes, el valor mínimo de edad de nuestra muestra tomada fue de 1999 estudiantes y el

máximo es de 2009 estudiantes.

El primer cuartíl de la variable Edad representa que no más del 25% de las observaciones de la

muestra toman valores menores o igual a 2006 estudiantes, el tercer cuartíl indica que hasta el

75% de las observaciones toman valores menores o igual a 2008 estudiantes.

También se puede observar que el valor que más se repite es 38 estudiantes.

Estadística Descriptiva de la variable Materias Aprobadas Media 23,46

Desv. Est. 8,68

Varianza 75,41

Coef. Var. 37,02

Mínimo 10

Q1 17,75

Mediana 21,5

Q3 26

Máximo 52

Rango 42

Moda 10

Sesgo 1,32

Kurtosis 1,56

Según la

encuesta hecha a un curso

de Estadística se tiene

una media de Número de

materias aprobadas(Sin

incluir Pre Politécnico)

de 23 materias, con un

error casi de 0,877,

además se tiene una

mediana de 21,50

materias, que es el valor

que se encuentra justo en

el centro de la tabla de

datos ordenados.

Page 32: Estadistica Estudiantes Espol 2010

ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico

Se tiene un varianza de 75,406 horas cuadradas, que es la dispersión con respecto a su

media y una desviación estándar de 8,684 horas, el valor mínimo de edad de nuestra

muestra tomada fue de 10,00 horas.

El primer cuartíl de la variable Edad representa que no más del 25% de las observaciones

de la muestra toman valores menores o igual a 17,75 horas, el tercer cuartíl indica que

hasta el 75% de las observaciones toman valores menores o igual a 26,00 horas.

IB3: Rango Intercuartíl, según nuestra información tenemos 8 datos aberrantes, es decir que

se encuentran fuera de los límites inferiores y superiores.

Estadística Descriptiva de la variable Materias Semestre Media 5,05

Desv. Est. 1,33

Varianza 1,77

Coef. Var. 26,31

Mínimo 1

Q1 4

Mediana 5

Q3 6

Máximo 8

Rango 7

Moda 33

Sesgo -0,49

Kurtosis 0,1

Según la encuesta

hecha a un curso de

Estadística se tiene una

media de Número de

materias que toma el

presente semestre de 5

materias, con un error casi

de 0,133, además se tiene

una mediana de 5 materias,

que es el valor que se

encuentra justo en el

centro de la tabla de datos

Page 33: Estadistica Estudiantes Espol 2010

ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico

ordenados.

Se tiene un varianza de 1,765 materias cuadradas, que es la dispersión con respecto a su media y

una desviación estándar de 1,329 materias, el valor mínimo de edad de nuestra muestra tomada

fue de 1,00 materia.

El primer cuartíl de la variable Edad representa que no más del 25% de las observaciones de la

muestra toman valores menores o igual a 1 materia, el tercer cuartíl indica que hasta el 75% de

las observaciones toman valores menores o igual a 6 materias.

IB3: Rango Intercuartíl, según nuestra información tenemos 2 datos aberrantes, es decir que se

encuentran fuera de los límites inferiores y superiores.

Estadística Descriptiva de la variable Minutos en Llegar Media 47,76

Desv. Est. 22,35

Varianza 499,55

Coef. Var. 46,8

Mínimo 20

Q1 30

Mediana 45

Q3 60

Máximo 120

Rango 100

Moda 16

Sesgo 1,35

Kurtosis 2,04

Según la encuesta

hecha a un curso de

Estadística se tiene una

media de minutos en llegar

de 47,76 minutos, además

se tiene una mediana de 45

minutos, que es el valor

que se encuentra justo en

el centro de la tabla de

datos ordenados.

Se tiene un varianza de 499

minutos cuadradas, que es

la dispersión con respecto a

Page 34: Estadistica Estudiantes Espol 2010

ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico

su media y una desviación estándar de 22,35 minutos, el valor mínimo de edad de nuestra

muestra tomada fue de 20 minutos.

El primer cuartíl de la variable Edad representa que no más del 25% de las observaciones de la

muestra toman valores menores o igual a 30 minutos, el tercer cuartíl indica que hasta el 75% de

las observaciones toman valores menores o igual a 60 minutos.

IB3: Rango Intercuartíl, según nuestra información tenemos 2 datos aberrantes, es decir que se

encuentran fuera de los límites inferiores y superiores.

Estadística Descriptiva de la variable Horas Computador Media 3,39

Desv. Est.

2,16

Varianza 4,65

Coef. Var.

63,68

Mínimo 0

Q1 2

Mediana 3

Q3 4

Máximo 16

Rango 16

Moda 26

Sesgo 2,33

Kurtosis 11,46

Según la encuesta

hecha a un curso de

Estadística se tiene una

media de horas diarias

frente a un computador de

3 horas , con un error casi

de 0,217, además se tiene

una mediana de 3 horas,

que es el valor que se

encuentra justo en el

Page 35: Estadistica Estudiantes Espol 2010

ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico

centro de la tabla de datos ordenados.

Se tiene un varianza de 4,648 horas cuadradas, que es la dispersión con respecto a su media y una

desviación estándar de 2,156 horas, el valor mínimo de edad de nuestra muestra tomada fue de

0,00 horas.

El primer cuartíl de la variable Edad representa que no más del 25% de las observaciones de la

muestra toman valores menores o igual a 2 horas, el tercer cuartíl indica que hasta el 75% de las

observaciones toman valores menores o igual a 4 horas.

IB3: Rango Intercuartíl, según nuestra información tenemos 2 datos aberrantes, es decir que se encuentran fuera de los límites inferiores y superiores.

Estadística Descriptiva de la variable Horas Internet Media 16,53

Desv. Est. 13,82

Varianza 191,02

Coef. Var. 83,63

Mínimo 1

Q1 5

Mediana 15

Q3 24,25

Máximo 80

Rango 79

Moda 11

Sesgo 1,46

Kurtosis 3,79

Según la encuesta

hecha a un curso de

Estadística se tiene una

media de horas semanales

que se accede a internet

de 17 horas , con un error

casi de 1,40, además se

tiene una mediana de 3,00

horas, que es el valor que

se encuentra justo en el

centro de la tabla de datos

ordenados.

Page 36: Estadistica Estudiantes Espol 2010

ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico

Se tiene un varianza de 191,02 horas cuadradas, que es la dispersión con respecto a su media y

una desviación estándar de 13,82 horas, el valor mínimo de edad de nuestra muestra tomada fue

de 1,00 horas.

El primer cuartíl de la variable Edad representa que no más del 25% de las observaciones de la

muestra toman valores menores o igual a 2 horas, el tercer cuartíl indica que hasta el 75% de las

observaciones toman valores menores o igual a 4 horas.

IB3: Rango Intercuartíl, según nuestra información tenemos 2 datos aberrantes, es decir que se encuentran fuera de los límites inferiores y superiores.

Estadística Descriptiva de la variable Horas Televisión Media 12,72

Desv. Est. 11,7

Varianza 136,89

Coef. Var. 91,98

Mínimo 0

Q1 5

Mediana 10

Q3 15

Máximo 60

Rango 60

Moda 16

Sesgo 1,88

Kurtosis 3,83

Según la encuesta

hecha a un curso de

Estadística se tiene una

media de horas

semanales que ve

telvisión de 13 horas ,

con un error casi de 1,17,

además se tiene una

mediana de 3,00 horas,

que es el valor que se

encuentra justo en el

Page 37: Estadistica Estudiantes Espol 2010

ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico

centro de la tabla de datos ordenados.

Se tiene un varianza de 136,89 horas cuadradas, que es la dispersión con respecto a su

media y una desviación estándar de 11,70 horas, el valor mínimo de edad de nuestra

muestra tomada fue de 0,00 horas.

El primer cuartíl de la variable Edad representa que no más del 25% de las observaciones

de la muestra toman valores menores o igual a 2 horas, el tercer cuartíl indica que hasta el

75% de las observaciones toman valores menores o igual a 4 horas.

IB3: Rango Intercuartíl, según nuestra información tenemos 2 datos aberrantes, es decir que

se encuentran fuera de los límites inferiores y superiores.