Estadistica Estudiantes Espol 2010
-
Upload
andres-sacoto -
Category
Documents
-
view
269 -
download
0
Transcript of Estadistica Estudiantes Espol 2010
ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico
ESPOL, Algunas Características de los Estudiantes de
Estadística para Ingenierías: Un Análisis Estadístico
Escuela Superior Politécnica del Litoral
Instituto de Ciencias Matemáticas
Ingeniería Electrónica y Telecomunicaciones
Estadística (Ing)(B)
Elaborado por:
Andrés Sacoto Castro ([email protected])
Carlos Vélez Altamirano ([email protected])
Michael Azúa Gutiérrez ([email protected])
Guayaquil – Ecuador
Septiembre del 2010
ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico
Escuela Superior Politécnica del Litoral
Instituto de Ciencias Matemáticas
Ingeniería Electrónica y Telecomunicaciones
Estadística (Ing)(B)
Septiembre del 2010
ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico
ESPOL, Algunas Características de los Estudiantes de
Estadística para Ingenierías: Un Análisis Estadístico
Elaborado por:
Andrés Sacoto Castro
Carlos Vélez Altamirano
Michael Azúa Gutiérrez
Dirigido por:
Ing. Sandra García
Guayaquil – Ecuador
Septiembre del 2010
ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico
ESPOL, Algunas Características de los Estudiantes de Estadística para
Ingenierías: Un Análisis Estadístico
INDICE GENERAL
Contenido 1. Introducción............................................................................................................................... 5
2. Análisis Estadístico Univariado ................................................................................................... 5
3. Análisis Estadístico Bivariado .................................................................................................... 12
4. Estadística Inferencial............................................................................................................... 15
4.1. Bondad de Ajuste .............................................................................................................. 15
4.2. Intervalos de Confianza ..................................................................................................... 16
4.3. Pruebas de Hipótesis ......................................................................................................... 20
4.4. Análisis de Contingencia .................................................................................................... 21
4.5. Regresión Lineal ................................................................................................................ 22
5. Conclusiones ............................................................................................................................ 23
7. Referencias Bibliográficas y Electrónicas................................................................................... 23
8. Anexos ..................................................................................................................................... 24
ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico
1. Introducción
Este proyecto consiste en el análisis de datos proporcionados por los estudiantes de la
ESPOL que estaban tomando la materia de estadística en el primer término 2010, los cuales
fueron obtenidos mediante encuesta a aproximadamente 300 alumnos durante el primer parcial.
Este trabajo está basado en una muestra de 100 datos (ver tabla X en anexo), a los cuales
realizamos un análisis individual por variables, así como un análisis en grupo a fin de comprobar
las relaciones que pueden existir entre estos datos (análisis bivariado), además nos apoyamos en
la estadística inferencial a fin de conocer, mediante los datos de la muestra, el comportamiento
general de las variables teniendo en cuenta que existe un cierto nivel de significancia en las
proyecciones que realizamos.
2. Análisis Estadístico Univariado
Estadística Descriptiva de la variable Género Genero 17%F 83%M
En el Gráfico 1 podemos observar la relación que existe en el género de los estudiantes que
tomaron la materia de estadística en el primer término del 2010.
Genero
Masculino
Femenino
ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico
Estadística Descriptiva de la variable Internet
Internet 25%NO 75%SI
En el Gráfico2 podemos observar la relación que existe entre los alumnos que tienen fácil
acceso a internet y los que no.
Estadística Descriptiva de la variable Facebook
Facebook 11%NO 89%SI
En el Gráfico3 podemos observar la relación que existe entre los alumnos que tienen
cuenta en la página web http://www.facebook.com y los que no poseen una.
Internet
Si
No
Si
No
ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico
Estadística Descriptiva de la variable Twitter
Twitter 84%NO 16%SI
En el Gráfico4 podemos observar la relación que existe entre los alumnos que tienen
cuenta en la página http://www.twitter.com y los que no poseen una.
Estadística Descriptiva de la variable Hi5
Hi5 37%NO 63%SI
En el Gráfico5 podemos observar la relación que existe entre los alumnos que tienen
cuenta en la página http://www.hi5.com y los que no poseen una.
Si
No
Hi5
Si
No
ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico
Estadística Descriptiva de la variable Edad
Media 21,39
Desv. Est. 2,14
Varianza 4,59
Coef. Var. 10,01
Mínimo 18
Q1 20
Mediana 21
Q3 22
Máximo 30
Rango 12
Moda 28
Sesgo 1,35
Kurtosis 2,22
Según la encuesta hecha a un curso de Estadística se tiene una media de edad de 21 años, con un error casi de 0,215, además se tiene una mediana de 21 años, que es el valor que se encuentra justo en el centro de la tabla de datos ordenados. Se tiene un varianza de
4,588 años cuadrados, que
es la dispersión con
respecto a su media y una
desviación estándar de
2,142 años, el valor mínimo de edad de nuestra muestra tomada fue de 18 años.
El primer cuartíl de la variable Edad representa que no más del 25% de las observaciones de la
muestra toman valores menores o igual a 20 años, el tercer cuartíl indica que hasta el 75% de las
observaciones toman valores menores o igual a 22 años.
IB3: Rango Intercuartíl, según nuestra información tenemos 2 datos aberrantes, es decir que se
encuentran fuera de los límites inferiores y superiores.
ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico
Estadística Descriptiva de la variable Mes de Nacimiento Media 6,18
Desv. Est. 3,08
Varianza 9,46
Coef. Var. 49,77
Mínimo 1
Q1 4
Mediana 6
Q3 9
Máximo 12
Rango 11
Moda 19
Sesgo 0,18
Kurtosis -0,91
Según la encuesta
hecha a un curso de
Estadística se tiene una
media de Mes de
Nacimiento de 6,18,
además se tiene una
mediana de 6, que es el
valor que se encuentra
justo en el centro de la
tabla de datos ordenados.
Se tiene un varianza de
9,46, que es la dispersión
con respecto a su media y
una desviación estándar de 3,08, el valor mínimo de edad de nuestra muestra tomada fue de 1 y
máximo de 12.
El primer cuartíl de la variable Edad representa que no más del 25% de las observaciones de la
muestra toman valores menores o igual a 4, el tercer cuartíl indica que hasta el 75% de las
observaciones toman valores menores o igual a 9.
ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico
Estadística Descriptiva de la variable Estatura Media 169,47
Desv. Est. 8,62
Varianza 74,31
Coef. Var. 5,09
Mínimo 130
Q1 165
Mediana 170
Q3 175
Máximo 187
Rango 57
Moda 14
Sesgo -1,14
Kurtosis 3,64
Según la encuesta
hecha a un curso de
Estadística se tiene una
media de estatura de 169
metros, además se tiene
una mediana de 170
metros, que es el valor que
se encuentra justo en el
centro de la tabla de datos
ordenados.
Se tiene un varianza de 74
metros cuadrados, que es
la dispersión con respecto a
su media y una desviación estándar de 8,62 metros, el valor mínimo de edad de nuestra muestra
tomada fue de 130 metros y el máximo es de 187 metros.
El primer cuartíl de la variable Edad representa que no más del 25% de las observaciones de la
muestra toman valores menores o igual a 165 metros, el tercer cuartíl indica que hasta el 75% de
las observaciones toman valores menores o igual a 175 metros.
También se puede observar que el valor que más se repite es 14.
ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico
Estadística Descriptiva de la variable Digito al Azar Media 5,31
Desv. Est. 2,54
Varianza 6,44
Coef. Var. 47,77
Mínimo 0
Q1 3
Mediana 6
Q3 8
Máximo 9
Rango 9
Moda 20
Sesgo -0,4
Kurtosis -1,09
Según la encuesta
hecha a un curso de
Estadística se tiene una
media de dígitos al azar de
5, además se tiene una
mediana de 6, que es el
valor que se encuentra
justo en el centro de la
tabla de datos ordenados.
Se tiene un varianza de
6,44, que es la dispersión
con respecto a su media y
una desviación estándar de
2,54, el valor mínimo de edad de nuestra muestra tomada fue de 0 y el máximo es de 9.
El primer cuartíl de la variable Edad representa que no más del 25% de las observaciones de la
muestra toman valores menores o igual a 3, el tercer cuartíl indica que hasta el 75% de las
observaciones toman valores menores o igual a 8.
También se puede observar que el valor que más se repite es 20.
ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico
3. Análisis Estadístico Bivariado
Edad – Estatura Como podemos ver, el coeficiente de correlación lineal es cercano a cero, por lo que no podemos afirmar que existe una relación lineal entre las variables analizadas.
𝑆𝑥𝑦 = (𝑥𝑖 − 𝑥)(𝑦𝑖 − 𝑦)
99
100
𝑖=1
= 2,91𝑟𝑥𝑦 =𝑆𝑥𝑦
𝑆𝑥𝑆𝑦= 0,16
Edad – Materias Tomadas Como podemos ver, el coeficiente de correlación lineal es cercano a cero, por lo que no podemos afirmar que existe una relación lineal entre las variables analizadas.
𝑆𝑥𝑦 = (𝑥𝑖 − 𝑥)(𝑦𝑖 − 𝑦)
99
100
𝑖=1
= −0,85𝑟𝑥𝑦 =𝑆𝑥𝑦
𝑆𝑥𝑆𝑦= −0,30
Edad - Horas Computador Como podemos ver, el coeficiente de correlación lineal es cercano a cero, por lo que no podemos afirmar que existe una relación lineal entre las variables analizadas.
𝑆𝑥𝑦 = (𝑥𝑖 − 𝑥)(𝑦𝑖 − 𝑦)
99
100
𝑖=1
= 1,52𝑟𝑥𝑦 =𝑆𝑥𝑦
𝑆𝑥𝑆𝑦= 0,32
Edad – Horas Internet Como podemos ver, el coeficiente de correlación lineal es cercano a cero, por lo que no podemos afirmar que existe una relación lineal entre las variables analizadas.
𝑆𝑥𝑦 = (𝑥𝑖 − 𝑥)(𝑦𝑖 − 𝑦)
99
100
𝑖=1
= 4,54𝑟𝑥𝑦 =𝑆𝑥𝑦
𝑆𝑥𝑆𝑦= 0,15
ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico
Edad – Horas Tv Como podemos ver, el coeficiente de correlación lineal es cercano a cero, por lo que no podemos afirmar que existe una relación lineal entre las variables analizadas.
𝑆𝑥𝑦 = (𝑥𝑖 − 𝑥)(𝑦𝑖 − 𝑦)
99
100
𝑖=1
= −6,12𝑟𝑥𝑦 =𝑆𝑥𝑦
𝑆𝑥𝑆𝑦= −0,25
Materias Tomadas – Horas Computado Como podemos ver, el coeficiente de correlación lineal es cercano a cero, por lo que no podemos afirmar que existe una relación lineal entre las variables analizadas.
r𝑆𝑥𝑦 = (𝑥𝑖−𝑥)(𝑦 𝑖−𝑦)
99
100𝑖=1 = −0,40 𝑟𝑥𝑦 =
𝑆𝑥𝑦
𝑆𝑥𝑆𝑦= −0,14
Materias Tomadas – Horas Internet Como podemos ver, el coeficiente de correlación lineal es cercano a cero, por lo que no podemos afirmar que existe una relación lineal entre las variables analizadas.
𝑆𝑥𝑦 = (𝑥𝑖 − 𝑥)(𝑦𝑖 − 𝑦)
99
100
𝑖=1
= −2,71𝑟𝑥𝑦 =𝑆𝑥𝑦
𝑆𝑥𝑆𝑦= −0,15
Materias Tomadas – Horas Tv Como podemos ver, el coeficiente de correlación lineal es cercano a cero, por lo que no podemos afirmar que existe una relación lineal entre las variables analizadas.
𝑆𝑥𝑦 = (𝑥𝑖 − 𝑥)(𝑦𝑖 − 𝑦)
99
100
𝑖=1
= 1,51𝑟𝑥𝑦 =𝑆𝑥𝑦
𝑆𝑥𝑆𝑦= 0,097
ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico
Matriz de Covarianzas Esta matriz la formamos con los datos obtenidos anteriormente para poder observar de una manera más ordenada la relación de las varianzas de cada variable.
Edad Materias
Tomadas
Horas
Computadora
Horas
Internet
Horas
TV
Edad 4,59
-0,85 1,52
4,54
-6,12
Materias Tomadas -0,85 1,77 -0,40
-2,71
1,51
Horas
Computadora
1,52
-0,40
4,65
24,35
3,39
Horas Internet 4,54
-2,71
24,35
191,02
21,75
Horas TV -6,12
1,51
3,39
21,75
136,89
Matriz de Correlación Esta matriz la formamos con los datos obtenidos anteriormente para poder observar de una manera más ordenada la correlación lineal de las variables entre sí.
Edad Materias
Tomadas
Horas
Computador
Horas
Internet
Horas
TV
Edad 1,00 -0,30 0,33 0,15
-0,25
Materias
Tomadas
-0,30 1,00 -0,14
-0,15
0,10
Horas
Computador
0,33 -0,14
1,00 0,81
0,14
Horas Internet 0,15
-0,15 0,81
1,00 0,14
Horas TV -0,25
0,10
0,14
0,14
1,00
ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico
4. Estadística Inferencial
4.1. Bondad de Ajuste
Prueba chi-cuadrada de bondad de ajuste para conteos observados en variable: Edad
Categoría Observado Proporción de prueba
Esperado Contribución a Chi-cuad.
18 – 21 42 0,33 33,33 2,25
21 – 24 43 0,33 33,33 2,80
24 – 30 15 0,33 33,33 10,08
N GL Chi-cuad. Valor P
100 2 15,14 0,001
Podemos darnos cuenta que el valor P obtenido es muy pequeño así que con esto
podemos rechazar Ho; en otras palabras la variable edad no tiene distribución normal.
Prueba chi-cuadrada de bondad de ajuste para conteos observados en variable: Estatura Categoría Observado Proporción de
prueba Esperado Contribución a
Chi-cuad.
130 – 165 21 0,33 33,33 4,56
165 – 175 51 0,33 33,33 9,36
175 – 187 28 0,33 33,33 0,85
N GL Chi-cuad. Valor P
100 2 14,78 0,001
Al igual que ocurrió con la variable edad, el valor P de la variable estatura podemos ver
que nos permite rechazar Ho; por tanto podemos decir que no tiene distribución normal.
ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico
4.2. Intervalos de Confianza
Para:
Media de Edad (𝛼 = 5%)
(20,97 - 21,81)
Con esta prueba, podemos afirmar con un nivel de significancia del 5% que la
media poblacional de la edad se encuentra entre el rango obtenido.
Varianza de Edad (𝛼 = 5%)
(3,14 - 7,15)
Con esta prueba, podemos afirmar con un nivel de significancia del 5% que la
varianza poblacional de la edad se encuentra entre el rango obtenido.
Proporción de Género masculino (𝛼 = 5%)
(0,74 - 0,90)
Con esta prueba, podemos afirmar con un nivel de significancia del 5% que la
proporción poblacional del género masculino se encuentra entre el rango obtenido.
Media de Estatura (𝛼 = 5%)
(167,90 - 171,05)
Con esta prueba, podemos afirmar con un nivel de significancia del 5% que la
media poblacional de la estatura se encuentra entre el rango obtenido.
Varianza de Estatura (𝛼 = 5%)
(57,20 - 100,40)
Con esta prueba, podemos afirmar con un nivel de significancia del 5% que la
varianza poblacional de la estatura se encuentra entre el rango obtenido.
ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico
Proporción de tenerFacebook (𝛼 = 5%)
(0,81 - 0,94)
Con esta prueba, podemos afirmar con un nivel de significancia del 5% que la
proporción de tener Facebook se encuentra entre el rango obtenido.
Proporción de tenerTwitter 𝛼 = 10%
0,16 − 1,645 0,16 𝑥 0,84
100< 𝑃 < 0,16 + 1,645
0,16 𝑥 0,84
100
(0,10 - 0,22)
Con esta prueba, podemos afirmar con un nivel de significancia del 10% que la
proporción de tener twitter se encuentra entre el rango obtenido.
Media de Materias Tomadas (𝛼 = 5%)
(4,80 - 5,31)
Con esta prueba, podemos afirmar con un nivel de significancia del 5% que la
media poblacional de las materias tomadas se encuentra entre el rango obtenido.
Varianza de Materias Tomadas (𝛼 = 5%)
(1,35 - 2,40)
Con esta prueba, podemos afirmar con un nivel de significancia del 5% que la
varianza poblacional de las materias tomadas se encuentra entre el rango obtenido.
Media de Materias Aprobadas (𝛼 = 5%)
(21,72 - 25,20)
Con esta prueba, podemos afirmar con un nivel de significancia del 5% que la
media poblacional de las materias aprobadas encuentra entre el rango obtenido.
ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico
Varianza de Materias Aprobadas (𝛼 = 5%)
(53,90 - 112,40)
Con esta prueba, podemos afirmar con un nivel de significancia del 5% que la
varianza poblacional de las materias aprobadas se encuentra entre el rango obtenido.
Media de Horas en Computador 𝛼 = 10%
3,39 – 1,6452,15
10< 𝜇 < 3,39 + 1,645
2,15
10
(3,04 - 3,74)
Con esta prueba, podemos afirmar con un nivel de significancia del 10% que la
media poblacional de las horas en el computador se encuentra entre el rango obtenido.
Varianza de Horas en Computador (𝛼 = 10%)
(2,75 - 9,60)
Con esta prueba, podemos afirmar con un nivel de significancia del 10% que la
varianza poblacional de las horas en el computador se encuentra entre el rango obtenido.
Media de Horas en Internet (𝛼 = 10%)
16,52 – 1,64513,68
10< 𝜇 < 16,52 + 1,645
13,68
10
(14,27 - 18,77)
Con esta prueba, podemos afirmar con un nivel de significancia del 10% que la
media poblacional de las horas en internet se encuentra entre el rango obtenido.
Varianza de Horas en Internet (𝛼 = 10%)
(131 - 294)
ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico
Con esta prueba, podemos afirmar con un nivel de significancia del 10% que la
varianza poblacional de las horas en internet se encuentra entre el rango obtenido.
Media de Horas de TV (𝛼 = 10%)
12,72 – 1,64511,70
10< 𝜇 < 12,72 + 1,645
11,70
10
(10,80 - 14,64)
Con esta prueba, podemos afirmar con un nivel de significancia del 10% que la
media poblacional de las horas de tv se encuentra entre el rango obtenido.
Varianza de Horas de TV (𝛼 = 10%)
(96 - 215)
Con esta prueba, podemos afirmar con un nivel de significancia del 10% que la
varianza poblacional de las horas de tv se encuentra entre el rango obtenido.
ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico
4.3. Pruebas de Hipótesis
Prueba para la Media de Edad
Ho: μ=21 VS. Ha: μ>21
Variable N Media Desv. Est. Z P
Edad 100 21,39 2,13 1,83 0.03
Dado que el valor P es menor a 0,05 podemos rechazar Ho.
Prueba para la Varianza de Edad Ho: 𝜎2 = 4,6 VS. Ha: 𝜎2 < 4,6
Variable Metodo Chi-cuadrada GL Valor P
Edad Estándar 97,78 99,00 0.48
Dado que el valor P es mayor a 0,05 no es posible rechazar la hipótesis Ho.
Prueba para la Proporción de Género masculino
Ho: P = 0,9 VS. Ha: P ≠ 0,9
Variable X N Muestra P Valor P exacto
Género 83 100 0,83 0,04
Rechazamos Ho.
Prueba para Media de Estatura
Ho: μ=170 VS. Ha: μ<170
Variable N Media Desv. Est. Z P
Estatura 100 169,47 8,58 -0,66 0,25
No podemos rechazar Ho.
ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico
4.4. Análisis de Contingencia
Ho: Edad y estatura son independientes entre si
H1: ¬Ho
Estatura
Edad 130-167 168-170 171-187 Total
18-20 13 12 17 42
21-22 6 6 11 23 23-30 12 7 16 35
Total 31 25 44 100
𝑋2 = (𝑛𝑖𝑗 − 𝑒𝑖𝑗 )2
𝑒𝑖𝑗=
𝑐
𝑗=1
1.0912
𝑟
𝑖=1
0,75 < 𝑣𝑎𝑙𝑜𝑟 𝑃 < 0,9
Debido a que el valor P es mucho mayor a 0,01, no podemos rechazar Ho; así que resulta
que edad y estatura si son independientes entre sí.
ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico
4.5. Regresión Lineal
Análisis de regresión: Estatura vs. Edad
La ecuación de regresión es
Estatura = 156 + 0,620 Edad
Predictor Coef. Coef. De EE T P
Constante 156,22 8,63 18,10 0,00 Edad 0,62 0,40 1,54 0,13
S = 8,51784 R-cuad. = 2,4% R-cuad.(ajustado) = 1,4%
Análisis de varianza
Fuente GL SC MC F P
Regresión 1 172,65 172,65 2,38 0,13 Error Residual 98 7110,26 72,55 Total 99 7282,91
Análisis de regresión: Horas TV vs. Horas Computadora
La ecuación de regresión es
Horas TV = 10,4 + 0,692 Horas Computadora
Predictor Coef. Coef. De EE T P
Constante 10,38 2,19 4,75 0,00 Edad 0,69 0,55 1,27 0,21
S = 11,6642 R-cuad. = 1,6% R-cuad.(ajustado) = 0,6%
Análisis de varianza
ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico
Fuente GL SC MC F P
Regresión 1 218,30 218,30 1,60 0,21 Error Residual 98 13333,30 136,10 Total 99 13551,70
5. Conclusiones
Una vez realizado el análisis respectivo a las variables, pudimos obtener las siguientes
conclusiones:
En los cursos de estadística para ingeniería existen más hombres que mujeres.
La mayoría de los estudiantes tienen acceso a internet.
Sí existe una moda en la edad de los estudiantes, es decir que la mayoría tiene
aproximadamente la misma edad (20 años).
No existe moda alguna para las variables de mes de nacimiento y digito al azar, además
como era de esperarse la media de los dígitos al azar se aproxima a 5.
Entre las variables de edad, materias aprobadas y horas de tv no existe ninguna relación
lineal.
En cambio, entre las variables horas de computadora y horas de internet sí existe una
relación, la cual nos dice que la mayoría del tiempo que los alumnos usan las
computadoras es para estar en internet.
También pudimos determinar que existe una varianza muy alta en cuanto a las horas que
los estudiantes ven televisión así como en las horas que usan la computadora.
Gracias a la prueba de hipótesis pudimos determinar que la media poblacional es mayor
que 21.
Mediante el análisis de contingencia, tal como lo esperábamos, para edad y estatura
conocimos que estas variables son independientes entre sí.
Determinamos los intervalos de confianza para algunas variables con niveles de
significancia entre 5% y 10%.
7. Referencias Bibliográficas y Electrónicas
Software estadístico minitab 15
ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico
Zurita Herrera, Gaudencio (2008), PROBABILIDAD Y ESTADISTICA – FUNDAMENTOS Y
APLICACIONES. Primera edición.
Walpole, Ronal. Myers, Raymond H. (1998), PROBABILIDAD Y ESTADISTICA PARA
INGENIERIA. Sexta edición.
http://www.mat.uda.cl/hgomez/Apuntes/Estad%C3%ADstica%20Descriptiva%20I.pdf
http://www.misrespuestas.com/
8. Anexos
ESCUELA SUPERIOR POLITÉCNICA DEL LITORAL Centro de Estudios e Investigaciones Estadísticas ICM-ESPOL
FORMULARIO DE ESTADÍSTICA PARA INGENIERÍAS
Formulario a ser administrado a estudiantes
Con el fin de disponer de un conjunto de datos reales que puedan ser utilizados en diversos ejercicios, se responderá de forma anónima a las siguientes preguntas.
1. DATOS GENERALES DEL INFORMANTE
1. Género: Masculino Femenino
2. Edad (en años):
3. Mes de Nacimiento (1 a 12):
4. Estatura (en centímetros):
5. Peso (en Kg, un Kg = 2.2 libras):
6. Número de hermanos:
7. Año de ingreso a la ESPOL: (Sin incluir Pre Politécnico)
8. Número de materias aprobadas: (Sin incluir Pre Politécnico)
9. Número de materias que toma el presente
semestre:
2. PARTICULARIDADES
1. Escriba un dígito al azar de 0 a 9:
2. Lugar de residencia (de lunes a viernes) en el presente semestre:
Hogar familiar en Guayaquil Residencia estudiantil Otra solución Hogar familiar fuera de Guayaquil Apartamento con compañeros en Guayaquil
3. ¿Tiene computadora personal en casa? Sí No
4. ¿Tiene usted Internet en casa? Sí No
5. En cuales de las siguientes redes sociales posee usted una cuenta (puede marcar más de una opción): Facebook Twitter Hi5 Otras__________________ Ninguna
(Especifique)
6. A cuál de las redes sociales le dedica más tiempo y atención:
ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico
7. ¿Cómo llega usted habitualmente a la ESPOL? Vehículo propio A pie Transporte ESPOL En moto o bicicleta En el vehículo de un compañero Transporte Público
8. ¿Cuántos minutos ha empleado hoy en venir a la ESPOL?
9. ¿Cuál es su equipo de fútbol favorito? Ninguno
10. ¿Cuál fue el último libro no relacionado con sus estudios en la ESPOL, que leyó por iniciativa propia?
11. Número de horas diarias que usted pasa frente un computador:
12. Número de horas semanales que usted accede a Internet:
13. Número de horas semanales que usted emplea para ver televisión:
14. ¿Tiene usted instalado servicio de Internet en su teléfono?:
3. OPINIÓN
1. ¿Cuál de los siguientes problemas considera es el más importante en el Ecuador actual? (Elija sólo una)
Déficit Fiscal Pérdida de valores morales
Desigualdad social Problemas Internacionales Drogas Seguridad ciudadana Falta de empleo Otro____________________________
(Especifique)
ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico
Estadística Descriptiva de la variable Computadora
Computadora 12%NO 88%SI
Según la encuesta hecha a un grupo de personas nos dimos cuenta que tuvimos un 12%
de usuarios que no tiene computadoras y un 88% que si tienen.
Estadística Descriptiva de la variable Otra Red Social Otra 88%NO 12%SI
Computadora
Si
No
Otra Red Social
Si
No
ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico
Según nuestra encuesta hecha a un grupo de personas nos dimos cuenta que tuvimos un
88% de usuarios que no tiene otras redes sociales y un 12% que si tienen.
Estadística Descriptiva de la variable Ninguna Red Social Ninguno 93%NO 7%SI
Según nuestra encuesta hecha a un grupo de personas nos dimos cuenta que tuvimos un
93% de usuarios que no tiene ninguna red social y un 7% que si lo tienen.
Estadística Descriptiva de la variable Internet teléfono
Internet teléfono 81%NO 19%SI
Según nuestra encuesta hecha a un grupo de personas nos dimos cuenta que tuvimos un
81% de usuarios que no tiene Internet-Teléfono y un 19% que si lo tienen.
Ninguna Red Social
Si
No
Internet Teléfono
Si
No
ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico
Estadística Descriptiva de la variable Hermanos Media 2,57
Desv. Est. 1,53
Varianza 2,33
Coef. Var. 59,49
Mínimo 0
Q1 1
Mediana 2
Q3 3
Máximo 8
Rango 8
Moda 32
Sesgo 0,98
Kurtosis 0,96
Según la encuesta
hecha a un curso de
Estadística se tiene una
media de hermanos
aproximadamente de 2,
además se tiene una
mediana de 2 hermanos,
que es el valor que se
encuentra justo en el
centro de la tabla de datos
ordenados.
Se tiene un varianza de
2,33 hermanos cuadrados,
ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico
que es la dispersión con respecto a su media y una desviación estándar de 1,53 hermanos, el valor
mínimo de edad de nuestra muestra tomada fue de 0 y el máximo es de 8 hermanos.
El primer cuartíl de la variable Edad representa que no más del 25% de las observaciones de la
muestra toman valores menores o igual a 1 hermano, el tercer cuartíl indica que hasta el 75% de
las observaciones toman valores menores o igual a 3 hermanos.
También se puede observar que el valor que más se repite es 32.
Estadística Descriptiva de la variable Peso Media 70,36
Desv. Est. 12,58
Varianza 158,37
Coef. Var. 17,89
Mínimo 46,8
Q1 63
Mediana 68,18
Q3 79,5
Máximo 110
Rango 63,2
Moda 10
Sesgo 0,54
Kurtosis 0,19
Según la encuesta
hecha a un curso de
Estadística se tiene una
media de peso de 70,36
kilos, además se tiene una
mediana de 68,18 kilos,
que es el valor que se
encuentra justo en el
centro de la tabla de datos
ordenados.
Se tiene un varianza de
158,37 kilos cuadrados, que
es la dispersión con
ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico
respecto a su media y una desviación estándar de 12,58 kilos, el valor mínimo de edad de nuestra
muestra tomada fue de 46,8 kilos y el máximo es de 110 kilos.
El primer cuartíl de la variable Edad representa que no más del 25% de las observaciones de la
muestra toman valores menores o igual a 63 kilos, el tercer cuartíl indica que hasta el 75% de las
observaciones toman valores menores o igual a 79,5 kilos.
También se puede observar que el valor que más se repite es 10 kilos.
Estadística Descriptiva de la variable Ingreso a la Espol Media 2006,5
Desv. Est. 1,81
Varianza 3,29
Coef. Var. 0,09
Mínimo 1999
Q1 2006
Mediana 2007
Q3 2008
Máximo 2009
Rango 10
Moda 38
Sesgo -1,57
Kurtosis 2,7
Según la encuesta
hecha a un curso de
Estadística se tiene una
media de ingreso a la espol
de 2006,5 estudiantes,
además se tiene una
mediana de 2007
estudiantes, que es el valor
que se encuentra justo en
el centro de la tabla de
datos ordenados.
Se tiene un varianza de
3,29 estudiantes
ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico
cuadrados, que es la dispersión con respecto a su media y una desviación estándar de 1,81
estudiantes, el valor mínimo de edad de nuestra muestra tomada fue de 1999 estudiantes y el
máximo es de 2009 estudiantes.
El primer cuartíl de la variable Edad representa que no más del 25% de las observaciones de la
muestra toman valores menores o igual a 2006 estudiantes, el tercer cuartíl indica que hasta el
75% de las observaciones toman valores menores o igual a 2008 estudiantes.
También se puede observar que el valor que más se repite es 38 estudiantes.
Estadística Descriptiva de la variable Materias Aprobadas Media 23,46
Desv. Est. 8,68
Varianza 75,41
Coef. Var. 37,02
Mínimo 10
Q1 17,75
Mediana 21,5
Q3 26
Máximo 52
Rango 42
Moda 10
Sesgo 1,32
Kurtosis 1,56
Según la
encuesta hecha a un curso
de Estadística se tiene
una media de Número de
materias aprobadas(Sin
incluir Pre Politécnico)
de 23 materias, con un
error casi de 0,877,
además se tiene una
mediana de 21,50
materias, que es el valor
que se encuentra justo en
el centro de la tabla de
datos ordenados.
ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico
Se tiene un varianza de 75,406 horas cuadradas, que es la dispersión con respecto a su
media y una desviación estándar de 8,684 horas, el valor mínimo de edad de nuestra
muestra tomada fue de 10,00 horas.
El primer cuartíl de la variable Edad representa que no más del 25% de las observaciones
de la muestra toman valores menores o igual a 17,75 horas, el tercer cuartíl indica que
hasta el 75% de las observaciones toman valores menores o igual a 26,00 horas.
IB3: Rango Intercuartíl, según nuestra información tenemos 8 datos aberrantes, es decir que
se encuentran fuera de los límites inferiores y superiores.
Estadística Descriptiva de la variable Materias Semestre Media 5,05
Desv. Est. 1,33
Varianza 1,77
Coef. Var. 26,31
Mínimo 1
Q1 4
Mediana 5
Q3 6
Máximo 8
Rango 7
Moda 33
Sesgo -0,49
Kurtosis 0,1
Según la encuesta
hecha a un curso de
Estadística se tiene una
media de Número de
materias que toma el
presente semestre de 5
materias, con un error casi
de 0,133, además se tiene
una mediana de 5 materias,
que es el valor que se
encuentra justo en el
centro de la tabla de datos
ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico
ordenados.
Se tiene un varianza de 1,765 materias cuadradas, que es la dispersión con respecto a su media y
una desviación estándar de 1,329 materias, el valor mínimo de edad de nuestra muestra tomada
fue de 1,00 materia.
El primer cuartíl de la variable Edad representa que no más del 25% de las observaciones de la
muestra toman valores menores o igual a 1 materia, el tercer cuartíl indica que hasta el 75% de
las observaciones toman valores menores o igual a 6 materias.
IB3: Rango Intercuartíl, según nuestra información tenemos 2 datos aberrantes, es decir que se
encuentran fuera de los límites inferiores y superiores.
Estadística Descriptiva de la variable Minutos en Llegar Media 47,76
Desv. Est. 22,35
Varianza 499,55
Coef. Var. 46,8
Mínimo 20
Q1 30
Mediana 45
Q3 60
Máximo 120
Rango 100
Moda 16
Sesgo 1,35
Kurtosis 2,04
Según la encuesta
hecha a un curso de
Estadística se tiene una
media de minutos en llegar
de 47,76 minutos, además
se tiene una mediana de 45
minutos, que es el valor
que se encuentra justo en
el centro de la tabla de
datos ordenados.
Se tiene un varianza de 499
minutos cuadradas, que es
la dispersión con respecto a
ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico
su media y una desviación estándar de 22,35 minutos, el valor mínimo de edad de nuestra
muestra tomada fue de 20 minutos.
El primer cuartíl de la variable Edad representa que no más del 25% de las observaciones de la
muestra toman valores menores o igual a 30 minutos, el tercer cuartíl indica que hasta el 75% de
las observaciones toman valores menores o igual a 60 minutos.
IB3: Rango Intercuartíl, según nuestra información tenemos 2 datos aberrantes, es decir que se
encuentran fuera de los límites inferiores y superiores.
Estadística Descriptiva de la variable Horas Computador Media 3,39
Desv. Est.
2,16
Varianza 4,65
Coef. Var.
63,68
Mínimo 0
Q1 2
Mediana 3
Q3 4
Máximo 16
Rango 16
Moda 26
Sesgo 2,33
Kurtosis 11,46
Según la encuesta
hecha a un curso de
Estadística se tiene una
media de horas diarias
frente a un computador de
3 horas , con un error casi
de 0,217, además se tiene
una mediana de 3 horas,
que es el valor que se
encuentra justo en el
ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico
centro de la tabla de datos ordenados.
Se tiene un varianza de 4,648 horas cuadradas, que es la dispersión con respecto a su media y una
desviación estándar de 2,156 horas, el valor mínimo de edad de nuestra muestra tomada fue de
0,00 horas.
El primer cuartíl de la variable Edad representa que no más del 25% de las observaciones de la
muestra toman valores menores o igual a 2 horas, el tercer cuartíl indica que hasta el 75% de las
observaciones toman valores menores o igual a 4 horas.
IB3: Rango Intercuartíl, según nuestra información tenemos 2 datos aberrantes, es decir que se encuentran fuera de los límites inferiores y superiores.
Estadística Descriptiva de la variable Horas Internet Media 16,53
Desv. Est. 13,82
Varianza 191,02
Coef. Var. 83,63
Mínimo 1
Q1 5
Mediana 15
Q3 24,25
Máximo 80
Rango 79
Moda 11
Sesgo 1,46
Kurtosis 3,79
Según la encuesta
hecha a un curso de
Estadística se tiene una
media de horas semanales
que se accede a internet
de 17 horas , con un error
casi de 1,40, además se
tiene una mediana de 3,00
horas, que es el valor que
se encuentra justo en el
centro de la tabla de datos
ordenados.
ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico
Se tiene un varianza de 191,02 horas cuadradas, que es la dispersión con respecto a su media y
una desviación estándar de 13,82 horas, el valor mínimo de edad de nuestra muestra tomada fue
de 1,00 horas.
El primer cuartíl de la variable Edad representa que no más del 25% de las observaciones de la
muestra toman valores menores o igual a 2 horas, el tercer cuartíl indica que hasta el 75% de las
observaciones toman valores menores o igual a 4 horas.
IB3: Rango Intercuartíl, según nuestra información tenemos 2 datos aberrantes, es decir que se encuentran fuera de los límites inferiores y superiores.
Estadística Descriptiva de la variable Horas Televisión Media 12,72
Desv. Est. 11,7
Varianza 136,89
Coef. Var. 91,98
Mínimo 0
Q1 5
Mediana 10
Q3 15
Máximo 60
Rango 60
Moda 16
Sesgo 1,88
Kurtosis 3,83
Según la encuesta
hecha a un curso de
Estadística se tiene una
media de horas
semanales que ve
telvisión de 13 horas ,
con un error casi de 1,17,
además se tiene una
mediana de 3,00 horas,
que es el valor que se
encuentra justo en el
ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico
centro de la tabla de datos ordenados.
Se tiene un varianza de 136,89 horas cuadradas, que es la dispersión con respecto a su
media y una desviación estándar de 11,70 horas, el valor mínimo de edad de nuestra
muestra tomada fue de 0,00 horas.
El primer cuartíl de la variable Edad representa que no más del 25% de las observaciones
de la muestra toman valores menores o igual a 2 horas, el tercer cuartíl indica que hasta el
75% de las observaciones toman valores menores o igual a 4 horas.
IB3: Rango Intercuartíl, según nuestra información tenemos 2 datos aberrantes, es decir que
se encuentran fuera de los límites inferiores y superiores.