Consumo de Bebidas Energizantes en Estudiantes...(Trabajo)

download Consumo de Bebidas Energizantes en Estudiantes...(Trabajo)

of 19

Transcript of Consumo de Bebidas Energizantes en Estudiantes...(Trabajo)

  • 1

    VI Escuela de Verano CEAES-Universidad del Valle

    Santiago de Cali, Noviembre 7-9 de 2013

    Consumo de bebidas energizantes en estudiantes de la Universidad

    Nacional de Colombia-Sede Medelln: Modelacin usando muestreo y modelos lineales generalizados

    RESUMEN Con el fin de conocer los hbitos de los estudiantes y dar informacin clara y concisa acerca del riesgo de abusar de las bebidas energizantes, se realiza un diseo de muestreo en dos etapas, estratificando primero por facultades y luego por carreras, y usando la asignacin del tamao muestral proporcional a la cantidad de estudiantes en el marco muestral considerado, estudiantes matriculados del semestre 01-2013, tanto por las cinco facultades como por carrera. Luego se escoge de manera completamente aleatoria una muestra de 340 estudiantes de cada una de las 26 carreras y se encuestan telefnicamente. Con los datos recolectados se hace un anlisis descriptivo del porcentaje de estudiantes que consumen bebidas energizantes, entre otras variables, por ejemplo la frecuencia de consumo, el semestre, el nmero de materias, la edad. Adicionalmente se estiman, usando el diseo de muestreo, diferentes proporciones, entre ellas, la proporcin de estudiantes que ingieren bebidas energizantes y el respectivo intervalo de confianza. Despus se procede a modelar la proporcin de inters a partir de algunas de las variables registradas en la encuesta aplicada, teniendo en cuenta el muestreo hecho previamente y con ayuda de los paquetes survey y la funcin svyglm del software estadstico R. Se utilizan las opciones del modelo lineal generalizado; familia quasibinomial. Se evalan tres diferentes modelos: el logstico, el log--logstico y el probit y se escoge el mejor modelo a partir de la significancia de los parmetros aplicando seleccin backward y se realizan las pruebas respectivas para la seleccin del mejor modelo. 1. INTRODUCCIN Conocer la proporcin de personas en el entorno acadmico que consumen bebidas energizantes puede ser de gran inters para la Universidad, ya que la mayora de personas ven esto como algo normal, pero no se detienen a pensar si estas bebidas a largo plazo pueden afectar la salud mental y fsica de los estudiantes. Se ha dicho que las bebidas energizantes causan dependencia en las personas, sobre todo aquellas que son ms propensas a pasar largas horas haciendo trabajos acadmicos o laborales, sin embargo no existe un estudio concreto que determine cules son las razones o los factores principales que llevan a que un estudiante universitario convierta esto en una dependencia o adiccin. Estudios previos acerca del consumo de bebidas energizantes han registrado que trastornan las funciones cardacas, provocan hipertensin, hiperactividad, dilatacin de pupila y cambios de humor inesperados. Todo esto es importante tomarlo en cuenta para que la Universidad piense en tomar medidas o hacer campaas de prevencin para controlar su consumo y concientizar a los estudiantes sobre todas las consecuencias que puede llevar el consumo descontrolado de ellas. Este trabajo se ha dividido en cinco secciones. En la primera seccin se describe el diseo de muestreo empleado para la recoleccin de los datos de inters. Luego, en la seccin 2, se hace un breve anlisis descriptivo donde se hace nfasis en la informacin ms relevante para la comunidad universitaria como identificar las facultades ms propensas para el consumo de bebidas energizantes y determinar las marcas de mayor preferencia. En la tercera seccin se procede a calcular las respectivas estimaciones de las proporcionales de inters para el estudio con sus respectivos intervalos de confianza y frmulas para la estimacin de ellos. En la cuarta seccin se presentar la

  • 2

    modelacin mediante el modelo lineal generalizado para encontrar el mejor modelo que describa la probabilidad de que un estudiante de la Universidad Nacional de Colombia Sede Medelln consuma bebidas energizantes. Entre los modelos usados estn el Logstico, el Loglogstico y el Probit, pero aplicando el diseo de muestreo empleado en el estudio. Para la eleccin del mejor modelo, se aplicar el procedimiento backward para la eleccin de las variables explicativas del modelo e identificacin de los datos outliers por medio de la distancia de Cook; adems, entre los tres modelos propuestos se escoger el mejor, es decir, el que presente el menor deviance. 2. MUESTREO 2.1. Planteamiento del problema Con base en la encuesta realizada a los estudiantes de pregrado de la Universidad Nacional de Colombia Sede Medelln, se busca dar respuesta a una serie de preguntas planteadas por los estudiantes del curso de Muestreo Estadstico, las cuales sern indispensables para determinar la frecuencia con la que se consumen bebidas energizantes en la Universidad. Adems, este trabajo se espera pueda servir como referencia para la realizacin de estudios futuros para la implementacin de campaas para el control del consumo de bebidas energizantes, o informar a la comunidad universitaria sobre sus contraindicaciones, efectos o dependencias. 2.2. Elementos del diseo de muestreo Poblacin objetivo: Todos los estudiantes de pregrado de la Universidad Nacional de Colombia Sede Medelln que se matricularon durante el semestre 2013-1. Poblacin susceptible de ser muestreada: Los estudiantes de pregrado de la Universidad Nacional de Colombia Sede Medelln que se matricularon durante el semestre 2013-1 y que viven en el rea Metropolitana, es decir, los que se encuentran en el marco muestral. Unidades de Muestreo: Cada uno de los estudiantes matriculados en el semestre 2013-1, pertenecientes al marco de muestreo, construido a continuacin. 2.3. Elaboracin del marco de Muestreo El marco muestral se construy a partir de la lista de estudiantes de pregrado con sus respectivos nmeros de telfono1. Se procede a depurar la base de datos eliminando aquellos registros de telfonos correspondientes a larga distancia asociados con el lugar de residencia habitual del estudiante a su ingreso a la Universidad ya que era altamente probable que el estudiante no se localizara all. Se realizaron las llamadas telefnicas a una muestra aleatoria de estudiantes de la lista de nmeros telefnicos. 2.4. Diseo de muestro utilizado El diseo de muestreo utilizado consisti en realizar estratificacin por facultades, teniendo en cuenta todas las facultades que conforman a la Universidad Nacional de Colombia Sede Medelln (Arquitectura, Ciencias, Ciencias Agrarias, Ciencias Humanas y Minas), y en cada una de las facultades se hizo estratificacin por carrera teniendo en cuenta todas las carreras pertenecientes a cada facultad, donde posteriormente, de cada carrera se tom una Muestra Aleatoria Simple de estudiantes. En la Tabla 1 se muestra el listado de las facultades y las carreras adscritas a cada facultad, adems el nmero de estudiantes por carrera que estaban considerados en el marco muestral y el tamao de muestra obtenido en la muestra piloto.

    1 Base de datos suministrada por la Universidad con propsitos acadmicos.

  • 3

    Facultad Carrera Tamao de muestra Total de

    Estudiantes

    Arquitectura (39)

    Arquitectura 21 446

    Artes Plsticas 7 135

    Construccin 11 103

    Ciencias (38)

    Estadstica 8 180

    Ingeniera Biolgica 15 282

    Ingeniera Fsica 8 188

    Matemticas 7 107

    Ciencias Agrarias (42)

    Ingeniera Agrcola 8 167

    Ingeniera Agronmica 10 201

    Ingeniera Forestal 11 228

    Zootecnia 13 265

    Ciencias Humanas (35)

    Ciencia Poltica 14 223

    Economa 11 201

    Historia 10 182

    Minas (186)

    Ingeniera Administrativa 29 574

    Ingeniera Ambiental 6 115

    Ingeniera Civil 26 532

    Ingeniera de Control 11 209

    Ingeniera De Minas y Metalurgia 6 108

    Ingeniera de Petrleos 8 149

    Ingeniera de Sistemas e Informtica 22 396

    Ingeniera Elctrica 10 197

    Ingeniera Geolgica 9 171

    Ingeniera Industrial 21 434

    Ingeniera Mecnica 21 398

    Ingeniera Qumica 17 338

    Tabla 1. Listado de Facultades (nmero de estudiantes en la muestral), carreras, tamao de muestra y nmero total de estudiantes, Universidad Nacional de Colombia Sede Medelln. 2.5. Metodologa para la obtencin de la informacin

    La obtencin de la informacin se realiz por medio de llamadas telefnicas, las cuales fueron avisadas previamente a toda la comunidad universitaria a travs del correo Institucional, esto con el fin de facilitar y garantizar el xito de las encuestas. Este muestreo se pudo llevar a cabo gracias a la colaboracin del personal del rea de Planeacin de la Universidad Nacional de Colombia Sede Medelln, quienes le facilitaron la informacin al profesor encargado del curso de Muestreo Estadstico, para que l generara muestras aleatorias y los estudiantes del curso de muestreo estadstico del semestre 2013-1 hicieran efectivas las encuestas a los estudiantes, el formato de la encuesta se encuentra en el Anexo 1. Se indag entre otras variables por: el gnero, la edad, el estrato socioeconmico, el semestre, las materias, la carrera, la actividad deportiva, y se hicieron varias preguntas para saber si se consume algn tipo de bebida energizante, la frecuencia con la cual se consume y el tipo de marca de bebida energizante que ms han consumido durante el semestre donde se realiz la encuesta.

  • 4

    Para poder hacer las estimaciones correspondientes, se determin el nmero de estudiantes a encuestar por carrera, para ello se realiz un muestreo piloto tomando una muestra inicial de 170 estudiantes, asignada de manera proporcional al nmero de estudiantes matriculados por carrera, a partir de este estudio piloto se hall el tamao muestral para llevar a cabo la muestra real. Se procedi de la siguiente manera para la obtencin, va telefnica de la informacin: Para cada una de las carreras de cada una de las facultades, se realizan las llamadas telefnicas a la muestra aleatoria de estudiantes, y se les realiza la respectiva encuesta. Aquellos nmeros equivocados o no asignados, o donde no contestaron (despus de realizar al menos dos llamadas en horarios distintos) se reemplazan por otros nmeros seleccionados aleatoriamente del marco muestral considerado. En la realizacin de las encuestas se presentaron diversos problemas, el mayor de ellos fue la falta de disposicin de los estudiantes por responder la encuesta. Al final se unific la informacin recolectada por cada estudiante (17 estudiantes del curso de muestreo), y se hizo el clculo del tamao de muestra arrojando un valor de 340 encuestas efectivas. Se procede a completar la muestra y con los datos obtenidos por los encuestadores se tabulan para crear la base de datos definitiva a partir de la cual se realizan las respectivas estimaciones. A continuacin se realiza un breve anlisis descriptivo de la informacin recolectada en las encuestadas, haciendo nfasis especial en el consumo de bebidas energizantes. 3. ANLISIS DESCRIPTIVO

    En la Figura 1 se observa que la mayor cantidad de estudiantes que consumen bebidas energizantes se encuentran matriculados entre el cuarto y el sexto semestre, pero no se ven diferencias evidentes entre los otros semestres. Esto se corrobora en la Tabla 2.

    Figura 1. Proporcin de estudiantes que consumen bebidas energizantes por semestre en el que se encuentra matriculado.

    1 2 3 4 5 6 7 8 9 10

    Proporcin de consumo de energizantes por semestre

    0.0

    0.1

    0.2

    0.3

    0.4

    0.5

    0.6

    0.7

  • 5

    Consumo de Bebidas Energizantes

    Semestre Proporcin

    1 36,76%

    2 36,36%

    3 41,94%

    4 59,26%

    5 54,55%

    6 57,58%

    7 51,43%

    8 46,43%

    9 45,83%

    10 46,67%

    Tabla 2. Porcentaje de estudiantes que consumen bebidas energizantes por semestre en el cual se encuentra matriculado.

    Ahora, se presentan algunos grficos para analizar cmo se comporta determinada variable teniendo en cuenta la frecuencia con la que se presenta el consumo de bebidas energizantes de los estudiantes encuestados de la Universidad Nacional de Colombia Sede Medelln. En la Figura 2 se muestra que los estudiantes hombres que fueron encuestados consumen bebidas energizantes con mayor frecuencia que las mujeres, sin importar si lo hacen diariamente, semanalmente, espordicamente o si slo fue por curiosidad, adems se aprecia que la mayora de la poblacin consume bebidas muy espordicamente sin importar el gnero.

    Figura 2. Porcentaje de la frecuencia de consumo de bebidas energizantes por gnero.

    En la Figura 3 se observa que la mayora de estudiantes encuestados consume bebidas energizantes de manera espordica, pero se percibe que para todas las frecuencias de consumo, aquellos que tienen ms de 21 aos de edad son quienes, en su mayora, consumen bebidas energizantes.

    Todos los dias 1Xsemana Esporadicamente 1XCuriosidad Otra

    Mujer

    Hombre

    Porcentaje de frecuencia

    de consumo por genero

    0.0

    0.1

    0.2

    0.3

    0.4

    0.5

  • 6

    Figura 3. Porcentaje de frecuencia de consumo de bebidas energizantes por edad, estudiantes encuestados Universidad

    Nacional de Colombia Sede Medelln.

    En la Figura 4 se observa que los estudiantes que son de estrato tres son los que ms consumen bebidas energizantes, pero tambin se aprecia que la mayor parte de la comunidad universitaria consume bebidas energizantes espordicamente.

    Figura 4. Porcentaje de frecuencia de consumo de bebidas energizantes de los estudiantes encuestados por estrato

    socioeconmico, estudiantes encuestados Universidad Nacional de Colombia Sede Medelln.

    En la Figura 5 se observa que la mayor cantidad de estudiantes encuestados que consumen bebidas energizantes pertenecen a la facultad de Ciencias Agrarias, y, similar a la Figura 4, la mayor parte de los estudiantes consumen bebidas energizantes espordicamente, aunque se nota que hay una cantidad considerable de estudiantes que han consumido bebidas energizantes durante el semestre 2013-1 simplemente por curiosidad.

  • 7

    Figura 5. Porcentaje de frecuencia de consumo de bebidas energizantes de los estudiantes encuestados por facultad,

    estudiantes encuestados Universidad Nacional de Colombia Sede Medelln.

    Adicionalmente se observa que el 39.38% de los estudiantes encuestados matriculados en el primer semestre consumen bebidas energizantes de manera espordica o por curiosidad. En los estudiantes de semestres intermedios (4-7) se nota que alrededor del 65% de ellos consumen bebidas energizantes con una frecuencia semanal, ver Tabla 3.

    Frecuencia

    Semestre 1XSemana Espordicamente 1XCuriosidad

    1 11,76% 15,24% 24,14%

    2 NA 12,38% 10,34%

    3 5,88% 8,57% 10,34%

    4 11,76% 6,67% 20,69%

    5 23,53% 11,43% 3,45%

    6 11,76% 11,43% 13,79%

    7 17,65% 12,38% 6,90%

    8 5,88% 9,52% 3,45%

    9 5,88% 7,62% 3,45%

    10 NA 4,76% 3,45%

    Tabla 3. Porcentaje de la frecuencia de estudiantes que consumen bebidas energizantes dependiendo del semestre, estudiantes encuestados Universidad Nacional de Colombia Sede Medelln.

    A continuacin se presentan algunos grficos para analizar cmo se comporta determinada variable teniendo en cuenta la marca de bebidas energizantes que consumen los estudiantes de la Universidad Nacional de Colombia Sede Medelln. En la Figura 6, se observa que los estudiantes hombres encuestados son quienes consumen bebidas energizantes en mayor porcentaje que las mujeres, sin importar el tipo de bebida, adems se aprecia que la mayora de la

  • 8

    poblacin consume bebidas de la marca Vive 100 y Red Bull y que hay un caso en el que las mujeres consumen ms bebidas energizantes que los hombres respecto a la marca StarBien.

    Figura 6. Proporcin de marca ms consumida por gnero, estudiantes encuestados Universidad Nacional de Colombia Sede

    Medelln. Tambin, es de observar que la mayor cantidad de los estudiantes encuestados que consumen bebidas energizantes son de la Facultad de Minas independiente de la marca de bebida energizante que consuman (ver Figura 7). Igualmente, como en la Figura 6, se tiene la misma tendencia de consumo de la bebida energizante Vive 100 y Red Bull.

    Figura 7. Proporcin de estudiantes que consumen determinada marca discriminados por facultad, estudiantes encuestados

    Universidad Nacional de Colombia Sede Medelln.

    4. ESTIMACIONES

    En esta seccin se muestra la estimacin puntual y por intervalos de las siguientes tres proporciones de inters,

    entre otras, teniendo en cuenta el diseo de muestreo utilizado:

  • 9

    Proporcin de Estudiantes de la Universidad que durante el semestre 2013-1 han ingerido Bebidas

    Energizantes.

    Proporcin de Estudiantes que han ingerido Bebidas Energizantes todos los das o una vez a la

    semana.

    Proporcin de Estudiantes que han ingerido Bebidas Energizantes espordicamente o una sola

    vez por curiosidad.

    Para la estimacin puntual, se utilizan las siguientes expresiones, ver Scheaffer y Mendenhall (2007).

    Denote por:

    Donde es el total estimado de estudiantes que cumplen con el atributo de inters y el total estimado de

    estudiantes de la carrera i-sima que cumplen con el atributo.

    ( ) (

    )

    ( )

    Donde es el nmero total de estudiantes en la carrera i-sima, es el nmero de estudiantes muestreados en

    la carrera i-sima y es el valor del atributo de inters del j-simo estudiante de la carrera i-sima.

    Y el respectivo intervalo de confianza est dado por:

    ( )

    Donde ( ) ( )

    y en este caso denota la estimacin del total de estudiantes que cumplen con el atributo j=1, 2, 3, asociados a

    las probabilidades de inters dadas inicialmente.

    En la tabla 4 se presenta las estimaciones de los totales, las proporciones, las varianzas estimadas y los intervalos

    de confianza respectivos.

    Proporcin ( ) ( ) I.C.

    ( )

    ( )

    ( )

    ( )

    ( )

    ( )

    Tabla 4. Estimaciones puntuales y por intervalo de las tres proporciones de inters.

  • 10

    Con base en la muestra de estudiantes encuestados se estima que el 46.55 % de los estudiantes de la Universidad

    Nacional de Colombia, matriculados en el semestre 2013-1 han ingerido bebidas energizantes, y con una confianza

    del 95% dicho porcentaje se encuentra entre el 41.4% y 51.7%. Adicionalmente se estima que el 13.28 % de los

    estudiantes de la Universidad Nacional de Colombia, matriculados en el semestre 2013-1 han ingerido bebidas

    energizantes todos los das o una vez a la semana, y con una confianza del 95% dicho porcentaje se encuentra entre

    el 7.98% y 18.57%. Se estima que el 86.45 % de los estudiantes de la Universidad Nacional de Colombia,

    matriculados en el semestre 2013-1 han ingerido bebidas espordicamente o una sola vez por curiosidad, y con una

    confianza del 95% dicho porcentaje se encuentra entre el 79.97% y 90.95%.

    MODELOS LINEALES GENERALIZADOS En la seccin anterior se estimaron las proporciones de inters. Ahora se har una aplicacin de los modelos lineales

    generalizados con el fin de determinar de qu factores o variables depende la probabilidad de que una persona

    ingiera o no bebidas energizantes. Para ello inicialmente se deducir la expresin para los estimadores de los

    parmetros y de la varianza estimada de cada uno de ellos, teniendo en cuenta los pesos del diseo de muestreo

    utilizado.

    Denote por: para indicar que el i-simo estudiante consume o no bebidas energizantes, respectivamente, denotar el vector de variables incluidas en el modelo para el i-simo estudiante donde es el vector de parmetros del modelo de tamao . Adems, denote por: : Conjunto de ndices de la poblacin * | + Espacio muestral * | + es el subconjunto de la poblacin correspondiente a los estudiantes que no ingieren bebidas energizantes, es decir:

    * | +,

    es el subconjunto de la poblacin correspondiente a los estudiantes que ingieren bebidas energizantes, es decir:

    * | + es el subconjunto del espacio muestral correspondiente a los estudiantes que no ingieren bebidas energizantes, es decir:

    * | +

    es el subconjunto del espacio muestral correspondiente a los estudiantes que ingieren bebidas energizantes, es decir:

    * | +. En general, se cuenta para cada estudiante de la muestra, con valores ( ) En general, se modela la probabilidad de que un estudiante elegido aleatoriamente consuma o no consuma bebidas energizantes mediante la siguiente expresin:

  • 11

    ( ) ( ) ( )

    es el nmero total de estudiantes en la muestra (340), (

    ) es alguna de las transformaciones Logit, LogLogit o Probit. Ver Tabla 5.

    Logit LogLogit Probit

    ( )

    ( )

    ( ) (

    )

    Tabla 5. Funciones Logit, Log logit y Probit.

    Utilizando el estimador de mxima verosimilitud para se tiene que

    ( ) ( )( (

    )

    )

    El estimador mximo verosmil de se halla al resolver la siguiente ecuacin:

    ( )

    .

    De donde:

    , ( )-

    siendo:

    ( )

    , (

    )( ( ))- .

    Ahora, incluyendo los pesos del diseo de muestreo para cada estudiante, se tiene que

    , ( )-

    .

    Donde es la probabilidad de seleccin del estudiante i-simo dependiendo de la carrera, bajo el diseo de muestreo utilizado, este valor es:

    ( )

    ( ) es el nmero de estudiantes de la carrera a la que pertenece el i-simo estudiante, ver Tabla 1 y es la cantidad total de estudiantes en el marco muestral utilizado de la Universidad Nacional de Colombia Sede Medelln. Sea

    ( ) , ( )-

  • 12

    ( ) , ( )-

    ( ) donde es la solucin de la ecuacin ( ) y se asume que existe una nica solucin

    que es tal que ( ) . Ahora, para encontrar la aproximacin de la varianza de los estimadores utilizando la expansin por series de Taylor

    para ( ) alrededor del punto donde es desconocido, se tiene que

    ( ) ( )

    .

    Lo cual da como resultado una matriz donde los elementos ( ) son

    ( )

    Utilizando ( ) y la expansin de series de Taylor de orden 1 se tiene que

    ( ) ( ) ( )( )

    Y despejando se tiene que ( ) ( ) y se asume que ( ) es la inversa de la matriz ( ). Aplicando varianza al resultado anterior

    ( ) ( ( ) ( ))

    ( ) [ ( )] [ ( )][ ( )] [ ( )] ( )[ ( )]

    (2)

    Donde ( ) es la matriz que contiene los elementos , denotados como :

    . ( ) ( )/ (, ( )-

    ) , (

    )-

    )

    ( ( )

    ( )

    )

    Sea , y utilizando el estimador de Horwitz-Thompson se tiene:

    ( ) ( )

    Como es desconocido, se estima ( ) ( )

    ( ) ( ) (3)

    Asumiendo consistencia y estimando ( ), se obtiene de reemplazar ( ) en ( ) lo siguiente

  • 13

    ( ) [ ( )] ( )[ ( )]

    Imputacin de datos Durante el estudio descriptivo se observ que haba un dato faltante para una observacin en la cantidad de materias matriculadas, por lo tanto se procedi a estimarlo por el mtodo de imputacin Hot Deck, es decir que se reemplaz con el dato ms similar respecto a la carrera, el sexo y el semestre. Despus de realizar la imputacin de este dato faltante, la observacin fue tomada como una observacin regular dentro del modelo. Datos extremos Para determinar los datos extremos se utiliz la agrupacin por cluster (Vecino ms cercano).

    Figura 8. Agrupacin por Materias

  • 14

    Figura 9. Agrupacin por Semestre

    Figura 10. Cluster por Materias y Semestre

    Luego, se tiene que los datos ms extremos son el 71, 115, 181, 24 y 254.

    Backward Con este mtodo para la depuracin de variables, se tom el modelo completo (con las variables edad, materias, deporte, estrato, gnero y semestre) y se eliminaron de manera consecutiva las variables edad, materias, deporte y estrato socioeconmico, para los tres modelos Logit, LogLogit y Probit. Los modelos que quedaron dependen de las variables gnero y semestre. Luego, dependiendo de los nuevos modelos, se realiz para determinar los outliers el mtodo de la Distancia de Cook.

  • 15

    Logit

    Figura 11. Distancia de Cook para el modelo Logit.

    LogLogit

    Figura 12. Distancia de Cooks para el modelo LogLogit.

  • 16

    Probit

    Figura 13. Distancia de Cook para el modelo Probit.

    Con este mtodo se determina que las observaciones 23, 181, 249 y 269 son outliers, por lo tanto se procede a eliminarlas de la muestra y no se tienen en cuenta para las estimaciones de los parmetros de los modelos. Los modelos resultantes fueron los siguientes:

    Modelo Lineal Generalizado Logit estimado:

    ( ) (

    )

    Estimate Std. Error t-value Pr(>|t|)

    Intercept -0,93804 0,27506 -3,41 0,000736

    Sexo 0,49301 0,23562 2,092 0,037219

    Semestre 0,09316 0,0374 2,491 0,013272

    Tabla 6. Estimadores del Modelo Logit.

    Modelo Lineal Generalizado LogLogit estimado:

    ( ) ( ( ))

    Estimate Std. Error t-value Pr(>|t|)

    Intercept -1,04529 0,21307 -4,906 1,51E-06

    Sexo 0,35904 0,17984 1,996 0,0468

    Semestre 0,06497 0,02735 2,376 0,0181

    Tabla 7. Estimadores del Modelo LogLogit.

  • 17

    Modelo Lineal Generalizado Probit

    ( ) ( )

    Estimate Std. Error t-value Pr(>|t|)

    Intercept -0,58829 0,16911 -3,479 5,76E-04

    Sexo 0,30868 0,14579 2,117 0,035035

    Semestre 0,05848 0,02321 2,519 0,012269

    Tabla 8. Estimadores del Modelo Probit.

    Clculo de los Deviance Para elegir el mejor modelo se utiliz el criterio del Deviance:

    [ ( ) ( ) (

    )]

    Donde para cada modelo lineal generalizado es:

    Logit LogLogit Probit

    ,

    -

    ( )

    Tabla 9. Modelos para el Deviance

    Luego

    Deviance

    Logit LogLogit Probit

    454,7588 455,1456 454,7089

    Tabla 10. Resultados para los Modelos del Deviance.

    As, el modelo que se escoge es el Probit ya que es el que presenta el menor Deviance, aunque se observa que los tres modelos presentan valores del Deviance muy cercanos. Entonces, el mejor modelo para determinar la probabilidad de que un estudiante consuma bebidas energizantes es

    ( ) ( )

    Donde es el sexo del i-simo estudiante y es el semestre en el que se encuentra el i-simo estudiante.

  • 18

    5. CONCLUSIONES Al tener en cuenta todas las variables aplicadas en la encuesta, en el anlisis descriptivo se observ que los estudiantes encuestados que consumen en mayor proporcin bebidas energizantes se encuentran cursando alrededor del sexto semestre y lo hacen con una frecuencia semanal o espordica. A partir de los tres diferentes modelos lineales generalizados (Logit, LogLogit y Probit) se tiene que el consumo de

    bebidas energizantes en los estudiantes de la Universidad Nacional de Colombia Sede Medelln depende o se ve

    afectado principalmente por el semestre y el gnero.

    El consumo de bebidas energizantes en los estudiantes de la Universidad es independiente de la edad del estudiante

    y de la prctica de algn deporte, ya que estas variables son las que presentan menor significancia dentro del

    modelo.

    Al emplear el mtodo de identificacin y eliminacin de datos outliers por la distancia de Cook, se aprecia que estas

    observaciones pueden influir en la significancia del modelo.

    Entre las dos variables explicativas del modelo, se aprecia que la variable que ms influye a la probabilidad de

    consumir bebidas energizantes es el semestre, esto por un rechazo con ms fuerza de su valor-p para los tres

    modelos lineales utilizados; luego la carga acadmica por semestre influye para que aumente o disminuya la

    probabilidad de que los estudiantes consuman bebidas energizantes.

    El mejor modelo lineal generalizado es el Probit ya que por un buen ajuste del criterio del deviance se obtuvo la

    menor desviacin para determinar la probabilidad de que los estudiantes de la Universidad Nacional de Colombia

    sede Medelln consuman bebidas energizantes.

    AGRADECIMIENTOS

    Los autores de este trabajo agradecen al funcionario, Daro Rico, Director de Planeacin de la Universidad Nacional

    de Colombia Sede Medelln y a los encuestadores del curso de muestreo estadstico, semestre 01-2013: Ricardo

    Bautista, Ana Mara Cardona, Milena Correa, Estefana Jimnez, Daniela Marn, Andrea Meja, Zaret Ortegn,

    Adriano Polo, Andrea Restrepo, Gloria Ra, Esteban Ruiz, Isaac Snchez, Giovanny Soto, Estefana Uribe,

    Alejandra Vanegas.

    BIBLIOGRAFA

    Falissard, Bruno (2012), Analysis of Questionnaire data with R, EdiCRC Press, 2012, p. 51-54, 89-97. ISBN 978-1-

    4398-1766-7.

    Sarndal, Carl; Swensson, Bengt; Wretman, Jan (1992), Model assisted survey sampling, Springer, 1992. Pgs 494-

    500. ISBN 0-387-97528-4

    Scheaffer, Richard; Mendenhall, William; Ott, Lyman (2007), Elementos de Muestreo, sexta edicin. Editorial

    Thomson. 2007 ISBN 84-9732-493-5

  • 19

    Anexo 1