Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf ·...

68
1 Universidad Autónoma del Estado de Hidalgo Dirección General de Planeación Metodología de muestreo e inferencia estadística para el Seguimiento de Egresados Act. José de Jesús Martínez Guarneros Apoyado con recursos del fondo PIFI 3.0

Transcript of Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf ·...

Page 1: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

1

Universidad Autónoma delEstado de Hidalgo

Dirección General de Planeación

Metodología de muestreo e inferenciaestadística para el Seguimiento de

Egresados

Act. José de Jesús Martínez Guarneros

Apoyado con recursosdel fondo PIFI 3.0

Page 2: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

2

Directorio

Lic. Juan Manuel Camacho BertránRector

M. en C. Enrique G. Macedo ÓrtizSecretario General

Lic. Gonzalo Villegas de la ConchaDirector General de Planeación

Page 3: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

3

CO

NTE

NID

OI.Introducción.............................................5II.Algunos conceptos preeliminares..............8 2.1 Nuestro marco muestral..................9 2.2 Variables estadísticas cualitativas y cuantitativas.......................11 2.3 Consideraciones para....................13

determinar los tamaños de la muestraIII. Obtención de la muestra aleatoria..........17IV. Análisis de sesgo.................................19 4.1 Estimadores ponderados para variables cualitativas .............................20 4.2 Estimadores ponderados para variables cuantitativas............................21V. Análisis estadístico...............................28 5.1 Detección de errores en la información.............................................28 5.2 Análisis de variables cualitativas....29 5.2.1 Obtención del intervalo de confianza

para una proporción (p)..................30 5.2.2 Comparación de proporciones.........30 5.2.3 Comparación entre las proporciones de

dos niveles de una variable con másde dos clases................................33

5.2.4 Comparación de la respuesta a losniveles de una variable cualitativaentre dos o más carreras ...............34

5.2.5 Tablas cruzadas para variablesnominales....................................36

5.2.6 Tablas cruzadas para una variabledicotómica medida antes

y después....................................39 5.3 Análisis de variables cuantitativas...42VI. Glosario de términos.....................47VII. Apéndice A: Cálculo de tamaños de

muestra:......................................50 A.1 Tamaño de muestra para un intervalo

de confianza de una proporción (p) ..50

Page 4: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

4

A.2 Tamaño de muestra para lacomparación de dos proporcionesindependientes (p1, p2)....................52

A.3 Tamaño de muestra para un intervalo de confianza de una variable cualitativa o categórica con más de dos clases ..................................54A.4 Tamaño de muestra para un intervalo

de confianza de una variablecuantitativa o de razón (µµµµµ) ...........55

A.5 Tamaño de muestra para comparaciónde dos medias (µµµµµ1, µµµµµ2) ................56

A.6 Tamaño de muestra para lacomparación de más de dos medias(µµµµµ1, µµµµµ2,..., µµµµµk)...............................57

VIII. Apéndice B: Responsabilidades:.....59B.1 Del personal que labora en la Dirección

de Seguimiento de Egresados..........59B.2 Del área de Control Escolar.............59B.3 Del que origina los procedimientos...59IX. Apéndice C: Descripción de

procedimientos de trabajo para elseguimiento de egresados:..............61

C.1 Procedimiento 1: Entre la Dirección deControl Escolar y las dependencias deeducación superior........................61

C.2 Procedimiento 2: Entre las áreasacadémicas y la Dirección deSeguimiento de Egresados..............62

X. Apéndice D: Diagramas de flujo deprocedimientos:............................65

D.1 Procedimiento 1: Entre la Dirección deControl Escolar y las dependencias deeducación superior.........................65

D.2 Procedimiento 2: Entre las áreasacadémicas y la Direcciónde Seguimiento de Egresados.........66

Page 5: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

5INTR

ODU

CCIÓ

NI. Introducción

El propósito de un estudio estadístico sueleser el de extraer conclusiones acerca de lanaturaleza de una población. Al resultar lapoblación grande y no poder ser estudiada ensu integridad, en la mayoría de los casos lasconclusiones obtenidas deben basarsesolamente de una parte de ella, lo que noslleva a la justificación y la definición detécnicas de muestreo.

Los primeros términos obligados a los quedebemos hacer referencia serán los deestadístico y estimador. Dentro de estecontexto, será necesario asumir unestadístico o estimador como una variablealeatoria con una determinada distribución,y que será la pieza clave en las dos ampliascategorías de la inferencia estadística: laestimación de nuestros parámetros y elcontraste de hipótesis o pruebas dehipótesis de nuestra información obtenida.El concepto de estimador, como herramientafundamental, lo caracterizamos mediante unaserie de propiedades que nos servirán paraelegir el “mejor” para un determinadoparámetro de una población, así comomediante algunos métodos para la obtenciónde ellos, tanto en la estimación puntual comopor intervalos.1

La tarea fundamental de la estadísticainferencial es hacer inferencias acerca dela población a partir de una muestra extraídade la misma.

1 Bioestadística: métodos y aplicaciones. U.D.Bioestadística. Facultad de Medicina. Universidad deMálaga, 2002. Versión electrónica: http://ftp.med.prev.uma.es/libro

Page 6: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

6

Es importante enfatizar que la información queproviene de un censo corresponde a la de todala población, por lo que los estadísticos deinterés que se obtienen a partir del mismo sonlos correspondientes a la población, mientrasque, cuando la información proviene de unamuestra, los estadísticos que se calculan sonlos propios de ella, debiendo utilizarse métodosde inferencia estadística apropiados para poderestablecer a partir de los resultados muestrales,inferencias sobre los poblacionales. Lametodología desarrollada está dirigida al casoen que la información sea recabada con baseen el muestreo aleatorio.2

La teoría del muestreo tiene por objetivo elestudio de las relaciones existentes entre ladistribución de una característica en unapoblación y las distribuciones de dichacaracterística en todas sus muestras.Las ventajas de estudiar una población a partirde sus muestras son principalmente:

·Costo reducido·Mayor rapidez·Más posibilidades

De este modo se ve que al hacer estadísticainferencial debemos enfrentarnos con dosproblemas:

·Elección de la muestra (muestreo).·Generalización de las conclusionesobtenidas con la muestra al resto de lapoblación (inferencia).3

2 “Metodología estadística para la realización deestudios de egresados en una institución de educaciónsuperior”; Alberto Castillo Morales y Rosa ObduliaGonzález Robles, 2002. Universidad AutónomaMetropolitana-Iztapalapa. Departamento deMatemáticas.3 Bioestadística: Métodos y aplicaciones. U.D.Bioestadística. Facultad de Medicina. Universidad deMálaga; 2002. Versión electrónica; http://ftp.med.prev.uma.es/libro

Page 7: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

7

El tipo de muestreo más importante es elmuestreo aleatorio, en el que todos loselementos de la población tienen la mismaprobabilidad de ser extraídos y es el queutilizaremos en nuestros estudios de egresados.

La mayor parte de la información de este manuales referida a la metodología estadística para larealización de estudios de egresados en unainstitución de educación, desarrollada por laUniversidad Autónoma Metropolitana-Iztapalapa(Alberto Castillo Morales y Rosa ObduliaGonzález Robles; Departamento deMatemáticas), la cual ha sido tomada comoreferencia para institucionalizar el seguimientode los egresados de la UAEH (exaueh).

Page 8: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

8

ALG

UNO

S CO

NCEP

TOS

PREL

IMIN

ARES

II. Algunos conceptos preeliminares

La metodología que se describe en estedocumento es aplicable para hacer un estudiode egresados por encuesta en una instituciónde educación superior.

El cuestionario para llevar a cabo dichaencuesta debe ser elaborado como resultadode una definición clara de los objetivos dela investigación, dado que con base en éstosse determinan los indicadores y las variablesque le conducen a la construcción delinstrumento adecuado para medirlas. Una vezque se conocen los objetivos, las variables y elcuestionario para mediarlas, se establecen lastécnicas de muestreo y de inferenciaestadística apropiadas. Las primeras permitenutilizar la estructura de la población y el marcomuestral para proponer un diseño de lamuestra, incluyendo los cálculos del tamañode la muestra; en tanto que las segundasdependen del tipo de variables y de los objetivosque la investigación involucra.

Es importante destacar que el cuestionario, lastécnicas de muestreo y las de inferenciaestadística no son partes aisladas de unainvestigación por encuesta. De hecho estánestrechamente relacionadas, por lo que esimportante conocer los métodos para laobtención del tamaño óptimo de la muestra, laselección de ésta, el cálculo de estadísticosapropiados y las técnicas de pruebasestadísticas, permitiendo obtener informaciónconfiable sobre los egresados, con márgenesde error pequeños en las conclusiones que sehagan a partir del estudio.

Page 9: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

9

2.1 Nuestro marco muestral4

Para poder llevar a cabo nuestro estudio deegresados es importante, en primera instancia,identificar la población, sobre la que deseamosobtener información de acuerdo con los objetivosya planteados.

En este caso, la población de egresados esdividida por carrera o área académica, debido aque éste es un criterio natural para subdividir alos egresados en nuestra institución. Por otrolado, conviene también definir a la población porcohorte de año de egreso, criterio que esadecuado siempre y cuando los egresadoshayan llevado el mismo plan de estudios porcarrera. El año de egreso permite ubicar a lapoblación de egresados de una misma carreraen una situación homogénea respecto al entornoacadémico y a las particularidades de laeconomía. Se pueden unir dos o más cohortesque tengan al menos cinco años de haberegresado.

Entonces, partiendo del hecho de que la carreray el año de egreso formarán los estratos de lassubpoblaciones de las que se va a elegir unamuestra, el número total de egresados lodenotaremos con la letra N y el número deentrevistas que se realicen en esa subpoblaciónse identificará con la letra n. Habrá una N y unan para cada subpoblación, es decir, para cadacarrera o área académica y su respectivo añode egreso.

4 “Metodología estadística para la realización de estudiosde egresados en una institución de educación superior”;Alberto Castillo Morales y Rosa Obdulia González Robles;2002. Universidad Autónoma Metropolitana-Iztapalapa.Departamento de Matemáticas.

Page 10: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

10

Una vez identificadas las subpoblaciones deestudio, se debe de determinar de dónde seelegirán los elementos de la muestra; esto seráel marco muestral. Si se tiene una lista deegresados para cada subpoblación, que incluyala identificación de su carrera, el año de egresoy las direcciones, teléfonos y datos de cadauno de ellos, entonces el marco muestral y lasubpoblación coinciden.La selección de la muestra se hará sobre elmarco muestral o lista de cada subpoblación,obteniéndose una muestra que permitirá hacerinferencias sobre toda la subpoblación y sobrecada uno de los estratos.

Puede darse el caso de que no se cuente coninformación completa de la subpoblación deestudio; es decir, que el marco muestral esmenor a la población; por ello es importanteque, antes de iniciar cualquier estudio deegresados, se verifique la calidad del marcomuestral por área académica; esto es, que seidentifique a los egresados que no aparecen eneste con el fin de completar la lista de nombresy datos para su localización. Si por alguna razónno se pudiera completar la lista, es necesarioconocer la proporción de los egresados queno están en el marco muestral correspondiente;y si esta proporción es grande, digamos mayora 20%, no conviene hacer el estudio, debido aque el alcance de las conclusiones que sepudieran obtener se alejarían bastante de larealidad.

Si la lista no está actualizada y completa, perola proporción de falta de información de losegresados es menor a 20%, la selección de lamuestra se hará sobre el marco para el que setengan registros, a sabiendas de que el alcancede las conclusiones del estudio disminuiráconforme el marco se refiere a una parte cadavez más pequeña de la población, pues los

Page 11: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

11

egresados que no están en la lista, o aquellosde los cuales no se poseen sus datos, nopodrán aportar información para el estudio.

2.2 Variables estadísticas cualitativasy cuantitativas5

Una vez que se ha determinado el objetivo delestudio de egresados, procedemos a elaborarel correspondiente cuestionario para llevar acabo la encuesta. Para cada egresado, lacaracterística que se desea medir, la maneracomo se va a preguntar para obtener lainformación y el tipo de respuestas permitidodeterminaran el tipo de variable utilizada. Estavariable condicionará la forma de llevar a caboel análisis y la interpretación de los resultados.Básicamente tendremos dos tipos de variables:las cualitativas, llamadas también variablescategóricas (en escala nominal u ordinal), condos o más posibles respuestas, y las variablescuantitativas (en escala de intervalo o derazón), cuya respuesta es un número.

Ejemplo de variable cualitativa:

En el caso en que se pregunte el régimenjurídico de la empresa donde está empleado elegresado, tendremos dos posibles respuestas:pública o privada. Para facilitar la captura deesta variable en la base de datos, supongamosque decidimos etiquetar con “0” al régimenpúblico y con “1” al privado. No significa queestos dos números que sustituyen al nombrede la variable sean susceptibles de ser operadosaritméticamente, es decir, manejados en lasuma, el producto o el promedio de los valoresobtenidos de la muestra para esta variable, pueslos resultados son sólo etiquetas, no números.

5 “Metodología estadística para la realización de estudiosde egresados en una institución de educación superior”;Alberto Castillo Morales y Rosa Obdulia González Robles;2002. Universidad Autónoma Metropolitana-Iztapalapa.Departamento de Matemáticas.

Page 12: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

12

En este caso, interesará conocer la proporciónde egresados que se clasifican en cada una delas dos posibilidades, “público” o “privado”; y enel caso de que se deseara comparar la variablerégimen en dos o más carreras, se utilizaríauna prueba estadística que compareproporciones, cuyo método es descritoposteriormente.El cálculo en general de una proporción es elsiguiente:

nmp =

Donde:p = proporción de una población,m = número de elementos de la población que tienen cierta característica en común,n = número total de elementos de esa población.

Ejemplo de variable cuantitativa:

Si se pregunta la edad a la que se concluyó lacarrera, o el ingreso percibido actualmente,tendremos una respuesta numérica de maneranatural, es decir, no hay necesidad deetiquetarla; en este ejemplo, los valoresobtenidos de la muestra para esta variable seránsusceptibles de ser operados aritméticamente.En este caso, interesa conocer el promediode la edad de los egresados; y si se deseacomparar la variable edad de terminación deestudios entre dos o más carreras, se deberáutilizar una prueba estadística para compararmedias, cuyo método también es descrito másadelante.El cálculo en general para un promedio o mediaes:

∑=

==n

1iix

n1xµ

Donde:µ = media o promedio de una población,xi = elemento i-ésimo de la población,

Page 13: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

13

n = número total de elementos xi en la población.

Nota: para uniformar el análisis y la presentación delos resultados, no se deberán hacer preguntas abiertasen los cuestionarios.

2.3 Consideraciones paradeterminar los tamaños de muestra6

Para decidir el tamaño de muestra de cadasubpoblación se debe tener en cuenta que lamuestra misma y los valores muestrales quede ésta se deriven, ya sea una proporción ouna media, estimarán las correspondientesproporciones o medias de la subpoblación. Losprimeros se denominan estimadores y lossegundos parámetros. El objetivo en el estudiode egresados, al igual que en toda encuestapor muestreo, es utilizar los estimadoreshallados en una muestra para hacer inferenciassobre los valores de los parámetros en lapoblación total. Por ejemplo, la proporción deegresados que se encuentran trabajando enempresas del régimen privado, en la muestrade una carrera, estima la proporción de losegresados que trabajan en empresas privadasde toda la población de egresados de esacarrera.

Un punto importante por señalar es que losvalores de los estimadores, ya sea unaproporción o una media, son diferentes en cadamuestra que se elija de una misma población.Por ello debemos tener en cuenta lo siguiente:Un estimador no es un valor concreto sino unavariable aleatoria, ya que, aunque dependeunívocamente de los valores de la muestra

6 Bioestadística: Métodos y aplicaciones. U.D.Bioestadística. Facultad de Medicina. Universidad deMálaga; 2002. Versión electrónica; http://ftp.med.prev.uma.es/libro

Page 14: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

14

observados (Xi=xi), la elección de la muestra esun proceso aleatorio. Una vez que la muestraha sido elegida, se denomina estimación alvalor numérico que toma el estimador sobre esamuestra.

Las características que son deseables para estanueva variable aleatoria (que usaremos paraestimar el parámetro desconocido) deben ser:

Consistencia:cuando el tamaño de la muestra crecearbitrariamente, el valor estimado se aproximaal parámetro desconocido.Carencia de sesgo:el valor medio que se obtiene de la estimaciónpara diferentes muestras debe ser el valor delparámetro.Eficiencia:al ser variable aleatoria, al estimador no puedeexigírsele que para una muestra cualquiera seobtenga como estimación el valor exacto delparámetro. Sin embargo, podemos pedirle quesu dispersión con respecto al valor central(varianza) sea tan pequeña como sea posible.Suficiencia:el estimador debería aprovechar toda lainformación existente en la muestra.

Para nuestros estudios de egresados, con elfin de garantizar que las diferencias de losvalores de los estimadores de una muestra aotra sean pequeñas y, por lo tanto, que lasinferencias sobre los parámetros sean lo másparecido posible, se debe llevar a cabo losiguiente: el tamaño de muestra se determinaráde tal manera que se garantice con unaprobabilidad alta que el estimador no difiera delparámetro por una cantidad pequeña yestablecida de antemano, a la cualdenominaremos precisión y, una vez que lamuestra ha sido obtenida, a dicha probabilidadse le denominará confianza de la muestra.

Page 15: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

15

Para un tamaño de muestra determinado, loselementos que la conformarán se deberánobtener por selección al azar, es decir, demanera aleatoria y sin reemplazo; estogarantiza que se seleccionarán n nombres denuestro marco muestral con igual probabilidadde ser extraídos, éste método se conoce comomuestreo aleatorio y es el que deberá seraplicado en nuestros estudios de egresados.

Debemos tener en cuenta que en nuestrosestudios de egresados, a partir de nuestras vari-ables cualitativas y cuantitativas, para calcularel tamaño de la muestra, vamos a enfocarnosen estimar principalmente dos tipos deparámetros: proporciones y medias ,calculando un tamaño de muestra para cadauno de éstos, y eligiendo el tamaño más grandepara aplicar los cuestionarios.

Como se muestra en el apéndice a, la ecuaciónpara el cálculo del tamaño de muestra cambiade acuerdo con el tipo de parámetro que sedesea estimar (proporción o media), y deacuerdo con el tipo de inferencias que se deseehacer. En el estudio de seguimiento deegresados se nos presentarán principalmentelos siguientes tipos de inferencias:

·Intervalo de confianza para unaproporción·Intervalo de confianza para unamedia·Comparación de proporciones·Comparación de medias

En resumen, para determinar el tamaño demuestra, debemos primeramente identificar ytomar las variables más relevantes en el estudioy calcular para éstas el tamaño de la muestra,de acuerdo con el tipo de inferencia que sedesea hacer de ellas, eligiendo el mayor de lostamaños de muestra obtenidos. Este tamañode la muestra deberá dar, con una buena

Page 16: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

16

aproximación, la precisión y la confianzarequeridas para las inferencias que se deseenrealizar.

Propuesta de tamaño de muestra para estudiode egresados:

Se sugiere obtener el tamaño de la muestra apartir de las variables: “proporción de egresadosque volverían a elegir la misma universidad, encaso de volver a estudiar una licenciatura”, parael caso de variable cualitativa o de proporción;y “promedio final con el que se concluye lalicenciatura”, para el caso de variablecuantitativa o de razón. Se toma el mayor delos valores muestrales que resulten.

Una vez que se obtiene el tamaño de la muestra,se procede a seleccionar los elementos demanera aleatoria, como se explica másadelante. Lo anterior es utilizado con variablesderivadas de preguntas del cuestionario quedeben ser aplicadas a todos los elementos dela muestra; es decir, no deben usarse con vari-ables que contemplen sólo una proporción dela muestra, como podrían ser aquellas que sederivan de preguntas hechas únicamente a losque han realizado estudios posteriores a lalicenciatura.

Es importante mencionar que, en aquellos casosen que el tamaño de la muestra fuese igual omayor que N (total del tamaño del marcomuestral), se hará censo.

En el apéndice a se presentan los métodos paraobtener el tamaño de la muestra para el estudiode egresados de la institución, mostrándolospor separado, para cada uno de los casos deinferencia.

Page 17: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

17

III. Obtención de la muestraaleatoria7

Una vez que el tamaño de la muestra ha sidoobtenido, se procede a seleccionar loselementos del marco muestral de la siguientemanera:

·En primer término, se numera la lista deegresados de todo nuestro marco muestral; elcriterio de numeración no es relevante.

·Se obtienen “n” números aleatorios entre 1 yN, usando el paquete estadístico SPSS.

·Los egresados del marco muestral, cuyonúmero en la lista corresponda con losseleccionados en los n números obtenidos,son los que conformarán la muestra para nuestroestudio y a los que se deberá aplicarel cuestionario.

·En el proceso de localización de los egresadospuede darse el caso de que sea necesariointentar contactarlos más de una vez antes deconseguir la entrevista; en ocasiones no se leslocaliza, o en caso de ser localizados, noacceden a ser entrevistados. Este grupo deegresados se denotará de “no respuesta”.

·En el caso en que se tengan k “no respuestas”en la muestra, si k es menor o igual que 20%de n, se deberá llevar a cabo una segundaselección aleatoria de k elementos, parasustituir a los elementos del grupo de “norespuesta”. Esta nueva muestra se tomará delos elementos del marcomuestral que nohabían sido seleccionados en la primera

7 “Metodología estadística para la realización deestudios de egresados en una institución de educaciónsuperior”; Alberto Castillo Morales y Rosa ObduliaGonzález Robles; 2002. Universidad AutónomaMetropolitana-Iztapalapa. Departamento deMatemáticas.

OB

TEN

CIÓ

N D

E LA

MU

ESTR

A A

LEAT

OR

IA

Page 18: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

18

muestra.

·Si k es mayor que 20% de n, conviene hacerun estudio de sesgo; y en caso de probar queel sesgo es significativo en determinadasvariables, se deberán calcular y reportar paraéstas las estimaciones ponderadas, ya seade proporciones o de medias, que seráncalculadas a partir de las proporciones o me-dias de los dos subestratos: de los que seobtuvo “respuesta” y de los “no respuesta”, ycuya metodología se describe más adelante.

Page 19: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

19

IV. Análisis de sesgo8

Este análisis tiene como objetivo la búsquedade una posible diferencia entre el grupo deegresados de tamaño (n-k), que responde alcuestionario y los del grupo de “no respuesta”de tamaño k, en las variables más importantesdel estudio; es decir, el investigador debedestacar la posibilidad de un efecto de gruposobre dichas variables.El hecho de que el grupo de “no respuesta” noconteste el cuestionario puede deberse arazones que no afectan a las variables deinterés, pero también puede depender de algunacausa que influye en ellas. Para conocer surespuesta al cuestionario y decidir si es simi-lar o diferente de la respuesta de los que síresponden, se debe hacer una labor especialde búsqueda y convencimiento para conseguirlas respuesta de una cantidad de m egresadosdel grupo de “no respuesta”. El valor de m seobtendrá como:

=

Nnkm

Donde:k = número del grupo de “no respuesta” en la muestra de los egresadosN = total de la población de egresados o marco muestral del estudion = tamaño de muestra para esa poblaciónm = tamaño de muestra para el subgrupo de egresados de “no respuesta”

Una vez que se conoce el valor de m, la

AN

ÁLI

SIS

DE

SESG

O

8 “Metodología estadística para la realización de estudiosde egresados en una institución de educación superior”;Alberto Castillo Morales y Rosa Obdulia González Robles;2002. Universidad Autónoma Metropolitana-Iztapalapa.Departamento de Matemáticas.

Page 20: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

20

obtención de éste en la lista del grupo de “norespuesta” debe ser también aleatoria. Una vezque se tienen las entrevistas hechas a esos megresados, se calculan los estimadorescorrespondientes de acuerdo con el tipo de vari-able; es decir; para las variables cualitativas,se calcularán las proporciones y en el caso delas cuantitativas, se calcularan las medias opromedios, en ambos grupos, en el de“respuesta” y en el de “no respuesta”.

Por último, se procederá a realizar las pruebasde hipótesis9 de comparación de proporcioneso de medias, según sea el caso. Si los datosdan suficiente evidencia de que las proporcioneso medias de una variable determinada difierenen los grupos, se desprende que hay sesgo enesa variable y, en caso contrario, se concluyeque no hay sesgo.

En aquellas variables en las que se haencontrado sesgo significativo, se debencalcular y reportar los estimadores ponderados.

4.1 Estimadores ponderados paravariables cualitativas10

Sean:p̂1 = la proporción estimada de una variablecualitativa en el grupo de “respuesta” en unamuestra,

9 Éstas constituyen la parte de nuestro análisis estadísticoy serán explicadas detalladamente más adelante.

10 “Metodología estadística para la realización de estudiosde egresados en una institución de educación superior”;Alberto Castillo Morales y Rosa Obdulia González Robles;2002. Universidad Autónoma Metropolitana-Iztapalapa.Departamento de Matemáticas.

Page 21: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

21

p̂2 = la proporción estimada de una variablecualitativa en el grupo de “no respuesta” en unamuestra,

El estimador ponderado se calcula de lasiguiente manera:

n(k)p̂k)(np̂

p̂ 21* +−=

Donde:k = número del grupo de “no respuesta” en lamuestra de los egresadosn = tamaño de muestra para esa población

p̂* = estimador ponderado para la proporciónde una variable cualitativa en la población deestudio

4.2 Estimadores ponderados paravariables cuantitativas11

Por lo general, una variable cuantitativa dependede las respuestas obtenidas en una cualitativa;esto es que, la media o promedio que se calculapara un grupo dependerá primero de si respondióafirmativamente a alguna pregunta previa; de locontrario, si la respuesta es negativa, no tendríacaso calcular dicho promedio o media. Para estecaso, tenemos que nuestro estimadorponderado estará dado de la siguiente manera.

Sean:

1µ̂ = la media estimada de una variablecuantitativa en el grupo de “respuesta” en unamuestra, y

2µ̂ = la media estimada de una variable

11 “Metodología estadística para la realización de estudiosde egresados en una institución de educación superior”;Alberto Castillo Morales y Rosa Obdulia González Robles;2002. Universidad Autónoma Metropolitana-Iztapalapa.Departamento de Matemáticas.

Page 22: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

22

cuantitativa en el grupo de “no respuesta” enuna muestra

El estimador ponderado se calcula de lasiguiente manera:

+

+−

=

mv*kn

mv*kµ̂u)-k(nµ̂

µ̂21

*

Donde:n = tamaño de muestra para la población deestudiok = número del grupo de “no respuesta” en lamuestra de los egresadosm = tamaño de muestra para el subgrupo deegresados de “no respuesta”u = número de egresados en el grupo de“respuesta” que contestan “no” a una variablecategórica de interésv = número de egresados entrevistados en elsubgrupo de “no respuesta” que contestanafirmativamente a una variable categórica deinterés

µ̂* = estimador ponderado para la media de unavariable cuantitativa en la población de estudio.

En el caso de que el cálculo del estimador deuna media no dependa de una respuesta a unavariable cualitativa anterior, el cálculo delestimador ponderado se hará de manera simi-lar al visto para una proporción:

n(k)µ̂k)(nµ̂

µ̂ 21* +−=

Donde:k = número del grupo de “no respuesta” en lamuestra de los egresados

Page 23: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

2312 Nótese que para la comparación de proporciones seutiliza la prueba de Ji-Cuadrada; y para la comparaciónde medias o promedios, se utiliza la prueba F de Fisher.Se sugiere al lector estudiar estas pruebas estadísticascon la finalidad de no tener problemas para interpretarlos resultados obtenidos.

n = tamaño de muestra para esa población

µ̂* = estimador ponderado para la media de unavariable cualitativa en la población deestudio

Nota: Para las variables en las cuales el sesgo resulteno significativo, se unen los n-k egresados que sírespondieron con los m del grupo de “no respuesta”que se lograron entrevistar, obteniéndose una muestrade tamaño n-k+m, con la cual se calculan losestimadores que se deben reportar en el estudio.

Todo lo anterior se puede mostrar de maneramás clara en el siguiente ejemplo:

En un estudio de egresados, en la búsquedade los n=98 seleccionados en la muestra, deun total de N=385 de la carrera de Medicina, selogró entrevistar a 67 de ellos, se obtuvo una“no respuesta” de k=31. Como k>20% de 98,se hace un estudio de sesgo. Con este fin seprocede a la localización de m de los 31egresados del grupo de “no respuesta”, dondem = 31*(98/385) = 8. Para las variables “¿volveríaestudiar la misma carrera?” y “¿laboraactualmente?”, se obtienen las frecuencias delas respuestas, tanto en la muestra de los querespondieron como en los ocho casoslocalizados para el estudio de sesgo (elegidosaleatoriamente del grupo de “no respuesta”),reportadas en las siguientes tablas defrecuencias12:

Page 24: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

24

*Chi-Square Test

Esta tabla produce una Ji-cuadrada de 0.028.Se concluye que no hay efecto de grupo sobreesta variable, esto es, no hay diferenciasignificativa entre las proporciones del nivel “sí”en ambos grupos, y la muestra no da evidenciade que exista sesgo. Uniendo los dos grupos

aairevloVraidutseamsimal

arerrac

atseupseR atseupseroN latoT

iS

edopurGyatseupseR

oNatseupseR

25

%8.77

6

%57

85%3.77

)57/85=(

oN

edopurGyatseupseR

oNatseupseR

51

%4.22

2

%52

71%7.22

)57/71=(

latoT

edopurGyatseupseR

oNatseupseR

76

%001

8

%001

57

%001

Volvería a estudiar la misma carrera. Grupo derespuesta y no respuesta.*Crosstabulation

eulaV fd.giS.pmysA

dedis-2

nosraePerauqS-ihC

820. 1 868.

ytiunitnoCnoitcerroC

000. 1 000.1

doohilekiLoidaR

720. 1 968.

ybraeniLraeniL

noitaicossa720. 1 868.

dilavfoNsesac

57

Page 25: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

25

atseupseRoN

atseupseRlatoT

ajabarTetnemlautca

iS

edopurGatseupseR

oNedyatseupseR

06

6.98

4

%05

46

%3.58

oN

edopurGatseupseR

oNedyatseupseR

7

%4.01

4

%05

11

%7.41

latoT

edopurGatseupseR

oNedyatseupseR

76

%001

8

%001

57

%001

*Chi-Square Test

eulaV fd.giS.pmysA

)dediS-2(

nosraePerauqS-ihC

339.8 1 300.

ytiunitnoCnoitcerroC

250.6 1 410.

doohilekiLoidaR

775.6 1 010.

ybraeniLraenil

noitaicossA418.8 1 300.

dilavfoNsesac

57

Con una Ji-cuadrada de 8.93, significativa al.003, se concluye que hay efecto de grupo sobreesta variable. Las proporciones de respuesta

se obtiene entonces una proporción de

77.3%7558p̂ == para el nivel “sí” de la variable

“volvería a estudiar la misma carrera”.Para la variable “labora actualmente”, se obtuvo:

Trabaja actualmente. Grupo de respuesta y de norespuesta.*Crosstabulation

Page 26: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

26

para el nivel “sí” de “trabaja actualmente” sonsignificativamente diferentes en los dos grupos.Dado que la muestra da evidencia de que haysesgo, se calcula el estimador ponderado parael nivel “sí” de la variable “trabaja actualmente”:

( ) ( ) 0.7798

310.5031980.896p̂* =+−=

Para la variable cuantitativa “ingreso”, medidaen salarios mínimos, se obtuvo lo siguiente:*Descriptives

osergnI*nelautcasoiralassominím

N naeM.dtS

noitaivsed.dtSrorrE

edopurGatseupseR

06 583.8 006.2 633

edopurGoN

atseupseR4 576.4 087.0 093

latoT 46 351.8 976.2 533

ecnedifnoc%59naemroflavretni

osergnI*nelautcasoiralassominím

rewoLdnuob

reppUdnuob

numiniM numixaM

edopurGatseupseR 317.7 750.9

5 61

edopurGoN

atseupseR334.3 719.5

4 6

latoT484.7 228.8 4 61

Page 27: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

27

ANOVA

El análisis de varianza produce un estadísticode F con valor de 7.989, significativo al 0.006.Se concluye, entonces, que hay diferencia en-tre los ingresos de los grupos de respuesta yde no respuesta de los egresados de la carrerade Medicina, por lo que se da un caso de sesgo,debiéndose utilizar el estimador ponderado.Para proceder a hacer el cálculo de dichoestimador, se deben tener en cuenta los 60+4egresados que perciben ingresos y querepresentan a los subestratos de 60 querespondieron y a los 31*(4/8) que norespondieron; entonces:

( )7.6233

843160

84314.675608.385

µ̂* =

+

+

=

osergnI*nelautcAsoiralaSsominíM

fomuSserauqs

fdnaeMerauqS

F .giS

neewteBspuorg

516.15 1 516.15 989.7 600.

nihtiWspuorG

465.004 26 164.6

latoT 971.254 36

Page 28: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

28

V. Análisis estadístico13

5.1 Detección de errores en lainformación

En primer lugar se debe verificar que cada vari-able tome sólo los valores correspondientes alas respuestas posibles que se dan en elcuestionario y, posteriormente, asegurarse deque el número de egresados que no contesta acada una de las variables sea pequeño, ya quede lo contrario, debe evitarse hacer inferenciassobre estas variables. Se denotará al númerode egresados que no contestan una variablecomo casos “no validos”, y al número deegresados que si la contestan, como “casosvalidos”.La primera parte de la verificación puedehacerse pidiendo al paquete SPSS una tablade frecuencias para cada variable cualitativa(nominal u ordinal) y un resumen descriptivo delas variables de razón que incluya el mínimo yel máximo valor de cada una de ellas; ambosanálisis reportan número de casos válidos. Laverificación de las variables ligadas se puedehacer con tablas de frecuencia o usando tablasde clasificación cruzadas entre las variables deliga y las que se derivan de ella. Si se detectanerrores, es necesario pedir al paquete queimprima el número de cuestionario para loscasos donde se presentan los valores diferentesa los permitidos, detectados a partir de loscasos de frecuencia. Los errores se localizanpor revisión directa del cuestionario.

13 “Metodología estadística para la realización deestudios de egresados en una institución de educaciónsuperior”; Alberto Castillo Morales y Rosa ObduliaGonzález Robles; 2002. Universidad AutónomaMetropolitana-Iztapalapa. Departamento deMatemáticas.

AN

ÁLI

SIS

ESTA

DÍS

TIC

O

Page 29: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

29

5.2 Análisis de variablescualitativas

Para cada variable cualitativa se piden lasfrecuencias para la muestra total de la población.El paquete SPSS presenta una columna de“porcentajes válidos”, misma que constituye entérminos de porcentaje, las proporcionescorrespondientes a cada valor de la variable,obtenidas para todos los que contestaron, estoes; sin considerar los casos “no validos”, loscuales debieron haber sido previamente definidoscomo “valores faltantes”. Puede darse el casode que una DES, para un estudio de egresadosen particular; en la mayoría de sus variablestambién requiera las frecuencias para cada unade las carreras, lo que se obtiene pidiendo loscruces (tablas cruzadas) de cada variable porcarrera. El total de casos por carrera en la tablano necesariamente coincide con el tamaño dela muestra por carrera que se tiene en el estudio,ya que en la tabla no aparecen contabilizadoslos casos “no validos” correspondientes a losegresados que no contestan alguna pregunta,situación que trae como consecuencia que elnúmero de casos para la variable que se midecon dicha pregunta sea menor que el tamañode la muestra calculado para la carrera.Es muy importante tener en cuenta que eltamaño de la muestra real de una variabledeterminada para un grupo de interés (como,por ejemplo, todos los que trabajan o todos losque estudian) se obtiene restando los casos“no validos”. El tamaño de la muestra real deuna variable cualquiera es el que debe utilizarsetanto para la comparación de proporciones,como para calcular intervalos de confianza(cuyos análisis se presentan en los siguientesapartados), y que debe reportarse en cadaanálisis que se realice con una variabledeterminada.

Page 30: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

30

5.2.1 Obtención del intervalo deconfianza para una proporción (p)

El valor que toma una proporción p̂ en lamuestra no coincide con el valor de la proporciónp en la población, pero, no obstante, es posibleestablecer entre qué valores se ubica el valoren la población con una confianza establecida.Los paquetes estadísticos no cuentan conrutinas para generar el intervalo de confianzade una proporción, ni para poblaciones finitasni infinitas. Sin embargo, es muy simple suobtención: solamente necesitamos calcular unvalor b, dado por la siguiente ecuación, yposteriormente sumarlo y restarlo al estimadormuestral de la proporción p̂ , para obtener elintervalo:

( ) ( )( )1nN

p̂1p̂nNZb−

−−=

Donde:

N = tamaño total de la poblaciónn = tamaño de la muestraZ = valor de la distribución Normal Estándar asociado al valor de la confianza requeridap̂ = estimador muestral de la proporción

Entonces, los límites del intervalo son bp̂ − y

bp̂ + , y se tendrá la confianza especificada deque entre esos límites está el valor de laproporción de la población.

Ejemplo:

En una carrera con N=362 egresados, se obtuvouna muestra real de n=194, calculándose laproporción de respuestas afirmativas a una

Page 31: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

31

variable, se obtuvo . El intervalo con 90% deconfianza para el valor de la proporción en lapoblación se calcula como:

( )( ) 0373.0193362

0.69*0.31*194362*1.645b =−=

Y el intervalo con 90% de confianza va de 0.272a 0.347. Esto quiere decir que la proporción derespuestas “sí” en la población está entre 0.272y 0.347, con 90% de confianza.

5.2.2 Comparación de proporciones

A continuación se puntualizan los distintoscasos de comparación entre proporciones (tiposde inferencias) que se pueden realizar para unavariable cualitativa determinada.Para poder declarar que las proporciones p yq=(1-p) de una variable con dos niveles sondiferentes, se requiere que el intervalo deconfianza para una de ellas no contenga al valor0.5. El intervalo se construye a partir de una delas proporciones estimadas, es decir, laobtenida en la muestra, y el valor de b que seobtenga.

Ejemplo1:

Para la variable “tipo de estudios posteriores ala licenciatura” se tiene que obtener primero lafrecuencia de cada uno de los niveles o clasesde la variable. Los pasos por seguir en el SPSSpara obtenerlas son:

1. A partir del menú principal de comandos, seactiva la opción “statistics”, y a partir del sub-menú correspondiente,2. Se selecciona la opción “sumaries”, y luego3. Se elige “frecuencies”:

Page 32: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

32

Nótese que no se registran casos “no validos”en esta muestra. Luego tenemos:

Estudios posteriores

Nota: La variable “tipo de estudios posteriores a lalicenciatura” no es dicotómica, pero ha sidorecodificada para serlo, uniendo los niveles:especialización, maestría y doctorado, de la variableoriginal en el nivel “postgrado”, usado en este análisis.El resto de las opciones de la variable original(diplomados, cursos cortos y otros) se ha unido yconforma el nivel “educación continua” en este análisis.

Se puede comparar la proporción poblacionalde los que realizan estudios de educación con-tinua con la proporción poblacional de los quehacen postgrado, cuyos estimadores sonrespectivamente: 78.1% y 21.9%. Para poderdeclarar que las proporciones poblacionales sondiferentes, se requiere que el intervalo deconfianza para una de ellas no contenga el valor0.5.El intervalo puede obtenerse calculando el valorde b, con los siguientes datos: tamaño de lapoblación N=4800, tamaño de la muestran=474, proporción estimada en la muestra de

ycneucerF tnecrePdilaV

tnecrePevitalumoC

tnecrep

dilaVnóicacudEaunitnoC

073 1.87 1.87 1.87

sesaC odargtsoP 401 9.12 9.12 0.001

latoT 474 0.001 0.001

latoT 474 0.001

N

dilaV gnissiM

soidutsEseroiretsop

474 0

Page 33: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

33

los que estudian algún postgrado 0.219p̂ = ,valor de confianza de 95%; con lo que se obtieneun valor de b=0.04. Entonces el intervalo deconfianza para la proporción de los que estudianpostgrado es {(0.219-0.04; 0.219+0.04)} =(0.179; 0.259), el cual no incluye el valor 0.5;por lo tanto, se declara con el 5% de significaciónque la proporción de los que estudian postgradodifiere de aquella de los que realizaron otro tipode estudios.

Ejemplo 2:

Supongamos que el intervalo de confianza parauna proporción p de una población al 95% deconfianza fuera (0.428; 0.541), entonces lamuestra no da suficiente evidencia para declararque p difiera de q14, pues el intervalo de confianzacontiene el valor 0.5.

5.2.3. Comparación entre lasproporciones de dos niveles de unavariable con más de dos clases

En este caso, el análisis se reduce a las dosclases de la variable cualitativa que se deseacomparar. La muestra real para el análisis serála suma de las frecuencias de dichas clases.Como siguiente paso, se obtienen los intervalosde confianza para las dos proporciones y, deser ajenos (es decir, que no se traslapan), seconcluye que las proporciones de las dos clasesno son iguales. En caso contrario, si losintervalos de confianza de las dos proporcionesse traslapan, la muestra no da evidencia de quelas proporciones en la población seandiferentes.

14 Recuérdese que p+q=1.

Page 34: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

34

Ejemplo:

La variable “tamaño de empresa” tiene cuatroniveles: grande, mediana, pequeña y micro. Paracomparar las proporciones poblacionales de losniveles mediano y pequeño, se toma comotamaño de muestra la suma de las frecuenciasde estos dos niveles, n=627. Si los intervalosde confianza al 95% (αi=0.05), basados en los627 egresados que pertenecen a esos nivelesen una población de 10,000 son (0.082; 0.142)y (0.107; 0.167), se concluye que la muestrano da suficiente evidencia con 10% designificación (1-α1-α2 = 1-0.05-0.05 = 90%), paradeclarar diferentes a las proporcionespoblacionales de los egresados que laboran enempresas de tamaño mediano y pequeño,debido a que los intervalos obtenidos con baseen la suma de frecuencias no son ajenos.

5.2.4 Comparación de la respuesta alos niveles de una variable cualitativaentre dos o más carreras

Supóngase que en una DES se tienen dos omás muestras independientes, una por cadacarrera, y se quiere saber si el patrón derespuestas a los niveles de una variable es igualentre las diferentes carreras, excepto por lavariación aleatoria que se presenta en lasmuestras. Con las frecuencias de lasrespuestas, se puede generar una tabla de dobleentrada, donde una de las entradas correspondea los niveles de la variable (criterio declasificación 1), y la otra, a las carreras (criteriode clasificación 2).

La prueba de homogeneidad de distribución derespuestas entre las diferentes carreras se basaen la Ji-cuadrada que se obtiene de la tabla de

Page 35: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

35

frecuencias (el SPSS lo calcula a través delprocedimiento “crosstabs”). Si la Ji-cuadrada essignificativa, se concluye que las carreras de laDES tienen diferente distribución de susrespuestas, debiéndose interpretar por separadoel resultado de cada carrera. En caso contrario,la muestra no da evidencia de diferencias enlos patrones de distribución de las respuestasentre las carreras, lo que significa que losegresados de las carreras se comportan demanera similar en cuanto a la variable analizada,pudiéndose interpretar que las diferentescarreras de la DES presentan el patrón derespuestas dado por los valores de lasproporciones correspondientes a los totales delas carreras. El uso de “crosstabs” del SPSSse detalla en el apartado 5.2.5 de tablascruzadas para variables nominales.

Nótese que la forma de realizar la prueba essimilar si la variable cualitativa tiene sólo dos omás de dos clases, y también si se deseacomparar dos carreras, varias carreras o todaslas carreras de la DES.

Ejemplo:En un estudio de egresados, se desea compararla distribución de respuestas de la variable“empleo” para tres carreras. Al pedir la tabla dedoble entrada y la Ji-cuadrada, se obtiene losiguiente:

Carrera/empleoCrosstabulationCount

oelpmE

arerraC iS oN latoT

anicideM 48 21 69

aígoloiB 06 82 88

aígoloicoS 52 9 43

latoT 961 94 812

Page 36: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

36

eulaV fd.giS.pmysA

)dedis-2(

nosraeP 202.01 2 600.

erauqS-ihC

doohekiLoitaR

116.01 2 500.

yb-raeniLraeniL

noitaicossA080.6 1 410.

dilavfoNsesac

812

En la tabla de salida del SPSS se lee el valorde Ji-cuadrada = 10.202, el cual es significativoal 0.5%. Se concluye que las proporciones derespuesta “sí” y “no” a la pregunta: “¿trabajaactualmente?”, no es la misma para las trescarreras consideradas en el ejemplo.

5.2.5 Tablas cruzadas para variablesnominales

Nota: Desde que se elabora el cuestionario, se debedeterminar qué variables se van a cruzar con otras.

Para cada cruce, usando el paquete SPSS:

1. Se activa primero la opción “statistics” delmenú principal,

2. Se selecciona del submenú correspondientela opción “sumaries”,

3. Del submenú correspondiente, se debeseleccionar la opción “crosstabs”,

4. En la ventana de diálogo de “crosstabs” sedebe seleccionar el botón “statistics”, que ofrecela opción “Chi-Square”. Esta opción permiteprobar si las variables son independientes oestán relacionadas. De acuerdo con el resultado

Page 37: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

37

de la prueba, se lleva a cabo el análisis deporcentajes de la siguiente manera:a). Si las dos variables son independientes, locual ocurre cuando el nivel de significaciónmuestral que aparece en el renglón de Chi-Square y en la columna Asymp. Sig. (2-sided)es mayor que 0.05, pueden describirse porseparado los porcentajes totales para cada vari-able, además de los porcentajes para cadacelda.b). Si las dos variables están relacionadas, locual ocurre cuando el nivel de significaciónmuestral que aparece en el renglón Chi-Squarey el la columna Asymp. Sig. (2-sided) es menoro igual a 0.05, sólo se puede hacer referencia alos porcentajes en las celdas, analizando sustendencias por renglón o por columna, y no esconveniente describir por separado losporcentajes totales de renglones ni decolumnas, ya que pueden no reflejar lastendencias de los renglones o de las columnasen las celdas de la tabla.

Para el caso en que se pruebe que los criteriosson independientes, conviene que lapresentación gráfica se haga por separado paracada variable. Por el contrario, si la muestra daevidencia de que las variables estánrelacionadas, conviene hacer una sola gráficadonde las barras para una variable correspondana la suma de las partes de la otra variable.

Ejemplo:

Suponga que se hace el cruce entre “sexo” y laopinión de los egresados sobre cómo les haido en el cambio de empleo que tenían alegresar, con el empleo que tienen actualmente(en el momento de la entrevista). Supóngaseque el número de egresados con el que se realizaeste cruce (967) corresponda a aquellos quetrabajaban tanto al egresar como en el momentode la entrevista.

Page 38: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

38

En el siguiente cuadro se presenta el cruceentre las dos variables mencionadas, que sepidió con la prueba de Ji-cuadrada, con lafinalidad de probar que hay relación entre dichasvariables. La prueba produce un valor designificación muestral de 0.00000, lo cual in-dica que sí hay asociación entre la opinión y elsexo:

*Opinión sobre el nivel de ingresos del empleo alegresar con el empleo actual por sexo

tnuoC.tcPwoR

tcPloCórojeM

átsElaugi

óroepmEwoR

latoT

onilucsaM 641 402 921 974

5.03 6.24 9.82 5.94

1.3 7.45 9.76

oninemeF 852 961 16 884

9.25 6.43 5.21 5.05

9.36 3.54 1.3

nmuloC 404 373 091 769

latoT 8.14 6.83 6.91 0.001

erauqS-ihC eulaV fd ecnacifingiS

nosraeP 58195.8 2 00000.0

oitardoohilekiL 22055.95 2 00000.0

lezsireaH-fetnaMtset

raenilroFnoitaicossa

53027.25 00000.0

En este caso en particular, se puede establecerque la opinión con respecto al cambio deempleo es diferente en los hombres que en lasmujeres. De hecho, si se toman los porcentajes

Page 39: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

39

por renglón (segundo número en la celda) parahombres y mujeres, la distribución de losporcentajes correspondientes a los distintosniveles de opinión difiere; esto es, mientras quelos hombres tienden en mayor proporción aopinar que “están igual” (42.6%), las mujeresopinan en mayor proporción que mejoraron(52.9%). Las razones por las que se está dandoesta situación no están al alcance de laestadística, por lo que el nivel explicativocorresponde darlo a algún especialista.

5.2.6 Tablas cruzadas para unavariable dicotómica medida antes ydespués

Si se tiene una variable cualitativa con dosclases, que se mide en dos tiempos distintos(antes y después), y se desean conocer lasproporciones de los cambios (por ejemplo, sise pregunta a los egresados si trabajan alterminar la carrera y si lo hacen cinco añosdespués), los cambios de un periodo a otro semiden con la prueba de Mc Nemar, la cualpermite probar la hipótesis nula de que loscambios en un sentido tienen igual magnitudque los cambios en el sentido contrario. Si elnivel de significación muestral es menor o igualque 0.05, quiere decir que la proporción decambios en un sentido difiere de la proporciónde los cambios en el sentido contrario. De otramanera, la muestra no permite identificar ladiferencia significativa. En el paquete SPSS estaprueba se realiza siguiendo los siguientespasos:

1. A partir del menú principal, se activa la opción“statistics”,2. Del submenú correspondiente, se seleccionala opción “Non parametric test”,3.- Del submenú correspondiente, se seleccionala opción “2 related samples”,4.- Al desplegarse la ventana de diálogo, se

Page 40: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

40

marca la opción “Mc Nemar” de entre lasopciones de “test type”.

Ejemplo 1:Suponga que se tiene la información sobre elnúmero de egresados que estuvieron empleadosal egresar y durante el último año de unacarrera. Dado que se trata de un caso típico deuna variable medida en dos tiempos distintos,“antes” y “después” a los mismos individuos,se pide la prueba de Mc Nemar. Se desea probarque la proporción de egresados que, sin habertrabajado durante el último año de su carrera,sí lo hacen al egresar; difiere de la proporciónde los que habiendo trabajado el último año desu carrera no lo hacen al egresar. Los egresadosque trabajan en ambos periodos no cambiaron,como tampoco lo hicieron los que no trabajaronen ninguno de los dos periodos (estos casosse llaman empates). Los empates se toman encuenta para realizar la prueba de Mc Nemar, enla que se busca la significación entre los dostipos posibles de cambios.

La siguiente tabla es generada cuando se pidela prueba de Mc Nemar:

*Empleo al egresar & Empleo durante el últimoaño

laoelpmErasergni

oñaomitlúleetnarudoelpmE

1 2

1 804 89

2 811 403

Page 41: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

41

rasergelaoelpmEoñaomitlúleetnarudoelpmE&

N 829

erauqS-ihC)detcerroCytiunitnoC(

176.1

.giS.pmysA 691.0

Test Statistics (Mc Nemar test)

De los 928 egresados, 712 corresponden aempates, es decir, sujetos que no cambiaronsu estatus laboral. Del resto, 98 egresadosdejaron de trabajar y 118 se incorporaron a untrabajo, dado que no lo estaban haciendo en elúltimo año de la carrera. Los datos muestralesno dieron suficiente evidencia para concluir quela proporción hacia obtener trabajo difiere de laproporción hacia dejar de trabajar (ya que lasignificación muestral de 0.196 es muy grande).Es importante señalar que, a pesar de que losnúmeros de casos 98 y 118 son evidentementediferentes, esa diferencia se debe sólo al azar,y no está evidenciando una diferencia en lasproporciones poblacionales, que es hacia dondese quiere inferir.

Ejemplo 2:En forma similar al ejemplo anterior, en éstesuponga que se desea probar si la proporciónde los cambios entre el tener empleo al egresary tener empleo actualmente (en el momento dela entrevista) es diferente en un sentido o enotro:*Empleo al egresar & Empleo actual

laoelpmEraserge

lautcaoelpmE21

1 025 6

2 083 22

Page 42: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

42

*Test Statistics (Mc Nemar test)

rasergelaoelpmElautcaoelpmE&

N 829

erauqS-ihC)detcerrocytiunitnoC(

384.063

.giS.pmysA 000.0

La tabla muestra una significación muestral de0.000, que permite declarar que la proporciónde aquellos que de no trabajar al egresar sí lohacen actualmente, difiere de la proporción delos que trabajando al egresar no lo hacenactualmente.

5.3 Análisis de variablescuantitativas

En la encuesta de egresados hay pocas varia-bles cuantitativas, pero para cada una de ellasse debe solicitar un análisis descriptivo quepresente su media, su desviación estándar ylos valores mínimo y máximo. Este análisis selleva a cabo en el paquete SPSS de la siguientemanera:

1. Se marca en el menú de comandos la opción“statistics”,2. En el submenú correspondiente, la opción“summarize”,3. Del submenú se elige “descriptives”.

Para una presentación gráfica, se sugiere lagráfica de barras15 para cada variable de interés.A fin de comparar medias de una variable

15 En este caso deseamos obtener el histograma defrecuencias.

Page 43: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

43

cuantitativa en los diferentes niveles de unavariable categórica, se usa el análisis devarianza con un solo factor.

En el paquete SPSS este análisis se realiza:

1. Seleccionando la opción “statistics” del menúprincipal,2. Del submenú correspondiente, la opción“compare means”, que lleva a su vez a otrosubmenú,3. Se elige la opción “One-way ANOVA”.

Si el valor de significación muestral para laprueba F (la columna sig. en la tabla de ANOVA)es mayor que 0.05, se concluye que no haydiferencia de medias en este caso; los datosno dieron evidencia de que las mediaspoblacionales (parámetros) son diferentes,aunque sus estimadores lo seannuméricamente, debido a variaciones dealeatoriedad. Si el valor de la significaciónmuestral para la prueba de F (la columna sig.en el ANOVA) es menor o igual a 0.05, entoncesse concluye que los datos dan suficienteevidencia para rechazar la hipótesis de igualdadde medias; por lo tanto, al menos una de lasmedias difiere.

Si se prueba (en la tabla de ANOVA) que almenos una de las medias es diferente, seprocede entonces a realizar la prueba deTukey para comparaciones múltiples demedias (esta prueba se elige después demarcar el boton “Post Hoc” en la ventana dediálogo desplegada por la opción “One-wayANOVA” en el SPSS). Este análisis, a partir dela comparación de cada media con las demás,presenta un arreglo por grupos, donde todasaquellas medias que entran en un grupo nodifieren significativamente entre sí, pero sídifieren con respecto a los otros grupos.

Page 44: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

44

Ejemplo:

Supóngase que se desea comparar el ingresoactual promedio de los egresados de lascarreras de Turismo, Administración yEconomía. Dicha comparación se lleva a caborealizando un análisis de varianza:

*Descriptives

N naeM.dtS

noitaivseD.dtSrorre

omsiruT 13 0922.5 2454.1 2162.0

nóicartsinimdA 02 0038.4 0412.1 5172.0

aímonocE 84 0573.71 3227.5 9528.0

latoT 99 4730.11 8504.7 3447.0

roflavretniecnedifnoc%59naem

dnuobrewoL dnuobreppU

omsiruT 6596.4 4267.5

nóicartsinimdA 8162.4 2893.5

aímonocE 4317.51 6630.91

latoT 3065.9 4415.21

ANOVAIngreso actual en salarios mínimos

fomuSserauqS

fdnaeMerauqS

F .giS

neewteBspuorg

614.4473 2 802.2781 432.011 000.0

nihtiWspuorg

654.0361 69 489.61

latoT 278.4735 89

Page 45: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

45

La tabla de análisis de varianza prueba que almenos en una de las carreras el promedio delingreso es diferente, con una significaciónmuestral de 0.000En la tabla de análisis descriptivo se presentanlas medias, desviaciones estándar, desviacionesestándar para la media, e intervalos de confianzapara la media correspondientes a cada una delas carreras comparadas. A partir de estosestimadores, se puede apreciar que las mediasmuestrales de ingreso para las carreras deTurismo y Administración son más cercanasnuméricamente que la media muestral deEconomía, lo que resulta más contundentecuando se analizan los intervalos de confianzade las medias, que coinciden para Turismo yAdministración y son totalmente ajenos enEconomía.

Sin embargo, se debe usar la prueba de Tukeypara agrupar las medias, ya que se deseaprobar la diferencia entre medias poblacionalesy no entre medias muestrales, que son las queofrece el análisis descriptivo.

En las siguientes tablas se presenta el reportede la prueba de Tukey. En la primera semuestran todas las comparaciones posibles depares de medias, y en la segunda se resumenlos resultados. En ésta se presentan dos grupos;de los que se concluye lo siguiente: los datosno ofrecieron suficiente evidencia de que lasmedias de ingreso que perciben actualmentelos egresados de las carreras de Turismo yAdministración difieren; pero dieron suficienteevidencia de que dichas medias, son diferentesde la media de los ingresos que perciben losegresados de la carrera de Economía:

Page 46: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

46

arerraC)I( arerraC)J(naeM

ecnereffiD)J-I(

rorrE.dtS

omsiruTnóicartsinimdA

aímonocE0993.0*0641.21-

281.1059.0

nóicartsinimdAomsiruTaímonocE

0993.0-*0545.21-

281.1790.1

aímonocEomsiruT

nóicartsinimdA*0641.21*0545.21

059.0790.1

lavretniecnedifnoC%59

arerraC)I( .giSrewoLdnuoB

reppUdnuoB

omsiruT939.0000.0

8414.2-5604.41-

8212.34588.9-

nóicartsinimdA939.0000.0

8212.3-1651.51-

8414.29339.9-

aímonocE000.0000.0

4588.99339.9

5604.411651.51

*The mean difference is significant at the 0.05 level.Ingreso Actual*Tukey HSDA,B

SS 50.0=ahplaroftesbuS

arerraC N 1 2

omsiruT 02 0038.4

nóicartsinimdA 13 0922.5

aímonocE 84 0573.71

.giS 829.0 000.1

Means for groups in homogeneous subset are dis-played.*A: Uses Harmonic Mean Samples Size=29.100*B: The group sizes are unequal. The harmonic meanof the group sizes is used. Type I error levels are notguaranteed.

*Multiple ComparisonsDependent Variable: Ingreso actualTukey HSD

Page 47: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

47

VI. GLOSARIO DE TÉRMINOS

Aleatoriamente:Actividades o métodos producidos o llevados acabo simulando un comportamiento al azar.

Censo:Recabación de la información de todos losindividuos pertenecientes a un grupo o unapoblación.

Datos:Son los valores cualitativos o cuantitativosmediante los cuales se miden lascaracterísticas de los elementos por estudiarde un grupo o población.

Egresado:Persona que haya concluido y aprobado sucorrespondiente plan de estudios.

Encuesta:Método de recolección de datos, la cual esllevada a cabo generalmente a través de algúnformulario que la persona seleccionada en lamuestra, debe responder.

Estadística:Ciencia que estudia los métodos para recoger,organizar, resumir y analizar, así como parasacar conclusiones y tomar decisionesrazonables basadas en dicho análisis.

Estimador:Medida resumen calculada en una muestra paraaproximarse al valor de un parámetro de lapoblación total. Los estimadores se usan parahacer inferencias sobre la población de estudio.

Inferencia estadística:Aplicación de los resultados de estudios de unamuestra a la población, y emisión de juicios oconclusiones sobre esa población en general.

GLO

SAR

IO D

E TÉ

RM

INO

S

Page 48: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

48

Inferir:Emisión de juicios o conclusiones basados enalgún conocimiento o experiencia sobre unevento o suceso.

Marco muestral:Base de datos o lista definida por la poblaciónque conforma el estudio de interés, y cuyonúmero de registros puede ser menor o igual altamaño total de la población o grupo de estudio.

Muestra:Grupo de individuos u objetos elegidos de ungrupo más amplio o población, de acuerdo conun criterio preestablecido. Los métodosestadísticos asumen que las muestras sonaleatorias.

Muestra aleatoria:Muestra elegida de tal modo que todos losindividuos u objetos de la población tienen lamisma probabilidad de ser elegidosindependientemente.

Muestreo:Selección al azar y sin reemplazo de elementosde una población, que conforman el tamaño demuestra determinado, con igual probabilidad deser seleccionados.

Población:Grupo de individuos u objetos también llamadouniverso.

Proporción:Porcentaje de una cantidad de datos específicoscon respecto al total de esos datos.

Page 49: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

49

Sesgo:Desviación sistemática entre el resultadoobtenido para cualquier estimador en la muestray el verdadero valor del parámetro en lapoblación, debido a la forma en que se hizo elestudio. Es decir, qué tanto se aleja de larealidad un valor estimado.

Tamaño de la muestra:Cantidad de datos que serán extraídos de lapoblación para formar parte de la muestra.

Variable estadística cualitativa:También llamada variable categórica, medida enescala nominal u ordinal, con dos o más posiblesrespuestas.

Variable estadística cuantitativa.:Son variables definidas en escala de razón, cuyarespuesta es un número.

Page 50: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

50

VII. APÉNDICE a

Cálculo de tamaños de muestra16

En este apéndice se presenta la metodologíapara los siguientes cálculos:

A.1 Tamaño de muestra para un intervalo deconfianza de una proporción (p).A.2 Tamaño de muestra para la comparaciónde dos proporciones independientes (p1, p2).A.3 Tamaño de muestra para un intervalo deconfianza de una variable cualitativa o categóricacon más de dos clases.A.4 Tamaño de muestra para un intervalo deconfianza de una variable cuantitativa o de razón(µ).A.5 Tamaño de muestra para comparación dedos medias (µ1, µ2).A.6 Tamaño de muestra para comparación demás de dos medias (µ1, µ2,..., µk).

A.1 Tamaño de muestra para unintervalo de confianza de unaproporción (p)

Si se desea tener un nivel determinado deconfianza tal que, entre una proporción de unavariable cualitativa de todos los egresados deuna carrera y la proporción de ese mismo nivelde la variable en la muestra obtenida de estosegresados no difiera por más de una cantidadpequeña, la cual debe ser determinada por elinvestigador y la denotaremos por la letra griega

16 “Metodología estadística para la realización deestudios de egresados en una institución de educaciónsuperior”; Alberto Castillo Morales y Rosa ObduliaGonzález Robles; 2002. Universidad AutónomaMetropolitana-Iztapalapa. Departamento deMatemáticas.

APE

ND

ICE

a

Page 51: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

51

α, se dice que se desea hacer una estimaciónp̂ para la proporción p en la población, con unaprecisión de α o menor.De esta manera, tenemos que:La proporción p̂ en la muestra es el estimadorpara el parámetro p en la población, α es laprecisión o el margen de error máximo quedeseamos tener para que el estimador p̂ nodifiera del parámetro p. 17

Por ejemplo, si se desea que la diferencia delas proporciones de los que opinan que “sivolverían a estudiar en la misma institución”, deentre todos los egresados de la carrera deAdministración y la muestra de egresados deésta no difiera por más de .05=α, se dice quese desea hacer una estimación de losegresados de la carrera de Administración quevolverían a estudiar en la misma institución, conprecisión de .05 o menor.

Una vez que se decide la precisión, se debeespecificar el nivel de confianza o intervalo deconfianza para dicha precisión, esto es, laprobabilidad con que se espera que se cumplaque el parámetro y el estimador difieran laprecisión deseada o menos. Con el fin de queno crezcan mucho los tamaños de la muestra,se sugiere usar una confianza entre 90% y 95%para cada subpoblación.De esta manera, se tiene la siguiente fórmula:

)p̂(1p̂Z

α1)(N)p̂(1p̂Nn

2

2−+−

−=

Donde:n = tamaño de la muestra

17 En este caso deseamos establecer que αp̂p ≤− ,

siendo esta nuestra hipótesis alternativa (Ha); para ellotendríamos que haber rechazado la hipótesis nula

Ho: αp̂p >− .

Page 52: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

52

p̂ = estimador para la proporción en lapoblación totalN = número total de la poblaciónα = precisión o margen de error deseadopara el estimadorZ = es el valor asociado para el nivel de confianzao intervalo de confianza requerido (1-α ),tomado de la distribución normal estándar

En la práctica se usa un valor de p̂ que provieneya sea de una muestra piloto, siempre y cuandoel estudio piloto se haya realizado con el rigorestadístico requerido, o bien, de estudiosanteriores. Si no existe información de este tipo,se puede utilizar p̂ =0.5, lo cual nos arroja elmayor tamaño de muestra.

A.2 Tamaño de muestra para lacomparación de dos proporcionesindependientes (p1, p2)

Es frecuente encontrarse con el hecho dequerer comparar dos proporciones. Por ejemplo:se dice que la proporción de egresados de lacarrera A, que se encuentran realizandoestudios posteriores a la licenciatura y es mayorque la proporción de egresados de la carrera B,que se encuentran realizando ese mismo tipode estudios. Para hacer la inferencia de que“dos proporciones difieren”, se debe haberrechazado la hipótesis nula de que “soniguales”,18 ya que, de no ser así, las diferenciasentre las proporciones muestrales se deben

18 En este caso, nuestra hipótesis nula es Ho: pp 21 = , y

nuestra hipótesis alternativa es Ha: pp 21 ≠ .

Page 53: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

53

sólo a variación aleatoria, aunquenuméricamente una sea mayor que la otra. Debenotarse que se compara entre carreras oestratos las proporciones de un mismo nivel devariable; en este caso, son las proporciones dela categoría “sí” de la variable “realización deestudios posteriores” las que se estáncomparando entre las carreras A y B.

Para hacer la hipótesis de igualdad deproporciones, sólo se dispone de métodosaproximados que no utilizan el tamaño de lapoblación y producen tamaños de muestramayores. En lugar de eso, y para aprovechar lametodología que se vio en el apartado anterior,se sugiere obtener el tamaño de muestra delos dos estratos que se desea comparar, usandolas ecuaciones y tablas para intervalos deconfianza de una proporción. Dichos tamañosde muestra se calculan usando las precisionesα1 y α2, de los dos intervalos, asumiendo que lasuma de α1+α2 es igual a la precisión deseadaα; esto es α1+α2=α.

Por lo tanto, si se desea declarar diferentes alas proporciones en las subpoblaciones, cuandola diferencia entre los estimadores sea mayorque una constante o diferencia mínima α, paraun nivel de significación establecido(probabilidad fijada o intervalo de confianza), sebuscan los tamaños de muestra para cada unade las proporciones con nivel de confianza ointervalo de confianza igual a uno menos la mitad

de esa significación establecida

2α1 , para

que las precisiones al sumarse den la diferenciamínima α. La modificación al nivel o intervalo deconfianza es necesaria para garantizar el nivelde significación de la prueba.

De este modo, debemos usar la fórmula:

Page 54: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

54

)p̂(1p̂Z

α1)(N)p̂Np(1

n

ii2

2i

i

−+−

−=

Donde:n = tamaño de la muestraN = tamaño de toda la subpoblaciónp̂i = estimador en nuestra muestra para laproporción pi en la subpoblación; i=1,2α =α1+α2; nivel de precisión deseada ovalor máximo que pueden diferir lasproporciones p1 y p2 en las subpoblaciones.Para calcular el tamaño de muestra se debehacer, por ejemplo:

+−=

2αα1deseadaprecisión de % 21

,

Z = valor asociado para nuestro nivel designificación o intervalo de confianza en ladistribución normal estándar, el cual debe sermodificado de la siguiente manera; por ejemplo:si se desea que las proporciones p1 y p2 nodifieran por más del valor a de 10%, entoncesdeberemos usar la confianza del 95%, la cuales hallada como: .95=1-(.10/2).

A.3 Tamaño de muestra para unintervalo de confianza de unavariable cualitativa o categórica conmás de dos clases

Para este tipo de variables se puede utilizar untamaño de muestra dirigido hacia la clase o nivelde la variable de mayor interés y reducir elproblema al caso de una proporción. De maneraalternativa, si la variable es orden o cuantitativa,de manera aproximada se puede hacerreferencia a la media y se utilizan los resultadosde las variables de razón que se verán en elsiguiente apartado.

Page 55: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

55

A.4 Tamaño de muestra para unintervalo de confianza de unavariable cuantitativa o de razón (µ)

Para calcular el tamaño de muestra para unintervalo de confianza de una variable de razón,por ejemplo, el ingreso, también es necesarioespecificar un valor para la precisión α ; pero,en este caso, debido a que la variable puedetomar cualquier valor numérico, esta precisióndeberá estar definida en términos de ladesviación estándar; es decir:

σαβ =

Donde:β = precisión en términos de la desviaciónestándar de nuestra variable de razónα = nivel de precisión deseadoσ = desviación estándar

Cuando se ha determinado un valor de precisiónα, del cual obtendremos un valor de precisión ,para que la media estimada µ̂ no difiera delparámetro µ en la población de estudio pormás de dicho valor β19, aclarando que, parautilizarla, la desviación estándar debe serconocida. Entonces la ecuación para calcularel tamaño de la muestra es la siguiente:

19 En este caso, nuestra hipótesis nula es Ho: βµ̂µ >−

y nuestra hipótesis alternativa es Ha: βµ̂µ ≤− .

Page 56: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

56

1ZβNNn

2

2

+=

Donde:n = tamaño de muestraN = tamaño total de la poblaciónβ = precisión deseada en términos de ladesviación estándarZ = valor asociado al nivel de significación ointervalo de confianza deseado (igual a 1-α),tomado de la distribución normal estándar

A.5 Tamaño de muestra paracomparación de dos medias (µ1, µ2)Con frecuencia surge la necesidad de comparardos medias independientes o más; por ejemplo,supóngase que un investigador de una DESdesea agrupar entre algunas carreras, aquellascuyas medias poblacionales de alguna variablecuantitativa; como podrían ser el ingreso o laedad, no difieran.Para realizar la prueba de hipótesis de igualdadde dos medias (µ1 y µ2), se puede procedercomo en el caso de dos proporciones. Seobtiene el tamaño de muestra de los dosestratos que se desea comparar, usando lasecuaciones para intervalos de confianza de unamedia µ. A partir de las precisiones de los dosintervalos (para β1 y β2), se diseña de maneraque la suma β1+β2=β sea la precisión deseadaen la comparación de dos medias (µ1 y µ2).Entonces, si se desea declarar que las mediasson diferentes cuando la diferencia entre losparámetros sea mayor que una constante odiferencia mínima β20, para un nivel designificación o intervalo de confianza establecido,

20 En este caso, nuestra hipótesis nula es Ho: µµ 21 = , y

nuestra hipótesis alternativa es Ha: µµ 21 ≠ .

Page 57: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

57

se buscan los tamaños de muestra para cadauna de las medias con el nivel de confianza ointervalo de confianza igual a uno menos la mitadde la significación establecida (1-α/2), paraprecisiones que al sumarse den la diferenciamínima α. Debe recordarse que las precisionesdeben estar en términos de las desviacionesestándar. Por lo tanto, tenemos:

1ZβNNn

2

2i +

=

Donde:n = tamaño de muestraN = tamaño de toda la subpoblaciónβ =β1+β2 =nivel de precisión deseada o valor máximo quepueden diferir las medias µ1 y µ2 en lassubpoblacionesZ = Valor asociado para nuestro nivel designificación o intervalo de confianza en ladistribución normal estándar, el cual debe sermodificado de la siguiente manera; por ejemplo:

Si se desea que las medias µ1 y µ2 no difieranpor más del valor β con un nivel de significaciónde 10%, entonces deberemos usar unaconfianza de 95%, la cual es hallada como:

( )95%

2.101

2αα1 21 =−=

+− .

A.6 Tamaño de muestra paracomparación de más de dos medias(µ1, µ2,..., µk)Cuando se desee comparar más de dos me-dias (µ1,µ2,...,µk), en general k medias, se sugiereutilizar el mismo procedimiento que al comparardos medias. 21

21En este caso, tenemos la hipótesis nulaHo: µ...µµ k21 === y la hipótesis alternativa Ha:

µ...µµ k21 ≠≠≠ .

Page 58: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

58

Pero calculando el nivel de confianza como:

Nivel de confianza =1 - ((significación deseada) / k)=1- ((á1 + á 2 + …+ ák)/ k)

Luego la precisión para calcular el tamaño dela muestra de cada uno de los estratos se tendríaque corregir por: β...ββγ k21 +++=

Donde:γ =precisión corregida para inferir sobre la diferenciade k medias entre k subpoblacionesβi =precisión deseada para la mediacorrespondiente a la i-ésima subpoblación, entérminos de la desviación estándar:

σαβ

i

ii = ; i=1,2,...,k.

Ejemplo:Si se tuvieran cinco carreras, y se desearacomparar entre éstas el ingreso de losegresados. Ya que el ingreso está medido enmoneda nacional o en número de salariosmínimos, la variable es cuantitativa, por lo quela comparación que se desea se tendría querealizar comparando (estadísticamente) lasmedias de las carreras. El procedimiento paracalcular el tamaño de muestra por estrato, enel que se deseara obtener 10% de significaciónpara la comparación de esas cinco medias(10%=α=α1+α2+α3+α4+α5), el nivel de confianzao intervalo de confianza que se tendría que usarsería: 1-(.10/5)=.98.

Y la precisión usada para calcular el tamaño demuestra de la i-ésima subpoblación es:

γ=β1+β2+β3+β4+β5

Page 59: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

59

VIII. APÉNDICE bResponsabilidades

B.1 Del personal que labora en laDirección de Seguimiento deEgresados

a. Servir de instrumento de apoyo a cada unade las áreas académicas para llevar a cabo losestudios de seguimiento de egresados.b. Determinar los muestreos correspondientespara cada estudio.c. Ordenar y clasificar la información obtenidade las encuestas realizadas, llevar a cabo elanálisis de resultados y publicar el estudio.

B.2 Del área de Control Escolar

a. Verificar que los datos sean capturados demanera correcta, siguiendo un mismo criterio.b. Validar los datos que al finalizar cadasemestre son enviados para alimentar la basedel Sistema Institucional de Seguimiento deEgresados.c. Enviar la base de datos de los egresadosactualizada.d. Validar, con la documentación que obra ensu archivo, la información que respalda losestudios de los exauaeh, generando númerosde cuenta y NIPS de acceso al sistema.

B.3 Del que origina losprocedimientos

a. Los directores de la DES, a través de losresponsables de los programas educativos,elaborarán los cuestionarios que serán enviadosa la Dirección de Seguimiento de Egresadospara su aplicación, indicando cuál es la finalidadde este estudio.b. Contactar a sus egresados para laactualización de la base de datos

APE

ND

ICE

b

Page 60: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

60

correspondiente y mantener el vínculo paracontar con información confiable cada vez quese requiera.c. Aplicar las encuestas específicas que seelaboren para estudiar los programas educativosy la productividad de los egresados.d. Es labor del área académica correspondientela toma de decisiones con base en losresultados obtenidos del estudio.

Page 61: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

61

IX. Apéndice c

Descripción de los procedimientos detrabajo para el seguimiento de

egresados

C1. Procedimiento 1: entre laDirección de Control Escolar y lasDependencias de Educación Superior

1. El área de Seguimiento de Egresadossustenta su actividad con la base de datos delos egresados que la Dirección de Control Es-colar proporciona de manera automática enforma semestral. Se reciben estos datos.

2. Los datos son revisados por las personasdesignadas por la Dependencia de EducaciónSuperior correspondiente, con la finalidad deverificar que estén completos y seancongruentes.

3. En caso de que haga falta obtener algunosdatos faltantes, es labor de las Dependenciasde Educación Superior establecer contacto conlos egresados para que se pueda validar suinformación.

4. Las Dependencias de Educación Superiordeben registrar y/o modificar los datos de losegresados y alumnos que así lo requieran, porcambio de domicilio, número telefónico, cambiode dirección de correo electrónico, actualizaciónde datos por acreditación de estudios depostgrado, etc. Deben reportar los cambiosrespectivos a la Dirección de Control Escolar,por medio de una aplicación en línea, con lafinalidad de que los datos de egresados yalumnos estén siempre actualizados.

APE

ND

ICE

c

Page 62: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

62

C2. Procedimiento 2: entre lasáreas académicas y la Dirección deSeguimiento de Egresados

1. El área académica correspondiente solicitaal área de Seguimiento de Egresados unestudio, especificando el cuestionario que deseaque sea aplicado a sus egresados.

2. El área de Seguimiento de Egresados revisael cuestionario, lo aprueba, lo calendariza y loprograma para su aplicación.

3. El área de Seguimiento de Egresados pu-blica en el portal web el cuestionario solicitadoy elabora copias impresas del mismo.

4. Se baja la base de datos de Control Escolarde la población de egresados del respectivo plande estudios.

5. El área de Seguimiento de Egresadosestablece las cohortes poblacionales de esabase de datos, de acuerdo con las fechas enlas que se han llevado a cabo cambios en elplan de estudios y éste ha entrado en vigor.

6. Una vez definido el universo de egresadosdel correspondiente plan de estudios, el áreaacadémica procede a contactar a los egresadospara la actualización de los datos (domicilios yteléfonos); al concluir esta labor, el área deSeguimiento de Egresados recibe dichainformación.

7. El área de Seguimiento de Egresados revisaesta base actualizada. El objetivo es contar conmás del 80% de los datos actualizados.

8. El área de Seguimiento de Egresados haceun muestreo de la base de datos actualizada.

Page 63: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

63

9. El área de Seguimiento de Egresados asignanúmeros de identificación personal (NIP’S) a losegresados seleccionados en la muestra, paraque únicamente ellos tengan acceso aresponder el cuestionario por medio del portalweb.

10. El área académica contacta a los egresadosseleccionados en la muestra y los invita a quecontesten el cuestionario por medio del portalweb en primer lugar y, de no ser posible para elegresado(a) esta opción, se concertará unavisita domiciliaria para la entrega de uncuestionario impreso.

11. El área de Seguimiento de Egresadoscaptura las respuestas obtenidas en una basede datos, conforme el área académica le vahaciendo llegar los cuestionarios contestados.En caso de existir respuestas incompletas enalgunos cuestionarios, se invita nuevamente alegresado a responder sus preguntas faltantes.

12. Se monitorean, cada periodo determinado,las respuestas obtenidas.

13. Se establece una fecha límite para larecepción de cuestionarios contestados.

14. En esa fecha límite, se comienza a depurarla base de datos, y se deja abierta la opción decapturar algunos cuestionarios que pudieranllegar al área de Seguimiento de Egresadosdurante la depuración de la base de datos.

15. Una vez depurada la base de datos, en casode que las respuestas obtenidas sean unaproporción menor que 80% del total del tamañode muestra definido, se procede a hacer unanálisis de sesgo, y si se hallara que este essignificativo, se trabaja nuevamente a partir delpunto 8, para lo cual se debe recalendarizar lapublicación de los resultados. En caso de queel sesgo no fuese significativo, se procede alpunto 17.

Page 64: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

64

16. Si la proporción de respuestas obtenidases mayor que 80% del total de la muestradefinida, se cierra el proceso de recepción decuestionarios.

17. Se procede al análisis estadístico de losdatos obtenidos y se obtienen conclusiones.

18. Se revisa y se estandariza la presentaciónde los resultados en un formato para supublicación.

19. Se publican los resultados en forma impresay en web.

Page 65: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

65

Inicio

Recepción automática de bases de datos

semestrales

Vinculación con los egresados

Registro y/o modificación de datos de alumnos y

egresados

Revisión de datos de alumnos y egresados

Fin

APE

ND

ICE

dX. APÉNDICE d

Diagramas de flujo de procedimientos

D.1 PROCEDIMIENTO 1: entre laDirección de Control Escolar y lasDependencias de EducaciónSuperior.

Page 66: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

66

D.2 PROCEDIMIENTO 2: entre lasáreas académicas y el área deSeguimiento de Egresados.

Inicio

Área académica solicita estudio al área de SE

Se baja la base de datos de Control Escolar de esa población de egresados

El área de SE revisa que la base contenga al menos 80%

de los datos actualizados

Se definen las cohortes poblacionales de acuerdo

con el plan de estudios

El área académica contacta a los egresados para la

actualización de sus datos

Área de SE revisa, aprueba, calendariza y programa el

estudio

Área de SE publica en el portal web el cuestionario y

hace copias impresas

A

Page 67: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

67

Se hace un muestreo de la base de datos actualizada

Se asignan NIP’s a los egresados

seleccionados en la muestra

Se invita a los egresados

seleccionados a contestar el

cuestionario por la web o en forma

impresa

Se capturan las respuestas

conforme van contestando los cuestionarios

Se monitorean las respuestas obtenidas

Se fija fecha límite para la recepción de

cuestionarios

Se depura la base de datos

A

B

C

Page 68: Universidad Autónoma del Estado de Hidalgosgc.uaeh.edu.mx/planeacion/images/pdf/4_egresados.pdf · cualitativas y cuantitativas.....11 2.3 Consideraciones para.....13 determinar

68

FIN

Sesgo significativo

Proporción de respuestas obtenidas

mayor a 80% de la muestra

Análisis de sesgo

Se revisan y estandarizan los resultados en un

formato para publicar

Análisis estadístico de los datos y obtención de conclusiones

Se publican los resultados en web

y en forma impresa

B

NO

NO SI

C

SI