Pt2 pf pelm (1)

38
“Análisis Estadístico y Probabilístico de la Deserción Escolar del IEMSDF mediante el Método de Regresión por Mínimos Cuadrados.” Elaboró: C. Pedro Lara Maldonado PRESENTACIÓN FINAL DEL PROYECTO TERMINAL

Transcript of Pt2 pf pelm (1)

Page 1: Pt2 pf pelm (1)

“Análisis Estadístico y Probabilístico de la Deserción Escolar del IEMSDF mediante el

Método de Regresión por Mínimos Cuadrados.”Elaboró: C. Pedro Lara Maldonado

PRESENTACIÓN FINAL DEL PROYECTO TERMINAL

Page 2: Pt2 pf pelm (1)

• La deserción escolar en esta dependencia es un grave problema para los habitantes capitalinos, por que genera consecuencias de desarrollo sustentable en las oportunidades de conseguir un buen empleo (Díaz, 2015).

• Para analizar cuantitativamente este evento a lo largo del tiempo y determinar la predicción certera de esta problemática, se considera el Modelo Estadístico del Ajuste Polinomial mediante el Método de Regresión por mínimos cuadrados (Gujarati, 2012).

INTRODUCCIÓN

Page 3: Pt2 pf pelm (1)

OBJETIVO

• Realizar predicciones de la deserción estudiantil en las últimas generaciones que no se ha realizado el cohorte de registro en la Subdirección de Administración Escolar que comprenden del año 2013 hasta el 2014:

Plantear una magnitud de aproximación de este fenómeno. Construir una estimación muestral. Definir cuál de los posibles valores futuros de la variable

objetivo es la más probable.

Page 4: Pt2 pf pelm (1)

METODOLOGÍA • Los datos se tomaron del registro que tiene el Sistema de Información Mexicana

del Distrito Federal (INFOMEXDF).

Page 5: Pt2 pf pelm (1)

DELIMITACIÓN GENERAL DEL ANÁLISIS ESTADÍSTICO

Para:

Analizar la Modalidad Escolarizada

Tomar los registros del número total generacional del ingreso

y del egreso estudiantil.

No tomar en cuenta el género estudiantil.

No considerar los rangos de edad de los estudiantes.

Page 6: Pt2 pf pelm (1)

VARIABLES DEL ANÁLISIS

Definiendo para como la representación discreta de la generación escolar considerando desde la fundación del IEMS, a partir de la generación 2001 hasta la delimitación de la generación 2012.

Definiendo para como el porcentaje de deserción generacional- que se define por (Ponce,2003):

Donde: Número de estudiantes que ingresaron por generación.Número de estudiantes que egresaron por generación.

Page 7: Pt2 pf pelm (1)

CÁLCULO DE DATOS POR AÑOGeneración EIG EEG PDG

2001-1 3062 349 88.62002-2 3719 644 82.682003-3 3401 901 73.512004-4 5647 1390 75.392005-5 5443 1602 70.572006-6 5538 1765 68.132007-7 5762 1735 69.892008-8 5804 1533 73.592009-9 5729 1502 73.782010-10 6149 1591 74.132011-11 6625 1700 74.342012-12 6372 1601 74.872013-13 6349 ¿? ¿?2014-14 6826 ¿? ¿?

Page 8: Pt2 pf pelm (1)

APLICACIÓN DEL INSTRUMENTO, SIMULACIÓN Y PRUEBA DE FUNCIONAMIENTO.

• Para poder realizar el óptimo ajuste funcional a los datos de la dependencia; se corrobora mediante el software de wólfram alpha: http://www.wolframalpha.com/ con la sintaxis:

fit {{1,86.60}, {2,82.68}, {3,73.51}, {4,75.39}, {5,70.57}, {6,68.13}, {7,69.89}, {8,73.59}, {9,73.78}, {10,74.13}, {11,74.34}, {12,74.87}}

Page 9: Pt2 pf pelm (1)

DIAGNÓSTICO

Ajuste Polinomial

Cúbico 0.902282 0.865638Cuartico 0.909252 0.857396Cuadrático 0.793787 0.747962

Page 10: Pt2 pf pelm (1)

CRITERIO DE DETERMINACIÓN PARA LA ELECCIÓN DE UN ÚNICO AJUSTE VIABLE

Donde:Coeficiente de determinación Coeficiente de determinación ajustado

Page 11: Pt2 pf pelm (1)

DETERMINACIÓN DE UN ÓPTIMO AJUSTE POLINOMIAL

• Esta determinación implica la

consideración de elaborar manualmente la tabla de ajuste de regresión por mínimos cuadrados para esta función determinada.

Page 12: Pt2 pf pelm (1)

TABLA CORRESPONDIENTE AL AJUSTE POLINOMIAL CUADRÁTICO

Suma por

columna

Page 13: Pt2 pf pelm (1)

COEFICIENTES DE LA FUNCIÓN CUADRÁTICA

• Se procede a encontrar los coeficientes: a través del siguiente sistema matricial para este ajuste cuadrático:

• Luego se resuelve el sistema matricial a través del Método de la Inversa por medio del software de Matrixcalc, que en este caso, se define por:

Page 14: Pt2 pf pelm (1)

ESTIMACIÓN DEL INTERVALO DE PREDICCIÓN AL 95% DE CONFIANZA

• Intervalo de predicción esta dado por (Wackerly, 2010):

Donde: Bivalencia Matriz inversa Número de datos Grado del mejor ajuste polinomial Variable porcentual de deserción que define la generación discreta del pronóstico

Page 15: Pt2 pf pelm (1)

ELEMENTOS DEL INTERVALO DE PREDICCIÓN

• Matriz pronóstico para datos discretos generacionales:

Ejemplo:• Para la generación 2013, implica que: • La matriz de parámetros:

Page 16: Pt2 pf pelm (1)

ELEMENTOS DEL INTERVALO DE PREDICCIÓN

• Matriz de diseño del ajuste polinomial:

• Matriz de respuesta del modelo ajustado a los datos:

Page 17: Pt2 pf pelm (1)

ELEMENTOS DEL INTERVALO DE PREDICCIÓNConsiderando que: • El percentil de una Student , se caracteriza por: Grados de libertad: Nivel de confianza al en su distribución probabilística.

Page 18: Pt2 pf pelm (1)

ELEMENTOS DEL INTERVALO DE PREDICCIÓNConsiderando que: • El error estándar de estimación es:

Donde: Suma de cuadrados del error Matriz transpuesta

Page 19: Pt2 pf pelm (1)

RESULTADOS • Valores de ajuste para aplicar la relación de variables en el método de

mínimos cuadrados

Suma por

columna

Page 20: Pt2 pf pelm (1)

DETERMINACIÓN DE LOS COEFICIENTES DE LA FUNCIÓN CUADRÁTICA

• Aplicando el Método de la Inversa por medio del software de Matrixcalc,

Page 21: Pt2 pf pelm (1)

DETERMINACIÓN DE LOS COEFICIENTES DEL AJUSTE POLINOMIAL CUADRÁTICO

• Los coeficientes se sustituyen en la función de ajuste polinomial cuadrático:

Page 22: Pt2 pf pelm (1)

INTEGRACIÓN DE RESULTADOS PARA LOS INTERVALOS DE PREDICCIÓN

• Considerando el ajuste polinomial cuadrático:

• Esto implica, sustituir los valores respectivos del percentil de una t Student y del error estándar de estimación para esta fórmula que define el ajuste polinomial cuadrático:

Page 23: Pt2 pf pelm (1)

VALOR DEL PERCENTIL DE LA T STUDENT MEDIANTE SOFTWARE DE WOLFRAM ALPHA

Page 24: Pt2 pf pelm (1)

ELEMENTOS MATRICIALES PARA REALIZAR OPERACIONES EN EL INTERVALO DE PREDICCIÓN.

• Para la matriz de diseño del ajuste polinomial:

Page 25: Pt2 pf pelm (1)

ELEMENTOS MATRICIALES PARA REALIZAR OPERACIONES EN EL INTERVALO DE PREDICCIÓN.

• Para la matriz de respuesta del modelo ajustado a los datos:

Page 26: Pt2 pf pelm (1)

ERROR DE LA ESTIMACIÓN

• Sustituir los elementos matriciales mencionados de la siguiente manera:

Page 27: Pt2 pf pelm (1)

INTERVALO DE PREDICCIÓN GENERALIZADO QUE PUEDE ESTIMAR EL PDG ESTUDIANTIL.

• Por lo tanto, se sustituyen los valores del percentil de la distribución t Student y del error de estimación en la fórmula generalizada del intervalo de predicción:

Generación 2013:

Generación 2014:

Page 28: Pt2 pf pelm (1)

VALOR IZQUIERDO DE LA BIVALENCIA MEDIANTE LAS MATRICES DE PRONÓSTICO Y DE PARÁMETROS EN LOS RESPECTIVOS

INTERVALOS DE PREDICCIÓN

Generación 2013, se sustituyen las matrices correspondientes al lado izquierdo de la bivalencia, para efectuar su operación:

Aplicando el software de wólfram alpha: {{1,13,169}}*{{91.42409},{-5.69021},{0.37881}}

Por lo tanto, el valor del lado izquierdo de la bivalencia es:

Page 29: Pt2 pf pelm (1)

VALOR DERECHO DE LA BIVALENCIA MEDIANTE LAS MATRICES DE PRONOSTICO Y DE DISEÑO EN LOS RESPECTIVOS

INTERVALOS DE PREDICCIÓN

Generación 2013:

Page 30: Pt2 pf pelm (1)

VALOR DERECHO DE LA BIVALENCIA MEDIANTE LAS MATRICES DE PRONOSTICO Y DE DISEÑO EN LOS RESPECTIVOS

INTERVALOS DE PREDICCIÓN {{1,13,169}}*inverse({{12,78,650},{78,650,6084},{650,6084,60710}})*{{1},{13},{169}}

Esta sintaxis da el resultado de la operación matricial y por lo tanto este valor resultante se sustituye en la fórmula de intervalo de predicción:

Page 31: Pt2 pf pelm (1)

CORROBORANDO LOS LÍMITES DEL INTERVALO DE PREDICCIÓN MEDIANTE EL SOFTWARE DE OCTAVE-MATLAB

• [p,S] = polyfit(x,y,n): Da los coeficientes del polinomio p de grado n que se encontró manualmente en la ecuación de la mejor función polinomial que ajusta los puntos (x,y) por mínimos cuadrados, con errores estimados S

• [Y,D] = polyconf(p,X,S,alpha): Predicción polinómica con intervalos de confianza Y±D de la salida S dada por polyfit con nivel de confianza alpha

Page 32: Pt2 pf pelm (1)

EJECUCIÓN DEL SOFTWARE OCTAVE PARA ENCONTRAR LOS LIMITES DE CADA INTERVALO DE PREDICCIÓN

• Estas instrucciones definidas, implica introducir las variables de los puntos del ajuste considerado, es decir (x,y)=(Generacion,Desercion) con el siguiente orden fundamental:

octave:1>Desercion=[88.60,82.68,73.51,75.39, 70.57,68.13,69.89,73.59,73.78,74.13,74.34,74.87];

octave:2>Generacion=[1,2,3,4,5,6,7,8,9,10,11, 12];• Luego, se agrega la instrucción polyfit definida en este caso,

como: octave:3>[p,S]=polyfit(Generacion,Desercion,2)p =

0.37881 -5.69021 91.42409

Page 33: Pt2 pf pelm (1)

EJECUCIÓN DEL SOFTWARE OCTAVE PARA ENCONTRAR LOS LIMITES DE CADA INTERVALO DE PREDICCIÓN

• Por lo tanto, se corroboran los predichos intervalos estudiantiles de la generación 2013 y 2014 de desertores, esto implica considerar lo que se obtuvo de la implementación polyfit para que se encuentra la última instrucción definida:

octave:4> [Y,D] = polyconf(p,13,S,0.05)

Y = 81.470D = 8.978 octave:5> [Y,D] = polyconf(p,14,S,0.05)

Y = 86.008D = 10.722

• Esta sintaxis ejecutada da certeza de nuestros resultados obtenidos.

Page 34: Pt2 pf pelm (1)

ANÁLISIS DE LOS RESULTADOS ESTIMADOS

Generación 2013:

Generación 2014:

Page 35: Pt2 pf pelm (1)

INTERPRETACIÓN DE RESULTADOS

• Considerando la premisa de que un modelo estadístico paramétrico:

Se encuentra por medio del grado que determina el óptimo ajuste funcional polinomial.

Depende principalmente del nivel de confianza al 95% y de su vía asociada al percentil de la distribución de Student.

Page 36: Pt2 pf pelm (1)

INTERPRETACIÓN DE RESULTADOS • Los límites porcentuales de cada intervalo predictivo involucra

qué para tamaños de muestras grandes, varían los resultados de la siguiente manera:

Generación 2013 en su respectiva desigualdad encontrada, se compara con el último valor obtenido en los datos del ajuste, es decir, con el porcentaje de la generación 2012; por lo tanto, se menciona que para su límite inferior el valor se considera optimista a razón de que es proporcional y en su límite superior el valor es fatalista por que incrementa significativamente.

Generación 2014 en su respectiva desigualdad encontrada, se compara con la desigualdad de la generación 2013 en sus respectivos límites, por lo tanto, se menciona que para su límite inferior el valor aumenta sustancialmente y en su límite superior el valor es catastrófico porque sigue incrementando la deserción estudiantil.

Page 37: Pt2 pf pelm (1)

CONCLUSIONES

• Este tratamiento informativo de resultados en su valor porcentual de cada intervalo predicho:

Refleja el error de muestreo de deserción estudiantil inherente al cálculo del error estándar de su dispersión generacional.

Puede ser inferido a partir de un profundo estudio del pasado y aceptando que el comportamiento de los agentes históricos no se modifica sustancialmente.

Se interpreta a corto plazo, la cobertura de la eficacia terminal. Busque alentar a la dependencia, en incentivar la flexibilidad de

culminar los estudios, a cada aprendiz del sistema escolarizado que esté en riesgo de abandonar su plantel, para que le genere una visión de superación personal al desarrollo profesional.

Page 38: Pt2 pf pelm (1)

REFERENCIAS BIBLIOGRÁFICAS.

• Díaz Martínez, Juan Pablo (2015) Deserción Escolar en la Educación Media Superior: Una aproximación logística Ed. UNAM-Facultad de Ciencias en: http://132.248.9.195/ptd2015/junio/306158177/Index.html

• Gujarati, Damodar N. (2010) Econometría (5ª Edición) Ed. McGraw-Hill Interamericana.

• Infante Gil, Said. (2012) Métodos Estadísticos: Un Enfoque Interdisciplinario. (3ª Edición) Ed. La Gaya Ciencia-COLPOS-SAGARPA.

• Ponce de León Topete, María del Socorro. (2003) Guía para el seguimiento de Trayectorias Escolares a Nivel Medio Superior y Superior. (1ª Edición) Ed. DGP-UAEH, en: http://intranet.uaeh.edu.mx/DGP/pdf/2_guia_trayectoria.pdf

• Sistema de Información Mexicana del Distrito Federal, INFOMEXDF. (2016) “Solicitud de Información Pública registrada y aprobada con el número de folio: 0311000001716; con los datos estadísticos estudiantiles del ingreso (apartado 4)) y del egreso (apartado 3)) desde su primera generación hasta su última generación en todos los planteles que la conforman.” Ed. DE-SAE-IEMSDF, en: http://www.infomexdf.org.mx/flslayer/seguimiento/d90c0f2c/06cd56f7/Respuesta%201716.pdf

• Wackerly, Dennis D. (2010) Estadística Matemática con Aplicaciones. (7ª Edición) Ed. Cengage Learning.