Modelo de predicción del rendimiento académico para el curso de nivelación de la Escuela Politécnica Nacional a partir de un modelo de aprendizaje supervisado
Palabras clave:
rendimiento académico, regresión logística, árboles de decisión, GBM, método del descenso del gradienteResumen
En el presente artículo se aplica un modelo de aprendizaje automático supervisado que predice la probabilidad de que un estudiante de la Escuela Politécnica Nacional apruebe el curso de nivelación. Para llevar a cabo esta tarea se describe una metodología estadística basada en gradient boosting y regresión logística donde el problema de aprendizaje se formula en términos de la minimización de la función de error mediante el método del descenso del gradiente. Para explicar la probabilidad de aprobación se toman en consideración dimensiones sugeridas por la literatura relacionadas a variables socioeconómicas, demográficas, familiares, institucionales y de desempeño académico en la postulación y en el curso de nivelación que tiene el estudiante. Los resultados del modelo de árbol de decisión muestran un nivel de precisión del 96% en el conjunto de datos de prueba, con un área bajo la curva ROC de 89.1, siendo estos niveles generalmente aceptados. Por otro lado, los resultados de la regresión logística sugieren que factores como la calificación ponderada del primer bimestre, la calificación con la que postuló, su jornada de estudios, su ubicación geográfica de origen, entre otras, afectan de una u otra manera a la probabilidad del estudiante, de aprobar el curso de nivelación.
Descargas
Referencias
G. Guiselle, “Factores asociados al rendimiento académico en estudiantes universitarios desde el nivel socioeconómico: Un estudio en la Universidad de Costa Rica”, El Salvador: Revista Electrónica Educare, vol. 17, 2013.
F. Carlos. “Sistemas de evaluación académica”, El Salvador: Editorial Universitaria, 2014.
V. Jorge y col., “Una explicación del rendimiento estudiantil universitario mediante modelos de regresión logística”. Venezuela: Visión Gerencial, 2009.
A. Carmen y col., “DISCUSSION PAPER SERIES The Economics of University Dropouts and Delayed Graduation : A Survey The Economics of University Dropouts and Delayed Graduation : A Survey". En: 11421, 2018.
Rodríguez Ayán, M. N., & Coello García, M. T. (2008), Prediction of university students’ academic achievement by linear and logistic models. Spanish Journal of Psychology, 11(1), 275–288. https://doi.org/10.1017/s1138741600004315
Friedman, Jerome H. “Greedy Function Approximation: A Gradient Boosting Machine.” The Annals of Statistics 29, 33,. 5, pp. 1189–1232, 2001 JSTOR, www.jstor.org/stable/2699986.
T. Hastie, T. Robert y F. Jerome, “The elements of statistical learning: data mining, inference, and prediction”, New York: Springer, 2017.
Jordi Gironés Roig y col. Minería de datos: modelos y algoritmos. pp. 274, 2017 isbn: 9788491169048.
C. Vincent, glmulti: “Model Selection and Multimodel Inference Made Easy”. R package version 1.0.7.1. [Online]. Available: https://CRAN.R-project.org/package=glmulti. [Accessed: 2019].
J. Hunt, “Classification by induction: Aplications to modelling and control of non linear dynamic systems. Intelligent Systems Engineering”, 1993.
I. Kononenko, I. Bratko and M. Kukar. Machine, “Learning and Data MIning: Methods and Aplications”. John Wiley & Sons Ltd, 1998.
S. Larose y col. “Nonintellectual learning factors as determinants for success in college". En: Research in Higher Education 39.3, pp. 275-297, 1998.
T. Ernest, P. Patrick, T. Terenzini y Lee M. “Wole. Orientation to College and Freshman Year Persistence/Withdrawal Decisions". En: The Journal of Higher Education 57.2, pp. 155, 1986.
N. Alexander y W. Ruth. “Determinants of College Success". En: The Journal of Higher Education 11.9, pp. 479-485, 1940.
Carmen Aina. Success and failure of Italian university students. Evidence from administrative data". pp 1-51, (2010).
P. Babcock y M. Mindy. “The falling time cost of college: Evidence from half a century of time use data". En: Review of Economics and Statistics, 2011
S. Iván y col.”Factores Asociados Al Abandono En Estudiantes De Grupos Vulnerables. Caso Escuela Politécnica Nacional". En: Congresos CLABES, pp. 132-141. [Online]. Available: https://revistas . [Accessed: 2018].
S. Walter, Escudero. “Big data y aprendizaje autom_atico: Ideas y desafíos para economistas". En: Una nueva econometría. isbn: 978-987-655-201-1, 2018.
Descargas
Publicado
Número
Sección
Licencia
Aviso de derechos de autor/a
Los autores/as que publiquen en esta revista aceptan las siguientes condiciones:
- Los autores conservan los derechos de autor y ceden a la revista el derecho de la primera publicación, con el trabajo registrado con la Creative Commons Attribution-Non-Commercial-Share-Alike 4.0 International, que permite a terceros utilizar lo publicado siempre que mencionen la autoría del trabajo y a la primera publicación en esta revista.
- Los autores pueden realizar otros acuerdos contractuales independientes y adicionales para la distribución no exclusiva de la versión del artículo publicado en esta revista (p. ej., incluirlo en un repositorio institucional o publicarlo en un libro) siempre que indiquen claramente que el trabajo se publicó por primera vez en esta revista.
- Se permite y recomienda a los autores a compartir su trabajo en línea (por ejemplo: en repositorios institucionales o páginas web personales) antes y durante el proceso de envío del manuscrito, ya que puede conducir a intercambios productivos, a una mayor y más rápida citación del trabajo publicado.
Descargo de Responsabilidad
LAJC en ningún caso será responsable de cualquier reclamo directo, indirecto, incidental, punitivo o consecuente de infracción de derechos de autor relacionado con artículos que han sido presentados para evaluación o publicados en cualquier número de esta revista. Más Información en nuestro Aviso de Descargo de Responsabilidad.




