Modelo de predicción del rendimiento académico para el curso de nivelación de la Escuela Politécnica Nacional a partir de un modelo de aprendizaje supervisado

Autores/as

  • Karen Calva EcuAnalytics
  • Miguel Flores Escuela Politécnica Nacional
  • Hugo Porras EcuAnalytics - INsight
  • Ana Cabezas-Martínez Facultad Latinoaméricana de Ciencias Sociales

Palabras clave:

rendimiento académico, regresión logística, árboles de decisión, GBM, método del descenso del gradiente

Resumen

En el presente artículo se aplica un modelo de aprendizaje automático supervisado que predice la probabilidad de que un estudiante de la Escuela Politécnica Nacional apruebe el curso de nivelación. Para llevar a cabo esta tarea se describe una metodología estadística basada en gradient boosting y regresión logística donde el problema de aprendizaje se formula en términos de la minimización de la función de error mediante el método del descenso del gradiente. Para explicar la probabilidad de aprobación se toman en consideración dimensiones sugeridas por la literatura relacionadas a variables socioeconómicas, demográficas, familiares, institucionales y de desempeño académico en la postulación y en el curso de nivelación que tiene el estudiante. Los resultados del modelo de árbol de decisión muestran un nivel de precisión del 96% en el conjunto de datos de prueba, con un área bajo la curva ROC de 89.1, siendo estos niveles generalmente aceptados. Por otro lado, los resultados de la regresión logística sugieren que factores como la calificación ponderada del primer bimestre, la calificación con la que postuló, su jornada de estudios, su ubicación geográfica de origen, entre otras, afectan de una u otra manera a la probabilidad del estudiante, de aprobar el curso de nivelación.

DOI

Descargas

Los datos de descarga aún no están disponibles.

Referencias

G. Guiselle, “Factores asociados al rendimiento académico en estudiantes universitarios desde el nivel socioeconómico: Un estudio en la Universidad de Costa Rica”, El Salvador: Revista Electrónica Educare, vol. 17, 2013.

F. Carlos. “Sistemas de evaluación académica”, El Salvador: Editorial Universitaria, 2014.

V. Jorge y col., “Una explicación del rendimiento estudiantil universitario mediante modelos de regresión logística”. Venezuela: Visión Gerencial, 2009.

A. Carmen y col., “DISCUSSION PAPER SERIES The Economics of University Dropouts and Delayed Graduation : A Survey The Economics of University Dropouts and Delayed Graduation : A Survey". En: 11421, 2018.

Rodríguez Ayán, M. N., & Coello García, M. T. (2008), Prediction of university students’ academic achievement by linear and logistic models. Spanish Journal of Psychology, 11(1), 275–288. https://doi.org/10.1017/s1138741600004315

Friedman, Jerome H. “Greedy Function Approximation: A Gradient Boosting Machine.” The Annals of Statistics 29, 33,. 5, pp. 1189–1232, 2001 JSTOR, www.jstor.org/stable/2699986.

T. Hastie, T. Robert y F. Jerome, “The elements of statistical learning: data mining, inference, and prediction”, New York: Springer, 2017.

Jordi Gironés Roig y col. Minería de datos: modelos y algoritmos. pp. 274, 2017 isbn: 9788491169048.

C. Vincent, glmulti: “Model Selection and Multimodel Inference Made Easy”. R package version 1.0.7.1. [Online]. Available: https://CRAN.R-project.org/package=glmulti. [Accessed: 2019].

J. Hunt, “Classification by induction: Aplications to modelling and control of non linear dynamic systems. Intelligent Systems Engineering”, 1993.

I. Kononenko, I. Bratko and M. Kukar. Machine, “Learning and Data MIning: Methods and Aplications”. John Wiley & Sons Ltd, 1998.

S. Larose y col. “Nonintellectual learning factors as determinants for success in college". En: Research in Higher Education 39.3, pp. 275-297, 1998.

T. Ernest, P. Patrick, T. Terenzini y Lee M. “Wole. Orientation to College and Freshman Year Persistence/Withdrawal Decisions". En: The Journal of Higher Education 57.2, pp. 155, 1986.

N. Alexander y W. Ruth. “Determinants of College Success". En: The Journal of Higher Education 11.9, pp. 479-485, 1940.

Carmen Aina. Success and failure of Italian university students. Evidence from administrative data". pp 1-51, (2010).

P. Babcock y M. Mindy. “The falling time cost of college: Evidence from half a century of time use data". En: Review of Economics and Statistics, 2011

S. Iván y col.”Factores Asociados Al Abandono En Estudiantes De Grupos Vulnerables. Caso Escuela Politécnica Nacional". En: Congresos CLABES, pp. 132-141. [Online]. Available: https://revistas . [Accessed: 2018].

S. Walter, Escudero. “Big data y aprendizaje autom_atico: Ideas y desafíos para economistas". En: Una nueva econometría. isbn: 978-987-655-201-1, 2018.

Descargas

Publicado

2021-07-01

Número

Sección

Artículos Científicos para el número regular

Cómo citar

[1]
“Modelo de predicción del rendimiento académico para el curso de nivelación de la Escuela Politécnica Nacional a partir de un modelo de aprendizaje supervisado”, LAJC, vol. 8, no. 2, pp. 58–71, Jul. 2021, Accessed: Dec. 12, 2025. [Online]. Available: http://lajc.epn.edu.ec/index.php/LAJC/article/view/264