Publicado
2026-03-09

Ciencia de Datos en Educación Media: Explorando Correlaciones y Prediciendo Resultados Saber 11 a Partir del Proceso Formativo

Data Science in Secondary Education: Exploring Correlations and Predicting Saber 11 Test Results from the Formative Process

DOI: https://doi.org/10.15332/23393076.11820
Danny Samuel Martinez Lobo
Erick Antonio Quintero Chitiva

Resumen (es)

Esta investigación explora la relación entre las calificaciones obtenidas por una Institución Educativa Distrital (IED) en diferentes asignaturas y los resultados alcanzados en las áreas evaluadas en las pruebas Saber 11. Se realizó un Análisis de Correlaciones Canónicas (ACC) tomando como variables explicativas las calificaciones obtenidas por los estudiantes en las asignaturas que cursaron en una IED logrando explicar un 25% de la varianza de los resultados de las cinco áreas que evalúa el Instituto Colombiano para la Evaluación de la Educación (ICFES). La interpretación de los resultados del ACC reveló que en la IED las asignaturas de Lengua Castellana, Idioma Extranjero y Convivencia tienen una influencia significativa en los resultados de las áreas evaluadas con las pruebas Saber 11, lo que destaca la importancia de las habilidades comunicativas. Finalmente, para la predicción del puntaje total en la prueba Saber 11, se construyó un Modelo Lineal Generalizado (MLG) que indicó que las calificaciones de las asignaturas Química, Lengua Castellana y Tecnología e Informática tienen un mayor impacto en los resultados obtenidos por los estudiantes de la IED en dichas pruebas.

Palabras clave (es): Análisis de Correspondencias Canónicas, Modelos Lineales Generalizados, Instituciones Educativas Distritales, Pruebas Saber 11

Resumen (en)

This research examines how student grades in various subjects at a District Educational Institution (DEI) relate to their performance on the Saber 11 tests. Using Canonical Correlation Analysis (CCA), the study found that grades in DEI subjects explained 25% of the variance in results across five key areas evaluated by the Colombian Institute for the Evaluation of Education (ICFES). The CCA results revealed that Spanish Language, Foreign Language, and coexistence subjects strongly influence Saber 11 test outcomes, emphasizing the value of communicative skills. In contrast, the study found only weak correlations between test performance and subjects such as physics, chemistry, and mathematics. This unexpected result suggests a complex, multi-faceted relationship between subject mastery and standardized test scores. Additionally, the research used a Generalized Linear Model (GLM) to predict overall Saber 11 scores. The analysis showed that student performance in Chemistry, Spanish Language, and Technology and Informatics had the greatest impact on total test scores at the DEI.

Palabras clave (en): Canonical Correlation Analysis, Generalized Linear Models, Secondary Education, Educational Assessment, Saber 11
Erick Antonio Quintero Chitiva, Facultad de Ciencias, Departamento de Matemáticas, Programa de Maestría en Estadística, Universidad El Bosque

-

Dimensions

PlumX

Visitas

27

Descargas

Los datos de descarga aún no están disponibles.

Cómo citar

Martinez Lobo, D. S., & Quintero Chitiva, E. A. (2026). Ciencia de Datos en Educación Media: Explorando Correlaciones y Prediciendo Resultados Saber 11 a Partir del Proceso Formativo. Comunicaciones En Estadística, 18(2), 33-42. https://doi.org/10.15332/23393076.11820