Ciencia de Datos en Educación Media: Explorando Correlaciones y Prediciendo Resultados Saber 11 a Partir del Proceso Formativo
Data Science in Secondary Education: Exploring Correlations and Predicting Saber 11 Test Results from the Formative Process
Resumen (es)
Esta investigación explora la relación entre las calificaciones obtenidas por una Institución Educativa Distrital (IED) en diferentes asignaturas y los resultados alcanzados en las áreas evaluadas en las pruebas Saber 11. Se realizó un Análisis de Correlaciones Canónicas (ACC) tomando como variables explicativas las calificaciones obtenidas por los estudiantes en las asignaturas que cursaron en una IED logrando explicar un 25% de la varianza de los resultados de las cinco áreas que evalúa el Instituto Colombiano para la Evaluación de la Educación (ICFES). La interpretación de los resultados del ACC reveló que en la IED las asignaturas de Lengua Castellana, Idioma Extranjero y Convivencia tienen una influencia significativa en los resultados de las áreas evaluadas con las pruebas Saber 11, lo que destaca la importancia de las habilidades comunicativas. Finalmente, para la predicción del puntaje total en la prueba Saber 11, se construyó un Modelo Lineal Generalizado (MLG) que indicó que las calificaciones de las asignaturas Química, Lengua Castellana y Tecnología e Informática tienen un mayor impacto en los resultados obtenidos por los estudiantes de la IED en dichas pruebas.
Resumen (en)
This research examines how student grades in various subjects at a District Educational Institution (DEI) relate to their performance on the Saber 11 tests. Using Canonical Correlation Analysis (CCA), the study found that grades in DEI subjects explained 25% of the variance in results across five key areas evaluated by the Colombian Institute for the Evaluation of Education (ICFES). The CCA results revealed that Spanish Language, Foreign Language, and coexistence subjects strongly influence Saber 11 test outcomes, emphasizing the value of communicative skills. In contrast, the study found only weak correlations between test performance and subjects such as physics, chemistry, and mathematics. This unexpected result suggests a complex, multi-faceted relationship between subject mastery and standardized test scores. Additionally, the research used a Generalized Linear Model (GLM) to predict overall Saber 11 scores. The analysis showed that student performance in Chemistry, Spanish Language, and Technology and Informatics had the greatest impact on total test scores at the DEI.
Cómo citar
Licencia

Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-CompartirIgual 4.0.
Los autores mantienen los derechos sobre los artículos y por tanto son libres de compartir, copiar, distribuir, ejecutar y comunicar públicamente la obra bajo las condiciones siguientes:
Reconocer los créditos de la obra de la manera especificada por el autor o el licenciante (pero no de una manera que sugiera que tiene su apoyo o que apoyan el uso que hace de su obra).
Comunicaciones en Estadística está bajo una licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional (CC BY-NC-SA 4.0)





