Publicado
2025-08-02

Comparación de cinco modelos de Machine Learning para la predicción de las elecciones presidenciales en Colombia: una perspectiva con datos composicionales

Comparison of five machine learning models for the prediction of presidential elections in Colombia: a compositional data perspective

DOI: https://doi.org/10.15332/23393076.11212
Paula Andrea Leal Varón
Germán Andrés Galeano Ortiz
Wilmer Pineda-Ríos

Resumen (es)

En los últimos años, numerosas investigaciones han empleado técnicas de Machine Learning y análisis de datos composicionales en distintos campos de estudio. Sin embargo, su integración en el análisis electoral sigue siendo escasa. Por tal razón, este trabajo integra ambos enfoques aplicando cinco modelos de machine learning: Random Forest, Gradient Boosting, Support Vector Machines, K-Nearest Neighbors y Feedforward Neural Networks, para predecir los resultados de las elecciones presidenciales en Colombia a nivel municipal, considerando los datos como composicionales. Específicamente, se pronostica la distribución de votos de cada municipio en el espectro ideológico unidimensional Izquierda-Derecha. De esta forma, se busca no solo mejorar la precisión de las predicciones, sino también generar un avance importante en las metodologías aplicadas al análisis electoral. Los modelos se entrenaron con el 70% de los datos de las elecciones presidenciales entre 2002 y 2022, y se evaluó su rendimiento en el 30% restante. Los algoritmos mostraron desempeños similares entre las transformaciones de cada espectro ideológico con porcentajes de variabilidad entre el 56% y 94% en la predicción de la proporción de votos, destacándose el modelo de Feedforward Neural Networks con la transformación log-cociente centrada, que alcanzó los mejores resultados.

Resumen (en)

In recent years, numerous studies have employed machine learning techniques and compositional data analysis in various fields of study. However, their integration into electoral analysis remains limited. For this reason, this work combines both approaches by applying five machine learning models: random forest, gradient boosting, support vector machines, k-nearest neighbors, and feedforward neural networks, to predict the results of the presidential elections in Colombia at the municipal level, onsidering the data as compositional. Specifically, it forecasts the vote distribution in each municipality along a unidimensional Left-Right ideological spectrum. This approach aims not only to improve prediction accuracy but also to comtribute a significant advancement in methodologies applied to electoral analysis. The models were trained on 70% of the presidential election data from 2002 to 2022 and evaluated on the remaining 30%. The algorithms demonstrated similar performance across transformations of each ideological spectrum, with variability percentages between 56% and 94% in predicting vote proportions, with the feedforward neural networks model using the centered log-ratio transformation achieving the best results.

Referencias

Aitchison, J. (1982). The statistical analysis of compositional data. Journal of the Royal Statistical Society: Series B (Methodological), 44(2), 139–160.

Aguilar López, J., & Aquino López, M. A. (2015). Modelo de predicción electoral: el caso de la elección municipal 2015 de León de los Aldama, Guanajuato. Estudios Políticos (México), 35, 87–101. Universidad Nacional Autónoma de México.

Baquero, K. S., Mojica-Paula, X., & Rosero, A. B. (2019). Aprendizaje de máquinas para la predicción de elecciones presidenciales en Colombia. Universidad de los Andes.

Barrios, A., Montoya, N., & Mancera, C. (2018). Sistema electoral - elecciones generales. Misión de Observación Electoral.

Borges, J. A. L., Balam, R. I. N., Gómez, L. R., & Strand, M. P. (2016). The machine learning in the prediction of elections. ReCIBE, 4(2).

Castaño-Gómez, I. M. (2019). Modelo predictivo para inferir en el próximo presidente de estado a través de un vocabulario ontológico en Twitter. Facultad de Ingeniería.

Cerón-Guzmán, J. A., & León-Guzmán, E. (2016). A sentiment analysis system of Spanish tweets and its application in Colombia 2014 presidential election. In 2016 IEEE International Conferences on Big Data and Cloud Computing (BDCloud), Social Computing and Networking (SocialCom), Sustainable Computing and Communications (SustainCom) (pp. 250–257). IEEE.

Cuervo, M. C., & Guerrero, M. A. V. (2019). Predicción electoral usando un modelo híbrido basado en análisis sentimental y seguimiento a encuestas: elecciones presidenciales de Colombia. Revista Politécnica, 15(30), 94–104.

Egozcue, J. J., Pawlowsky-Glahn, V., Mateu-Figueras, G., & Barcelo-Vidal, C. (2003). Isometric logratio transformations for compositional data analysis. Mathematical Geology, 35(3), 279–300.

Gechem Sarmiento, C. E. (2009). Los partidos políticos en Colombia: entre la realidad y la ficción. Departamento de Derecho Constitucional.

González, V. (2019). Una breve historia del machine learning. https://empresas.blogthinkbig.com/una-breve-historia-del-machine-learning/

Isaza, R. L. (2009). Historia resumida del partido liberal colombiano. Partido Liberal Colombiano.

Khan, A., Zhang, H., Boudjellal, N., Ahmad, A., Shang, J., Dai, L., & Hayat, B. (2021). Election prediction on Twitter: A systematic mapping study. Complexity, 2021. Hindawi. https://doi.org/10.1155/2021/6672813

Liscano Fierro, J. M. (2017). Modelos mixtos para datos composicionales: Una aplicación con resultados electorales en Colombia. Universidad Santo Tomás.

Marsland, S. (2011). Machine learning: An algorithmic perspective. Chapman and Hall/CRC.

Manual del Conservador. (2021). Partido Conservador Colombiano. https://www.partidoconservador.com/wp-content/uploads/2021/04/Manual-del-Conservador-1.pdf

Murphy, K. P. (2012). Machine learning: A probabilistic perspective. MIT Press.

Orjuela Escobar, L. J. (2022). Quién es quién en el espectro político colombiano. https://cerosetenta.uniandes.edu.co/quien-es-quien-en-el-espectro-politico-colombiano/

Plata Rincón, C. (2017). Plebiscito por la paz en Colombia: Análisis estadístico a partir de datos composicionales. Universidad Santo Tomás.

Santander, P., Elórtegui, C., González, C., Allende-Cid, H., & Palma, W. (2017). Redes sociales, inteligencia computacional y predicción electoral: el caso de las primarias presidenciales de Chile 2017. Cuadernos.info, 41, 41–56. Pontificia Universidad Católica de Chile.

Triglia, A. (2015). Los ejes políticos (izquierda y derecha). Psicología y Mente. https://psicologiaymente.com/social/ejes-politicos-izquierda-derecha

Asamblea Constituyente de Colombia. (1991). Constitución política de Colombia. leyfacil.com.ar

Dimensions

PlumX

Visitas

228

Descargas

Los datos de descarga aún no están disponibles.

Cómo citar

Leal Varón, P. A., Galeano Ortiz, G. A., & Pineda-Ríos, W. (2025). Comparación de cinco modelos de Machine Learning para la predicción de las elecciones presidenciales en Colombia: una perspectiva con datos composicionales. Comunicaciones En Estadística, 18(1). https://doi.org/10.15332/23393076.11212