Análisis comparativo de optimización de hiperparámetros por búsqueda en grilla y algoritmos genéticos para forecasting de XGBoost en ventas online
Abstract (en)
In the present study, a comparative analysis of the optimization of the hyperparameters used in the XGBoost model for the forecast of sales units is proposed with a time series of e-commerce sales, using grid search and genetic algorithms. Grid search is carried out in order to compare the performance of both optimization methods in their performance with the R^2 metric and the execution times, taking the sales data set, treating it, and implementing the XGBoost model with its hyperparameters by default and then applying the optimizations in 6 hyperparameters defined in two groups with different values, to proceed with the comparison. The results show that the grid search works better for optimization in the data set used, giving a result of 69.24%, while the genetic algorithm fails to reach an effective prediction, which opens the door to explore other libraries of evolutionary algorithms that can contribute to the investigation.
Abstract (es)
En el presente estudio, se plantea un análisis comparativo de la optimización de los hiperparámetros utilizados en el modelo XGBoost para el pronóstico de unidades de venta con una serie de tiempo de ventas de comercio electrónico, utilizando la búsqueda en grilla y algoritmos genéticos. La búsqueda en grilla se realiza con el fin de comparar el desempeño de ambos métodos de optimización en su rendimiento con la métrica R^2 y los tiempos de ejecución, tomando el conjunto de datos de ventas, tratándolo, e implementando el modelo XGBoost con sus hiperparámetros por defecto y luego aplicando las optimizaciones en 6 hiperparámetros definidos en dos grupos con diferentes valores, para proceder con la comparación. Los resultados muestran que la búsqueda en grilla funciona mejor para la optimización en el conjunto de datos utilizado, dando un resultado del 69.24%, mientras que el algoritmo genético no logra llegar a una predicción efectiva, lo que abre la puerta a explorar otras librerías de algoritmos evolutivos que puedan aportar a la investigación.
References
Espinoza Zúñiga, Jesús. Aplicación de algoritmos Random Forest y XGBoost en una base de solicitudes de tarjetas de crédito. Revista Ingeniería Investigación y Tecnología, volumen XXI (número 3), julio-septiembre 2020 1-16. Universidad Nacional Autónoma de México. México.
Granda Rodríguez, Manuela Andrea. Determinantes del riesgo de incumplimiento en créditos educativos: un análisis para Colombia. Tesis de Maestría en Economía. Universidad EAFIT. 2020.
Jain, M. (2018). Hyperparameter-tuning-in-XGBoost-using-genetic-algorithm.
Ji, S., Wang, X., Zhao, W., & Guo, D. (2019). An Application of a Three-Stage XGBoost: Based Model to Sales Forecasting of a Cross-Border E-Commerce Enterprise. Mathematical Problems in Engineering, 2019, 1-15. https://doi.org/10.1155/2019/8503252.
Torres Acero, Nicolás. Modelos para la Predicción de Deserción Universitaria de Estudiantes de Psicología de la Universidad el Bosque. Maestría en Estadística, Universidad del Bosque. 2022.
How to Cite
License
Copyright (c) 2023 CITAS

This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
The authors sign a transfer of rights so that Universidad Santo Tomás can publish the articles under the conditions described below. The authors, readers and other users are free to share, copy, distribute, perform and publicly communicate the work under the following conditions:
-
Attribution — You must give appropriate credit, provide a link to the license, and indicate if changes were made. You may do so in any reasonable manner, but not in any way that suggests the licensor endorses you or your use.
-
NonCommercial — You may not use the material for commercial purposes.
-
ShareAlike — If you remix, transform, or build upon the material, you must distribute your contributions under the same license as the original.
No additional restrictions — You may not apply legal terms or technological measures that legally restrict others from doing anything the license permits.
CITAS is licensed under Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0).

Until 2019 the documents published in the magazine were under the Creative Commons Attribution-ShareAlike license (CC BY-SA), however, in order to guarantee the open and free distribution of the content published in the magazine, it was decided to change the type Commons Attribution-NonCommercial-ShareAlike 4.0 International license (CC BY-NC-SA 4.0)




