Análisis comparativo de optimización de hiperparámetros por búsqueda en grilla y algoritmos genéticos para forecasting de XGBoost en ventas online
Resumen (es)
En el presente estudio, se plantea un análisis comparativo de la optimización de los hiperparámetros utilizados en el modelo XGBoost para el pronóstico de unidades de venta con una serie de tiempo de ventas de comercio electrónico, utilizando la búsqueda en grilla y algoritmos genéticos. La búsqueda en grilla se realiza con el fin de comparar el desempeño de ambos métodos de optimización en su rendimiento con la métrica R^2 y los tiempos de ejecución, tomando el conjunto de datos de ventas, tratándolo, e implementando el modelo XGBoost con sus hiperparámetros por defecto y luego aplicando las optimizaciones en 6 hiperparámetros definidos en dos grupos con diferentes valores, para proceder con la comparación. Los resultados muestran que la búsqueda en grilla funciona mejor para la optimización en el conjunto de datos utilizado, dando un resultado del 69.24%, mientras que el algoritmo genético no logra llegar a una predicción efectiva, lo que abre la puerta a explorar otras librerías de algoritmos evolutivos que puedan aportar a la investigación.
Resumen (en)
In the present study, a comparative analysis of the optimization of the hyperparameters used in the XGBoost model for the forecast of sales units is proposed with a time series of e-commerce sales, using grid search and genetic algorithms. Grid search is carried out in order to compare the performance of both optimization methods in their performance with the R^2 metric and the execution times, taking the sales data set, treating it, and implementing the XGBoost model with its hyperparameters by default and then applying the optimizations in 6 hyperparameters defined in two groups with different values, to proceed with the comparison. The results show that the grid search works better for optimization in the data set used, giving a result of 69.24%, while the genetic algorithm fails to reach an effective prediction, which opens the door to explore other libraries of evolutionary algorithms that can contribute to the investigation.
Referencias
Espinoza Zúñiga, Jesús. Aplicación de algoritmos Random Forest y XGBoost en una base de solicitudes de tarjetas de crédito. Revista Ingeniería Investigación y Tecnología, volumen XXI (número 3), julio-septiembre 2020 1-16. Universidad Nacional Autónoma de México. México.
Granda Rodríguez, Manuela Andrea. Determinantes del riesgo de incumplimiento en créditos educativos: un análisis para Colombia. Tesis de Maestría en Economía. Universidad EAFIT. 2020.
Jain, M. (2018). Hyperparameter-tuning-in-XGBoost-using-genetic-algorithm.
Ji, S., Wang, X., Zhao, W., & Guo, D. (2019). An Application of a Three-Stage XGBoost: Based Model to Sales Forecasting of a Cross-Border E-Commerce Enterprise. Mathematical Problems in Engineering, 2019, 1-15. https://doi.org/10.1155/2019/8503252.
Torres Acero, Nicolás. Modelos para la Predicción de Deserción Universitaria de Estudiantes de Psicología de la Universidad el Bosque. Maestría en Estadística, Universidad del Bosque. 2022.
Cómo citar
Licencia
Derechos de autor 2023 CITAS

Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-CompartirIgual 4.0.
Los autores firman una cesión de derechos para que la Universidad Santo Tomás pueda publicar los artículos bajos las condiciones descritas abajo. Los autores, lectores y demás usuarios son libres de compartir, copiar, distribuir, ejecutar y comunicar públicamente la obra bajo las condiciones siguientes:
- Atribución — Usted debe dar crédito de manera adecuada, brindar un enlace a la licencia, e indicar si se han realizado cambios. Puede hacerlo en cualquier forma razonable, pero no de forma tal que sugiera que usted o su uso tienen el apoyo de la licenciante.
- No Comercial — Usted no puede hacer uso del material con propósitos comerciales
- Compartir Igual — Si remezcla, transforma o crea a partir del material, debe distribuir su contribución bajo la misma licencia del original.
- No hay restricciones adicionales — No puede aplicar términos legales ni medidas tecnológicas que restrinjan legalmente a otras a hacer cualquier uso permitido por la licencia.
CITAS está bajo una licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional (CC BY-NC-SA 4.0)
Hasta el año 2019 los documentos publicados en la revista se encontraban bajo licencia Creative Commons Atribución-CompartirIgual (CC BY-SA), sin embargo con el fin de garantizar la distribución abierta y libre del contenido divulgado en la revista se optó por cambiar al tipo de licencia Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional (CC BY-NC-SA 4.0)