Publicado
11-10-2023 — Actualizado el 26-10-2023
Versiones

Análisis comparativo de optimización de hiperparámetros por búsqueda en grilla y algoritmos genéticos para forecasting de XGBoost en ventas online

DOI: https://doi.org/10.15332/24224529.8401
Leizy Melissa Pinzon Villanueva

Resumen (es)

En el presente estudio, se plantea un análisis comparativo de la optimización de los hiperparámetros utilizados en el modelo XGBoost para el pronóstico de unidades de venta con una serie de tiempo de ventas de comercio electrónico, utilizando la búsqueda en grilla y algoritmos genéticos. La búsqueda en grilla se realiza con el fin de comparar el desempeño de ambos métodos de optimización en su rendimiento con la métrica R^2 y los tiempos de ejecución, tomando el conjunto de datos de ventas, tratándolo, e implementando el modelo XGBoost con sus hiperparámetros por defecto y luego aplicando las optimizaciones en 6 hiperparámetros definidos en dos grupos con diferentes valores, para proceder con la comparación. Los resultados muestran que la búsqueda en grilla funciona mejor para la optimización en el conjunto de datos utilizado, dando un resultado del 69.24%, mientras que el algoritmo genético no logra llegar a una predicción efectiva, lo que abre la puerta a explorar otras librerías de algoritmos evolutivos que puedan aportar a la investigación.

Palabras clave (es): Optimización, busqueda en grilla, algoritmo genetico, pronostico, hiperparametros

Resumen (en)

In the present study, a comparative analysis of the optimization of the hyperparameters used in the XGBoost model for the forecast of sales units is proposed with a time series of e-commerce sales, using grid search and genetic algorithms. Grid search is carried out in order to compare the performance of both optimization methods in their performance with the R^2 metric and the execution times, taking the sales data set, treating it, and implementing the XGBoost model with its hyperparameters by default and then applying the optimizations in 6 hyperparameters defined in two groups with different values, to proceed with the comparison. The results show that the grid search works better for optimization in the data set used, giving a result of 69.24%, while the genetic algorithm fails to reach an effective prediction, which opens the door to explore other libraries of evolutionary algorithms that can contribute to the investigation.

Palabras clave (en): optimization, Search grid, genetic algortihm, forecasting, hyperparameters

Referencias

Espinoza Zúñiga, Jesús. Aplicación de algoritmos Random Forest y XGBoost en una base de solicitudes de tarjetas de crédito. Revista Ingeniería Investigación y Tecnología, volumen XXI (número 3), julio-septiembre 2020 1-16. Universidad Nacional Autónoma de México. México.

Granda Rodríguez, Manuela Andrea. Determinantes del riesgo de incumplimiento en créditos educativos: un análisis para Colombia. Tesis de Maestría en Economía. Universidad EAFIT. 2020.

Jain, M. (2018). Hyperparameter-tuning-in-XGBoost-using-genetic-algorithm.

Ji, S., Wang, X., Zhao, W., & Guo, D. (2019). An Application of a Three-Stage XGBoost: Based Model to Sales Forecasting of a Cross-Border E-Commerce Enterprise. Mathematical Problems in Engineering, 2019, 1-15. https://doi.org/10.1155/2019/8503252.

Torres Acero, Nicolás. Modelos para la Predicción de Deserción Universitaria de Estudiantes de Psicología de la Universidad el Bosque. Maestría en Estadística, Universidad del Bosque. 2022.

Dimensions

PlumX

Visitas

149

Descargas

Los datos de descarga aún no están disponibles.

Cómo citar

Pinzon Villanueva, L. M. (2023). Análisis comparativo de optimización de hiperparámetros por búsqueda en grilla y algoritmos genéticos para forecasting de XGBoost en ventas online . CITAS, 9(2). https://doi.org/10.15332/24224529.8401 (Original work published 2023)