Comparación entre árboles de regresión CART y regresión lineal
Comparison between CART regression trees and linear regression
Archivos adicionales
Resumen (es)
La Regresión lineal es el método más usado en estadística para predecir valores de variables continuas debido a su fácil interpretación, pero en muchas situaciones los supuestos para aplicar el modelo no se cumplen y algunos usuarios tienden a forzarlos llevando a conclusiones erróneas. Los árboles de regresión CART son una alternativa de regresión que no requiere supuestos sobre los datos a analizar y es un método de fácil interpretación de los resultados. En este trabajo se comparan a nivel predictivo la Regresión lineal con CART mediante simulación. En general, se encontró que cuando se ajusta el modelo de regresión lineal correcto a los datos, el error de predicción de regresión lineal siempre es menor que el de CART. También se encontró que cuando se ajusta erróneamente un modelo de regresión lineal a los datos, el error de predicción de CART es menor que el de regresión lineal sólo cuando se tiene una cantidad de datos suficientemente grande.Resumen (en)
Referencias
Ankarali, H., Canan, A., Akkus, Z., Bugdayci, R. & Ali Sungur, M. (2007), ‘Comparison of logistic regression model and classification tree: An application to postpartum depression data’, Expert Systems with Applications 32, 987–994.
Breiman, L., Friedman, J., Olshen, R. & Stone, C. (1984), Classification And Regression Trees, CHAPMAN & HALL/CRC, Boca Raton.
Izenman, A. (2008), Modern Multivariate Statistical Techniques, Springer, New York.
Tamminen, S., Laurinen, P. & Roning, J. (1999), ‘Comparing regression trees with neural networks in aerobic fitness approximation’.
Zhang, H. & Singer, B. (2010), Recursive Partitioning and Applications, Springer, New York.
Cómo citar
Licencia
Los autores mantienen los derechos sobre los artículos y por tanto son libres de compartir, copiar, distribuir, ejecutar y comunicar públicamente la obra bajo las condiciones siguientes:
Reconocer los créditos de la obra de la manera especificada por el autor o el licenciante (pero no de una manera que sugiera que tiene su apoyo o que apoyan el uso que hace de su obra).
Comunicaciones en Estadística está bajo una licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional (CC BY-NC-SA 4.0)