
Comparación entre árboles de regresión CART y regresión lineal

Comparison between CART regression trees and linear regression

Juan Felipe Díaz Sepúlveda
Juan Carlos Correa

Additional Files

Abstract (en)

Linear regression is the most widely used method in statistics to predict values of continuous variables due to its easy interpretation, but in many situations the suppositions to apply the model are not met and some users tend to force them leading them to erroneous conclusions. CART regression trees is a regression alternative that does not require suppositions on the data to be analyzed and is a method of easy interpretation of results. This work compares predictive levels of linear regression with CART through simulation. In general, it was found that when the correct linear regression model is adjusted to the data, the prediction error of linear regression is always lower than that of CART. It was also found that when linear regression model is erroneously adjusted to the data, the prediction error of CART is lower than that of linear regression only when it has a sufficiently large amount of data.
Keywords (en): Simulación, Error de predicción, Regresión Lineal, Árboles de clasificación y Regresión CART

Abstract (es)

La Regresión lineal es el método más usado en estadística para predecir valores de variables continuas debido a su fácil interpretación, pero en muchas situaciones los supuestos para aplicar el modelo no se cumplen y algunos usuarios tienden a forzarlos llevando a conclusiones erróneas. Los árboles de regresión CART son una alternativa de regresión que no requiere supuestos sobre los datos a analizar y es un método de fácil interpretación de los resultados. En este trabajo se comparan a nivel predictivo la Regresión lineal con CART mediante simulación. En general, se encontró que cuando se ajusta el modelo de regresión lineal correcto a los datos, el error de predicción de regresión lineal siempre es menor que el de CART. También se encontró que cuando se ajusta erróneamente un modelo de regresión lineal a los datos, el error de predicción de CART es menor que el de regresión lineal sólo cuando se tiene una cantidad de datos suficientemente grande.
Keywords (es): Simulación, Error de predicción, Regresión Lineal, Árboles de clasificación y Regresión CART
Juan Carlos Correa, Universidad Nacional de Colombia, sede Medellín
Profesor asociado.


Ankarali, H., Canan, A., Akkus, Z., Bugdayci, R. & Ali Sungur, M. (2007), ‘Comparison of logistic regression model and classification tree: An application to postpartum depression data’, Expert Systems with Applications 32, 987–994.

Breiman, L., Friedman, J., Olshen, R. & Stone, C. (1984), Classification And Regression Trees, CHAPMAN & HALL/CRC, Boca Raton.

Izenman, A. (2008), Modern Multivariate Statistical Techniques, Springer, New York.

Tamminen, S., Laurinen, P. & Roning, J. (1999), ‘Comparing regression trees with neural networks in aerobic fitness approximation’.

Zhang, H. & Singer, B. (2010), Recursive Partitioning and Applications, Springer, New York.






Download data is not yet available.

How to Cite

Díaz Sepúlveda, J. F., & Correa, J. C. (2013). Comparison between CART regression trees and linear regression. Comunicaciones En Estadística, 6(2), 175-195.