Estrategia de imputación con la media bajo el uso de árboles de regresión

Victor Ernesto Marquez Perez, Lelly María Useche Castro, Dulce María Mesa Avila, Ana Ides Chacon Contreras

Resumen


Se presenta un diseño de imputacion en el que conjuga la clasicacion y la imputación con el fin de mejorar la calidad del dato imputado. La imputacion se lleva acabo para datos cuantitativos bajo perdida completamente aleatoria con el uso de arboles de regresion, comparando la tecnica de imputacion con la media teorica y empricamente con el uso de los arboles de regresion, con ello se busca desarrollar una estrategia integral de clasicacion e imputacion.

Se obtuvieron estimadores insesgados desarrollando el valor esperado del estimador,se evaluaron las propiedades de los estimadores mediante el desarrollo de sus varianzas y sesgos, en el que se observo insesgamiento. En cuanto a la varianza del estimador insesgado de la media, no se probo suciencia para el estimador de la media.

Palabras clave:  datos faltantes, imputacion, CART, arboles de regresion, estimadores insesgados, simulacion.


Texto completo:

PDF BibText

Referencias


Borgoni, R y Berrington, A. (2004). A sequential tree-based procedure for multivariate imputation of complex missing data structure. Recuperado 10, octubre del 2005 en http://www.ccsr.ac.uk/methods/events/attrition/documents/Borgoni.pdf

Box, G.E.P. (1949), “A General Distribution theory for a class of likelihood Criteria”, Biometrika, 36, 317-346.

Breiman, L., Freidman, J.H., Olshen, R.A. & Stone, C.J. (1984) Classification and Regression Tree Pacific Grove, CA: Wadsworth.

Censo Agricola 1998 INE

Hansen, M., Hurwits, W., y Madow, W (1953) Sample survey Methods and Theory, vol 2 New York; J. Wiley & Sons, Inc. [139-141].

Lee, J.C., Chang, T.C., and Krishnaiah, P.R.(1977). “Approximations to the Distributions of the likelihood Ratio Statistics for testing certain structures on the Covariance Matrices of Real Multivariate Normal Populations”, in Multivariate Analysis, vol. 4, P.R Krishnaiah (ed), Amsterdam: North-Holland, pp.105-118.

Little, R y Rubin, D (1987): Statistical Analysis with Missing Data. Series in Probability and Mathematical Statistics. John Wiley & Sons, Inc. New York.

Mesa, D (2004). Imputación y Árboles de Decisión. Caracas, Venezuela. Guía práctica. Postgrado en Estadística, Universidad Central de Venezuela.

Rencher, A. 2002. Methods oh Multivariate Analysis. 2da ed. Wiley-Interscience. England.

Schafer, J. (1997) Analysis of incomplete multivariate data. Chapman & Hall, London

Useche, L y Mesa, D (2006). Una introducción a la imputación de valores perdidos. Revista Terra. No. 31-Vol XXII. 127-151.




DOI: http://dx.doi.org/10.15332/s2027-3355.2017.0001.01

Métricas de artículo

Cargando métricas ...

Metrics powered by PLOS ALM

Enlaces refback

  • No hay ningún enlace refback.


ISSN: 2027-3355 – ISSN Online: 2339-3076