Diagnósticos de Regresión Usando la FDR (Tasa de Descubrimientos Falsos)
Regression Diagnostics Using the FDR Technique
Resumen (es)
Proponemos el uso de las pruebas Tasa de Descubrimientos Falsos (False Discovery Rate, FDR), test en lugar de los punto de cortes tradicionales utilizados en diagnósticos de regresión para detectar observaciones sospechosas. Este procedimiento disminuye la complejidad de los diagnósticos mediante la reducción del conjunto de puntos para ser considerados para análisis posteriores, manteniendo sólo aquéllos que son realmente extraños.Resumen (en)
We use False Discovery Rate (FDR) tests instead of traditional cutoff values used in regression diagnostics to detect suspicious observations and control the rate of false discoveries. This method reduces the complexity of diagnostics by reducing the set of data points to be considered for further analysis, keeping only those that are really extraneous.
Referencias
Belsey, D. A., K. E. y. W. (1980), Regression Diagnostics: Identifying Influential Data and Sources of Collinearity, John Wiley & Sons, New York.
Benjamini, Y. y Hochberg, Y. (1995), ‘Controlling the False Discovery Rate: A Practical and Powerful Approach to Multiple Testing’, Journal of the Royal Statistical Society, Series B57, 289–300.
Benjamini, Y. y Yekutiele, D. (2001), ‘The control of the False Discovery Rate in Multiple Testing Under Dependency’,The Annals of Statistics 29(4), 1165–1188.
Chi, Z. (2008), ‘False discovery rate control with multivariate p-values’,Electronic Journal of Statistics 2, 368–411.
Donoho, D. y Jin, J. (2004), ‘Higher Criticism for Detecting Sparse Heterogeneous Mixtures ’,The Annals of Statistics32(3), 962–994.
Dudoit, S. y van der Laan, M. J. (2008),Probability and Statistical Inference, Springer-Verlag, New York.
Efron, B, y. T. R. (2002), ‘Empirical Bayes Methods and False Discovery Ratesfor Microarrays’,Genetic Epidemiology23, 70–86.
Fowlkes, E. B. (1986), ‘Some Diagnostics for Binary Logistic Regression Via Smoothing’, Proceedings of the Statistical Computing Section: ASA.
Pregibon, D. (1981), ‘Logistic Regression Diagnostics’,The Annals of Statistics9(4), 705–724.
Preisser, J. S. y Qaqish, B. F. (1996), ‘Deletion Diagnostics for Generalized Estimating Equations’,Biometrika83, 551–562.
Scott, C. y Bellala, G. (2009), ‘The false discovery rate for statistical pattern recognition’,Electronic Journal of Statistics3, 651–677.
van den Oord, E. J. C. G. (2008), ‘Controlling False Discoveries in Genetics Studies’, American Journal of Medical Genetics Part B (Neuropsychiatric Gene-tics)147B, 637–644
Cómo citar
Licencia
Los autores mantienen los derechos sobre los artículos y por tanto son libres de compartir, copiar, distribuir, ejecutar y comunicar públicamente la obra bajo las condiciones siguientes:
Reconocer los créditos de la obra de la manera especificada por el autor o el licenciante (pero no de una manera que sugiera que tiene su apoyo o que apoyan el uso que hace de su obra).
Comunicaciones en Estadística está bajo una licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional (CC BY-NC-SA 4.0)