Análisis de distribuciones a priori de los parámetros de escala del modelo ZIP
Analysis of prior distributions for the scales parameters of the ZIP model
Archivos adicionales
Resumen (es)
En el presente artículo se plantea la evaluación de un conjunto de distribuciones a priori para los parámetros de escala del modelo de regresión Poisson inflado con ceros (conocido como modelo ZIP por sus siglas en inglés). Tradicionalmente se utiliza la distribución gamma-inversa como a priori para los parámetros de escala. Algunos estudios han mostrado que cuando los valores de los hiperparámetros de esta distribución son muy pequeños, las inferencias a posteriori no son adecuadas. El interés se centra en evaluar tres distribuciones a priori para los parámetros de escala del modelo: la gamma-inversa; la Half Cauchy que se ha usado para la situación planteada y que ha demostrado funcionar adecuadamente; y la beta 2 escalada (SBeta2) la cual es una distribución de colas pesadas que tiene un mejor comportamiento en el origen y en la cola derecha.
Se desarrolla un estudio de simulación, con el que se pretende analizar el efecto de la distribución a priori asignada a los parámetros de escala sobre el encogimiento de los parámetros a posteriori del modelo; además se evalúa ante la presencia de observaciones atípicas cómo es el ajuste que el modelo realiza de estas, con cada una de las distribuciones a priori candidatas para los parámetros de escala. El análisis se centra en estas dos características (encogimiento de los parámetros a posteriori y ajuste de observaciones atípicas) pues son estas las principales críticas que diferentes autores plantean al uso de la distribución gamma-inversa como a priori para los parámetros de escala. Finalmente se presenta una aplicación con datos reales.
Resumen (en)
In this paper, it is proposed the evaluation of a set of prior distributions for the scale parameters of the Zero-Inflated Poisson Regression model (ZIP). Traditionally the inverse-gamma distribution is used as prior for scale parameters. Some studies have shown that when the values of the hyperparameters of this distribution are very small, inferences are not adequate. We focus on evaluating three prior distributions for modeling scale parameters: inverse-gamma; half Cauchy and scaled beta 2 (SBeta2). The half Cauchy has been used in the situation in question and has proven to work properly. The SBeta2 is a heavy-tailed distribution that has better performance at the origin and at the right tail. A simulation study is developed, with which we intend to analyze the effect of the priordistributionassignedtothescaleparametersontheshrinkageoftheposterior estimates of parameters. Besides, the presence of outliers is evaluated regarding the adjustment of the corresponden values. This is done for each of the three prior distributions considering. The analysis focuses shrinkage of the posterior estimates of parameters and adjustment of outliers because the main criticisms on the use of the inverse-gamma distribution concentrate on this two issues. Finally an application is presented with real data.
Referencias
Barrera, C. & Correa, J. (2008), ‘Distribución predictiva bayesiana para modelos de pruebas de vida vía MCMC’, Revista Colombiana de Estadística 31(2), 145– 155.
Berger, J. (2006), ‘The case for objective Bayesian analysis’, Bayesian Analysis 1(3), 385–402.
Fruhwirth-Schnatter, S. & Wagner, H. (2010), ‘Bayesian variable selection for random intercept modeling of Gaussian and non-Gaussian data’, Bayesian Statistics 9, 165.
Fúquene, J., Pérez, M. & Pericchi, L. (2014), ‘An alternative to the Inverted Gamma for the variances to modelling outliers and structural breaks in dynamic models’, Brazilian Journal of Probability and Statistics 28(2), 288–299.
Gelman, A. (2006), ‘Prior distributions for variance parameters in hierarchical models’, Bayesian Analysis 1(3), 515–533.
Ghosh, S., Mukhopadhyay, P. & Lu, J. (2006), ‘Bayesian analysis of zero-inflated regression models’, Journal of Statistical Planning and Inference 136, 1360– 1375.
Heibron, D. (1994), ‘Zero-altered and other regression models for count data with added zeros’, Biometrical Journal 36, 531–547.
Kwiatkowski, D., Phillips, P. & Schmidt, P. (1992), ‘Testing the Null Hypothesis of Stationarity Against the Alternative of a Unit Root’, Journal of Econometrics 54, 159–178.
Lambert, D. (1992), ‘Zero-Inflated Poisson regression with an application to defects in manufacturing’, Technometrics 34, 1–14.
Marin, J., Jones, O. & Hadlow, W. (1993), ‘Micropropagation of columnar apple trees’, Journal of Horticultural Science 68(2), 289–297.
O’Hagan, A. & Pericchi, L. (2012), ‘Bayesian heavy-tailed models and conflict resolution: A review’, Brazilian Journal of Probability and Statistics 26(4), 372– 401.
Pérez, M., Pericchi, L. & Ramírez, I. (2016), ‘The Scaled Beta2 distribution as a robust prior for scales’, Artículo sometido para Publicación .
Pericchi, L. (2010), ‘Discussion of Polson, N., and Scott, J.’, Bayesian Statistics 9, 531.
Polson, N. & Scott, J. (2012), ‘On the half-Cauchy prior for a global scale parameter’, Bayesian Analysis 7(4), 887–902.
Rodrigues, J. (2006), ‘Full Bayesian Significance Test for Zero-Inflated Distributions’, Communications in Statistics - Theory and Methods 35(2), 299–307.
Cómo citar
Licencia
Los autores mantienen los derechos sobre los artículos y por tanto son libres de compartir, copiar, distribuir, ejecutar y comunicar públicamente la obra bajo las condiciones siguientes:
Reconocer los créditos de la obra de la manera especificada por el autor o el licenciante (pero no de una manera que sugiera que tiene su apoyo o que apoyan el uso que hace de su obra).
Comunicaciones en Estadística está bajo una licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional (CC BY-NC-SA 4.0)