Paquete ZOIP de R para analizar datos proporcionales inflados con ceros y/o unos
DOI:
https://doi.org/10.15332/s2027-3355.2018.0001.02Palabras clave:
datos proporcionales, distribución ZOIP, máxima verosimilitud, R.Resumen
Los datos obtenidos a partir de variables medidas bajo porcentajes, tasas y proporciones, son llamados datos proporcionales y estos se encuentran ubicados por lo general en el intervalo (0,1). Diferentes distribuciones se han desarrollado para caracterizar este tipo de variables, sin embargo, existe la posibilidad que este tipo de variables puedan dar resultados de cero o uno. Haciendo que se implementaran dos distribuciones beta inflada con ceros y/o unos, diferenciadas solo por su parametrización. Otros autores han trabajo con otras distribuciones para datos proporcionales inflados, como la distribución simplex, sin embargo, no se ha encontrado una distribución que reúna las principales distribuciones para datos proporcionales inflados con ceros y/o unos, en este trabajo se presenta el paquete ZOIP del sistema de computación R para la implementación de la distribución ZOIP (Zeros Ones Inflated Proportional) que reúne la distribución simplex y beta bajo diferentes parametrizaciones y estima los parámetros de dicha distribución. La estimación de los parámetros de la distribución ZOIP se hace vÃa máxima verosimilitud. Se realizan estudios de simulación que muestran la convergencia satisfactoria de los parámetros y se presenta el ajuste de una distribución ZOIP a datos reales.Citas
Ferrari, S. & Cribari-Neto, F. (2004), ‘Beta regression for modelling rates and proportions’, Journal of applied statistics 31(7), 799–815.
Galvis, D. & Lachos, V. (2014), Bayesian analysis of regression models for proportional data in the presence of zeros and ones, PhD thesis, Estatal University of Campinas.
Hahn, E. (2008), ‘Mixture densities for project management activity times: A robust approach to pert’, European Journal of operational research 188(2), 450–459.
Hossain, A. (2015), ‘Modelling a proportion response variable using generalized additive models for location scale and shape’, International Workshop on Statistical Modelling 2, 137–140.
Jørgensen, B. (1997), ‘The theory of dispersion models’, Computational statistics and Data analysis 76.
Jørgensen, B. & Barndorff-Nielsen (1991), ‘Some parametric models on the simplex’, Journal of multivariate analysis 39(1), 106–116.
Kosmidis, I., Zou, A. & Jagan, K. (2015), ‘Beyond beta regression: modelling percentages and fractions in the presence of boundary observations’, International Workshop on Statistical Modelling 1, 267–272.
Ospina, R. & Ferrari, S. (2010), ‘Inflated beta distributions online: doi:10.1007/s00362-008-0125-4’, Statitical papers .
Ospina, R. & Ferrari, S. (2012), ‘A general class of zero-or-one inflated beta regression models’, Computational Statistics and Data Analysis 56(6), 1609–1623.
Owen, C. (2008), Parameter estimation for the beta distribution, Master’s thesis, Brigham young university.
Pace, L. & Salvan, A. (1997), ‘Principles of statistical inference from a neo-fisherian perspective. in: Advanced series on statistical science and applied probability’, World Scientific 4, 128.
Qiu, Z., Song, P. & Tan, M. (2008), ‘Simplex mixed-effects models for longitudinal proportional data’, Scandinavian Journal of Statistics 35(4), 577–596.
R Core Team (2017), R: A Language and Environment for Statistical Computing, R Foundation for Statistical Computing, Vienna, Austria. *http://www.R-project.org/
Rigby, B. & Stasinopoulos, M. (2005), ‘Generalized additive models for location, scale and shape’, Applied Statistical 54(3), 507–554.
Rigby, B. & Stasinopoulos, M. (2008), ‘Instructions on how to use the gamlss package in r’, Computational statistics and Data analysis 2, 194–195.
Zeileis, A., Cribari-Neto, F. & Gr¨un, B. (2010), ‘Beta regression in r’, Journal of statistical software 34(2), 1–24.
Zhang, P., Qiu, Z. & Shi, C. (2016), ‘simplexreg: An r package for regression analysis of proportional data using the simplex distribution’, Journal of Statistical Software 71(11).
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Los autores mantienen los derechos sobre los artÃculos y por tanto son libres de compartir, copiar, distribuir, ejecutar y comunicar públicamente la obra bajo las condiciones siguientes:
Reconocer los créditos de la obra de la manera especificada por el autor o el licenciante (pero no de una manera que sugiera que tiene su apoyo o que apoyan el uso que hace de su obra).
Comunicaciones en EstadÃstica está bajo una licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional (CC BY-NC-SA 4.0)