Paquete ZOIP de R para analizar datos proporcionales inflados con ceros y/o unos

Autores/as

  • Juan Camilo Diaz Zapata Universidad Nacional de Colombia, Sede Medellín.
  • Freddy Hernández Barajas Universidad Nacional de Colombia, Sede Medellín.
  • Olga Cecilia Usuga Manco Universidad de Antioquia, Medellín.

DOI:

https://doi.org/10.15332/s2027-3355.2018.0001.02

Palabras clave:

datos proporcionales, distribución ZOIP, máxima verosimilitud, R.

Resumen

Los datos obtenidos a partir de variables medidas bajo porcentajes, tasas y proporciones, son llamados datos proporcionales y estos se encuentran ubicados por lo general en el intervalo (0,1). Diferentes distribuciones se han desarrollado para caracterizar este tipo de variables, sin embargo, existe la posibilidad que este tipo de variables puedan dar resultados de cero o uno. Haciendo que se implementaran dos distribuciones beta inflada con ceros y/o unos, diferenciadas solo por su parametrización. Otros autores han trabajo con otras distribuciones para datos proporcionales inflados, como la distribución simplex, sin embargo, no se ha encontrado una distribución que reúna las principales distribuciones para datos proporcionales inflados con ceros y/o unos, en este trabajo se presenta el paquete ZOIP del sistema de computación R para la implementación de la distribución ZOIP (Zeros Ones Inflated Proportional) que reúne la distribución simplex y beta bajo diferentes parametrizaciones y estima los parámetros de dicha distribución. La estimación de los parámetros de la distribución ZOIP se hace vía máxima verosimilitud. Se realizan estudios de simulación que muestran la convergencia satisfactoria de los parámetros y se presenta el ajuste de una distribución ZOIP a datos reales.

Citas

Ferrari, S. & Cribari-Neto, F. (2004), ‘Beta regression for modelling rates and proportions’, Journal of applied statistics 31(7), 799–815.

Galvis, D. & Lachos, V. (2014), Bayesian analysis of regression models for proportional data in the presence of zeros and ones, PhD thesis, Estatal University of Campinas.

Hahn, E. (2008), ‘Mixture densities for project management activity times: A robust approach to pert’, European Journal of operational research 188(2), 450–459.

Hossain, A. (2015), ‘Modelling a proportion response variable using generalized additive models for location scale and shape’, International Workshop on Statistical Modelling 2, 137–140.

Jørgensen, B. (1997), ‘The theory of dispersion models’, Computational statistics and Data analysis 76.

Jørgensen, B. & Barndorff-Nielsen (1991), ‘Some parametric models on the simplex’, Journal of multivariate analysis 39(1), 106–116.

Kosmidis, I., Zou, A. & Jagan, K. (2015), ‘Beyond beta regression: modelling percentages and fractions in the presence of boundary observations’, International Workshop on Statistical Modelling 1, 267–272.

Ospina, R. & Ferrari, S. (2010), ‘Inflated beta distributions online: doi:10.1007/s00362-008-0125-4’, Statitical papers .

Ospina, R. & Ferrari, S. (2012), ‘A general class of zero-or-one inflated beta regression models’, Computational Statistics and Data Analysis 56(6), 1609–1623.

Owen, C. (2008), Parameter estimation for the beta distribution, Master’s thesis, Brigham young university.

Pace, L. & Salvan, A. (1997), ‘Principles of statistical inference from a neo-fisherian perspective. in: Advanced series on statistical science and applied probability’, World Scientific 4, 128.

Qiu, Z., Song, P. & Tan, M. (2008), ‘Simplex mixed-effects models for longitudinal proportional data’, Scandinavian Journal of Statistics 35(4), 577–596.

R Core Team (2017), R: A Language and Environment for Statistical Computing, R Foundation for Statistical Computing, Vienna, Austria. *http://www.R-project.org/

Rigby, B. & Stasinopoulos, M. (2005), ‘Generalized additive models for location, scale and shape’, Applied Statistical 54(3), 507–554.

Rigby, B. & Stasinopoulos, M. (2008), ‘Instructions on how to use the gamlss package in r’, Computational statistics and Data analysis 2, 194–195.

Zeileis, A., Cribari-Neto, F. & Gr¨un, B. (2010), ‘Beta regression in r’, Journal of statistical software 34(2), 1–24.

Zhang, P., Qiu, Z. & Shi, C. (2016), ‘simplexreg: An r package for regression analysis of proportional data using the simplex distribution’, Journal of Statistical Software 71(11).

Descargas

Publicado

2018-06-30

Cómo citar

Diaz Zapata, J. C., Hernández Barajas, F., & Usuga Manco, O. C. (2018). Paquete ZOIP de R para analizar datos proporcionales inflados con ceros y/o unos. Comunicaciones En Estadística, 11(1), 37–61. https://doi.org/10.15332/s2027-3355.2018.0001.02

Número

Sección

Artículos