Una nota de cuidado sobre el efecto de datos parcialmente faltantes en la prueba de independencia χ2

Autores/as

  • Juan Carlos Correa Escuela de Estadística, Universidad Nacional de Colombia, Sede Medellín. Grupo de Investigación en Estadística, Universidad Nacional de Colombia, Sede Medellín.
  • Jorge Iván Vélez Genomics and Predictive Medicine Group, Department of Genome Biology, John Curtin School of Medical Research, The Australian National University, Canberra, ACT, Australia. Grupo de Investigación en Estad ́ıstica, Universidad Nacional de Colombia, Sede Medellín. Grupo de Neurociencias, Universidad de Antioquia, Medellín, Colombia.

DOI:

https://doi.org/10.15332/s2027-3355.2014.0002.05

Palabras clave:

datos faltantes, modelos loglineales, prueba de independencia, tablas de contingencia.

Resumen

El análisis de tablas de contingencia se utiliza ampliamente en muchas disciplinas, siendo el principal inter ́es la determinación de posibles asociaciones entre dos variables categóricas. Una de las pruebas más utilizadas para este fin es la prueba de independencia basada en el estad ́ıstico χ2. Con frecuencia, los investigadores enfrentan situaciones en las que una de las dos variables (o, en el peor de los casos, ambas) es parcialmente observada (es decir, presenta algunos valores faltantes). Por lo general, el procedimiento en estos casos es excluir de los anáisis aquellas observaciones (i.e., sujetos) en los que por lo menos para una de las variables no se tiene información. En esta nota analizamos el efecto de no considerar observaciones parcialmente observadas en la prueba cuando ajustamos modelos loglineales, concentr ́andonos principalmente en la prueba de independencia χ2. 

Citas

Agresti, A. (1990), Categorical Data Analysis, New York: Wiley.

Andersen, E. B. (1997), Introduction to the Statistical Analysis of Categorical Data, Springer-Verlag: Berlin.

Grizzle, J. E., Starmer, C. F. & Koch, G. G. (1969), ‘Analysis of categorical data by linear models’, Biometrics 25(3), 489–504.

Haberman, S. (1972), ‘Log-linear fit for contingency tables—Algorithm AS51’, Applied Statistics 21, 218–225.

Jeansonne, A. (2014), ‘Loglinear Models ’. Consultado Marzo 25, 2014. URL = http://goo.gl/e0Y3aE.

Leung, A. & Robson, W. (1990), ‘Nailbiting’, Clin Pediatr (Phila) 29(12), 690–2.

Little, R. & Rubin, D. (2002), Statistical Analysis With Missing Data, 2nd edn, New York: Wiley.

McCullagh, P. & Nelder, J. A. (1983), Generalized Linear Models, Chapman & Hall, London.

McHugh, M. L. (2013), ‘The χ2 test of independence’, Biochemia Medica 23(2), 143–9.

R Core Team (2014), R: A Language and Environment for Statistical Computing, R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051- 07-0, URL = http://www.R-project.org/.

Rubin, D. B. (1976), ‘Inference and missing data’, Biometrika 63(3), 581–592.

Descargas

Publicado

2014-12-20

Cómo citar

Correa, J. C., & Vélez, J. I. (2014). Una nota de cuidado sobre el efecto de datos parcialmente faltantes en la prueba de independencia χ2. Comunicaciones En Estadística, 7(2). https://doi.org/10.15332/s2027-3355.2014.0002.05

Número

Sección

Artículos

Artículos más leídos del mismo autor/a

1 2 > >>