Una aplicación estadística de los métodos de clasificación en astronomía

Autores/as

  • Héctor Hortúa Docente. Semillero de Investigación en Astronomía, Departamento de Ciencias Básicas, Fundación Universitaria Los Libertadores. Colombia
  • Alex J. Zambrano Docente. Facultad de Estadística, Universidad Santo Tomás. Colombia

DOI:

https://doi.org/10.15332/s2027-3355.2014.0001.05

Palabras clave:

cúmulos abiertos, diagrama Hertzsprung-Russell, clasificación basada en modelos

Resumen

En los últimos años, los avances en  astrofísica y cosmología han sido impulsados por grandes y complejos conjuntos de datos, los cuales sólo pueden ser analizados e interpretados con  el uso de métodos estadísticos muy  refinados. Esto ha llevado a que estas disciplinas se complementen para formar una rama llamada la astroestadística. En este trabajo se da a conocer un método de clasificación estadístico usando modelos de mezclas de Gausianas. Este método se aplicará para encontrar estrellas que pertenecen al cúmulo de las Hyades usando una muestra de 2678 estrellas de la base de datos de Hipparcos. Se realiza una descripción breve de las características del cúmulo y se estudia la evidencia de outliers. Con este método se encuentra que la clasificación arroja tres grupos de los cuales podemos estudiar  la pertenencia al cúmulo y se encuentra que la mayoría de estrellas pertenecientes al mismo están de acuerdo con la literatura.  También  se muestra el diagrama de Hertzsprung-Russell obtenido para el cúmulo, muy importante en  estudios de evolución estelar. Finalmente, se analiza un tercer grupo obtenido por el método el cual fue analizado a través de filtros y otros métodos estadísticos para el manejo de outliers y determinar con más precisión la pertenencia de las estrellas en el cúmulo de las Hyades.

Biografía del autor/a

Alex J. Zambrano, Docente. Facultad de Estadística, Universidad Santo Tomás. Colombia

Alex Johann Zambrano es profesional en Matemáticas con énfasis en Estadística de la Universidad del Tolima (Ibagué-Colombia). Fue Catedrático en la Universidad del Tolima dictando varias disciplinas de Estadística (Estadística Fundamental, Probabilidad, Diseño y Análisis de Experimentos, Simulación Estadística, Análisis Multivariado, Control de Calidad Estadística). Fue Docente de Tiempo Completo en la Fundación Universitaria Los Libertadores (Bogotá-Colombia) dictando varias disciplinas en materias de pregrado (Estadística, Estadística II, Probabilidad y Estadística, Estadística Inferencial, Medición I, Medición II, Algebra Lineal) y postgrado (Regresión Aplicada). Colaborador en el Observatorio del Empleo y Recursos Humanos del Tolima (Ibagué-Colombia), colaborador del grupo GELIMO de la Universidad del Tolima e investigador apasionado en Control de Calidad Estadística y el Análisis Multivariado de Datos. Trabajo en la empresa de investigación de mercados YanHaas. Docente tiempo completo de la Universidad Santo Tomás (Bogotá-Colombia) y actualmente se encuentra culminando su Maestría en Estadística en la Universidad Nacional de Colombia (Bogotá-Colombia).

Citas

Ball, N. M. & Brunner, R. J. (2010), ‘Data mining and machine learning in astronomy’, International Journal of Modern Physics D 19(07), 1049–1106.

Brieva, E. & Uribe, A. (1985), ‘Una aplicación del método de máxima verosimilitud en astronom´ıa galactica’, Revista Colombiana de Estad´ıstica 12, 1–25.

Celeux, G. & Govaert, G. (1992), ‘A classication em algorithm for clustering and two stochastic versions’, Computational Statistics and Data Analysis 14, 315–332.

Celeux, G. & Govaert, G. (1995), ‘Gaussian parsimonious clustering models’, Pattern Recognition 28, 781–793.

Chilingarian, A. A. & Vardanyan, A. A. (2003), ‘Multivariate methods of data analysis in cosmic-ray astrophysics’, Nuclear Instruments and Methods in

Physics Research Section A: Accelerators, Spectrometers, Detectors and Associated Equipment 502(2), 787–788.

Dasgupta, A. & Raftery, A. E. (1998), ‘Detecting features in spatial point processes with clutter via model-based clustering’, Journal of the American Statistical Association 93(441), 294–302.

De’ath, G. (2013), mvpart: Multivariate partitioning.

URL: http://CRAN.R-project.org/package=mvpart

Dempster, A. P., Laird, N. M. & Rubin, D. B. (1977), ‘Maximum likelihood from incomplete data via the em algorithm’, Journal of the Royal statistical Society 39(1), 1–38.

Everitt, B. S., Landau, S., Leese, M. & Stahl, D. (2011), Cluster Analysis, 5 edn, Wiley.

Feigelson, E. D. & Babu, G. J. (2012), Modern Statistical Methods for Astronomy: with R applications, Cambridge: University Press.

Fraley, C. & Raftery, A. E. (1998), ‘How many clusters? which clustering method? answers via model-based cluster analysis’, The computer journal 41(8), 578–588.

Fraley, C. & Raftery, A. E. (2002), ‘Model-based Clustering, Discriminant Analysis and Density Estimation’, Journal of the American Statistical Association 97, 611–631.

Fraley, C., Raftery, A. E., Murphy, T. B. & Scrucca, L. (2012), mclust version 4 for R: Normal Mixture Modeling for Model-Based Clustering, Classification, and Density Estimation, (technical report no. 597), Department of Statistics, University of Washington.

Hobson, M. P., Jaffe, A. H., Liddle, A. R., Mukherjee, P. & Parkinson, D. (2010), Bayesian Methods in Cosmology, Cambridge: University Press.

Hothorn, T. & Zeileis, A. (2013), partykit: A Toolkit for Recursive Partytioning. URL: http://CRAN.R-project.org/package=partykit

Johnson, R. & Wichern, D. (1998), Applied Multivariate Statistical Analysis, 4 edn, New Jersey: Prentice Hall.

Karttunen, H., Kr¨oger, P. & Oja, H. (2007), Fundamental astronomy, 5 edn, New York: Springer.

Liddle, A. R. (2009), ‘Statistical methods for cosmological parameter selection and estimation’, Annual Review of Nuclear and Particle Science 59(1), 95–114.

Loredo, T. J. (2012), ‘On the future of astrostatistics: statistical foundations and statistical practice’, arXiv preprint, arXiv:1208.3035,http://arxiv.org/abs/1208.3035 .

Perryman, M. A. C., Brown, A. G. A., Lebreton, Y., Gómez, A., Turon, C., Cayrel de Strobel, G., Mermilliod, J. C., Robichon, N., Kovalevsky, J. & Crifo, F. (1998), ‘The Hyades: distance, structure, dynamics, and age’, Astronomy and Astrophysics 331, 81–120.

R Core Team (2013), R: A Language and Environment for Statistical Computing, R Foundation for Statistical Computing, Vienna, Austria. URL: http://www.R-project.org/

Sarro, L. M., Eyer, L., O’Mullane, W. & De Ridder, J. (2012), Astrostatistics and Data Mining, Vol. 2, New York: Springer.

Schwarz, G. (1978), ‘Estimating the dimension of a model’, The Annals of Statistics 6, 461–464.

Uribe, A., Barrera-Rojas, R.-S. & Brieva, E. (2008), ‘Membership in the region of the open cluster m67 via the expectation maximization algorithm and age determination using a bag of basti isochrones’, Memorias, COCOA 1, 88–93.

Vaughan, S. (2013), ‘Random time series in astronomy’, Philosophical Transactions of the Royal Society A: Mathematical, Physical and Engineering Sciences 371, 371–399.

Descargas

Publicado

2014-06-20

Cómo citar

Hortúa, H., & Zambrano, A. J. (2014). Una aplicación estadística de los métodos de clasificación en astronomía. Comunicaciones En Estadística, 7(1), 67–87. https://doi.org/10.15332/s2027-3355.2014.0001.05

Número

Sección

Artículos