Análisis de datos funcionales aplicado en electroencefalogramas: agrupamiento por k-medias funcional
Multivariate functional data applied to encephalogram curves
Resumen (es)
El análisis de datos funcionales se basa en el estudio de la función que describe la variabilidad de un conjunto de datos en un espacio de n muestras, y dentro de sus modelos se encuentra el análisis de conglomerados por k-medias funcional. Dado que la actividad cerebral responde a una función de onda de la carga eléctrica de las neuronas sobre el tiempo, observamos la oportunidad de aplicar el análisis de datos funcionales a este tipo de registros. El objetivo de este trabajo es describir la aplicabilidad del análisis de conglomerados por k-medias funcional para clasificación de la actividad cerebral en ratas Norvegicus Wistar. Se realizó la conversión de los registros en funciones de onda en bases de Fourier, las cuales fueron procesadas con análisis de componentes principales funcionales, algoritmo de k-medias funcional (k=6) y un análisis de correspondencias entre los conglomerados y las fases de actividad registradas manualmente en el hipnograma. Los conglomerados obtenidos hacen una categorización no supervisada consistente, especialmente en respecto a los atributos de frecuencia y regularidad de las ondas; elementos a tener en cuenta para la clasificación de señales. El análisis de datos funcionales es aplicable a la clasificación de registros de electroencefalograma, dado que toma un dato que es n-dimensional (en teoría infinito) y permite manejarlo como un único valor (una función de onda) y así ser procesado con diferentes técnicas de minería de datos.
Resumen (en)
Technological developments have made it possible for researchers in many areas to have large volumes of information for the same individual. Usually these data can be represented through curves or in general functions. From this arises a new field of study in statistics called Functional Data Analysis (FDA). In the FDA the basic unit of information is the complete function, rather than a set of values (Ramsay & Dalzell 1991). The usual statistical methods have been adapted to this situation, in particular the analysis of functional conglomerates by the k-means method has been developed. Since the brain activity responds to a wave function of the neuronal charge over time, the opportunity arises to apply the FDA to this type of record. The objective of this work is to describe the applicability of the functional cluster analysis by the k-means method to classify brain activity in Norvegicus Wistar rats. The conversion of the registers into wave functions was carried out using Fourier bases, which were analyzed according to the methodology developed in (Yamamoto 2012) and a simple correspondence analysis between the clusters and the phases of activity manually recorded in the hypnogram. The obtained conglomerates make a consistent unsupervised categorization, especially with respect to the attributes of frequency and regularity of the waves.
Referencias
Acharya, R., Faust, O., Kannathal, N., Chua, T. & Laxminarayan, S. (2005), ‘Nonlinear analysis of eeg signals at various sleep stages’, Computer methods and programs in biomedicine 80(1), 37–45.
Andersen, M., Antunes, I., Silva, A., Alvarenga, T., Baracat, E. & Tufik, S. (2008), ‘Effects of sleep loss on sleep architecture in wistar rats: gender-specific rebound sleep’, Progress in Neuro-Psychopharmacology and Biological Psychiatry 32(4), 975–983.
Ferraty, F. & Vieu, P. (2006), Nonparametric functional data analysis: theory and practice, Springer Science & Business Media.
Iber, C. (2007), The AASM manual for the scoring of sleep and associated events: rules, terminology and technical specifications, American Academy of Sleep Medicine.
Jacques, J. & Preda, C. (2014), ‘Functional data clustering: a survey’, Advances in Data Analysis and Classification 8(3), 231–255.
Moser, D., Anderer, P., Gruber, G., Parapatics, S., Loretz, E., Boeck, M., Kloesch, G., Heller, E., Schmidt, A., Danker-Hopfe, H. et al. (2009), ‘Sleep classification according to aasm and rechtschaffen & kales: effects on sleep scoring parameters’, Sleep 32(2), 139–149.
Peña, D. (2002), Análisis de datos multivariantes, Vol. 24, McGraw-Hill Madrid.
R Core Team (2013), R: A Language and Environment for Statistical Computing, R Foundation for Statistical Computing, Vienna, Austria. *http://www.R-project.org/
Ramsay, J. O. & Dalzell, C. (1991), ‘Some tools for functional data analysis’, Journal of the Royal Statistical Society 3, 539–572.
Ramsay, J. O., Hooker, G. & Graves, S. (2009), Functional data analysis with R and MATLAB, Springer Science & Business Media. Ramsay, J. & Silverman, B. (2005), ‘Functional data analysis’.
Yamamoto, M. (2012), ‘Clustering of functional data in a low-dimensional subspace’, Advances in Data Analysis and Classification 6(3), 219–247.
Yamamoto, M. & Terada, Y. (2014), ‘Functional factorial k-means analysis’, Computational Statistics & Data Analysis 79, 133–148.
Cómo citar
Licencia
Los autores mantienen los derechos sobre los artículos y por tanto son libres de compartir, copiar, distribuir, ejecutar y comunicar públicamente la obra bajo las condiciones siguientes:
Reconocer los créditos de la obra de la manera especificada por el autor o el licenciante (pero no de una manera que sugiera que tiene su apoyo o que apoyan el uso que hace de su obra).
Comunicaciones en Estadística está bajo una licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional (CC BY-NC-SA 4.0)