CORDIS - Resultados de investigaciones de la UE
CORDIS

Pattern Recognition in High Dimensional Data

Article Category

Article available in the following languages:

Agrupación fiable de datos biomédicos para su análisis estadístico

La cantidad de datos disponible hoy día es abrumadora, pero no todos necesariamente proporcionan información útil. Empleando herramientas de vanguardia para la identificación de patrones, unos investigadores financiados con fondos comunitarios lograron extraer información útil a partir de datos de enfermedades infecciosas potenciales y de imágenes del cerebro.

Salud icon Salud

Los datos generados por la investigación biomédica son muy numerosos, tienen una naturaleza muy diversa y, generalmente, no están disponibles en formatos estandarizados. Por tanto, para obtener información útil a partir de estos datos es necesario desarrollar un criterio lógico con el que agrupar los datos en subconjuntos, de manera que los datos dentro de un mismo grupo compartan características comunes. Las técnicas de agrupación son solo el punto de partida cuando se trabaja con datos multivariantes o multidimensionales, donde cada dimensión representa un atributo diferente (es decir, una variable). Las técnicas de reconocimiento de patrones funcionan bien cuando se trabaja con un número reducido de dimensiones; sin embargo, su rendimiento disminuye conforme aumenta el número de variables en los datos analizados. Investigadores financiados por la Unión Europea abordaron los retos del agrupamiento de datos multivariantes centrándose en estructuras de datos con una menor dimensionalidad, que permiten obtener conclusiones generales para el conjunto de datos originales. Bajo los auspicios del proyecto PRINHDD (Pattern recognition in high dimensional data), estos desarrollaron nuevas técnicas de análisis de datos para estudios de diversidad de especies y de enfermedades, entre otros. El equipo de trabajo planteó el uso de métodos de análisis de vecino más próximo para obtener información sobre patrones espaciales. En este sentido, dos de los patrones espaciales comúnmente estudiados entre diferentes especies y sus características (sexo, capacidad de supervivencia, etc.) son la segregación y la asociación. Los investigadores también analizaron patrones de reflexividad y correspondencia entre especies. Para evaluar los resultados del agrupamiento por tipo de enfermedades entre pacientes de poblaciones homogéneas y heterogéneas, se emplearon dos índices de segregación basados en matrices de distancias. Los investigadores evaluaron la sensibilidad de estos análisis al tamaño muestral para el patrón de fondo subyacente, el nivel de agrupamiento y el número de grupos. Asimismo, se espera que un nuevo método permita aprovechar mejor la información morfométrica contenida en datos de mapas de distancias de sustancia gris cortical marcada (LCDM, por sus siglas in inglés). La puesta en común y la supervisión de la matriz de distancias de píxeles en tres dimensiones (vóxeles) de sustancia gris de la superficie del córtex cerebral pueden revelar diferencias en el plano temporal entre pacientes con esquizofrenia y trastorno bipolar. Los resultados de la investigación de PRINHDD han motivado la publicación de once artículos en revistas científicas de prestigio con revisión por pares. Durante la celebración de simposios internacionales, el equipo del proyecto también tuvo la oportunidad de presentar los resultados a otros científicos que trabajan en el campo del análisis de datos multivariantes y el reconocimiento de patrones. La continuación del trabajo del proyecto PRINHDD sobre la clasificación y el agrupamiento de datos multivariantes mediante nuevas colaboraciones debería favorecer avances en métodos estadísticos y sus aplicaciones.

Palabras clave

Agrupación, biomédico, análisis de datos, datos multivariantes, reconocimiento de patrones, PRINHDD

Descubra otros artículos del mismo campo de aplicación