Skip to main content

Probabilistic modelling of electronic health records

Article Category

Article available in the folowing languages:

Análisis de los historiales médicos electrónicos para una medicina personalizada

Los historiales médicos electrónicos (HME) almacenan cantidades ingentes de información médica con el objetivo general de mejorar los sistemas sanitarios. Investigadores europeos han estudiado nuevas técnicas de aprendizaje automático para interpretar los HME e identificar los factores de riesgo de enfermedad.

Economía digital
Salud

Los investigadores confían cada vez más en los métodos de aprendizaje automático para descifrar complejos patrones de enfermedades, estudiar interacciones de fármacos y elaborar predicciones. Sin embargo, los métodos actuales no son compatibles con el análisis de datos heterogéneos ni con la integración de conjuntos de datos masivos como los HME.

Utilización de técnicas de aprendizaje automático probabilístico

El proyecto PMOHR, llevado a cabo con el apoyo del programa Marie Skłodowska-Curie (MSC), abordó este reto al desarrollar modelos interpretables capaces de analizar HME. «Utilizamos técnicas aprendizaje automático probabilístico, las cuales se utilizan cada vez más para analizar datos en tiempo real en muchas áreas de la ciencia», explica el beneficiario de la beca de investigación MSC Francisco Rodríguez Ruiz. En el aprendizaje automático probabilístico, las suposiciones acerca de la estructura de los datos están codificadas en un modelo con patrones ocultos. El modelo aprende estos patrones y analiza los conjuntos de datos para hacer predicciones mediante un algoritmo de inferencia. El beneficiario de la beca de investigación MSC ha generado una nueva clase de modelos, conocida como inclusiones de familias exponenciales (EFE, por sus siglas en inglés), que permite captar los patrones de coocurrencia en un conjunto de datos. Básicamente, esto significa que las EFE pueden desvelar características significativas de los diagnósticos, así como elementos ocultos como enfermedades, términos médicos o parámetros biológicos que coocurren en un conjunto de datos determinado. Las EFE analizan sin supervisión cómo estas características y diagnósticos médicos se relacionan entre sí.

Evaluación de los modelos

Los modelos de PMOHR se basan en algoritmos de inferencia rápidos y pueden, por lo tanto, manejar diferentes tipos de datos a una mayor velocidad. Al mismo tiempo, los expertos en el campo pueden interpretar los resultados de forma sencilla, lo que permite que los modelos puedan refinarse si los hallazgos carecen de sentido. Estos modelos son ampliables para el manejo de grandes conjuntos de datos y, por tanto, pueden utilizarse para el análisis estadístico de los HME. Los investigadores de PMOHR han aplicado las herramientas a los datos de HME a disposición del público, así como a los datos del Hospital Presbiteriano de Nueva York. Las EFE aplicadas a enfermedades y texto clínico de la base de datos MIMIC-III de acceso libre identificaron grupos de enfermedades basándose únicamente en sus patrones de coocurrencia. El agrupamiento de modelos mostró información más allá de la mera clasificación de las enfermedades, que desvela factores de riesgo no triviales y orienta el análisis futuro de características ocultas.

Importancia del proyecto y perspectivas de futuro

PMOHR ha mejorado el estado actual de la modelización probabilística mediante el desarrollo de herramientas con el poder de analizar conjuntos complejos de datos heterogéneos. Una ventaja importante de las técnicas de modelización probabilística es la capacidad de medir la incertidumbre de las predicciones. «Cuando se trata de predecir factores de riesgo de enfermedad, la medida de la incertidumbre es de vital importancia», destaca Rodríguez Ruiz. El objetivo a largo plazo de PMOHR es la aplicación de modelos probabilísticos para mejorar los sistemas sanitarios mediante el diseño de sistemas de medicina personalizada y de apoyo clínico. No solo contribuirá a mejorar la salud, sino que también recortará los costes sanitarios. Al mismo tiempo, tiene capacidad para descubrir patrones antes desconocidos a partir de los datos e, incluso, para descubrir nuevas teorías causales. «Los planes futuros implican la propuesta de modelos para determinar la causalidad y el efecto de los tratamientos médicos o de los fármacos», concluye Rodríguez Ruiz.

Palabras clave

PMOHR, aprendizaje automático probabilístico, historias clínicas electrónicas, HME, inclusiones de familias exponenciales, EFE, modelo, algoritmos de inferencia, modelización probabilística

Descubra otros artículos del mismo campo de aplicación