Skip to main content

Semantic Indexing of French Biomedical Data Resources - mobility

Article Category

Article available in the folowing languages:

Herramienta en línea abierta para la anotación de texto biomédico en lengua francesa

Teniendo en cuenta el aumento constante del volumen de datos biomédicos, existe una necesidad urgente de usar terminologías y ontologías (indexación semántica) estándares que orienten los futuros descubrimientos científicos basados en datos. Una herramienta en línea abierta desarrollada por el proyecto europeo SIFRm ofrece anotación de texto biomédico en textos en lengua francesa.

Economía digital
Salud

Los científicos emplean ontologías y terminologías para indexar, minar y recuperar información biomédica. El uso de ontologías y terminologías sirve como común denominador para estructurar los datos biomédicos. Sin embargo, la mayoría de las herramientas están en inglés y, a pesar de la gran cantidad de datos clínicos producidos en francés, existe muy poca tecnología disponible.

Una herramienta de anotación biomédica en lengua francesa

El objetivo del proyecto SIFRm, emprendido con el apoyo del programa Marie Skłodowska-Curie (MSC), era la creación de un flujo de trabajo de indexación basado en ontologías especializado en otras lenguas europeas, empezando por el francés. «Nuestro objetivo principal era hacer que la anotación de los datos de textos biomédicos estuviera disponible con el clic del ratón para liberar a los investigadores de la carga de tratar con terminologías y ontologías o el procesamiento del lenguaje natural», explica Clement Jonquet, beneficiario de una MSCA. SIFRm es una colaboración entre el equipo del profesor Cerri en el Laboratorio de Informática, Robótica y Microelectrónica de Montpellier (LIRMM) en Francia y el equipo del profesor Musen en Centro de Stanford para la Investigación Informática Biomédica (BMIR) en Estados Unidos, conocido por el desarrollo de servicios basados en ontologías. Los investigadores crearon el Anotador SIFR, un servicio en línea accesible al público que permite el procesamiento de datos de textos biomédicos en francés. Básicamente, el anotador etiqueta el texto sin formato con conceptos de ontología biomédica pertinentes y expande semánticamente las anotaciones mediante el conocimiento incorporado en las ontologías. Por ejemplo, si una nota clínica contiene la frase «no hay signos de melanoma», la anotación semántica ayudará a clasificar al paciente como no relevante para estudios sobre el cáncer. Para prestar apoyo al servicio, el proyecto ha desarrollado el repositorio de ontologías SIFR BioPortal. SIFR BioPortal, similar a la tecnología NCBO BioPortal desarrollada en la Universidad de Stanford, alberga diferentes terminologías y ontologías en francés, prestando así múltiples servicios relacionados con ontologías a la comunidad.

Anotación de datos clínicos y entidades agronómicas

El Anotador SIFR se ha enriquecido, en colaboración con el proyecto PractiKPharma, para procesar datos clínicos y contextualizar las enfermedades en notas clínicas. Los científicos desarrollaron características específicas para la anotación de texto clínico, abordando así la necesidad del Hospital Europeo Georges Pompidou y el Hospital Universitario de Nancy. Además, SIFRm ha generalizado los métodos científicos para la creación de un repositorio abierto de ontologías agronómicas llamado AgroPortal, que es un esfuerzo comunitario iniciado por la comunidad científica de Montpellier y finalizado gracias al desplazamiento del investigador a Stanford. Los científicos desarrollaron AgroPortal para la agronomía y dominios relacionados como los alimentos, la botánica y la biodiversidad, basándose en los resultados científicos y la experiencia obtenidos en el dominio biomédico. «AgroPortal aborda la necesidad de una plataforma común que aloje, preste servicio y alinee los recursos semánticos disponibles en este dominio y que permita su explotación en aplicaciones agroinformáticas», informa Jonquet. El repositorio AgroPortal aloja actualmente más de ciento diez vocabularios y ontologías y se enriquecerá aún más en un futuro próximo. La plataforma cuenta ya con más de ciento noventa usuarios registrados que realizan visitas frecuentes todos los meses. En general, el proyecto SIFRm ha ofrecido la primera herramienta en línea accesible al público para el reconocimiento de entidades y la anotación y contextualización de texto biomédico en francés. El servicio web funciona de forma muy parecida a otras plataformas de anotación y se espera que mejore el trabajo de una variedad de científicos, incluidos médicos, profesionales sanitarios e investigadores. Los planes de futuras asociaciones con hospitales y centros de investigación en Francia ampliarán el uso del Anotador SIFR en investigación biomédica. En un esfuerzo similar, la herramienta AgroPortal se usará en el proyecto D2KAB, financiado principalmente por la agencia nacional de investigación francesa para convertir los datos en conocimiento sobre agronomía y biodiversidad.

Palabras clave

SIFRm, biomédico, ontología, anotador, AgroPortal, BioPortal, lengua francesa, datos clínicos, indexación

Descubra otros artículos del mismo campo de aplicación