CORDIS
Resultados de investigaciones de la UE

CORDIS

Español ES

Noticias

Español ES

Científicos alemanes desarrollan software para leer compuestos químicos

Científicos alemanes han desarrollado una nueva herramienta de software capaz de identificar imágenes de estructuras químicas en documentos de patentes. El propósito es posibilitar que las imágenes puedan ser leídas y extraídas por un ordenador. Los documentos y archivos de ...

Científicos alemanes han desarrollado una nueva herramienta de software capaz de identificar imágenes de estructuras químicas en documentos de patentes. El propósito es posibilitar que las imágenes puedan ser leídas y extraídas por un ordenador. Los documentos y archivos de patentes de las publicaciones científicas contienen frecuentemente información sobre estructuras químicas en formato de imagen. Aunque clasificar estas estructuras no plantea problema alguno para los científicos químicos, que pueden abrir cada documento y comprender el significado de las imágenes, los ordenadores no pueden indizar las estructuras, puesto que para ellos éstas no son más que una masa de píxeles. El software chemoCR, que fue desarrollado por el Instituto Fraunhofer de Algoritmos y Computación Científica (SCAI) e InfoChem (una empresa alemana), combina técnicas de reconocimiento de patrones con conceptos de aprendizaje automático supervisado. Este método se basa en la idea de identificar, en las fórmulas estructurales, las entidades semánticas más significativas (p. ej. enlaces quirales, superátomos, flechas de reacción). Esto permite a un ordenador extraer la información contenida en las patentes químico-farmacéuticas realizando búsquedas de estructuras. «Hasta ahora algunas de estas estructuras han sido dibujadas por químicos de la India, Rusia y otros países de rentas bajas, e introducidas manualmente en las bases de datos. Los países que están desarrollándose a gran velocidad se están beneficiando de este aumento de la capacidad de indización. Ahora, con chemoCR, podemos reconstruir las estructuras químicas más rápidamente y de manera menos costosa, con ordenadores», indicó Peter Loew, director general de InfoChem. «Con nuestro software, por primera vez, es posible realizar búsquedas en millones de patentes utilizando la información química contenida en las imágenes. Esto abre nuevas posibilidades para la investigación de derechos de patentes relativos a compuestos y procedimientos de síntesis. El programa chemoCR soluciona uno de los retos más comunes de la industria química y farmacéutica», añadió el profesor Martin Hofmann-Apitius, director del SCAI.

Países

Alemania