Skip to main content
Weiter zur Homepage der Europäischen Kommission (öffnet in neuem Fenster)
Deutsch Deutsch
CORDIS - Forschungsergebnisse der EU
CORDIS

Article Category

Inhalt archiviert am 2023-03-02

Article available in the following languages:

Deutsche Wissenschaftler entwickeln Software zur Erkennung von chemischen Strukturformeln

Deutsche Wissenschaftler haben eine neue Software entwickelt, die chemische Strukturformeln in Patenten erkennen kann. Ziel ist es, diese Bilder maschinenlesbar und abrufbar zu machen. Patente und wissenschaftliche Publikationen enthalten chemische Strukturinformationen häuf...

Deutsche Wissenschaftler haben eine neue Software entwickelt, die chemische Strukturformeln in Patenten erkennen kann. Ziel ist es, diese Bilder maschinenlesbar und abrufbar zu machen. Patente und wissenschaftliche Publikationen enthalten chemische Strukturinformationen häufig als Bild. Die Klassifizierung dieser Strukturen ist für Chemiker, die das Dokument öffnen und die Bedeutung der Bilder verstehen können, kein Problem. Computer jedoch können diese Strukturen nicht indizieren, da sie für sie nur eine Anhäufung von Pixeln sind. Die Software chemoCR, die vom Fraunhofer-Institut für Algorithmen und Wissenschaftliches Rechnen (SCAI) und der deutschen Firma InfoChem entwickelt wurde, kombiniert Strukturerkennungstechniken mit Konzepten für überwachtes maschinelles Lernen. Die Methode beruht auf der Idee, die bedeutendsten semantischen Einheiten (z. B. chirale Verbindungen, Superatome, Reaktionspfeile) aus Strukturformeln zu erkennen. Dies ermöglicht es dem Computer, Informationen in chemisch-pharmazeutischen Patenten mittels Struktursuchen zu finden. "Heute zeichnen Chemiker in Indien, Russland und anderen Billiglohnländern Strukturformeln per Hand ab und pflegen sie manuell in die Datenbanken ein. Die damit verbundene Wertschöpfung geht momentan in diese aufstrebenden Länder. Mit chemoCR können wir diesen Rekonstruktionsschritt jetzt per Computer schneller und billiger ausführen", erklärt Peter Löw, Geschäftsführer von InfoChem. "Mit unserer Software lassen sich erstmals Millionen von Patenten nach der in Bildern enthaltenen chemischen Strukturinformation durchsuchen. Wir eröffnen hierdurch neue Möglichkeiten, Patentansprüche auf Stoffe und Syntheseverfahren zu untersuchen. Damit adressieren wir ein Alltagsproblem der chemischen und pharmazeutischen Industrie", ergänzt Professor Martin Hofmann-Apitius, Leiter der Abteilung Bioinformatik am Fraunhofer-Institut SCAI.

Länder

Deutschland