Niemieccy naukowcy opracowują oprogramowanie do odczytywania związków chemicznych
Niemieccy naukowcy opracowali nowy program pozwalający na identyfikację obrazów struktur chemicznych w zgłoszeniach patentowych. Celem jest uczynienie tych obrazów odczytywalnymi dla komputera i możliwymi do wyszukania. Zgłoszenia patentowe i repozytoria publikacji naukowych często zawierają informacje na temat struktur chemicznych w formie obrazów. Klasyfikowanie tych struktur nie stanowi problemu dla chemików, którzy mogą otworzyć dokument i rozumieją znaczenie ilustracji, jednak komputery nie mają możliwości indeksowania tych struktur, ponieważ stanowią one tylko masę pikseli. Oprogramowanie chemoCR, opracowane wspólnie przez Instytut Algorytmów i Informatyki Naukowej im. Fraunhofera (SCAI) oraz niemiecką firmę InfoChem, łączy techniki rozpoznawania wzorów z koncepcjami nadzorowanego uczenia maszynowego. Metoda jest oparta na idei identyfikowania z wzorów strukturalnych najbardziej znaczących czynników semantycznych (np. wiązania chiralne, superatomy, oznaczenie reakcji strzałkami). Umożliwia to komputerowi odnajdywanie informacji zawartych w patentach chemiczno-farmaceutycznych poprzez wyszukiwanie struktur. - Do tej pory struktury były opracowywane przez chemików w Indiach, Rosji oraz innych krajach o niskim poziomie płac i wprowadzane manualnie do baz danych. Te szybko rozwijające się kraje czerpią korzyści z wartości dodanej indeksowania. Dzięki chemoCR możemy teraz odtwarzać struktury chemiczne w sposób szybszy i tańszy, za pomocą komputerów - powiedział Peter Loew, dyrektor generalny InfoChem. - Nasze oprogramowanie umożliwia po raz pierwszy przeszukiwanie milionów patentów z wykorzystaniem wykorzystanie informacji chemicznych zawartych w obrazach. Otwiera to nowe możliwości sprawdzania wniosków patentowych dotyczących związków i procedur syntezy; chemoCR stanowi odpowiedź na jedno z najpowszechniejszych wyzwań branży chemicznej i farmaceutycznej - dodał profesor Martin Hofmann-Apitius, dyrektor SCAI.
Kraje
Niemcy