Rechner erkennt chemische Strukturformeln

Die automatische Erschließung graphischer chemischer Strukturinformationen durch Software ist eines der herausragenden Probleme in der chemisch-pharmazeutischen Forschung. Publikationen und Patente enthalten Strukturformeln typischerweise als Bild. Für einen Chemiker ist das kein Problem. Häufig genügt sein schneller Blick, um chemische Strukturen einzuordnen. Für Computer sind solche Strukturen jedoch nur eine Anhäufung von Pixeln.

Mit der Software "chemoCR", die Forscher am Fraunhofer-Institut für Algorithmen und Wissenschaftliches Rechnen SCAI entwickelt haben, ist es nun möglich, in hohem Durchsatz aus den umfangreichen Sammlungen wissenschaftlicher Publikationen und aus Millionen von Patenten die in Bildern vorliegende chemische Strukturinformation in ein maschinenlesbares Format zu überführen. Die Computer werden dadurch in die Lage versetzt, die in chemisch-pharmazeutischen Patenten enthaltene Strukturinformation zu durchsuchen.

"Wir haben insgesamt drei Jahre an Forschungs- und Entwicklungsarbeit in dieses Projekt investiert und sind vom großen Interesse in der chemischen und pharmazeutischen Industrie positiv überrascht worden", sagt Dr. Marc Zimmermann, Leiter der Entwicklung von "chemoCR" am Fraunhofer SCAI.

"Mit unserer Software lassen sich erstmals Millionen von Patenten nach der in Bildern enthaltenen chemischen Strukturinformation durchsuchen. Wir eröffnen hierdurch neue Möglichkeiten, Patentansprüche auf Stoffe und Syntheseverfahren zu untersuchen. Damit adressieren wir ein Alltagsproblem der chemischen und pharmazeutischen Industrie", ergänzt Prof. Dr. Martin Hofmann-Apitius, Leiter der Abteilung Bioinformatik am Fraunhofer-Institut SCAI.

COMPAMED.de; Quelle: Fraunhofer-Institut für Algorithmen und Wissenschaftliches Rechnen SCAI