Patentsuche vereinfachen mit Bildvergleichen

read this article in English

Das Projekt

Patentrecherche ist meist schwierig und aufwändig. Der Vergleich einzelner Patente ist oft mühselig – ob Texte langwierig gelesen oder Bilder minutiös miteinander verglichen werden müssen. Zudem stehen Patentrechercheur:innen und Forschende bei der Prüfung der Patentierbarkeit von eigenen Forschungsergebnissen immer wieder vor Sprach- und Terminologiebarrieren. Existierende Patentretrieval-Methoden basieren nämlich in erster Linie auf textueller Suche in Patentschriften und klammern Abbildungen und die Bezüge zwischen Text und Bild weitestgehend aus. Häufig kann die Innovation und das Verwertungspotenzial eines Patents jedoch erst mithilfe einer Abbildung erkannt werden und die Analyse einer Menge von Patenten mit ähnlichen oder verwandten Innovationen durch das schnelle, vergleichende Betrachten von Abbildungen erfolgen. Der Zugang über Abbildungen bietet eine von Sprache und Terminologie unabhängig funktionierende Alternative oder Ergänzung und vereinfacht die Identifizierung von relevanten Ergebnissen in Patentschriften.

Genau an dieser Stelle setzt das Projekt ExpResViP (Exploitation of Research Results through Visual Patent Retrieval) an. Die TIB entwickelt zusammen mit dem Fraunhofer IAIS, dem Institut für Informationswissenschaft und Sprachtechnologie der Universität Hildesheim (IWIST) und der Geschäftsstelle der Leibniz Gemeinschaft eine neuartige visuelle Suche für das Patentretrieval, die auf der automatischen Erkennung von Bildähnlichkeiten und Text-Bild-Bezügen mittels maschineller Lernverfahren in Patentschriften basiert. Das Ziel ist es neue Methoden zur Suche und Analyse von visuellen Elementen in Patenten zu entwickeln und in ein Patentretrieval-Tool zu integrieren.

Die Entwicklung erfolgt ganz dicht an den Bedürfnissen von Patenrechercheur:innen. Mittels Interviews mit Expert:innen aus Patentämtern, der freien Wirtschaft und Forschungseinrichtungen wurde eine Bedarfserhebung durchgeführt. Aus den Anforderungen wurde eine Prioritätenliste erstellt, die die gewünschten Funktionen des Retrievaltools abbildet. Die Umsetzung der Anforderungen erfolgt in mehreren Iterationen in enger Absprache mit den Patentexpert:innen. Ganz oben auf der Bedarfsliste stehen u.a. die Möglichkeit nicht nur nach sondern auch mit eigenen Bildern zu suchen, das Anschauen mehrerer Bilder auch verschiedener Patente sowie das Hervorheben und Verlinken von Referenzzeichen in den Bildern.

Stand der Entwicklung

Zum jetzigen Zeitpunkt steht bereits die SOLR-basierte Suchmaschine mit Textindexierung. Das bedeutet es kann mit Text nach Text und Bildern gesucht werden. Derzeit wird die Möglichkeit der Bildindexierung optimiert. Hierfür werden die Bilder mittels Texterkennung (OCR – optical character recognition) gescannt und automatisiert in verschiedene Bildklassen kategorisiert. Durch die Texterkennung ist auch die Zuordnung von Bezugszeichen in den Bildern mit ihren Beschreibungen im Text möglich. Diese Zuordnung wird wiederum in der GUI verwendet, um den Patentrechercheur:innen einen schnellen Überblick über Bilder und Beschreibungen zu geben.

Vergleich mehrerer Bilder eines Patents

Aus diesen Entwicklungen entstand in den letzten Monaten ein erster Prototyp, der den kooperierenden Patentexpert:innen zur Evaluation vorgelegt wurde. Die weitere Entwicklung wird sich an deren Rückmeldungen ausrichten. Bis zur nächsten Version des Prototypen werden wir u.a. an der Verbesserung an der Kommunikation der einzelnen Komponenten der Suche untereinander arbeiten, um auch die Geschwindigkeit der Indexierung und Suche zu erhöhen, die Bildindexierung weiterentwickeln und die Darstellung der Suchergebnisse verbessern.

Mockup der Suchergebnisse mit Fokus auf Bilddarstellung

... ist Mitarbeiterin im Referat PID- und Metadaten Services der TIB und dort vor allem für das Projekt PID Network zuständig.