Wissensgraph visualisiert Wissen zu Psychosen aus unstrukturierter Fachliteratur
SANKT AUGUSTIN. Das Fraunhofer-Institut für Algorithmen und Wissenschaftliches Rechnen SCAI und das Software-Unternehmen Kairntech (Grenoble) haben einen Wissensgraphen für psychiatrische Erkrankungen, insbesondere Psychosen, erstellt. Mit Wissensgraphen lassen sich unstrukturierte Texte in ein strukturiertes, vergleichbares Format bringen. Sie visualisieren Ursache-Wirkungs-Modelle und helfen so den medizinischen Fachkräften, Entscheidungen zu Therapien zu treffen. SCAI und Kairntech nutzen Verfahren der Künstlichen Intelligenz (KI) und des Natural Language Processing (NLP), um Abhängigkeiten und Beziehungen zu extrahieren. Somit konnte das gesamte mechanistische Wissen zu einem Indikationsgebiet erschlossen werden.
Heute ist der größte Teil des vorhandenen Wissens zu einem Fachgebiet in Form unstrukturierter Texte in zahlreichen wissenschaftlichen Publikationen enthalten. Darin werden beispielsweise die Interaktion von Protein X mit der regulatorischen Gensequenz Y oder die Auswirkungen einer Genvariante Z auf den klinischen Verlauf einer Krankheit beschrieben. Nur ein Bruchteil dieser Erkenntnisse ist in strukturierter Form verfügbar. Der überwiegende Teil unseres medizinischen Wissens ist in kaum strukturierter wissenschaftlicher Prosa kodiert.
»Auf dem Gebiet der psychiatrischen Erkrankungen gibt es solche strukturierten Datenbanken nicht in der Form, wie wir sie brauchen würden: umfangreich, detailliert und dennoch aktuell«, erklärt Prof. Martin Hofmann-Apitius, Leiter der SCAI-Abteilung Bioinformatik. »Gemeinsam mit Kairntech ist es uns gelungen, die schnell wachsende Fachliteratur auf dem Gebiet psychiatrischer Erkrankungen in kurzer Zeit automatisiert zu analysieren.«
Das Softwareunternehmen Kairntech arbeitet seit 2018 an einer generischen Plattform für KI-/NLP-Aufgaben. »Wir hatten unsere Software bereits erfolgreich auf eine Reihe von Anwendungsfällen wie die Analyse juristischer Dokumente, Presseartikel oder technische Berichte angewendet. Daher lag die Übertragung auf ein weiteres Fachgebiet nahe«, sagen Stefan Geißler und Olivier Terrier von Kairntech.
Das Projekt erforderte eine detaillierte Erkennung von Entitäten – das sind eindeutig identifizierbare Objekte, über die Informationen gespeichert werden – in der Fachliteratur und deren Verknüpfung mit geeigneten kanonischen Vokabularen. Hinzu kam die Bestimmung entsprechender »Ursache-Wirkungs«-Beziehungen zwischen diesen Entitäten. Schließlich mussten noch Nebenbedingungen wie assoziierte biologische Prozesse und Testsysteme bestimmt werden, bevor das Ergebnis in der Biological Expression Language (BEL) kodiert werden konnte. »Erstmals haben wir indikationsspezifische Ursache-Wirkungs-Informationen in großen Umfang extrahiert«, erklärt Martin Hofmann-Apitius. Die erfolgreiche Studie habe gezeigt, so Hofmann-Apitius, dass sich spezifische, qualitativ hochwertige, berechenbare Ursache-Wirkungs-Modelle auch für weitere Wissensgebiete erzeugen lassen.
SCAI und Kairntech sehen ein breites Spektrum für künftige Anwendungen ihrer kombinierten Arbeitsabläufe in der Pharma-, Biotech- und Gesundheitsbranche.
Über Fraunhofer SCAI – Geschäftsfeld Bioinformatik:
Die Forschungsarbeiten konzentrieren sich auf Informationsextraktion und NLP sowie auf die Generierung berechenbarer Ursache-Wirkungs-Modelle neurologischer und psychiatrischer Erkrankungen.
Über Kairntech:
Kairntech bietet Softwarelösungen für KI und NLP an, die bei der Dokumentenanalyse in verschiedenen Geschäftskontexten zum Einsatz kommen.
Ansprechpartner:
Prof. Dr. Martin Hofmann-Apitius
Leiter des Geschäftsfeld Bioinformatik, Fraunhofer SCAI
Telefon +49 2241 14-4103
E-Mail: martin.hofmann-apitius@scai.fraunhofer.de
https://www.scai.fraunhofer.de/bio
Stefan Geißler
Chief Scientific Officer, Kairntech
E-Mail: info@kairntech.com
https://kairntech.com