Expertennetzwerke in der Pharmaindustrie

01.03.2019 17:06
Daten sind der Schlüssel im Gesundheitswesen und der Pharmaindustrie. Um Expertennetzwerke zusammenzustellen und in Echtzeit Millionen von Daten und Dokumenten zu durchsuchen, nutzen Pharmakonzerne wie AstraZeneca oder UCB die Software des Herstellers Sinequa für KI-unterstützte Suche und Analyse. Diese ermittelt verborgene Korrelationen auch in nicht kodifizierten Informationen und spürt semantisch ähnliche Inhalte auf.

>> Mit KI-unterstützter Suche und Analyse können Pharmaunternehmen eine Suchplattform der nächsten Generation für Biodaten aufbauen. So bekommen sie große und heterogene Datenbestände aus internen und externen Quellen in der pharmazeutischen Forschung und Entwicklung in den Griff. Sie beschleunigen ihre Forschung und verkürzen die Time-to-Market von Arzneimitteln.

Bei forschungsintensiven Pharmaunternehmen wie AstraZeneca erstellen interne wie externe Spezialisten tagtäglich eine immense Anzahl hochtechnischer Dokumente: Forschungsunterlagen, Einträge in medizinische Datenbanken, Versuchsberichte oder Patenteinreichungen. Hinzu kommt die gesammelte Kommunikation zwischen Forschern aus verschiedenen Fachgebieten. Auf der anderen Seite stehen die Experten, die in den verschiedenen Geschäftsfeldern eines biopharmazeutischen Unternehmens tätig sind: Auch hier kann in einem weltweit tätigen Unternehmen die Anzahl schnell bei 10.000 und mehr Personen alleine in Forschung und Entwicklung liegen.

Im Rahmen der Forschungs- und Entwicklungsarbeit kommt es bei AstraZeneca täglich vor, dass jemand einen Experten oder Informationen im Konzern zu einem dezidierten Thema sucht. Wer kennt sich zum Beispiel mit „Arteriosklerose“ gut aus, wer weiß über Wirkstoffe und aktive Moleküle in den Medikamenten Bescheid, welche Dokumente zu Nebenwirkungen und Patenten gibt es?

Meist versuchen es die Firmen zunächst mit sozialen Unternehmensnetzwerken (Enterprise Social Networks). In der unternehmerischen Praxis jedoch schlägt dieser im Grunde logische Lösungsansatz oft fehl. Denn die Pflege der eigenen Kompetenz-Matrix in einem sozialen Netzwerk ist meist zu kompliziert und zeitaufwändig. Anfangs noch korrekte Informationen sind schnell veraltet.

Der Pharmakonzern experimentierte zunächst mit einfachen Suchmaschinen, um Experten anhand der Spuren zu lokalisieren, die sie in Dokumenten hinterlassen. Die eingesetzten Suchlösungen waren jedoch nicht in der Lage, die schiere Vielfalt an Daten aus den verschiedenen Quellen zu verarbeiten; ihre Fähigkeiten zur Content-Analyse waren unterentwickelt oder schlichtweg zu langsam für die vorhandenen Datenmengen.

Inhaltsanalyse mit computer-linguistischen Methoden

Erst die Einführung der Sinequa-Plattform für KI-unterstützte Suche und Analyse half letztlich, aus der großen Vielfalt an Daten die richtigen Informationen herauszufiltern. Die Inhaltsanalyse basiert dabei auf einer patentierten semantischen sowie linguistischen Analyse und ist für beliebige unstrukturierte und strukturierte Daten einsetzbar. So erhält der Anwender auch Fundstellen, in denen der eigentliche Suchbegriff gar nicht vorkommt, wohl aber Synonyme oder inhaltlich ähnliche Begriffe.

In einem initialen Prozess analysierte AstraZeneca mit der Software zunächst rund 200 Millionen interne und externe Dokumente aus Forschung und Entwicklung. Dabei wurden auch fachspezifische Relationen zwischen Begriffen (synonyme und semantisch verwandte Begriffe) ermittelt. Der Index ergab ein Datenreservoir, aus dem relevante Informationen in weniger als zwei Sekunden zusammengestellt werden können. Bei Eingabe eines Begriffes in die Suchmaske stellt das System aus all dem, was zu diesem Thema geschrieben wurde, die besten Experten beziehungsweise Forschungsgruppen zusammen. Der hohe Wettbewerbsdruck in der Pharmabranche zwingt die Hersteller, Innovationen möglichst schnell zur Produktreife zu bringen. Wer hier in kürzester Zeit also interdisziplinäre Expertenteams konstituieren kann, die standortübergreifend an einem gemeinsamen Thema arbeiten, hat dabei definitiv einen Wettbewerbsvorteil.

SAS-Datensätze gehen in die Millionen

Ähnlich nutzt der internationale Pharmakonzern UCB die Sinequa-Plattform. Dieser filtert damit relevante Informationen aus strukturierten und unstrukturierten Daten von jahrelangen klinischen Versuchen. Auf die aus den klinischen Studien entstehenden Big-Data-Inhalte müssen die Forscher bei der Medikamentenentwicklung permanent zugreifen, um relevante Daten für weiterführende statistische Analysen zu finden.

Rund zehn Millionen Files haben sich dabei in den letzten 15 Jahren angesammelt – ein Datenberg von 20 Tera-bytes, der jährlich um derzeit 30 Prozent wächst. Darunter ist mehr als eine Million SAS-Datensätze. Mit wachsender Anzahl an Dateitypen und Inhaltsvolumina wird das Auffinden benötigter Informationen zusehends schwieriger. Die KI-unterstützte Suche hilft UCB, Zeit und Kosten einzusparen, weil Analysten und Programmierer relevante klinische Datensätze schneller finden. <<

Autor
Matthias Hintenaus ist seit 2014 Sales Director DACH des französischen Softwareherstellers Sinequa, einem Spezialisten für KI-basierte Suche und Analyse. Als Experte für Realtime Search & Analytics beschäftigt er sich mit der Erschließung neuer Datenquellen im Kontext von Big-Data-Szenarien.
Kontakt: matthias.hintenaus@sinequa.com

Ausgabe 03 / 2019

Digital Health