Cognitive Computing: Search Based Applications unterstützen bei Kognitiver Suche

Produktmeldung: Enterprise Search hielt bislang selten, was ihr Name verspricht: die Einbeziehung aller Daten oder zumindest der wichtigsten Datenquellen eines Unternehmens. Mit dem Modell eines “Rich Index plus AppFactory“ des französischen Cognitive-Computing- Spezialisten Sinequa rückt dieses Ziel nun näher.

„Das Wissen einer Organisation steckt heute in komplexen, hybriden Datenquellen, die in der Cloud ebenso angesiedelt sind wie in Hadoop-Umgebungen oder lokal installierten IT-Anwendungen“, erklärt David Schubmehl, Research Director bei IDC. “Aus diesen separaten Datensilos umfassende Erkenntnisse abzuleiten, ist für Unternehmen inzwischen eine der größten Herausforderungen.“ Und die Bedeutung von Cloud und Hadoop wird in datenintensiven Organisationen noch weiter ansteigen.

Einen Ansatz, wie Unternehmen neue Datenquellen ohne aufwändige Eigenprogrammierung schnell an die Big-Data-Analyse anschließen können, hat der französische Hersteller Sinequa mit seiner Konnektortechnologie entwickelt. Rund 150 so genannte Konnektoren stellt die Analysesoftware bereit, welche sie mit alle gängigen Datenquellen eines Unternehmens verbindet, strukturierten (Tabellen) ebenso wie unstrukturierten (E-Mails, Worddateien…). Die Software analysiert die Quellen dann mittels semantischer Methoden und Natural Language Processing (NLP) und indexiert ihre Inhalte. Der Index ergibt ein Datenreservoir, aus dem sich Nutzer der Analysesoftware innerhalb von Sekundenbruchteilen alle relevanten Informationen zum gesuchten Begriff anzeigen lassen können. Dabei wirft die Software auch solche Ergebnisse aus, die den gesuchten Begriff u.U. gar nicht enthalten – die aber ein semantisch verwandtes Thema darstellen und deshalb interessant sein könnten.

Die Sinequa System-Architektur: Inhalte und Nutzerverhalten werden mittels maschinellen Lernens analysiert und über Apps zur Verfügung gestellt (Bildquelle: Sinequa)

 

Indexmodell schneller als klassische BI & Analytics-Umgebungen

Die Erstellung eines solchen semantischen Rich Search Index kann oft um eine ganze Größenordnung schneller realisiert werden als in klassischen BI & Analytics-Umgebungen. Abfragen auf Basis des Index sind zudem einfacher und flexibler als die Arbeit mit einem Data Warehouse. Nicht nur IT-Experten können damit arbeiten, sondern ungeschulte Endanwender können natürlichsprachliche Fragen stellen, die nicht an eine ihnen unbekannte Datenstruktur gebunden sind.

Auf Basis dieses „Rich Index“ lassen sich ferner so genannte „Search Based Applications” (SBA) einrichten – Anwendungen zur dezidierten Informationsbeschaffung für einzelne Nutzer(gruppen). Der Pharmakonzern AstraZeneca hat seit Einführung der Analyseplattform von Sinequa einen regelrechten „AppStore” für solch individualisierte Informationsbeschaffungen aufgebaut. Mit agilen Entwicklungsmethoden erstellt AstraZeneca im Wochenrhythmus Prototypen für seine Forschungsteams. Entsprechen diese den Vorstellungen der Forscher, wird aus den Prototypen in wenigen weiteren Wochen ein Produkt.

Wenn nicht, werden weitere Prototypen erstellt und so in wenigen Iterationsschritten zusammen mit den Anwendern die für sie beste Lösung entwickelt. Durch die schnelle Prototyp-Entwicklung können Anwender konkret beurteilen, wie sich ihnen die endgültige Anwendung präsentieren wird. Diese Trial-und-Error-Methode auf der einheitlichen Informationsplattform führt wesentlich schneller zum Ziel als das alte „Wasserfall-Modell“ der Software-Entwicklung, insbesondere wenn dabei die Komplexität der diversen Datenquellen noch bewältigt werden muss.
Ein halbes Jahr nach der Initialisierung ihres Such- und Analyseprojektes in der F&E-Abteilung hat AstraZeneca bereits zahlreiche Search Based Applications entwickelt:

  • Die App ”R&D Pulse” umfasst rund 110 Millionen Dokumente aus externen Datenquellen wie Publikationen, Inhalten branchenspezifischer Informationsquellen wie Embase, Medline, Scopus, klinischen Testberichten usw. sowie internen Datenquellen wie Sharepoint, Documentum u.a. R&D Pulse liefert neueste wissenschaftliche Informationen über das Fachgebiet eines Anwenders mit automatischen Benachrichtigungen („Alerts“).
  • Über ”R&D Experts” lassen sich Experten-Netzwerke zu einem dezidierten Thema zusammenstellen. Dies fördert die Zusammenarbeit und vermeidet redundante Projekte.
  • ”R&D Department” liefert Informationen über Teams in anderen Abteilungen.
  • Mit “R&D KOL” findet man Key Opinion Leaders (KOL) innerhalb und außerhalb des Konzerns und sieht, wie diese miteinander vernetzt sind.  
  • ”R&D Chemsearch”: Chemische Molekülstrukturen sind der Startpunkt für das Finden von Informationen über ein Molekül und ähnliche Verbindungen in internen und externen Dokumenten
  • ”R&D Intelligence” identifiziert neue Methoden zur Zielidentifikation und Neupositionierung von Medikamenten.
  • ”R&D Journal” für das Erstellen interner Zeitschriften zu wissenschaftlichen Themen und Teilen der Ergebnisse.  
  •  

Die Benutzeroberfläche der Cognitive Search Software von Sinequa.

 

Durch die Agilität, die eine solche SBA-Plattform bietet, wird die IT-Abteilung zum Geschäftspartner ihrer internen “Kunden” im Unternehmen. Statt die Rolle desjenigen weiterzuleben, der die Anforderungen der Nutzer wohl nie innerhalb der gewünschten Zeit erfüllen kann, avanciert sie zum Co-Innovator und trägt damit sichtbar zum Erfolg des Unternehmens bei. Dem Image von Enterprise Search wird so zu neuer Strahlkraft verholfen.

Autor: Frank Zscheile

(jm)

0
RSS Feed

Hat Ihnen der Artikel gefallen?
Abonnieren Sie doch unseren Newsletter und verpassen Sie keinen Artikel mehr.

Mit einem * gekennzeichnete Felder sind Pflichtfelder!

Neuen Kommentar schreiben

Entdecken Sie die Printmagazine des WIN-Verlags