Werbung

Fraunhofer und IBM präsentieren intelligente Suchtechnologie Smart Semantics

Share on facebook
Share on twitter
Share on linkedin
Share on xing
Share on whatsapp
Share on email
Share on print

Fraunhofer und IBM präsentieren intelligente Suchtechnologie Smart Semantics

Share on facebook
Share on twitter
Share on linkedin
Share on xing
Share on whatsapp
Share on email
Share on print

Das Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS stellt seine intelligente Suchtechnologie „Smart Semantics“ vor. Sie basiert auf UIMA, der von IBM initiierten und entwickelten Architektur zur Analyse unstrukturierter Daten. In Kürze werden modellbasierte Komponenten für die maschinelle Klassifizierung von Dokumenten sowie für die automatische Schlagwortgenerierung und Namenserkennung zur Verfügung stehen . Durch die Verknüpfung der Smart Semantics mit dem UIMA-Framework wollen das Fraunhofer IAIS und IBM die hocheffizienten Suchtechnologien auch kleinen und mittelständischen Unternehmen zugänglich machen. Das Fraunhofer IAIS erforscht und entwickelt innovative Systeme, um Daten zu analysieren und Informationen zu erschließ;en. Als jüngstes Ergebnis dieser Arbeit bringt das Fraunhofer IAIS jetzt Smart Semantics auf den Markt. Dabei handelt es sich um intelligente Softwarekomponenten, die die Bedeutung aus unstrukturierten Daten wie z.B. Webseiten oder Dokumenten durch modellbasierte Inhaltsanalysen erkennen. Im Gegensatz zu stichwort- oder regelbasierten Verfahren, wie sie die bekannten Suchmaschinen im Internet nutzen, verwenden Smart Semantics lernende und mustererkennende Verfahren. Sie ersparen dem Nutzer somit aufwändiges Filtern seiner Suchergebnisse.

Smart Semantics sind vefügbar für UIMA. Das Fraunhofer IAIS entschied sich für die von IBM initierte Architektur aufgrund der Offenheit, der Integrationsfreundlichkeit, der kostengünstigen Testmöglichkeiten und der Zuverlässigkeit des Frameworks. Auß;erdem will das Institut die groß;e Verbreitung von UIMA im Unternehmensumfeld nutzen, um seine Bausteine zur intelligenten Informationserschließ;ung auch kleinen und mittelständischen Unternehmen verfügbar zu machen, die bisher die hohen Investitionskosten für semantische Technologien scheuten.

KMU profitieren von Smart Semantics

„Gerade kleine und mittelständische Unternehmen konnten in der Vergangenheit aus Zeit- und Kostengründen nicht oder nur unzureichend Informationen aus unstrukturierten Daten berücksichtigen“, so Andreas Schäfer, Business Development Manager am Fraunhofer-Institut für intelligente Analyse und Informationssysteme IAIS. „Mit Smart Semantics für UIMA wollen wir diese Herausforderung mit einem starken Technologie-Partner wie IBM angehen. Für Unternehmen ergeben sich dadurch nicht nur attraktive Möglichkeiten für ein besseres Informationsmanagement – wir arbeiten bereits heute mit Firmen zusammen, die mit Hilfe dieses Angebots neue Dienste und Geschäftsmodelle entwickeln.“

„Die Menge an unstrukturierten Informationen schwillt immer weiter an, mit herkömmlichen Suchmethoden wird es für Unternehmen in naher Zukunft unmöglich sein, aus dieser Kakophonie des Wissens, die für sie geschäftsentscheidenden Inhalte herauszufiltern“, so Thomas Hampp-Bahnmüller, Senior Software Engineer, IBM Deutschland Research & Development. „Die Lösung hierzu liefern intelligente neue Suchtechniken wie diejenigen des Fraunhofer IAIS. Dass unsere Architektur dazu beiträgt, dass clevere Lösungen wie die Smart Semantics Verbreitung finden, ist eine groß;artige Bestätigung unserer Strategie, UIMA als offene Plattform der Community zur freien Verfügung zu stellen.“

Offene Architektur mit Hebelwirkung

Die Smart Semantic Komponenten können als Plug-Ins auf UIMA basierenden Technologien wie der IBM Suchlösung IBM Omnifind eingebunden werden. UIMA steht für „Unstructured Information Management Architecture“ und bezeichnet ein maß;geblich im deutschen IBM Forschungs- und Entwicklungszentrum Böblingen entwickeltes Framework. UIMA ist ein offener OASIS Standard und zudem als Open Source Implementierung auf Apache verfügbar. Damit können beispielsweise Anwendungen zur Verarbeitung unstrukturierter Informationen erstellt werden, insbesondere natürlicher Sprache (Natural Language Processing, NLP).

Effizientere Suchtechnologien

Verfügbar sind bereits drei Smart Semantic Komponenten: „Site-Classifier“, „Named-Entity-Recognizer“ sowie der „Keyword-Extractor“. Der Site-Classifier erlaubt die maschinelle Klassifikation ganzer Dokumente wie z.B. Webseiten. Nach einer Trainingsphase sind auf diese Weise z.B. Projekt-, Mitarbeiter- oder Produktseiten automatisch als solche erkennbar und für die effizientere Suche nutzbar (z.B. „Zeige alle Seiten, die den Begriff X enthalten und als Produktseite klassifiziert wurden“). Gegenüber konventionellen Verfahren haben lernende Verfahren den Vorteil, dass auch unbekannte Dokumente mit alternativen Begrifflichkeiten aufgrund ihrer Ähnlichkeit zu einem gelernten Modell klassifizierbar sind. Da auf diese Weise die Pflege von Stichwort-Listen oder Heuristiken zur statischen Klassifikation entfällt, sparen Unternehmen umfangreichen Wartungsaufwand.

Der Named-Entity-Recognizer identifiziert benannte Entitäten wie Personen, Organisationen, Orte und ermöglicht dadurch die Filterung von Dokumenten nach bestimmten Entitäten (z.B. „Zeige alle Seiten, die X und zusätzlich Personennamen enthalten“). Im Gegensatz zu herkömmlichen Verfahren erkennt die Smart Semantic-Komponente Bedeutungsunterschiede gleichlautender Begriffe, wie etwa die den Unterschied zwischen „Vogel“ als Tier und „Vogel“ als Personenname, in dem der inhaltliche Kontext des Begriffs berücksichtigt wird.

Der Keyword-Extractor ist eine Komponente, die statistisch signifikante Wörter aus Dokumenten extrahiert und diese z.B. für Tagclouds, für Wortvorschläge bei Suchanfragen oder als Zusatzinformationen in der Suchergebnisdarstellung bereitstellt.

Unternehmen können die Smart Semantics ab Herbst 2009 über IBM erwerben, weitere Komponenten sind bereits in Planung.

Share on facebook
Facebook
Share on twitter
Twitter
Share on linkedin
LinkedIn
Share on xing
XING
Share on whatsapp
WhatsApp
Share on email
E-Mail
Share on print
Drucken

Ihre Meinung zum Artikel

Abonnieren
Benachrichtige mich bei
guest
0 Comments
Inline Feedbacks
View all comments

Andere Leser haben sich auch für die folgenden Artikel interessiert

Werbung

Redaktionsbrief

Tragen Sie sich zu unserem Redaktionsbrief ein, um auf dem Laufenden zu bleiben.

Werbung
Werbung

Aktuelle Ausgabe

Topthema: Auf dem daten Friedhof

Dark Data: Wirtschaftliche Chancen mit Cloud, KI und BI nutzen.

Mehr erfahren

Wir wollen immer besser werden!

Deshalb fragen wir SIE, was Sie wollen!

Nehmen Sie an unserer Umfrage teil, und helfen Sie uns noch besser zu werden!

zur Umfrage

Tragen Sie sich jetzt kostenlos und unverbindlich ein, um keinen Artikel mehr zu verpassen!

    * Jederzeit kündbar

    Entdecken Sie weitere Magazine

    Schön, dass Sie sich auch für weitere Fachmagazine unseres Verlages interessieren.

    Unsere Fachtitel beleuchten viele Aspekte der Digitalen Transformation entlang der Wertschöpfungskette und sprechen damit unterschiedliche Leserzielgruppen an.