Die Google-Suche ist so magisch, dass man manchmal vergisst, wie viel Technik dahinter steckt. Ihre Eingabe führt sofort zu Ergebnissen, egal wie kryptisch Sie beschreiben, wonach Sie suchen!
Komischerweise funktioniert die Suche nach dem letzten Umsatzbericht oder einer bestimmten Rechtsklausel in Ihrer Unternehmensdatenbank nicht auf diese Weise. Der große Unterschied? Die semantische Suche!
In diesem Blogbeitrag werden wir die semantische Suche aus geschäftlicher Sicht erörtern und wie sie für verschiedene Arten von Unternehmen von Nutzen sein kann. Wir beantworten, wann und warum Sie eine semantische Suche benötigen und wie eine semantische Suchmaschine implementiert und genutzt werden kann.
Außerdem finden Sie Beispiele aus verschiedenen Branchen, wie z. B. Rechtswesen, Personalvermittlung, Medien und Medizin & Biowissenschaften, die die semantische Suche zur Unterstützung ihrer Geschäftsprozesse nutzen.
Beginnen wir ganz einfach und definieren wir, was eine Suchmaschine ist. Im Wesentlichen handelt es sich um ein Tool, mit dem Sie Daten schnell und intuitiv mit natürlicher Sprache durchsuchen können. Wahrscheinlich wird hier das Offensichtliche gesagt, aber die bekanntesten Beispiele sind Websites wie Google, Yahoo, Yandex, Baidu, Bing und DuckDuckGo. Suchmaschinen wie diese machen es einfach, die richtige Website und/oder öffentlich zugängliche Informationen im Internet für eine bestimmte Suche zu finden. Wir sind uns alle einig, dass sie ziemlich effizient arbeiten und meist nicht viel Zeit benötigen, um die gesuchten Informationen zu finden.
Viel schwieriger wird es jedoch, wenn es darum geht, Informationen zu finden, die auf Ihrem Computer oder in den Datenbanken Ihres Unternehmens gespeichert sind. Wenn diese über eine klare Ordnerstruktur verfügen, finden Sie die gesuchten Informationen vielleicht schnell. Ist dies nicht der Fall, werden Sie wahrscheinlich auf mühelose Methoden wie die integrierte Suchfunktion Ihres Betriebssystems oder Ihres Cloud-Anbieters zurückgreifen. Bei den meisten dieser Tools müssen Sie ein oder mehrere Wörter eingeben und erhalten dann eine breite Palette von Ergebnissen mit Dokumenten, in denen das betreffende Wort häufig vorkommt. Und seien wir ehrlich: Wie oft kommt es vor, dass Sie eine der ersten hier vorgeschlagenen Dateien benötigen? In der Tat nicht sehr oft. Zum Glück haben wir die Lösung, um Ihre Effizienz zu steigern.
Warum ist es also so viel einfacher, Informationen über Google oder Bing zu finden, als etwas in der Verkaufsmappe Ihres Unternehmens zu suchen? Dafür gibt es eine Reihe von Gründen. In diesem Blogbeitrag wird einer der wichtigsten Gründe näher beleuchtet: die Verwendung der semantischen Suche.
Die semantische Suche fügt sowohl Ihrer Suchanfrage als auch den von Ihnen gescannten Dateien einen Kontext hinzu. Was meinen wir hier mit dem Wort Kontext? Oft ist es entscheidend, die genaue Bedeutung des oder der verwendeten Wörter zu verstehen, da viele Sprachen mit vielen Synonymen, Homonymen und Redewendungen arbeiten. Wenn Sie nach "Python" suchen, meinen Sie dann das Tier, oder meinen Sie die Programmiersprache? Wenn Sie nach einem "Python-Handbuch" suchen, erwarten Sie Ergebnisse, die erklären, wie man in Python programmiert, und nicht etwa einen Leitfaden für den Umgang mit der Schlange. Das können Sie nur wissen, wenn Sie auch den Kontext des Satzes verstehen, in dem Sie diese Wörter verwenden.
Ein anderes Beispiel: Wenn Ihre Suchanfrage "Verkaufsergebnisse des letzten Jahres" lautet, möchten Sie nicht nach Dateien suchen, in denen die Wörter "letztes", "Jahr", "Verkauf" und "Ergebnisse" häufig vorkommen, sondern nach Dateien aus dem letzten Jahr oder nach Dateien, in denen häufig Daten aus dem letzten Jahr aufgeführt sind UND die Text über Verkaufsergebnisse enthalten.
Wie macht die semantische Suche das? Kurz gesagt, sie gibt dem Text numerische Werte(Einbettungen), so dass die Ähnlichkeit oder Unähnlichkeit quantifiziert werden kann und somit festgestellt werden kann, welcher Text eng verwandt ist und welcher nicht.
Die Definition dieser numerischen Werte (Einbettungen) erfolgt zunächst für einzelne Wörter. Ein einfaches Beispiel: Die Wörter "König" und "Königin" sind in gewisser Weise aufgrund des königlichen Aspekts eng miteinander verwandt, haben aber entgegengesetzte Geschlechterwerte. Die Einbettungen für diese Wörter werden diese unterschiedlichen Aspekte numerisch widerspiegeln.
Als nächstes werden die Einbettungen in Sätze und Absätze eingefügt. Um mit dem Beispiel "Umsatz des letzten Jahres" fortzufahren, ist es wichtig zu wissen, ob eine ganze Datei von den Umsatzergebnissen des letzten Jahres handelt oder nur ein kleiner Absatz. Es ist auch wichtig zu wissen, ob die Verkaufsergebnisse des letzten Jahres das Hauptthema des Absatzes sind oder nur erwähnt werden.
Wenn Sie die technische Funktionsweise der semantischen Suche genauer verstehen möchten, verweise ich Sie gerne auf unseren technischen Blogbeitrag über die semantische Suche, den Sie hier finden können.
Warum sollten Sie eine Suchmaschine in Ihrer Organisation einrichten? Der wichtigste Aspekt bleibt der Kontext. Nehmen wir an, Sie suchen in erster Linie nach Dateien oder Dokumenten auf der Grundlage exakter Schlüsselwörter oder danach, wie oft ein bestimmtes Schlüsselwort in einem Dokument vorkommt. In diesem Fall wäre die semantische Suche vielleicht zu viel des Guten, und Sie würden wahrscheinlich bereits mit einer herkömmlichen lexikalischen Suchmaschine hervorragende Ergebnisse erzielen. Sie würden wahrscheinlich einen gewissen Nutzen daraus ziehen, aber nicht genug im Vergleich zu den Kosten.
Wenn Sie jedoch häufig nach Dokumenten suchen, die miteinander in Beziehung stehen, und Suchwerkzeuge wünschen, die viel umfassender arbeiten können, dann könnte eine semantische Suchmaschine viel sinnvoller sein. Die nächste Frage, die Sie sich stellen müssen, ist, mit wie viel Fachjargon Sie zu tun haben. Eine allgemeine semantische Suchmaschine wird bereits einen gewissen Mehrwert bieten, ist aber nicht für den Umgang mit sehr spezifischer Terminologie ausgebildet. Im letzteren Fall würde ich dazu raten, eine individuelle Suchmaschine zu entwickeln, die ganz auf Ihre Bedürfnisse und Ihren Sektor zugeschnitten ist.
Die semantische Suche kann in den meisten Situationen eingesetzt werden, in denen Sie eine große Menge an Textdaten haben, aber lassen Sie uns einige konkrete Beispiele für ihre Verwendung näher betrachten.
Es gibt kaum einen Bereich, in dem mehr Papierkram anfällt als im Rechtswesen. Die schiere Menge an Dokumenten, die bei der Vorbereitung eines Gerichtsverfahrens durchsucht werden müssen, ist für die meisten von uns, die nicht in diesem Bereich tätig sind, unergründlich. Ähnlich verhält es sich, wenn Sie sich auf ein Audit vorbereiten, die notwendigen Dokumente und Verträge aufsetzen, ...
Dies führt zu einem erheblichen Zeitverlust bei der Suche nach den erforderlichen Dokumenten und dazu, dass mehrere Personen dieselbe Arbeit erledigen, weil sie keine ähnlichen Unterlagen finden, die sie als Grundlage für ihre Arbeit verwenden können.
Die Medien können die semantische Suche nutzen, um den Menschen das Leben zu erleichtern, wenn sie in einem digitalen Archiv nach dem richtigen Artikel suchen. Diese semantische Suchmaschine auf einem digitalen Archiv kann zwei Zielgruppen helfen.
Erstens könnte es seinen Abonnenten eine semantische Suchmaschine anbieten, um ihnen die Suche nach den richtigen Artikeln in einem digitalen Archiv zu erleichtern. Darüber hinaus verbessert es das Leben der Journalisten, indem es ihnen das interne Auffinden der richtigen Informationen erleichtert (z.B. unveröffentlichte Arbeiten, alte Notizen von (ehemaligen) Kollegen, ...).
Nebenbei bemerkt: KI kann auch bei der Entwicklung dieser digitalen Archive eine große Hilfe sein, da Standard-OCR-Tools (Optical Character Recognition - Technik zur Erkennung von Text in einem digitalen Bild) besser mit dem vielen Fachjargon zurechtkommen.
Im medizinischen Bereich sind je nach Situation sowohl die semantische Suche als auch herkömmliche Filter sinnvoll. In einer Situation, in der Mediziner nach Dateien suchen, in denen sehr spezifische Namen von Krankheiten, Körperteilen usw. aufgeführt sind, ist die Suche nach einem exakten Schlüsselwort der richtige Weg, da eine semantische Suche ähnliche Ergebnisse liefern wird.
Wenn Sie jedoch versuchen, Informationen aus Notizen von Ärzten und/oder Forschungsunterlagen zu finden oder zu sammeln, ist eine semantische Suche sehr viel sinnvoller. Dies könnte die akademische Forschung, klinische Studien, die Entwicklung von Medikamenten usw. erheblich beschleunigen.
Die Personalbeschaffungsbranche ist dafür bekannt, dass sie sich sehr stark auf Schlüsselwörter konzentriert. Ein Personalverantwortlicher oder Kunde sucht nach einer Reihe von Fähigkeiten oder spezifischem Fachwissen und bittet den Personalvermittler, nach Personen zu suchen, die dieser Anfrage entsprechen. Dies führt dann zu einer Suche in einer riesigen Menge von Lebensläufen, die von überall her kommen (interne Datenbank, Jobbörsen, LinkedIn, ...), wobei der Personalverantwortliche versucht, potenzielle Kandidaten mit bestimmten Schlüsselwörtern in ihrem Lebenslauf zu finden.
Hier könnte eine semantische Suchmaschine einen großen Unterschied machen, da sie auch Bewerber mit relevanteren Erfahrungen in ihrem Lebenslauf anzeigt, ohne dass die erforderlichen Schlüsselwörter aufgeführt sind.
Zunächst müssen Sie herausfinden, ob die semantische Suche für Sie von Nutzen sein wird. Wenn ja, sollten Sie prüfen, welche Art von Daten Sie haben. Ist alles digital, oder müssen Sie auch Papierdokumente mit OCR erfassen? Der nächste Schritt besteht darin, zu prüfen, ob Ihr Datenbestand groß genug ist. Zehntausende sind auf jeden Fall besser als ein paar tausend Dokumente.
Sind Sie neugierig, mehr über die semantische Suche aus technischer Sicht zu erfahren? Lesen Sie den Blogbeitrag unseres NLP-Experten Mathias Leys zu diesem Thema.
Möchten Sie herausfinden, ob ML6 Ihnen helfen kann, durch die Implementierung von Suchmaschinen in Ihrem Unternehmen mehr aus Ihren Daten herauszuholen? Nehmen Sie Kontakt auf!