22. Juni 2026Von Matthias Dietrich

Semantic Search und Agentic Search im B2B: Wann Vektor-Embeddings, wann LLM-Agenten?

Semantic Search ist im eCommerce kein Forschungsthema mehr. Vektor-Embeddings hängen produktiv in Algolia NeuralSearch, Constructor, Coveo und Bloomreach Discovery; native Pipelines lassen sich auf Snowflake mit Cortex bauen. Parallel hat sich mit "Agentic Search" eine neue Stufe etabliert — der LLM-Agent als Berater, der mehrere Quellen abfragt, Rückfragen stellt und in Mehr-Schritt-Dialogen führt. Im B2B-Kontext heißt das nicht: alles muss KI werden. Es heißt: Sie haben jetzt drei Reifegrade — Keyword plus Synonyme, Semantic mit Embeddings, Agentic mit LLM — und müssen entscheiden, welcher zu welchem Such-Anlass passt. Dieser Beitrag schließt unsere Serie zur B2B-Suche mit der Frage, die in Architektur-Workshops am häufigsten kommt: Was bringt KI in der Suche wirklich — und was kostet sie?

Semantic Search: Wann Embeddings messbar besser sind

Vektor-Embeddings verwandeln Suchbegriffe und Produkte in mathematische Vektoren, deren Nähe semantische Ähnlichkeit abbildet. Eine Suche nach "rutschfeste Schutzhandschuhe für Ölumgebung" findet damit auch Produkte, die im Titel "Nitril-Handschuhe, Grip-Beschichtung, Oil-Grip" heißen — ohne dass jemand die Synonyme manuell pflegt.

In B2C-Studien finden sich für Semantic Search regelmäßig Konversions-Effekte im zweistelligen Prozentbereich. Solche Zahlen lassen sich nicht ungeprüft auf B2B übertragen — die Suche-Anlässe sind anders, das Sortiment kleiner, das Klickverhalten ein anderes. Wo Embeddings im B2B aber messbar tragen, sind drei Konstellationen: lange Natural-Language-Anfragen wie "Schmiermittel für Hochtemperatur-Lager bis 250 Grad", Anfragen mit beschreibendem Vokabular statt SKU, und Sortimente mit ausgeprägter Synonym-Vielfalt aus DIN/ISO-Bezeichnungen, Markennamen und Branchenjargon.

Wo Embeddings nicht tragen, ist genauso klar: bei reiner SKU- und Bestellnummern-Suche. Pure dense Vector-Suche degradiert auf exakten Produkt-IDs, SKUs, Maßbezeichnungen — also genau dem Verhalten, das den größeren Teil der B2B-Suche ausmacht. Die produktive Konsequenz ist Hybrid Search: Keyword (BM25) und Vector laufen parallel, die Treffermengen werden fusioniert und gemeinsam geranked. Algolia NeuralSearch macht das in einer API; Elastic, OpenSearch und die nativen Cortex-Search-Services in Snowflake auch. Wer in einem B2B-Setup über Semantic nachdenkt, denkt in der Praxis über Hybrid Search nach.

Agentic Search: Der Agent als Berater, nicht als Trefferliste

Agentic Search ist nicht die nächste Version von Semantic. Sie ist ein anderes Interaktionsmodell. Ein klassisches Suchsystem antwortet auf eine Anfrage mit einer Trefferliste. Ein agentischer Suchassistent bricht eine Anfrage in mehrere Teilaufgaben, ruft Tools auf — Produktkatalog, Verfügbarkeit, Konfigurator, ERP — und führt einen Dialog, bis die Anfrage entschieden ist. Amazon hat dieses Muster mit Rufus seit Februar 2024 im B2C produktiv.

Im B2B verschiebt das die Suche in Richtung Konfigurator-Logik. Eine Anfrage wie "Wir bauen eine Förderanlage für Schüttgut bis 80 Tonnen pro Stunde, Außenbereich, FDA-konform — welche Lager passen?" bekommt von einem klassischen Index keine sinnvolle Trefferliste. Ein Agent, der die Anwendungsparameter klärt, dann den Katalog filtert, Datenblätter prüft, Cross-Sell-Komponenten ergänzt und am Ende drei Kandidaten mit Begründung präsentiert, ist näher an dem, was Einkäufer aus dem persönlichen Verkauf kennen. Genau hier liegt das Cross-Sell-Potenzial: nicht im "Andere kauften auch", sondern in der kontextgetriebenen Kombination — passende Schmierstoffe zur Lager-Empfehlung, passende Befestigungselemente zur Konstruktion.

Die Architektur dahinter ist nicht trivial. Ein produktiver Agent braucht Tool-Use (API-Calls zu Katalog, Pricing, Bestand), Multi-Turn-State (das System merkt sich, was bereits geklärt wurde), und eine Abbruch-Logik, wenn der Agent in eine Halluzinations-Zone läuft. Im B2B kommt eine Anforderung dazu, die der B2C-Discovery-Kontext nicht hat: Der Agent darf eine empfohlene Komponente nicht erfinden. Sie muss im Sortiment sein, der Kunde muss sie bestellen dürfen, der Preis muss der Vertragspreis sein.

Tech-Stack: Native Plattform-Features oder eigene Pipeline?

Für die Umsetzung von Semantic und Agentic im B2B gibt es zwei realistische Pfade — selten ein Entweder-Oder, oft eine bewusste Aufteilung.

Pfad A: Native Such-Plattform. Algolia NeuralSearch liefert Hybrid Search aus einer API; Constructor und Coveo bringen ähnliche Capabilities mit. Vorteil: Time-to-Market in Wochen statt Monaten, Latenz unter 50 ms, kein eigener Embedding-Service, kein eigener Vector-Store. Grenze: Die Embedding-Modelle sind herstellereigen, Re-Ranking-Logik teilweise Blackbox, Anpassung an branchenspezifisches Vokabular läuft über Tuning, nicht über Modell-Wechsel. Für klassische eCommerce-Suche im B2B ist das in den allermeisten Fällen der pragmatische Weg.

Pfad B: Eigene Embedding-Pipeline auf Snowflake/Cortex. Wer ohnehin auf Snowflake aufsitzt — und das ist bei foobar-Kunden zunehmend der Fall — kann Embeddings nativ über Cortex erzeugen (EMBED_TEXT_768, EMBED_TEXT_1024) und mit Cortex Search als managed Vector-Service betreiben. Das eröffnet Use Cases jenseits der Storefront: semantische Suche über Datenblätter, Service-Manuals, Vertragsdokumente, interne Wissensdatenbanken. Wirtschaftlich relevant: Cortex Search rechnet Embedding-Indexing pro Token ab, das Hosting des Indexes pro GB-Monat — also auch ohne Abfragen. Das ist ein Modell, das man in der Kalkulation ehrlich abbilden muss.

Für Agentic Search liegt der Schwerpunkt heute klar auf dem zweiten Pfad: LLM-Agent (z. B. über OpenAI, Anthropic oder Snowflake Cortex AI SQL) plus Tool-Calls in die Commerce-Plattform. Wir vertiefen die Daten- und KI-Pipeline dazu in unserer parallelen Serie zu Snowflake — siehe den Beitrag Snowflake meets KI und LLMs. Weiterführend zu Agent-Mustern im Commerce: foobar.agency/agentic-commerce.

Ehrliche Grenzen: Halluzination, Compliance, Erklärbarkeit

Die drei Grenzen, die in B2B-Implementierungen am häufigsten unterschätzt werden, kommen nicht aus der Technik, sondern aus dem Einkaufs-Kontext.

Halluzination. Ein LLM-Agent, der einer Einkäuferin ein Produkt empfiehlt, das es im Sortiment nicht gibt, produziert keinen "kreativen Vorschlag" — er produziert eine Reklamation und im schlimmsten Fall eine Compliance-Verletzung. Agentische Suche im B2B braucht harte Tool-Constraints: Der Agent darf ausschließlich aus dem freigegebenen Sortiment empfehlen, jede Empfehlung muss gegen einen autoritativen Katalog validiert sein, der Preis kommt aus der Pricing-Engine, nicht aus dem Modell.

Compliance. Im Industrie-B2B sind Sortimente regulatorisch geprägt — REACH, RoHS, Exportkontrolle, branchenspezifische Normen. Ein Agent, der einem Kunden in Land X einen Artikel empfiehlt, der dort nicht versendet werden darf, ist nicht "fast richtig". Compliance-Filter müssen vor der LLM-Antwort greifen, nicht danach.

Erklärbarkeit. Einkäufer wollen wissen, warum ein bestimmtes Produkt empfohlen wird — gegenüber dem Vorgesetzten, dem Auditor, der QM-Abteilung. "Das Modell hat es ausgegeben" trägt nicht. Ein produktiver B2B-Agent muss Quellen, Datenblatt-Referenzen und die genutzten Filter ausweisen können. Wo das nicht möglich ist, bleibt die klassische Trefferliste mit Facetten der saubere Ansatz.

Vier Entscheidungsfragen vor dem KI-Such-Pilot

Bevor ein Pilot startet, sollten diese vier Fragen beantwortet sein. Sie entscheiden, ob ein KI-Such-Projekt eine Investition oder ein Showcase wird.

#	Frage	Was die Antwort entscheidet
1	Welche Suchanfragen treffen heute schlecht — SKU oder Natural-Language?	SKU-Schwäche löst man mit Indexing-Logik, nicht mit Embeddings. Natural-Language-Schwäche ist der Embedding-Case.
2	Gibt es einen klaren Use Case für Multi-Turn-Dialog (Konfigurator, technische Beratung)?	Ohne Multi-Turn-Use-Case ist Agentic Search Overengineering. Hybrid Search reicht.
3	Sind Sortiment, Preis und Compliance pro Kunde sauber gemodelt?	Ohne diese Basis halluziniert jeder Agent — und produziert Reklamationen statt Aufträgen.
4	Wer trägt die laufenden Kosten — Hosting des Indexes, Token-Verbrauch, Modell-Updates?	Embedding-Indexing und LLM-Calls sind verbrauchsbasiert. Die TCO-Linie muss vor dem Pilot stehen.

Embeddings sind kein Allheilmittel. Wir sehen in B2B-Projekten regelmäßig, dass eine ehrliche Hybrid-Search auf Algolia oder Elastic die Suche schon um Stufen besser macht — und für Agentic-Use-Cases legen wir den LLM-Layer dann gezielt nur dort drüber, wo der Multi-Turn-Dialog wirklich Geld verdient. Die Modell-Logik bringt nichts, wenn das Sortiment und die Vertragsdaten dahinter nicht sauber sind.
Dominik ThalmeierTeam Lead Data Science, foobar Agency

Häufig gestellte Fragen

: Bei wenigen tausend SKUs und überschaubarer Synonym-Komplexität bringt ein gut gepflegter Keyword-Index mit Synonym-Listen oft 80 Prozent des Effekts — bei einem Bruchteil der laufenden Kosten. Semantic lohnt sich, sobald lange Natural-Language-Anfragen, viel Branchenjargon oder mehrsprachige technische Begriffe in den Logs auftauchen.
: Der pragmatische Weg ist ein vorgeschalteter Query-Understanding-Layer: Der LLM klassifiziert die Anfrage, schreibt sie um (z. B. extrahiert Filter-Parameter aus Natural Language) und reicht sie an die bestehende Such-API weiter. So bleiben Index, Ranking und Berechtigungslogik unangetastet — der LLM-Layer ist ein Übersetzer, kein Ersatz.
: Bei nativen Plattformen wie Algolia ist es Teil der NeuralSearch-Lizenz. Bei eigenen Pipelines auf Snowflake fallen zwei Kostenblöcke an: Embedding-Erzeugung pro Token (laut Snowflake-Dokumentation im Bereich von 0,03 bis 0,07 Credits pro Million Token, abhängig vom Modell) und Index-Hosting pro GB-Monat — letzteres auch ohne aktive Abfragen. Genaue Zahlen kommen nur aus der Pilot-Kalkulation mit echtem Sortiment.

KI-Such-Pilot oder Hybrid-Search-Audit

In einem zweistündigen Architektur-Workshop klären wir mit Ihnen, ob Ihre B2B-Suche durch Hybrid Search, Embeddings oder einen agentischen Layer wirklich besser wird — auf Basis Ihrer Such-Logs, Ihres Sortiments und Ihres Tech-Stacks. Keine Folien, sondern Architektur-Entscheidungen mit Aufwand und Kostenbild.

Workshop anfragen

Matthias Dietrich

CEO

Matthias Dietrich ist Gründer und Geschäftsführer der foobar Agency und begleitet seit über 20 Jahren Commerce-Projekte für Retailer und Hersteller im DACH-Raum – ausgezeichnet mit dem 1. Platz beim E-Commerce Germany Award 2024. Als ehemaliger Entwickler denkt er Plattformstrategie immer von der Architektur her: verankert in Geschäftsprozessen, offen für Daten und KI. Sein aktueller Fokus: warum KI die Schere zwischen digitalen Vorreitern und dem Rest massiv beschleunigt – und was das konkret für B2B-Hersteller und Retailer bedeutet.

Alle Beiträge von Matthias Dietrich

Kontakt aufnehmen

Wir freuen uns auf Ihre Anfrage.

Bitte akzeptieren Sie Marketing-Cookies, um das Kontaktformular zu laden.

Matthias Dietrich

CEO

+49 89 244 174 840 matthias.dietrich@foobar.agency