RFM und CLV: Wer Ihre wertvollsten Kunden sind — und welche Sie gerade verlieren

Die meisten eCommerce-Organisationen wissen ziemlich genau, wer im letzten Quartal viel gekauft hat. Sie wissen seltener, wer im nächsten Quartal viel kaufen wird — und noch seltener, welche Stammkunden gerade leise verschwinden. Genau diese Lücke füllt eine Customer Lifetime Value Prediction: Sie verwandelt Bestelldaten in eine belastbare Erwartung, wie viel Umsatz ein einzelner Kunde in den kommenden zwölf oder vierundzwanzig Monaten beitragen wird. In der Praxis sehen wir bei foobar Agency, dass dieser Schritt selten an der Methode scheitert — sondern daran, dass RFM-Auswertungen und CLV-Berechnungen nebeneinander leben, statt aufeinander aufzubauen. Dieser Beitrag zeigt, wie die Brücke von RFM zu probabilistischer CLV aussieht, was BG/NBD und Gamma-Gamma im Tagesgeschäft leisten — und welche Geschäftsentscheidungen sich damit anders treffen lassen.

Wir bauen damit auf dem ersten Beitrag dieser Reihe auf, in dem es um die Snowflake-Foundation als gemeinsames Datenfundament ging — und ordnen den Use Case in den Maturity-Pfad ein, den wir bei Retail- und B2C-Kunden in DACH wiederkehrend sehen.

RFM: Drei Zahlen, die mehr sagen als ein Dashboard

RFM steht für Recency, Frequency und Monetary — drei Kennzahlen pro Kunde, abgeleitet aus der Bestellhistorie: Wann hat dieser Kunde zuletzt gekauft? Wie oft hat er in einem Zeitfenster gekauft? Welchen Wert haben seine Bestellungen im Durchschnitt? In der klassischen Variante wird jede der drei Dimensionen in fünf Quintile geteilt, und jeder Kunde erhält ein dreistelliges Profil — von 1-1-1 (lange nicht da, selten gekauft, kleine Beträge) bis 5-5-5 (zuletzt aktiv, häufig gekauft, hochwertig).

Was nüchtern klingt, ist in der Praxis oft der erste Punkt, an dem Marketing-Verantwortliche zum ersten Mal sehen, wer ihre wertvollsten Kunden tatsächlich sind. Die typischen Aha-Effekte: Top-Frequenz-Kunden sind nicht automatisch Top-Monetary-Kunden. Reaktivierungs-Kandidaten lassen sich präzise eingrenzen — nicht "alle Kunden, die in 90 Tagen nicht gekauft haben", sondern "Kunden mit historisch hoher Frequenz, deren Recency-Score jetzt ins zweite Quintil rutscht". Und Marketing-Spending, das vorher gleichmäßig über die Datenbank verteilt war, bekommt eine erste Hierarchie.

RFM hat zwei Grenzen, die man kennen muss. Erstens beschreibt es Vergangenheit, nicht Zukunft — ein 5-5-5-Kunde von heute kann morgen ein Wechsler sein, ohne dass es im Score sichtbar wird. Zweitens behandelt es alle Kunden mit demselben Recency-Score gleich, obwohl ein Kunde mit 180 Tagen Recency und einer historischen Bestellfrequenz von einem Monat ein anderer Fall ist als ein Kunde mit 180 Tagen Recency und einer Frequenz von sechs Monaten. Genau hier setzen probabilistische Modelle an.

Probabilistische CLV: Was BG/NBD und Gamma-Gamma wirklich tun

Probabilistische CLV-Modelle behandeln jeden Kunden als individuelle Wahrscheinlichkeits-Verteilung — nicht als Punkt in einem Quintil-Raster. Das Standard-Setup im non-contractual eCommerce, also überall dort, wo Kunden ohne Abo oder Vertragsbindung kaufen, besteht aus zwei Modellen, die aufeinander aufbauen: BG/NBD für die Frage "wie oft kauft dieser Kunde wieder?" und Gamma-Gamma für die Frage "wie viel gibt er pro Bestellung aus?".

BG/NBD — Beta-Geometric / Negative Binomial Distribution — wurde 2005 von Fader, Hardie und Lee als pragmatische Weiterentwicklung des älteren Pareto/NBD-Modells (Schmittlein/Morrison/Colombo, 1987) eingeführt. Beide Modelle beantworten dieselben Fragen, BG/NBD ist nur deutlich einfacher zu schätzen und numerisch stabiler. Der Kern in zwei Sätzen: Die Kauffrequenz eines aktiven Kunden folgt einem Poisson-Prozess mit individueller Rate; die Wahrscheinlichkeit, dass ein Kunde nach einer Bestellung "inaktiv wird" (in der Sprache des Modells: drop out), folgt einer Beta-Verteilung. Beobachtet werden nur die Bestellungen — das Modell errechnet daraus die Wahrscheinlichkeit, dass ein Kunde überhaupt noch aktiv ist, und die erwartete Zahl seiner Bestellungen in einem zukünftigen Zeitfenster.

Gamma-Gamma modelliert den durchschnittlichen Bestellwert. Die Annahme ist, dass der erwartete Bestellwert eines Kunden um einen individuellen Mittelwert streut und dass diese Mittelwerte über die Kundenbasis gammaverteilt sind. Wichtig: Gamma-Gamma setzt formal voraus, dass Frequenz und Bestellwert unkorreliert sind — eine Annahme, die in der Praxis vor dem Modelltraining geprüft wird, weil sie nicht in jedem Sortiment hält.

Das Produkt aus erwarteter zukünftiger Bestellzahl (aus BG/NBD) und erwartetem Bestellwert (aus Gamma-Gamma) ergibt die individuelle CLV-Prognose über einen festgelegten Zeithorizont. Die Standard-Implementierung in Python ist die Bibliothek `lifetimes` von Cam Davidson-Pilon — sie macht aus einer transaktionalen Bestelltabelle innerhalb weniger Schritte einen kundenindividuellen CLV-Wert.

Was im Tagesgeschäft zählt: Die Ausgabe pro Kunde ist nicht ein Punktwert, sondern ein Wert mit Aussagekraft über Unsicherheit. Marketing-Verantwortliche, die das verinnerlichen, fangen an, anders zu fragen — nicht "wie hoch ist die CLV?", sondern "wie sicher sind wir, dass dieser Kunde noch aktiv ist?".

Praxisfall: Ein DACH-Multi-Channel-Händler auf Snowflake

Bei einem DACH-Multi-Channel-Händler aus dem Retail-Umfeld haben wir genau diese Brücke gebaut: RFM-Auswertung und probabilistische CLV in einem Datenmodell auf Snowflake, transformiert über dbt, mit klaren Schnittstellen ins Marketing- und Service-Tooling.

Verankert. Den Ausgangspunkt bildete eine konkrete Geschäftsfrage des Marketing-Bereichs: Welcher Anteil des kommenden Akquisebudgets ist Akquise wert, und welcher Anteil müsste eigentlich in Retention fließen? Diese Frage lässt sich ohne CLV nicht beantworten — und die bestehenden RFM-Reports gaben sie nur in ihrer Vergangenheits-Perspektive her. Das Projekt setzte deshalb nicht beim Modell an, sondern bei den Geschäftsentscheidungen, die das Modell anschließend stützen sollte: Spending-Allokation zwischen Akquise und Retention, CRM-Trigger für Reaktivierung, Priorisierung von Service-Cases nach Kundenwert.

Vernetzt. Die Datenbasis lag in Snowflake — Bestelldaten aus dem Commerce-System, Retouren, Kundenattribute aus dem CRM. Über dbt wurde ein Layer von RFM-Modellen aufgebaut: pro Kunde Recency, Frequency und Monetary, plus die Quintil-Scores, plus eine stabile Segment-Zuordnung. Auf demselben Layer setzt die probabilistische CLV-Berechnung auf: Trainings- und Holdout-Zeitfenster werden in dbt definiert, das eigentliche Modelltraining läuft in einer Python-Umgebung gegen Snowflake (Cam Davidson-Pilons `lifetimes`-Bibliothek), und die Vorhersagen — erwartete Käufe in den nächsten zwölf Monaten, erwarteter Bestellwert, daraus abgeleiteter CLV — fließen als neue Spalten zurück in das dbt-Modell. Deterministische Berechnungen (RFM-Quintile, historische Werte) und probabilistische Predictions (BG/NBD, Gamma-Gamma) liegen damit in derselben Datentabelle, nebeneinander, mit denselben Schlüsseln — und werden im Service- und Marketing-Tooling über dieselbe Customer-ID konsumiert.

Vorausgedacht. Die Architektur ist bewusst so geschnitten, dass sich weitere Predictions ergänzen lassen, ohne dass neue Datenpipelines entstehen — Next-Best-Action, Churn-Klassifikation, kategorie-spezifische CLV-Sichten. Snowflake ist dabei nicht die "Daten-Insel für Predictions", sondern dasselbe Datenfundament, von dem aus auch Reporting und operative Steuerung leben. Marketing-Automation, Service-Tooling und CRM-Kampagnen bekommen die Scores über regelmäßige Reverse-ETL-Strecken oder direkt über Live-APIs — je nach Anwendungsfall.

Der Nutzen ist messbar dort, wo vorher mit Bauchgefühl gearbeitet wurde: Reaktivierungs-Kampagnen werden auf Kunden mit hoher prognostizierter Restwertigkeit gerichtet — nicht auf "alle inaktiven Kunden". Service-Mitarbeitende sehen bei einer Eskalation den Kundenwert und entscheiden anders. Und Akquisebudgets bekommen eine Soll-Wertigkeit: Wir wissen, was ein Neukunde im Durchschnitt wert ist — und können sagen, ob ein neuer Kanal überhaupt ökonomisch tragen kann.

Vom Score in den Stack: Was Marketing und Service damit anfangen

Eine CLV-Prediction, die nur im Data-Warehouse liegt, ist kein Use Case — sie ist eine Tabelle. Der Wert entsteht erst, wenn die Werte in den Systemen ankommen, in denen Entscheidungen fallen.

Spending-Allokation. Mit kundenindividueller CLV lässt sich der Erwartungswert eines Neukunden errechnen — segmentiert nach Akquisekanal, Kampagne oder Sortimentskategorie. Wenn der durchschnittliche CLV eines Neukunden aus Kanal A bei einem bestimmten Wert liegt und der CAC dort darüber liegt, ist das nicht eine Bauchentscheidung, sondern eine Zahl. Dasselbe gilt für Retention: Was darf eine Reaktivierungs-Kampagne pro reaktiviertem Kunden kosten? Antwort wieder: die erwartete CLV der reaktivierten Kohorte, gewichtet mit Reaktivierungs-Wahrscheinlichkeit.

CRM-Triggering. BG/NBD liefert pro Kunde eine Wahrscheinlichkeit, noch aktiv zu sein. Sobald diese Wahrscheinlichkeit unter eine Schwelle fällt — und gleichzeitig die prognostizierte Restwertigkeit hoch ist — entsteht ein präzises Reaktivierungs-Signal. Statt eines breiten "90 Tage keine Bestellung"-Triggers bekommt das CRM einen wertgewichteten Frühwarn-Trigger.

Service-Priorisierung. In Service-Eskalationen ist Kundenwert eine relevante Größe — kontroverser, aber relevant. Wenn ein Service-Team weiß, dass ein eingehender Fall einen hochwertigen Bestandskunden mit niedrig werdender Aktiv-Wahrscheinlichkeit betrifft, wird er anders behandelt als ein Erst-Käufer mit kleinem Warenkorb. Das ist kein Auto-Pilot — das ist eine Information, die Service-Verantwortliche bei Bedarf nutzen.

Personalisierte Kommunikation. Frequenz und erwarteter Bestellwert sind starke Inputs für Mailing-Frequenz, Empfehlungs-Logik und Sortimentskuration. Ein Kunde mit hoher prognostizierter Frequenz braucht keine wöchentlichen Newsletter-Pushes — er kauft ohnehin. Ein Kunde mit hoher CLV und niedriger Frequenz reagiert oft auf gezielte Anlässe (Sortimentsstart, Limited Edition), nicht auf Mengen-Kommunikation.

CLV im Vergleich: heuristisch, RFM-basiert, probabilistisch

Wenn Sie einen schnellen Vergleich brauchen, wo Sie heute stehen und wohin der nächste Schritt führen kann — diese drei Reifegrade sind die Stationen, die wir in Projekten regelmäßig sehen.

Reifegrad

Methode

Aufwand

Aussagekraft

Anwendungsfall

Heuristisch

Durchschnittlicher Bestellwert × Bestellfrequenz × Marge × angenommene Laufzeit

Tage

Vergangenheitsbezogen, kein Kunden-Differenzierung über Segment hinaus

Grobe Wirtschaftlichkeitsrechnung, frühe Strategie-Phase

RFM-basiert

Recency-, Frequency-, Monetary-Quintile, daraus abgeleitete CLV-Schätzung pro Segment

Wochen

Beschreibt die Vergangenheit gut, ist als Zukunftssignal robust, aber gröber

Reaktivierungs-Kampagnen, Basis-Segmentierung im CRM

Probabilistisch

BG/NBD + Gamma-Gamma (oder vergleichbare Modelle), pro Kunde individuell

Wochen bis Monate für Aufbau, dann laufender Betrieb

Individuelle Vorhersagen mit Unsicherheits-Maß; trennt aktive von wahrscheinlich inaktiven Kunden

Spending-Allokation, CRM-Triggering, Service-Priorisierung

Die wichtige Lesart: Es ist kein Wettbewerb. RFM bleibt auch in fortgeschrittenen Setups als deskriptiver Layer erhalten — er ist die einfachste Sprache, in der Marketing- und Service-Teams über Kunden reden. Die probabilistische Schicht setzt sich darauf, sie ersetzt sie nicht.

CLV ändert weniger das Reporting als das Entscheidungs-Muster. Sobald Marketing-Spending und Service-Priorisierung an einer individuellen Wert-Erwartung hängen, fällt eine ganze Klasse von Bauchentscheidungen weg — und das Gespräch zwischen Marketing, Vertrieb und Finance wird ein anderes. Das ist der eigentliche Wert hinter der Methodik.

Philipp KruegerCo-CEO, foobar Agency

Häufig gestellte Fragen

CLV ist ein kundenindividueller Wert — die erwartete zukünftige Wertschöpfung aus genau einem Kunden. Customer Equity ist die Summe der CLVs über alle Kunden eines Unternehmens; die Kennzahl bewertet also die gesamte Kundenbasis als Vermögenswert. In der Praxis arbeitet das Marketing operativ mit CLV; Customer Equity ist eine Steuerungs-Größe für die Geschäftsleitung und für Investitions-Diskussionen über Akquise und Retention im Aggregat.

Eine Faustregel aus der Praxis: mindestens zwei vollständige Kaufzyklen Ihres typischen Kunden — bei Verbrauchsgütern können das zwölf Monate sein, bei Anschaffungsgütern eher 24 bis 36. Wichtig ist nicht nur die Länge, sondern die Sauberkeit: anonymisierte Bestellungen, Retouren, Gutscheine, Mitarbeiter-Accounts müssen sauber von normalen Käufen getrennt sein, sonst verzerren sie die Modell-Schätzungen.

Im Grundsatz ja, aber mit Einschränkungen. BG/NBD und Gamma-Gamma sind für nicht-vertragliche Käufer-Mengen mit vielen, kleinen Transaktionen optimiert — also klassisches B2C-eCommerce. Im B2B liegen oft wenige große Bestellungen pro Kunde, längere Vertriebszyklen und Account-Strukturen mit mehreren Bestellern hinter einer Kundennummer. Das macht reine BG/NBD-Setups oft instabil. Der nächste Beitrag dieser Reihe zeigt, wie sich die Methodik in den B2B übertragen lässt — mit Account-Hierarchien, Auftragstypen und längeren Zeithorizonten.

CLV-Use-Case-Workshop

In zwei Stunden klären wir bei foobar Agency mit Ihnen, welche RFM- und CLV-Ausbaustufe zu Ihrer Datenlage, Ihrem Commerce-Stack und Ihren Marketing-Prozessen passt — mit konkretem Maturity-Check, nicht mit Folien.

Dominik Thalmeier

Dominik Thalmeier

Data Scientist

Dominik ist Data Scientist und Softwareentwickler und setzt sich leidenschaftlich dafür ein, eine Brücke zwischen Forschung und Industrie zu schlagen. Er hat sich mit Algorithmen des verstärkenden Lernens und des maschinellen Lernens befasst, um Krankheiten wie Demenz und genetisch bedingten Hörverlust zu diagnostizieren. In der Industrie ist er als Berater für Data Science Architektur und Governance tätig und arbeitet als KI-Entwickler und Data Scientist.

Alle Beiträge von Dominik Thalmeier

Kontakt aufnehmen

Wir freuen uns auf Ihre Anfrage.

Bitte akzeptieren Sie Marketing-Cookies, um das Kontaktformular zu laden.