The Churnover Chronicles: hoe prijsverhogingen klanten in vlinders veranderen

The Churnover Chronicles: hoe prijsverhogingen klanten in vlinders veranderen

Een hand met bankbiljetten voor een rekenmachine
Een hand met bankbiljetten voor een rekenmachine
Een hand met bankbiljetten voor een rekenmachine

Wanneer Data Science voldoet aan zakelijke en wettelijke vereisten.

Wanneer Data Science voldoet aan zakelijke en wettelijke vereisten.

Wanneer Data Science voldoet aan zakelijke en wettelijke vereisten.

Klantenbinding is een belangrijke zakelijke uitdaging, vooral bij het nemen van moeilijke beslissingen zoals prijsverhogingen. Een bedrijf verhoogde jaarlijks de abonnementsprijzen, maar had geen inzicht in hoe deze prijsverhogingen de klantloyaliteit beïnvloeden en welk prijspunt de winst zou maximaliseren. Om deze uitdaging aan te gaan, schakelden ze ons team van experts in voorspellende modellen in.

Dit is nooit zo eenvoudig als het splitsen van een dataset en het uitvoeren van een Train-Test model. Wettelijke beperkingen weerhielden ons ervan een conventioneel churn-model te gebruiken om klanten te targeten voor prijsverhogingen. In plaats daarvan moesten we alleen werken met niet-discriminerende klantkenmerken.

Benadering

We begonnen dit project met een precieze probleemstelling: Hoe kunnen we de optimale prijsverhoging voor het abonnement van een klant bepalen en tegelijkertijd het risico op churn minimaliseren?

Het is duidelijk dat de aanname van een nulrisico niet klopt, want klanten zijn prijsgevoelig, vooral in de huidige inflatoire omgeving. We begonnen met het analyseren van de impact van eerdere prijsstijgingen. Voor deze eventstudie moesten we een duidelijk tijdvenster definiëren. Na overleg met de klant stemden we ermee in om het verloop binnen 4 maanden na elke prijsverhoging te onderzoeken, waarbij we ons specifiek richtten op Annuleringsverzoeken (CR) die binnen een periode van 2 maanden werden ingediend.

Tijdvensterweergave

Na het voltooien van deze taak stelden we een uitgebreide dataset samen die verschillende kenmerken bevatte van de historische en huidige gedragspatronen van onze klanten. Deze dataset bevatte de cumulatieve effecten van eerdere prijsverhogingen en externe variabelen zoals inflatie. De uiteindelijke dataset was bijzonder onevenwichtig, met een verlooppercentage van slechts 1,5%.

Voorspellingen?

Op basis van onze grondige gegevensanalyse uit de vorige fase ontwikkelden we twee afzonderlijke voorspellende modellen: één voor particuliere klanten en één voor bedrijven. Uit de analyse bleek dat deze groepen duidelijk verschillend gedrag vertoonden. Voor beide segmenten kozen we LGBM regressor algoritmen voor feature selectie en voorspellingen. Van de vele beschikbare algoritmen kozen we LGBM om twee belangrijke redenen:

  • De dataset is onevenwichtig.

  • De gegevens zijn transactioneel.

In plaats van in te gaan op de details van de modelselectie, concentreren we ons op de voorspellingsresultaten. Deze waren niet uitzonderlijk of slecht, maar gewoon voldoende. Deze prestatie was niet verontrustend omdat we wettelijk gezien toch geen voorspellend model konden gebruiken. Wat echt van belang was, was de selectie van de eigenschappen.

Waarschijnlijkheid van churn, distributies voor verschillende prijsverhogingen.

Om gevoeligheidsklassen te bepalen, analyseerden we de variabiliteit in churnkansen tussen prijsverhogingen van 0% en 10%. We simuleerden de kans op opzegging bij prijsverhogingen van 1% tot 10%. Zoals in de onderstaande figuur te zien is, identificeerden we de groep met een laag risico (roze gemarkeerd). Deze klanten toonden een sterke loyaliteit: zelfs bij een prijsstijging van 10% (onze maximaal geteste waarde) bleef de kans op churn onder de 55%. Op basis van door de klant gespecificeerde drempels hebben we drie verschillende groepen geïdentificeerd:

  • Lage gevoeligheid: 47% van de klanten / 0,7% opzegpercentage

  • Middelmatige gevoeligheid: 32% van de klanten / 1% opzegpercentage

  • Hoge gevoeligheid: 21% van de klanten / 2,4% opzegpercentage

De risicogroep heeft 3,5 keer meer kans om te veranderen - eenopmerkelijk verschil gezien onze ongebalanceerde dataset.

Klanten met een laag risico selecteren.

Een weg vinden: Multi-informatie criteria

Je hebt misschien gemerkt dat we weliswaar een voorspellend algoritme gebruiken voor voorspellingen, maar dat we het wettelijk gezien niet kunnen gebruiken om prijsverhogingen te bepalen. Dit is onze oplossing: we hebben al onze geconstrueerde kenmerken gerangschikt op basis van hoe goed ze onderscheid maken tussen groepen met een laag, gemiddeld en hoog risico.

Laten we bijvoorbeeld eens kijken hoe het kenmerk 'Aantal keer gebruik afgelopen maand' zich verhoudt tot deze drie klantklassen:

Aantal keren gebruikt in de maand voor de prijsverhoging en gevoeligheid voor prijsverhoging.

We pasten de Multi-informatie Criteria toe om de beste combinatie van kenmerken te vinden die gegevensvariantie vastlegde en tegelijkertijd redundantie elimineerde. Voor praktische bedrijfsdoeleinden selecteerden we tien kenmerken en combineerden deze in groepen van drie, waardoor 120 mogelijke combinaties ontstonden.

Oplossing en resultaten

We implementeerden de combinatie van drie functies die het beste onderscheid maakte tussen groepen met een laag, gemiddeld en hoog risico. Zo vielen klanten met nul gebruik consequent in de categorie met hoog risico. Deze aanpak stelde ons in staat om groepen te maken puur op basis van gebruikerskenmerken en hun historische opzegpercentages te analyseren. Elke groep vertoonde ook verschillende prijsgevoeligheidsniveaus, die we met lineaire regressie hebben gemeten.

Onze uiteindelijke oplossing stelt het bedrijfsteam in staat om drie functies te selecteren uit een pool van tien om gevoeligheidsgroepen te vormen. De tool genereert gedetailleerde rapporten voor elke groep, waarin verwachte opzeggingspercentages en aanbevolen prijsverhogingen worden weergegeven. Het berekent zowel het risico op churn als de verwachte winststijging van prijsaanpassingen en bepaalt vervolgens de totale verwachte payoff door deze factoren met elkaar te vergelijken. We leverden onze klant een gedetailleerde lijst met aanbevolen prijsverhogingen, ondersteund door historische gegevens die hun impact op klantbehoud aantoonden. We gaven ook advies over de optimale combinatie van gebruikerskenmerken voor effectieve groepssegmentatie.

Een laatste woord

Hoewel dit project zakelijk gezien eenvoudig was, bracht het unieke uitdagingen met zich mee. Hoewel technische aspecten zoals gegevensanalyse en voorspellende modellen onze kracht zijn, lag de echte uitdaging in het omgaan met wettelijke beperkingen. Ons team moest complex klantgedrag distilleren tot slechts drie onderscheidende kenmerken - en dat alles met de grootst mogelijke nauwkeurigheid. Het was onbekend terrein voor ons, maar dat maakte het juist zo spannend!

Klantenbinding is een belangrijke zakelijke uitdaging, vooral bij het nemen van moeilijke beslissingen zoals prijsverhogingen. Een bedrijf verhoogde jaarlijks de abonnementsprijzen, maar had geen inzicht in hoe deze prijsverhogingen de klantloyaliteit beïnvloeden en welk prijspunt de winst zou maximaliseren. Om deze uitdaging aan te gaan, schakelden ze ons team van experts in voorspellende modellen in.

Dit is nooit zo eenvoudig als het splitsen van een dataset en het uitvoeren van een Train-Test model. Wettelijke beperkingen weerhielden ons ervan een conventioneel churn-model te gebruiken om klanten te targeten voor prijsverhogingen. In plaats daarvan moesten we alleen werken met niet-discriminerende klantkenmerken.

Benadering

We begonnen dit project met een precieze probleemstelling: Hoe kunnen we de optimale prijsverhoging voor het abonnement van een klant bepalen en tegelijkertijd het risico op churn minimaliseren?

Het is duidelijk dat de aanname van een nulrisico niet klopt, want klanten zijn prijsgevoelig, vooral in de huidige inflatoire omgeving. We begonnen met het analyseren van de impact van eerdere prijsstijgingen. Voor deze eventstudie moesten we een duidelijk tijdvenster definiëren. Na overleg met de klant stemden we ermee in om het verloop binnen 4 maanden na elke prijsverhoging te onderzoeken, waarbij we ons specifiek richtten op Annuleringsverzoeken (CR) die binnen een periode van 2 maanden werden ingediend.

Tijdvensterweergave

Na het voltooien van deze taak stelden we een uitgebreide dataset samen die verschillende kenmerken bevatte van de historische en huidige gedragspatronen van onze klanten. Deze dataset bevatte de cumulatieve effecten van eerdere prijsverhogingen en externe variabelen zoals inflatie. De uiteindelijke dataset was bijzonder onevenwichtig, met een verlooppercentage van slechts 1,5%.

Voorspellingen?

Op basis van onze grondige gegevensanalyse uit de vorige fase ontwikkelden we twee afzonderlijke voorspellende modellen: één voor particuliere klanten en één voor bedrijven. Uit de analyse bleek dat deze groepen duidelijk verschillend gedrag vertoonden. Voor beide segmenten kozen we LGBM regressor algoritmen voor feature selectie en voorspellingen. Van de vele beschikbare algoritmen kozen we LGBM om twee belangrijke redenen:

  • De dataset is onevenwichtig.

  • De gegevens zijn transactioneel.

In plaats van in te gaan op de details van de modelselectie, concentreren we ons op de voorspellingsresultaten. Deze waren niet uitzonderlijk of slecht, maar gewoon voldoende. Deze prestatie was niet verontrustend omdat we wettelijk gezien toch geen voorspellend model konden gebruiken. Wat echt van belang was, was de selectie van de eigenschappen.

Waarschijnlijkheid van churn, distributies voor verschillende prijsverhogingen.

Om gevoeligheidsklassen te bepalen, analyseerden we de variabiliteit in churnkansen tussen prijsverhogingen van 0% en 10%. We simuleerden de kans op opzegging bij prijsverhogingen van 1% tot 10%. Zoals in de onderstaande figuur te zien is, identificeerden we de groep met een laag risico (roze gemarkeerd). Deze klanten toonden een sterke loyaliteit: zelfs bij een prijsstijging van 10% (onze maximaal geteste waarde) bleef de kans op churn onder de 55%. Op basis van door de klant gespecificeerde drempels hebben we drie verschillende groepen geïdentificeerd:

  • Lage gevoeligheid: 47% van de klanten / 0,7% opzegpercentage

  • Middelmatige gevoeligheid: 32% van de klanten / 1% opzegpercentage

  • Hoge gevoeligheid: 21% van de klanten / 2,4% opzegpercentage

De risicogroep heeft 3,5 keer meer kans om te veranderen - eenopmerkelijk verschil gezien onze ongebalanceerde dataset.

Klanten met een laag risico selecteren.

Een weg vinden: Multi-informatie criteria

Je hebt misschien gemerkt dat we weliswaar een voorspellend algoritme gebruiken voor voorspellingen, maar dat we het wettelijk gezien niet kunnen gebruiken om prijsverhogingen te bepalen. Dit is onze oplossing: we hebben al onze geconstrueerde kenmerken gerangschikt op basis van hoe goed ze onderscheid maken tussen groepen met een laag, gemiddeld en hoog risico.

Laten we bijvoorbeeld eens kijken hoe het kenmerk 'Aantal keer gebruik afgelopen maand' zich verhoudt tot deze drie klantklassen:

Aantal keren gebruikt in de maand voor de prijsverhoging en gevoeligheid voor prijsverhoging.

We pasten de Multi-informatie Criteria toe om de beste combinatie van kenmerken te vinden die gegevensvariantie vastlegde en tegelijkertijd redundantie elimineerde. Voor praktische bedrijfsdoeleinden selecteerden we tien kenmerken en combineerden deze in groepen van drie, waardoor 120 mogelijke combinaties ontstonden.

Oplossing en resultaten

We implementeerden de combinatie van drie functies die het beste onderscheid maakte tussen groepen met een laag, gemiddeld en hoog risico. Zo vielen klanten met nul gebruik consequent in de categorie met hoog risico. Deze aanpak stelde ons in staat om groepen te maken puur op basis van gebruikerskenmerken en hun historische opzegpercentages te analyseren. Elke groep vertoonde ook verschillende prijsgevoeligheidsniveaus, die we met lineaire regressie hebben gemeten.

Onze uiteindelijke oplossing stelt het bedrijfsteam in staat om drie functies te selecteren uit een pool van tien om gevoeligheidsgroepen te vormen. De tool genereert gedetailleerde rapporten voor elke groep, waarin verwachte opzeggingspercentages en aanbevolen prijsverhogingen worden weergegeven. Het berekent zowel het risico op churn als de verwachte winststijging van prijsaanpassingen en bepaalt vervolgens de totale verwachte payoff door deze factoren met elkaar te vergelijken. We leverden onze klant een gedetailleerde lijst met aanbevolen prijsverhogingen, ondersteund door historische gegevens die hun impact op klantbehoud aantoonden. We gaven ook advies over de optimale combinatie van gebruikerskenmerken voor effectieve groepssegmentatie.

Een laatste woord

Hoewel dit project zakelijk gezien eenvoudig was, bracht het unieke uitdagingen met zich mee. Hoewel technische aspecten zoals gegevensanalyse en voorspellende modellen onze kracht zijn, lag de echte uitdaging in het omgaan met wettelijke beperkingen. Ons team moest complex klantgedrag distilleren tot slechts drie onderscheidende kenmerken - en dat alles met de grootst mogelijke nauwkeurigheid. Het was onbekend terrein voor ons, maar dat maakte het juist zo spannend!

Klantenbinding is een belangrijke zakelijke uitdaging, vooral bij het nemen van moeilijke beslissingen zoals prijsverhogingen. Een bedrijf verhoogde jaarlijks de abonnementsprijzen, maar had geen inzicht in hoe deze prijsverhogingen de klantloyaliteit beïnvloeden en welk prijspunt de winst zou maximaliseren. Om deze uitdaging aan te gaan, schakelden ze ons team van experts in voorspellende modellen in.

Dit is nooit zo eenvoudig als het splitsen van een dataset en het uitvoeren van een Train-Test model. Wettelijke beperkingen weerhielden ons ervan een conventioneel churn-model te gebruiken om klanten te targeten voor prijsverhogingen. In plaats daarvan moesten we alleen werken met niet-discriminerende klantkenmerken.

Benadering

We begonnen dit project met een precieze probleemstelling: Hoe kunnen we de optimale prijsverhoging voor het abonnement van een klant bepalen en tegelijkertijd het risico op churn minimaliseren?

Het is duidelijk dat de aanname van een nulrisico niet klopt, want klanten zijn prijsgevoelig, vooral in de huidige inflatoire omgeving. We begonnen met het analyseren van de impact van eerdere prijsstijgingen. Voor deze eventstudie moesten we een duidelijk tijdvenster definiëren. Na overleg met de klant stemden we ermee in om het verloop binnen 4 maanden na elke prijsverhoging te onderzoeken, waarbij we ons specifiek richtten op Annuleringsverzoeken (CR) die binnen een periode van 2 maanden werden ingediend.

Tijdvensterweergave

Na het voltooien van deze taak stelden we een uitgebreide dataset samen die verschillende kenmerken bevatte van de historische en huidige gedragspatronen van onze klanten. Deze dataset bevatte de cumulatieve effecten van eerdere prijsverhogingen en externe variabelen zoals inflatie. De uiteindelijke dataset was bijzonder onevenwichtig, met een verlooppercentage van slechts 1,5%.

Voorspellingen?

Op basis van onze grondige gegevensanalyse uit de vorige fase ontwikkelden we twee afzonderlijke voorspellende modellen: één voor particuliere klanten en één voor bedrijven. Uit de analyse bleek dat deze groepen duidelijk verschillend gedrag vertoonden. Voor beide segmenten kozen we LGBM regressor algoritmen voor feature selectie en voorspellingen. Van de vele beschikbare algoritmen kozen we LGBM om twee belangrijke redenen:

  • De dataset is onevenwichtig.

  • De gegevens zijn transactioneel.

In plaats van in te gaan op de details van de modelselectie, concentreren we ons op de voorspellingsresultaten. Deze waren niet uitzonderlijk of slecht, maar gewoon voldoende. Deze prestatie was niet verontrustend omdat we wettelijk gezien toch geen voorspellend model konden gebruiken. Wat echt van belang was, was de selectie van de eigenschappen.

Waarschijnlijkheid van churn, distributies voor verschillende prijsverhogingen.

Om gevoeligheidsklassen te bepalen, analyseerden we de variabiliteit in churnkansen tussen prijsverhogingen van 0% en 10%. We simuleerden de kans op opzegging bij prijsverhogingen van 1% tot 10%. Zoals in de onderstaande figuur te zien is, identificeerden we de groep met een laag risico (roze gemarkeerd). Deze klanten toonden een sterke loyaliteit: zelfs bij een prijsstijging van 10% (onze maximaal geteste waarde) bleef de kans op churn onder de 55%. Op basis van door de klant gespecificeerde drempels hebben we drie verschillende groepen geïdentificeerd:

  • Lage gevoeligheid: 47% van de klanten / 0,7% opzegpercentage

  • Middelmatige gevoeligheid: 32% van de klanten / 1% opzegpercentage

  • Hoge gevoeligheid: 21% van de klanten / 2,4% opzegpercentage

De risicogroep heeft 3,5 keer meer kans om te veranderen - eenopmerkelijk verschil gezien onze ongebalanceerde dataset.

Klanten met een laag risico selecteren.

Een weg vinden: Multi-informatie criteria

Je hebt misschien gemerkt dat we weliswaar een voorspellend algoritme gebruiken voor voorspellingen, maar dat we het wettelijk gezien niet kunnen gebruiken om prijsverhogingen te bepalen. Dit is onze oplossing: we hebben al onze geconstrueerde kenmerken gerangschikt op basis van hoe goed ze onderscheid maken tussen groepen met een laag, gemiddeld en hoog risico.

Laten we bijvoorbeeld eens kijken hoe het kenmerk 'Aantal keer gebruik afgelopen maand' zich verhoudt tot deze drie klantklassen:

Aantal keren gebruikt in de maand voor de prijsverhoging en gevoeligheid voor prijsverhoging.

We pasten de Multi-informatie Criteria toe om de beste combinatie van kenmerken te vinden die gegevensvariantie vastlegde en tegelijkertijd redundantie elimineerde. Voor praktische bedrijfsdoeleinden selecteerden we tien kenmerken en combineerden deze in groepen van drie, waardoor 120 mogelijke combinaties ontstonden.

Oplossing en resultaten

We implementeerden de combinatie van drie functies die het beste onderscheid maakte tussen groepen met een laag, gemiddeld en hoog risico. Zo vielen klanten met nul gebruik consequent in de categorie met hoog risico. Deze aanpak stelde ons in staat om groepen te maken puur op basis van gebruikerskenmerken en hun historische opzegpercentages te analyseren. Elke groep vertoonde ook verschillende prijsgevoeligheidsniveaus, die we met lineaire regressie hebben gemeten.

Onze uiteindelijke oplossing stelt het bedrijfsteam in staat om drie functies te selecteren uit een pool van tien om gevoeligheidsgroepen te vormen. De tool genereert gedetailleerde rapporten voor elke groep, waarin verwachte opzeggingspercentages en aanbevolen prijsverhogingen worden weergegeven. Het berekent zowel het risico op churn als de verwachte winststijging van prijsaanpassingen en bepaalt vervolgens de totale verwachte payoff door deze factoren met elkaar te vergelijken. We leverden onze klant een gedetailleerde lijst met aanbevolen prijsverhogingen, ondersteund door historische gegevens die hun impact op klantbehoud aantoonden. We gaven ook advies over de optimale combinatie van gebruikerskenmerken voor effectieve groepssegmentatie.

Een laatste woord

Hoewel dit project zakelijk gezien eenvoudig was, bracht het unieke uitdagingen met zich mee. Hoewel technische aspecten zoals gegevensanalyse en voorspellende modellen onze kracht zijn, lag de echte uitdaging in het omgaan met wettelijke beperkingen. Ons team moest complex klantgedrag distilleren tot slechts drie onderscheidende kenmerken - en dat alles met de grootst mogelijke nauwkeurigheid. Het was onbekend terrein voor ons, maar dat maakte het juist zo spannend!

Klaar om je doelen te bereiken met gegevens?

Als je je doelen wilt bereiken door slimmer gebruik te maken van gegevens en A.I., dan zit je hier goed.

Klaar om je doelen te bereiken met gegevens?

Als je je doelen wilt bereiken door slimmer gebruik te maken van gegevens en A.I., dan zit je hier goed.

Klaar om je doelen te bereiken met gegevens?

Als je je doelen wilt bereiken door slimmer gebruik te maken van gegevens en A.I., dan zit je hier goed.

Klaar om je doelen te bereiken met gegevens?

Als je je doelen wilt bereiken door slimmer gebruik te maken van gegevens en A.I., dan zit je hier goed.

© 2025 Agilytic

© 2025 Agilytic

© 2025 Agilytic