Predicción del churn rate de clientes de una Telco
El coste de adquirir un cliente es más de 5 veces superior al de mantenerlo. ¿Es posible predecir si un cliente dejará de serlo?
Respositorio
Introducción y objetivo del proyecto
¿Qué es el churn rate (o tasa de fuga?
Es el porcentaje de clientes que dejan de serlo durante un periodo de tiempo concreto. Si, por ejemplo, al principio del año la base de clientes de una empresa SaaS es de 1000 y al final del mismo 100 han decidido rescindir la relación con la compañía, el churn rate ha sido del 10%.
¿Por qué es tan importante?
El CAC (Customer Acquisition Cost) es el coste que supone adquirir un nuevo cliente, y tiene en cuenta tanto los gastos de ventas (por ejemplo, sueldo e incentivos de los gestores comerciales) como los de marketing (anuncios, entre otros) [1]. Pues bien, según varios estudios, el CAC puede llegar a ser entre 5 y 25 veces superior al de retener a uno ya existente. Además, según Frederick Reichheld (inventor del Net Promoter Score), incrementar la retención únicamente un 5% supone aumentar los beneficios de un 25 a un 95%, ya que estos continuan siendo una fuente de ingresos con el tiempo e incluso hacen de promotores para conocidos [2]. ¿Sería posible entonces predecir cuándo un cliente dejará de serlo?
Dataset
En este caso, la compañía interesada es una de telecomunicaciones y el dataset que ha compartido contiene la siguiente información:
- state_code: código postal del Estado correspondiente
- tenure: tiempo total (días) como cliente de la compañía
- contract_length: tiempo de vigencia de su contrato actual (meses)
- promotions_offered: si se le ha ofrecido alguna promoción o no
- remaining_term: tiempo restante del contrato (meses)
- last_nps_rating: último NPS reportado
- area_code: código de la zona en la que reside
- international_plan: si dispone de plan internacional o no
- voice_mail_plan: si dispone de plan de email o no
- number_vmail_messages: número de emails enviados
- total_day_minutes: total de minutos hablados por la mañana
- total_day_calls: total de llamadas realizadas por la mañana
- total_day_charge: cargo total de las llamadas realizadas por la mañana
- total_eve_minutes: total de minutos hablados por la tarde
- total_eve_calls: total de llamadas realizadas por la tarde
- total_eve_charge: cargo total de las llamadas realizadas por la tarde
- total_night_minutes: total de minutos hablados por la noche
- total_night_calls: total de llamadas realizadas por la noche
- total_night_charge: cargo total de las llamadas realizadas por la noche
- total_intl_minutes: total de minutos internacionales hablados
- total_intl_calls: total de llamadas internacionales realizadas
- total_intl_charge: cargo total de las llamadas internacionales realizadas
- number_customer_service_calls: número de llamadas realizadas al servicio técnico
- churn: si ha dejado de ser cliente o no
Modelo predictivo
El modelo elegido ha sido una regresión logística desarrollada desde cero (apartado 4). Una vez entrenado, la matriz de confusión resultante ha sido la siguiente:

Por tanto:
- La accuracy es del 91%
- La precision es del 72%
Es decir, aproximadamente en 9 de cada 10 ocasiones se consigue saber correctamente si un cliente dejará de serlo o no, pero únicamente en 7 de cada 10 ocasiones en las que se ha dicho que abandonará, realmente lo hará.
Conclusiones
Al realizar un análisis de las variables más importantes del modelo se puede ver que las que tienen más impacto y afectan de forma más negativa son: el tiempo restante del contrato del cliente (remaining_term) y el último NPS reportado (last_nps_rating).
Por tanto, una opción a tener en cuenta sería invertir parte del presupuesto en ofrecer mejoras o descuentos a aquellos clientes a los que les queda poco para que termine su contrato y además no están contentos con la compañía según la última encuesta realizada.

Fuentes
[1] https://corporatefinanceinstitute.com/resources/accounting/customer-acquisition-cost-cac/
[2] https://hbr.org/2014/10/the-value-of-keeping-the-right-customers
Últimas entradas
- Dashboard para analizar las compañías del S&P500Dashboard con estados financieros y ratios clave de las compañías del S&P500 para poder analizarlas rápidamente
- Modelo de IA para encontrar las mejores viviendas donde invertir¿Es posible crear un modelo que permita predecir el precio de alquiler ideal de una vivienda para encontrar buenas oportunidades de inversión?
- Predicción del churn rate de clientes de una TelcoEl coste de adquirir un cliente es más de 5 veces superior al de mantenerlo. ¿Es posible predecir si un cliente dejará de serlo?