我正在研究电信流失问题,这是我的数据集。

http://www.sgi.com/tech/mlc/db/churn.data

名称 - http://www.sgi.com/tech/mlc/db/churn.names

我是生存分析的新手。鉴于训练数据,我的想法是建立一个生存模型来估计生存时间以及基于独立因素预测测试数据的流失/非流失。谁能帮我提供代码或指针关于如何解决这个问题。

准确地说,说我的火车数据已经得到

客户电话使用详情、计划详情、他的帐户使用期限等,以及他是否流失。

使用通用分类模型,我可以预测测试数据的流失与否。现在使用生存分析,我想预测测试数据中生存的期限。

谢谢,
麦迪

最佳答案

如果您仍然感兴趣(或为了以后的利益),我已经编写了一些指南,专门用于使用 R 对客户流失数据进行生存分析。它们涵盖了许多不同的分析技术,所有这些都带有样本数据和R 代码。

基本生存分析:http://daynebatten.com/2015/02/customer-churn-survival-analysis/

基本的 cox 回归:http://daynebatten.com/2015/02/customer-churn-cox-regression/

cox回归中的时间相关协变量:http://daynebatten.com/2015/12/survival-analysis-customer-churn-time-varying-covariates/

cox 回归中的时间相关系数:http://daynebatten.com/2016/01/customer-churn-time-dependent-coefficients/

受限平均生存时间(以美元为单位量化流失的影响):http://daynebatten.com/2015/03/customer-churn-restricted-mean-survival-time/

伪观察(量化与变量流失效应相关的美元 yield /损失):http://daynebatten.com/2015/03/customer-churn-pseudo-observations/

请原谅愚蠢的图像。

关于r - 使用 R 进行电信流失的生存分析,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/27080207/

10-12 17:10