本案例主要用于学习RFM模型,同时加深对数据分析流程的理解和python数据分析相关的coding能力。 其中涉及到:
- python匿名函数 lambda
- matplotlib和pyecharts基础绘图及美化
- pandas模块的数据透视表pivot_table函数、分类groupby函数、分段cut函数
-
1.1 每月退货率
-
2.1 利用RFM模型对用户群进行细分
- 用户分类(RFM模型),是网点衡量当前用户价值和客户潜在价值的重要工具和手段。对比分析不同用户群体在时间、地区等维度下交易量,交易金额指标,并根据分析结果提出优化建议
- R(recent): 最近一次消费时间(最近一次消费到参考时间的长度)
- F(frequency): 消费频次(单位时间消费了多少次)
- M(money): 消费金额(单位时间内总消费金额)
- 用户分类(RFM模型),是网点衡量当前用户价值和客户潜在价值的重要工具和手段。对比分析不同用户群体在时间、地区等维度下交易量,交易金额指标,并根据分析结果提出优化建议
3.1 缺失处理
3.2 重复值
3.3 异常分析
4.1 退货率
4.1.1 2011年每月退货率
4.1.2 2011年月平均退货率
4.1.3 可视化
4.2 用户分级(RFM模型)
4.1.1 计算R,F,M
4.2.2 观察R,F,M的数据分布
4.2.3 对R,F,M分段(给予权重)
4339 rows × 3 columns
4.2.4 分级标准
4339 rows × 6 columns
4339 rows × 7 columns
4.2.5 确认分级
4339 rows × 8 columns
4.2.6 用户分级结果及可视化
-
1月和12月退货率高于月平均退货率的原因: 根据第一篇实战数据分析知道影响总销量最大的是英国,同时其他也大都是西方国家,1月1日是他们的新年 以及12月25日是圣诞节,购物量大幅增加的同时也导致了退货量的增加。
-
对于不同等级用户采取针对且有效的营销措施:
非营销专业不知从何说起