随着电商行业近几年的迅猛发展,电⼦商务从早些年的粗放式经营,逐步转化为精细化运营。随着 平台数据量的不断积累,通过数据分析挖掘消费者的潜在需求,消费偏好成为平台运营过程中的重要环节。本项目基于淘宝电商平台用户行为数据,在MySQL关系型数据库,探索用户行为规律,寻找高价值用户;分析商品特征,寻找高贡献商品;分析产品功能,优化产品路径。
想通过对用户行为数据进行分析,为以下问题提供解释和改进建议: (1)基于漏斗模型的用户购买流程各环节分析指标,确定各个环节的转换率,便于找到需要改进的环节; (2)基于RFM模型找出核心付费用户群,对这部分用户进行精准营销; (3)商品分析: 找出热销商品,研究热销商品特点。
数据来源:
数据说明:该数据集包含了2017年11月25日至2017年12月3日之间,有行为的约一百万随机用户的所有行为(行为包括点击、购买、加购、喜欢)。
数据集的每一行表示一条用户行为,由用户ID、商品ID、商品类目ID、行为类型和时间戳组成,并以逗号分隔。关于数据集中每一列的详细描述如下:
四种用户类型包括:
平台维度
通过对电商流量维度的分析,可以了解到用户流量的相关信息,比如用户活跃时间、用户流量漏斗转化率。
需要指标:uv、pv、人均访问量、跳出率、复购率、用户流量漏斗转化率…
用户维度
通过对用户行为的分析,可以了解用户四种行为数据,用户购买路径偏好,用户留存率等。
通过对用户价值进行分析,使用RFM模型,对用户进行分类,找出有价值的用户,对用户进行精细化运营。
需要指标:行为数据、购买路径、用户留存率、RFM
商品维度
通过对商品品类、商品成交量、商品点击次数、购买转化率等指标的分析,探索用户对商品及商品品类的偏好,了解商品销售的规律。
导入方式:Navicat
在MySQL中新建一个taobao数据库,导入向导,保留前100w条数据
结果都是空,不存在重复值
统计每一个字段下有多少行,查询结果行数是相等的,说明没有缺失值。
最终处理结果如下:
过滤时间范围不在2017-11-25至2017-12-3之间的数据
检查下是否将异常值剔除干净
5.1.1 流量分析
总体流量分析
2017.11.25-2017.12.03期间,网站总访问量约100万次,总访客数为9739人,人均访问量为103次。其中用户行为数据: 商品详情页访问量约90万,收藏次数约2.8万,加购次数约5.5万,购买次数约2万。
每日流量分析
行为指标: 点击量 收藏量 加购物车量 购买量
将视图导出到excel,对每日流量进行可视化:
分析结论: 1. 2017-11-25到2017-12-01这段期间流量保持着稳定的趋势,在2017-12-02之后,流量呈现增长的趋势,推测可能是因为双12预热活动,造成流量上升。 2. 12-02后用户的购物频率及购物欲望有所增加,可在此阶段多进行运营活动或商品推送等优化策略。
每时流量分析
分析结论:
1. 从不同时段的访问数据中可发现,页面浏览量与独立访客数随时间呈相同变化趋势,每日18点用户访问量开始增加,约21点达到顶峰,说明用户在傍晚至晚上期间经常访问淘宝。 2. 根据用户行为数据可得知,每日18点至22点,用户行为呈显著上升趋势,用户在这段期间倾向于做出购物决策,也有较多时间进行购物抉择,符合现代人的生活习惯。可针对此特征进行商品运营及推送。
5.1.2 流量转化漏斗分析
用户行为有点击、收藏、加购、购买四种,默认用户需要先进行了点击行为,才有后续操作。
用户在平台的行为路径为
- 点击--收藏--购买
- 点击--加购--购买
- 点击--购买
由于本案例收藏与加购未明确先后顺序,故将两个行为合并
分析结论:
1. 收藏、加购、购买三种行为相对于点击的转化率在2-6%左右,转化率较低,可通过业内信息对比近一步分析平台的推送机制是否精准。 2. 收藏与加购之后的购买转化率相比起其他转化率显著提升,说明收藏、加购行为有助于用户的后续购买行为,所以可增加活动运营促进用户的收藏加购行为,例如加购收藏赠优惠卷等。 3. 用户从点击到购买的转化率只有约2.27%,可能是不同的行为路径会影响转化率,也可能是推荐的商品不符合用户爱好影响转化率,将在后面继续分析。
5.1.3 复购率
复购率定义:指消费者对该品牌产品或者服务的重复购买次数,重复购买次数越多,则反应出消费者对该品牌的忠诚度就越高,反之就越低。
公式:复购率=有重复购买行为的用户数(消费两次及以上)/有购买行为的用户数
分析结论:
1. 计算得到复购率高达66.21%,反映淘宝的用户忠诚度高,顾客愿意回购。 2. 可进一步培养用户忠诚度,鼓励更高频次的消费。
5.1.4 跳失率
跳失率定义:指用户从相应入口进入后,只访问了一个页面就离开的数量占从相应入口进入的总用户占比。
跳出率可以反映用户对网站内容的认可程度,评判用户对网站的粘性,是衡量网站/APP内容质量的重要标准。
公式:只访问一个页面就离开的用户数/总用户数
分析结论:
9天内没有一名用户仅访问一个页面就离开淘宝,用户跳失率为0。反映出淘宝平台对用户有足够的吸引力,用户愿意花时间在淘宝中选购商品。
5.2.1 独立访客(UV)的转化漏斗
将用户去重,对每个用户的四种行为进行统计,并创建视图,以便之后的分析。
分析结论:
1. 用户并未在浏览商品详情页后大量流失,有75%左右用户进行加购,40%的用户进行收藏,最终有68.92%的付费用户,用户的购买转化率很不错,说明app符合大部分用户的需求。 2. 在分析总体流量行为时,各用户的点击量非常多,购买转化率很低,推测是在购买前,用户会对于不同店铺、不同价位、不同款式商品进行对比,最终进行加购/收藏步骤。 3. 为提高商详页点击到购买的转化率,APP可以优化筛选功能及商品推荐策略,使得推荐商品更精准,使用户不用浏览很多的页面,用更快、更少的点击获得心怡的商品。
5.2.2 用户行为路径分析
拼接行为路径,把多个行为路径并列摆放 用户的行为转化路径可以分为以下几种:
- 点击--直接购买
- 点击--收藏不加购--购买
- 点击--加购不收藏--购买
- 点击--收藏且加购--购买
分析结论:
1. 四种路径对比说明:加购物车购买是用户最喜欢的一种方式,其次喜欢的就是收藏且加购,用户对商品进行收藏且加购之后,转化为购买的比率要更高。推断原因可能是因为加购物车,用户可以享受满减等优惠或者折扣。 2. 可以引导用户将商品加购物车,提高中间转化率;通过在商品详情页或客服引导或优惠活动引导用户进行收藏且加购物车,提高用户的购买转化率。
5.2.3 用户RFM模型价值分析
RFM模型是衡量客户价值与客户创利能力的工具
-
R(Recency):用户最近一次消费距离现在的时间,R越小,用户价值越高;
-
F(Frequency):用户在统计周期内购买商品的次数,F越大,用户交越频繁,用户价值越高;
-
M(Monetary):用户在统计周期内的消费金额,M越大,用户价值越高。
由于原数据集中没有消费金额数据,所以本次分析暂时不考虑M维度,仅考虑RF维度将现有用户分为以下四类:
RFM模型:R部分
1. 统计每个用户最近一次的购买时间与2017-12-04日的距离天数
2. 计算用户最近一次的购买时间的平均值
3. 根据用户的最近一次购买时间间隔是否超过平均值,给用户用0/1评分(超过平均数的为0,没超过为1)
4. 创建视图以便后续查取
RFM模型:F部分
1. 统计每个用户的购买次数
2. 计算用户购买次数的平均值
3. 根据用户的购买次数是否超过平均值,给用户用0/1评分(超过平均数的为0,没超过为1)
4. 创建视图以便后续查取
整合RF
根据R、F两个维度的表将用户进行分类,分成四类用户。
分析结论:
通过RFM模型中的用户最近一次购买时间、用户消费频次分析,分拆得到四类用户,可以在后续精细化运营场景中直接使用细分用户,做差异化运营。
- 对比保持用户,挽留用户、发展用户、价值用户这三类占比差异不大,应提升价值用户的占比,降低挽留用户。
- 价值用户:这部分用户的价值极高,可以做VIP服务设计,增加用户粘性同时通过设计优惠券提升客户消费。
- 保持用户:这部分用户的比例最低,待挖掘的潜在价值很大,应该对这部分用户做定向广告、短信召回策略,尝试召回用户。
- 发展用户:这类用户占比最多,可以对这部分用户做广告、推送刺激,提升消费频次。
- 挽留用户:这类用户占比也比较高,可能是产品体验不佳,用户流失至竞品app,可以做优惠券、签到送礼策略,增加挽留用户粘性。
5.2.4 留存分析
次日留存率、三日留存率、七日留存率,通过留存率分析用户粘性。
注:结果中后半部分时间出现0的数据,是时间长度不足无法计算的缘故,在此次分析中暂不做参考,计算均值时不计入。
分析结论:
- 近九天,次日留存率平均值约为83.82%,三日留存率平均值约为83.8%,7日留存率均值约为91.4%。
- 从整体数据来看,用户留存率较为稳定,用户对平台的粘性较高,说明平台对用户有着较高的价值,保留用户能力强。
关于“受欢迎”的商品,可以从销量与点击量两个维度(用户行为)去分析。点击量高的商品可能是因为被页面或广告等吸引而来,只是感兴趣,用户并不一定会购买;而销量高的产品才是用户真正需要的。因此需要同时结合销量与浏览量两个维度去进行分析。
5.3.1 商品数量与类别概览
5.3.2 购买量Top10商品
分析结论:
可以看出销量最多的商品才17件,且销量前十的商品中只有一半超过10件,可以看出淘宝主要是依靠商品多样性来满足用户需求,并不存在爆款商品。今后也可继续增加商品类目,打造多元化商品。
对购买量top10商品进行购买转化分析
购买转化:该商品的所有用户中有购买转化的用户比
分析结论:
热销商品如上所示。其中‘3031354’品类购买转化率较其余商品品类极低,需要结合更多数据做进一步解读。(可能的原因:商品自有特性导致用户购买较低,比如非必需品、奢侈品等等。)
5.3.3 点击量Top10商品
分析结论:
1. 高点击和高销量商品ID不存在重合,可看出流量高并不意味着销量高,推荐的商品未完全符合用户偏好,从而影响购买转化。 2. 点击量高说明并非极小众产品,但是大部分商品购买转化率都极低,甚至为0。对于此类商品,需要注意是否是平台算法不合理或是由于商品打广告的原因,导致推送给用户的商品实际上用户并不需要,但却获得了的了一定的点击量;或是由于质量或者价格的原因导致用户不愿意购买,需要结合更多信息进行进一步分析。
5.3.4 购买量Top10商品类别
分析结论:
1. 可对购买量top10的商品品类的特征进行分析,看是否有相似之处,比如是否均为需求较大的生活日用品等; 2. 可针对性的对品类内销量高的商品进行推广,或与购买量低的销售品类中的商品进行捆绑销售,或满减促销活动,促进用户购买; 3. 后续可以针对金额数据对销售额及利润率等指标进行进一步分析。 4. 购买量前十的商品品类中,大部分的转化率在10%以下,转化率较低的原因可能是在于同一类商品中有多款商品,用户存在“货比三家”的心理,可以考虑这类商品的精准定位,预测用户感兴趣的物品,这样可以减少用户比较多个商品来回跳转的点击量,更能在短时间内做出比较并选择需要购买的商品,提高用户体验。
5.3.5 商品四象限分析
对商品的下单量和浏览量进行四象限分析,可以更好的制定营销策略。
由于数据量过大,此次分析只选取购买量前300的商品数据。
用Tabelau连接MySQL数据库,将数据导入到Tabelau中进行可视化:
分析结论:
1. 第Ⅰ象限:商品浏览量与销量都高,属于比较受用户欢迎的商品,转化率也比较高。可以对这类商品多做活动,增加曝光量,吸引更多的潜在用户。
2. 第Ⅱ象限:销量高浏览量低,产生这种现象可能有以下两种原因: ①从C端用户看,该象限内的商品属于垂直领域,有特定受众会直接进行性购买,用户的购买目标明确。可以针对该类用户推测出特定活动,做到精准推送,或建立该类商品受众的专属社群,提供用户交流平台,进一步增加用户粘性; ②从B端来看,商品受众广,但是商家的宣传力度小,曝光量过少,用户接触到该类商品的渠道较少。商家应该加大宣传力度,多做宣传,设置高频率搜索关键词,设计亮眼的宣传图等,增加用户的浏览量,销量也会随之提升。
3. 第Ⅲ象限:购买量低,浏览量低。说明用户对商品不感兴趣,需要考虑流量入口和商品本身两方面的问题: ①流量问题:是否对商品的宣传力度过小,用户没有渠道点进来此类商品。可以尝试提高商品的曝光量; ②若提高商品曝光量后商品的销量还是比较低迷,就需要考虑商品本身是否符合用户的需求,效果不好的商品也可以直接优化掉。
4. 第Ⅳ象限:浏览量高,购买量低,说明商品整体的转化率很低。也可以从B/C端进行分析: ①在B端方面,是否是商品的定价与定位的原因,价格太贵且不符合主流消费群体的胃口;是否是商品详情页的图片、描述以及商品的评价较差;是否是客服的服务不到位、APP操作更新流程复杂等因素。 ②在C端方面,是否是广告的投放人群或者商品的推送目标有问题,并没有获取到对应商品的目标用户,很多非目标用户点击商品,但是没有进行购买。
1. 每时流量:12.02日后用户的购物频率及购物欲望有所增加,可在此阶段多进行运营活动或商品推送等优化策略。 每时流量:每日18点至22点,用户行为呈显著上升趋势,约21点达到顶峰,可针对此特征进行商品运营及推送。 2. 流量转化:收藏、加购、购买三种行为相对于点击的转化率在2-6%左右,转化率较低;但是收藏与加购之后的购买率(36%~73%) 较其他转化率有显著提升,建议推出加购收藏领优惠券等活动,提高用户的加购收藏行为,由此促进购买转化。 3. 复购率和跳失率:复购率高达66.21%,9天内的跳失率为0,由此说明淘宝的用户忠诚度高,顾客愿意回购。
1. 用户习惯在购买前,对于不同店铺、不同价位、不同款式商品进行对比,最终进行加购/收藏步骤。为提高商详页点击到购买的转化率,APP可以优化筛选功能及商品推荐策略,使得推荐商品更精准。 2.在用户的购买的路径中,用户多以加购物车购买为主,且对商品进行收藏且加购之后,购买转化率也要更高,可以维持引导用户进行收藏且加购物车的活动策略。 3. 根据RFM模型对用户进行了分类,对不同价值的用户采用不同的运营策略,进行精细化运营,提升价值客户的占比,减少挽留用户占比。 4. 用户留存率较高且较稳定,平台对用户有着较高的价值,保留用户能力强。
1. 淘宝主要是依靠商品多样性来满足用户需求,并不存在爆款商品。今后也可继续增加商品类目,打造多元化商品。 2. 高浏览的商品并未对应高销量,存在流量的浪费。通过推荐算法、流量推广、商品价格与质量等维度定位问题原因。 3. 对商品类别的点击购买转化率较低的问题,可以尝试从精准推荐、优质推送、优化同类别商品的搜索流程等维度改善。 4. 根据四象限图,可以从B端与C端两个角度去分析原因,并针对性的进行改善。