UserBehavior是阿里巴巴提供的一个
淘宝用户行为
数据集,用于隐式反馈推荐问题的研究。
本
数据集包含了2017年11月25日至2017年12月3日之间,有行为的约一百万随机
用户的所有行为(行为包括点击、购买、加购、喜欢)。
数据集的组织形式和MovieLens-20M类似,即
数据集的每一行表示一条
用户行为,由
用户ID、商品ID、商品类目ID、行为类型和时间戳组成,并以逗号分隔。关于
数据集中每一列的详细描述如下:
列名称 说明
用户ID 整数类型,序列化后的
用户ID
商品ID 整数类型,序列化后的商品ID
商品类目ID 整数类型,序列化后的商品所属类目ID
行为类型 字符串,枚举类型,包括(
'pv
',
'buy
',
'cart
',
'fav
')
时间戳 行为发生的时间戳
注意到,
用户行为类型共有四种,它们分别是
行为类型 说明
pv 商品详情页pv,等价于点击
buy 商品购买
cart 将商品加入购物车