数据湖探索 DLI-使用DLI进行电商BI报表分析:数据说明
数据说明
为保护用户的隐私和数据安全,所有数据均已进行了采样和脱敏。
- 用户数据
表1 用户数据 字段名称
字段类型
字段说明
取值范围
user_id
int
用户ID
脱敏
age
int
年龄段
-1表示未知
gender
int
性别
- 0表示男
- 1表示女
- 2表示保密
rank
Int
用户等级
有顺序的级别枚举,越高级别数字越大
register_time
string
用户注册日期
单位:天
- 商品数据
表2 商品数据 字段名称
字段类型
字段说明
取值范围
product_id
int
商品编号
脱敏
a1
int
属性1
枚举,-1表示未知
a2
int
属性2
枚举,-1表示未知
a3
int
属性3
枚举,-1表示未知
category
int
品类ID
脱敏
brand
int
品牌ID
脱敏
- 评价数据
表3 评价数据 字段名称
字段类型
字段说明
取值范围
deadline
string
截止时间
单位:天
product_id
int
商品编号
脱敏
comment_num
int
累计评论数分段
- 0表示无评论
- 1表示有1条评论
- 2表示有2-10条评论
- 3表示有11-50条评论
- 4表示大于50条评论
has_bad_comment
int
是否有差评
0表示无,1表示有
bad_comment_rate
float
差评率
差评数占总评论数的比重
- 行为数据
表4 行为数据 字段名称
字段类型
字段说明
取值范围
user_id
int
用户编号
脱敏
product_id
int
商品编号
脱敏
time
string
行为时间
-
model_id
string
模块编号
脱敏
type
string
- 浏览(指浏览商品详情页)
- 加入购物车
- 购物车删除
- 下单
- 关注
- 点击
-