推荐系统 RES-召回策略:基于用户的协同过滤推荐

时间:2025-02-12 14:54:25

基于用户的协同过滤推荐

采用经典算法基于用户的协同过滤(UserCF)进行召回。
表10 参数说明

参数名称

说明

默认值

策略别名

策略显示名称,由中文、英文、数字、下划线、空格或者中划线组成,并且不能以空格开始和结束,长度为1~60个字符。

默认召回策略的名称

数据源

数据源类型有初始格式和通用格式2种可选。

初始格式
  • 用户操作行为表:单击选择OBS中存储的用户操作行为表。当选择数据格式为csv时,根据情况单击设置数据参数。
通用格式
  • 通用格式数据:特征工程“初始用户画像-物品画像-标准宽表生成”算子生成的用户推荐系统的数据。从用户特征表、物品特征表以及用户行为表中提取用户、物品特征和用户行为,并生成json数据,即内部通用格式。

默认选择初始格式

行为时间跨度(天)

指定历史行为时间段,选取数据中最靠后的时间往前N天的行为数据计算用户偏好。建议至少设置30天。

30天

行为权重

当用户行为信息中存在多种行为类型时,可通过指定行为的权重,来统一量化行为类型对应的评分。

用户行为权重项包含如下几种类型:

  • view:物品曝光
  • click:用户点击物品
  • collect:用户收藏了某个物品
  • search_click:用户点击搜索结果中的物品
  • comment:用户对物品的评论
  • share:分享
  • like:点赞
  • grade:评分
  • consume:消费
  • use:观看视频/听音乐/阅读。

您可以单击“增加行为权重”,新增一个行为权重。通过来自定义权重大小。

单击可以删除对应行的行为权重。

物品曝光 1.0

用户最近邻域数

在UserCF算法中使用,指定某个用户的若干个最近邻用户,构成该用户近邻集合。

50

相似性度量方式

请参见表7中说明。

基于余弦夹角的相似性计算

行数

用于筛选用户最近邻域的条件组合参数。该值越大,筛选条件越严格。

5

条数

用于筛选用户最近邻域的条件组合参数。该值越小,筛选条件越严格。

4

最大推荐结果数

最多生成多少个推荐结果。

该参数会运用在“输出数据”的推荐候选集上。

100

表11 输入数据

数据

是否必须

描述

USER_BEHAVIOR

用户操作行为表。

表12 输出数据

名称

类型

描述

USERCF_REC_OFFLINE_CANDIDATES

CANDIDATES_SET

UserCF算法生成的用户-物品列表候选集。

support.huaweicloud.com/usermanual-res/res_01_0020.html