推荐系统 RES-召回策略:基于综合行为热度推荐

时间:2024-09-07 16:00:54

基于综合行为热度推荐

基于综合行为热度推荐与基于特定行为热度推荐的召回原理大体相同,不同点是用统计几种行为的加权热度代替了特定行为热度。
表4 参数说明

参数名称

说明

默认值

策略别名

策略显示名称,由中文、英文、数字、下划线、空格或者中划线组成,并且不能以空格开始和结束,长度为1~60个字符。

默认召回策略的名称

扩展功能

组合作业的资源选择数据源类型为“通用格式”时,会出现扩展功能选项。

创建“基于综合行为热度推荐”的召回策略时,当开启扩展功能,数据源类型仅支持通用格式。

该功能表名是否使用分组推荐功能,根据全局特征信息文件勾选的用户特征或物品特征进行分组。

  • 扩展功能开启:
  • 扩展功能关闭:

默认关闭

数据源

数据源类型有初始格式和通用格式2种可选。

初始格式
  • 用户操作行为表:初始单击选择OBS中存储的用户操作行为表。当选择数据格式为csv时,根据情况单击设置数据参数。
通用格式
  • 通用格式数据:特征工程“初始用户画像-物品画像-标准宽表生成”算子生成的用户推荐系统的数据。从用户特征表、物品特征表以及用户行为表中提取用户、物品特征和用户行为,并生成json数据,即内部通用格式。

默认选择初始格式

时间选择

时间选择包括数据时间和行为时间跨度。

  • 数据时间:用于匹配在起始时间和终止时间内的行为数据。
  • 行为时间跨度:指定历史行为时间段,选取数据中最靠后的时间往前N天的行为数据计算用户偏好。建议至少设置30天。

默认选择数据时间的当月所有数据

行为权重

当用户行为信息中存在多种行为类型时,可通过指定行为的权重,来统一量化行为类型对应的评分。

用户行为权重包含:

  • view:物品曝光
  • click:用户点击物品
  • collect:用户收藏了某个物品
  • uncollect:用户取消收藏某个物品
  • search_click:用户点击搜索结果中的物品
  • comment:用户对物品的评论
  • share:分享
  • like:点赞
  • dislike:点衰
  • grade:评分
  • consume:消费
  • use:观看视频/听音乐/阅读

您可以单击“增加行为权重”,新增一个行为权重。通过来自定义权重大小。

单击可以删除对应行的行为权重。

物品曝光 1.0

全局特征信息文件

开启扩展功能时,此配置项生效。其中“数据源类型”您可以选择“用户特征”或者“物品特征”进行设置。

  • 全局特征信息文件:单击选择该文件的OBS存储路径,当涉及更新时,单击更新全局特征信息文件,并重新设置依赖此文件的配置项。
  • 用户特征:从下拉选项中勾选全局特征信息文件中提取的用户特征用于进行分组推荐。
  • 物品特征:从下拉选项中勾选全局特征信息文件中提取的物品特征用于进行分组推荐。

-

行为次数统计方法

统计物品记录数的方式。

  • pv:page view,即页面浏览量或点击量。
  • uv:unique visitor,即同一个访客只记录一条数据。

默认pv

排序算法类型

物品热度是否随着时间衰减。

  • 不衰减:normal。
  • 衰减:time。

不衰减

最大推荐结果数

最多生成多少个推荐结果。

该参数会运用在“输出数据”的推荐候选集上。

100

表5 输入数据

数据

是否必须

描述

USER_BEHAVIOR

用户操作行为表。

表6 输出数据

名称

类型

描述

WEIGHT_BEHAVIORS_REC_OFFLINE_CANDIDATES

CANDIDATES_SET

综合行为热度推荐算法生成的候选集。

support.huaweicloud.com/usermanual-res/res_01_0020.html