检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Storage Service,简称OBS)进行数据源以及黑白名单和用户数据的存储。因此,在使用RES之前您需要开通OBS服务并创建桶,然后在OBS桶中上传用户数据用于推荐作业的计算。 需要存放在OBS桶中的数据包括: 离线数据源:包含用户类数据,物品类数据,行为数据以及推荐候选列表。 黑名单
过滤规则别名。 黑名单地址,黑名单所在路径。 黑名单中的物品不能出现在最终推荐结果集里面。 白名单地址,白名单所在的路径。白名单之外的物品不应该出现在最终推荐结果集里。 历史行为过滤,指定与用户个性化的物品候选集过滤准则。例如对于用户过去3天内有过view行为的物品(如新闻)过滤,使之不进入候选集。
全局特征信息文件路径。 “通用格式数据”:经过特征工程处理的宽表路径。 “用户属性表”:离线数据用户属性表的OBS路径。 “物品属性表”:离线数据物品属性表的OBS路径。 “用户操作行为表”:离线数据用户操作行为表的OBS路径。 图1 属性配置 删除场景 登录RES管理控制台,在
新版本可升级至1.3.12。 上传实时数据至RES 初始化DIS客户端,使用代码初始化DIS SDK客户端实例,代码样例如下。具体方式请参见初始化DIS客户端。 1 2 3 4 5 6 7 8 // 创建DIS客户端实例 DIS dic = DISClientBuilder.standard()
客体的id列表,非必选项。有下面两种场景使用: 在线上策略使用到关联推荐召回策略时需要提供。例如,给用户推荐物品,主体是用户,客体是物品;给物品推荐用户,主体是物品,客体是用户;给用户推荐用户,主体是用户,客体是用户;给物品推荐物品,主体是物品,客体是物品。 纯排序场景中,该参数为传入待排序物品列表的字段,传入物品集供模型排序使用。
推荐系统被推荐的对象,一般是指使用业务系统的客户。例如,某电商的客户。 物品 被推荐的内容,一般是指业务系统提供的给其用户的商品。例如,某视频网站的视频。 召回策略 召回策略是指通过大数据计算或深度训练生成推荐候选集的算法策略。 过滤规则 过滤规则用于生成推荐的过滤集,包含黑白名单、 特征过滤等特性。支持用户在线上推理过程中完成对相关物品的过滤。
组合作业作为一个包含多个子任务的作业,通常用于多个召回、过滤、排序等任务。 组合作业 数据质量 数据质量是用户在进行离线计算之前使用原始初始格式数据或者通用格式数据检测输入数据是否合法。 数据质量 特征工程 特征工程常用于抽取用户、物品的特征和特定算法的特征生成,一般作为某些算法的前置输入条件。 特征工程 召回策略
程之间的AB,并返回最终结果。 创建在线服务 获取推荐结果 - 您可以通过在线服务预测结果,也可以通过API接口获取最终的推荐结果。 获取推荐结果 (可选)效果评估 - 创建效果评估可以对线上服务设置指标,查看推荐结果的具体衡量指标。 效果评估 父主题: 用户指南(旧版)
获取访问密钥并添加RES全局配置 由于使用RES时,用户上传数据、进行离线计算等需要依赖其他服务,如果没有添加访问密钥则无法使用其他服务。因此,在使用RES前,您需要获取访问密钥并在RES管理控制台完成添加访问密钥的配置。 获取访问密钥 登录华为云,鼠标移动至页面右上方用户名,在下拉列表中选择“账号中心”。如图1所示。
离线作业 离线作业简介 组合作业 数据质量 特征工程 召回策略 排序策略 过滤规则 效果评估 管理离线作业 删除离线作业 父主题: 用户指南(旧版)
管理资源 创建资源 绑定或解绑资源 创建跨源连接 开启公共终端节点 父主题: 用户指南(旧版)
全局配置 全局配置简介 管理属性配置 管理计算资源 父主题: 用户指南(旧版)
该文件标识了每一个域下的特征数量,排序数据处理接口会生成这个文件,需要用户提供此文件完整路径。文件路径为特征工程中排序样本预处理作业输出数据的结果保存路径的“fields_feature_size”目录下文件名称是part-00000开头的文件,需要用户提供文件的OBS路径。 最大迭代轮数 模型训练的最大迭代轮数,默认50。
单击目标服务名称进入服务详情页面,单击下方的“预测”页签,输入预测代码,单击“预测”后显示预测结果,如图1所示。输入用户ID和推荐数量,根据您设置的召回策略等返回用户的预测结果。 图1 在线预测 获取预测接口 通过在线服务页面获取接口 登录RES管理控制台,在左侧菜单栏中选择“在线服务”,进入服务列表页面。
在线服务 创建在线服务 获取推荐结果 查看在线服务详情 管理在线服务 父主题: 用户指南(旧版)
准备工作 注册华为帐号并开通华为云 获取访问密钥并添加RES全局配置 创建OBS桶 开通相关资源 父主题: 用户指南(旧版)
数据格式规范 推荐系统OBS文件夹规范 离线数据源 实时日志 全局特征信息文件 父主题: 用户指南(旧版)
选择离线计算、实时计算、排序模型训练规格和在线并发数。 个性化配置 匹配特征对 匹配用户和物品特征,以便于筛选出该用户相关联的物品进行推荐。 用户特征名:从下拉框中选择目标用户特征用于和物品特征进行匹配。 物品特征名:从下拉框中选择目标物品特征用于匹配用户特征,更好的做出推荐。 权重:取值为0.01-1。权重
单击作业或服务名称,进入该详情页面,可以查看资源信息、策略信息和日志信息。您也可以通过页面快速创建作业或服务。单击“创建在线服务”,快速进入创建在线服务页面。 父主题: 用户指南(旧版)
DLI创建集群操作详请参见数据湖探索用户指南>Spark作业控制台>Spark集群管理>创建集群章节。 CloudTable创建集群操作详请参见表格存储服务用户指南> 集群模式> 集群操作指导> 创建集群章节。 DIS创建通道操作详请参见数据接入服务用户指南> 入门> 步骤1:开通DIS通道章节。