检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
否 traceId String 用于追踪每个被推荐物品的唯一ID。用于推荐效果的计算。 否 flowId String 用于计算每一个在线服务的效果。flowId由推荐系统的API返回给用户,用户需把flowId写到用户行为日志中。 否 实时行为日志示例 { "userId":
如何开始使用RES? 使用RES,从资源准备到在线服务完成推荐的全流程,如图1所示。 图1 RES操作流程 表1 使用流程说明 流程 子任务 说明 详细指导 数据源 准备离线数据源 需要您准备包含用户数据,物品数据,行为数据上传至对象存储服务(OBS)用于推荐系统的离线计算。 准备离线数据源
约束与限制 您能创建的在线服务的数量与配额有关系,具体请参见关于配额。 更详细的限制请参见具体API的说明。 父主题: 使用前必读
运行推荐作业 创建在线服务 - 创建在线服务用于部署上线服务、更新模型。配置实时计算的逻辑,包括设置在线流量、组装推荐结果和设置排序策略。根据策略做在线推荐结果融合、过滤、重排以及多流程之间的AB,并返回最终结果。 创建在线服务 获取推荐结果 - 您可以通过在线服务预测结果,也可以通过API接口获取最终的推荐结果。
一用户或物品有多条记录,将会按照用户ID或者物品ID去重。 前提条件 已按照创建离线数据源操作指导完成数据源的创建。 已完成数据结构识别和人工复核确认。 操作步骤 在“执行步骤”页签,单击数据导入下的“执行”。进入“导入”页面,确认页面信息后单击“确认”,允许推荐系统读取您OBS中存储的特征数据,生成画像和宽表。
RES操作流程 操作流程 本章节介绍使用RES,从资源准备到在线服务完成推荐的全流程。RES流程图如图1所示。 图1 RES操作流程 表1 使用流程说明 流程 子任务 说明 详细指导 数据源 准备离线数据源 需要您准备包含用户数据,物品数据,行为数据上传至对象存储服务(OBS)用于推荐系统的离线计算。
组合作业 创建组合作业 通过创建组合作业,用户可以根据配置的策略规则进行离线计算得到不同策略的候选集ID,来进行在线流程计算,得到用户满意的推荐结果。组合作业具体实现请参见图1。 图1 组合作业 创建组合作业主要包括如下设置: 基本配置 资源选择 召回策略 过滤规则 排序策略 预览配置
“时间间隔”:如果选择的调度类型为间隔调度,需要配置调度的时间间隔。 业务规则-人工导入 业务规则-人工导入是指用户自定义物品列表,并将此列表作为候选集,以供在线服务调用。 表6 业务规则-人工导入参数说明 参数名称 说明 名称 策略名称,由中文、英文、数字、下划线、空格或者中
功能包括:数据源。 在线服务:用于推荐系统在线推理,获得最终推荐结果。 套餐介绍 计算资源分为“计算型CPU(1U4G)实例”、“计算型GPU(P100)实例”、“计算型GPU(V100)实例”3种类型。存储资源支持“画像存储(一百万)”。在线服务支持“在线并发9000TPS-时
用于存放用户行为表、用户属性表和物品属性表。 │ obs-customize-data 用于存放用户自定义列表“customize.csv”,该列表应用于召回策略的人工导入策略。 │ obs-filter-data 用于存放用户黑白名单,应用于过滤策略。 │ obs-global-data
该离线作业设置的召回策略详情,召回策略信息包括: 策略别名,策略显示的名称。 OBS地址,推荐业务人员可从OBS中选择保存有人工编辑推荐结果的列表,进行人工推荐便于进行ABTest。 该策略生成的候选集ID。 过滤规则信息 过滤规则用于配置候选集的过滤方式,过滤规则信息包括: 过滤规则别名。
获取推荐结果 在线服务创建完成,部署成功后,当服务状态会显示“运行中”,表示服务状态正常。您可以通过在线预测功能测试推荐结果进一步调整作业参数,也可以通过预测接口来调用API,获取推荐结果。 界面预测 登录RES管理控制台,在左侧菜单栏中选择“推荐业务>自定义场景”,进入自定义场景列表页面。
排序策略-近线排序策略 近线排序策略用于对在线实时数据排序。如果使用在线排序模型,需在排序策略-近线特征工程中创建完成后才可以正常使用排序策略。 在“创建自定义场景”页面,进入“排序策略”页签,单击“添加近线排序策略”。 进行在线学习参数配置。 名称:自定义在线排序策略名称。 离线排序策略:
离线排序作业名称(在线训练任务需要提供此参数)。 update_interval 否 Integer 更新周期(在线训练任务需要提供此参数)。 optimizer 否 Optimizer object 优化器(在线训练任务需要提供此参数)。 flows 否 Flow object 在线流程(在线训练任务需要提供此参数)。
全局特征信息文件 在特征工程、在线模块,近线模块时都会用到该全局的特征信息文件。当上传的数据中的特征有变化时,用户需要同步更新该文件。该文件为JSON格式,包含特征名、特征大类、特征值类型。 表1 全局特征信息文件字段描述 字段名 类型 描述 是否必选 user_features
略生成的候选集进行重排序,得到推荐候选集列表。 排序策略-离线排序模型 在线服务 在线服务用来做线上推荐时的应用,每个服务之间是独立的。即根据不同的离线计算得到的候选集以及相关参数,提供不同的推荐服务。 在线服务 效果评估 指用于通过推荐系统推荐出去的结果集并利用trace_id
斯蒂回归算法通过在线性回归的基础上叠加一个sigmoid激活函数将输出值映射到[0,1]之间,是机器学习领域里常用的二分类算法。LR算法参数请参见逻辑斯蒂回归。 因子分解机算法是一种基于矩阵分解的机器学习算法,能够自动进行二阶特征组合、学习特征之间的关系,无需人工经验干预,同时能
离线排序作业名称(在线训练任务需要提供此参数)。 update_interval 否 Integer 更新周期(在线训练任务需要提供此参数)。 optimizer 否 Optimizer object 优化器(在线训练任务需要提供此参数)。 flows 否 Flow object 在线流程(在线训练任务需要提供此参数)。
自定义行为类型,行为名称需要符合以下要求,由数字、字母、下划线组成,长度为4-32。 自定义行为类型接入系统后,初始默认为正向行为,分数为0.5,后续可通过人工复核进行修改。 正向行为: click :点击 ,默认分数0.3 collect:收藏,默认分数0.5 search_click:点击搜索,默认分数0
离线排序作业名称(在线训练任务需要提供此参数)。 update_interval Integer 更新周期(在线训练任务需要提供此参数)。 optimizer Optimizer object 优化器(在线训练任务需要提供此参数)。 flows Flow object 在线流程(在线训练任务需要提供此参数)。