检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
RES工作空间帮您实现离线作业、近线作业和在线服务隔离的功能,达到不同角色用户信息隔离管理的目的。 如果您未开通企业项目管理服务的权限,您可以在RES创建自己独立的工作空间。 如果你开通了企业项目管理服务的权限,可以在创建工作空间的时候绑定企业项目,并在企业项目下添加用户组,为不同的用户组设置细粒度权限供组里的用户使用。
online_job_uuid 是 String 关联的在线服务的uuid。 flow_name 是 String 关联在线服务的其中一个在线流程的名称。流式训练作业所需的行为参数、模型文件路径、数据预处理信息等参数会从指定的在线服务的在线流程中获取。 online_training_config
NEARLINE_WRITE_USER_PROFILE (根据用户信息日志写入用户画像) NEARLINE_WRITE_ITEM_PROFILE(根据物品信息日志写入物品画像) NEARLINE_UPDATE_USER_PORTRAIT(根据行为日志,更新用户画像) NEARLINE_UPDATE_US
参数类型 说明 作业ID(job_id) 是 String 作业的ID。离线策略特征工程-初始用户画像-物品画像-标准宽表算子、近线策略基于用户数据更新用户画像算子、近线策略基于物品数据更新物品画像算子可以作为此处的作业ID。 新的全局特征配置文件路径(new_global_features_info)
自定义场景关闭后,为什么会自动启动? 在创建自定义场景时,如果设置了自动召回策略,且此召回策略关联了在线服务,就会自动运行场景实例。用户可关闭召回策略,或者在在线服务中删除依赖的这个策略。 父主题: 自定义场景
DLI集群建议创建跨源连接,通过RPC方式访问,提高读写性能。 开通存储平台CloudTable CloudTable作为存储平台,用于用户推荐在线数据和推荐候选集的存储。在使用推荐系统之前,您需要开通表格存储服务(CloudTable Service)来创建集群。 登录华为云。在
命名实体识别模型 模型名称 res-default-ner 功能 将待处理的文本中的人名、地名、组织名提取出来。 URL POST 服务部署成功后返回的预测地址。 请求消息 请求参数请参见表1。 表1 请求参数说明 参数名称 是否必选 参数类型 说明 text 是 String 待处理的文本。
“任务配置地址”:用于存放创建作业时自动生成的JSON格式的配置源文件存储路径。 “全局特征信息文件”:根据全局特征信息文件规范准备并上传的全局特征信息文件路径。 “通用格式数据”:经过特征工程处理的宽表路径。 “用户属性表”:离线数据用户属性表的OBS路径。 “物品属性表”:离线数据物品属性表的OBS路径。
过滤规则 过滤规则用于配置候选集的过滤方式,使之不进入候选集。对于每个需要过滤的行为,生成用户具有该行为的物品的列表。再对同用户的每种行为的物品列表进行“与”或者“或”的关系,最终生成用户-物品过滤表。 表1 过滤规则参数说明 参数名称 说明 名称 自定义过滤规则名称。由中文、英
推荐系统被推荐的对象,一般是指使用业务系统的客户。例如,某电商的客户。 物品 被推荐的内容,一般是指业务系统提供的给其用户的商品。例如,某视频网站的视频。 召回策略 召回策略是指通过大数据计算或深度训练生成推荐候选集的算法策略。 过滤规则 过滤规则用于生成推荐的过滤集,包含黑白名单、 特征过滤等特性。支持用户在线上推理过程中完成对相关物品的过滤。
如何开始使用RES? 使用RES,从资源准备到在线服务完成推荐的全流程,如图1所示。 图1 RES操作流程 表1 使用流程说明 流程 子任务 说明 详细指导 数据源 准备离线数据源 需要您准备包含用户数据,物品数据,行为数据上传至对象存储服务(OBS)用于推荐系统的离线计算。 准备离线数据源
离线作业 离线作业简介 组合作业 数据质量 特征工程 召回策略 排序策略 过滤规则 效果评估 管理离线作业 删除离线作业 父主题: 用户指南(旧版)
管理资源 创建资源 绑定或解绑资源 创建跨源连接 开启公共终端节点 父主题: 用户指南(旧版)
全局配置 全局配置简介 管理属性配置 管理计算资源 父主题: 用户指南(旧版)
该页面包含“用户特征”、“物品特征”、“正向行为类型”和“负向行为类型”等信息,具体描述请参见表1。 图1 确认特征抽取 表1 确认特征参数 参数名称 说明 用户特征 列表中展示抽取的用户特征和参数类型。您可以根据业务需求单击增加用户特征。单击特征后方的删除不需要的用户特征。 物品特征
准备工作 注册华为帐号并开通华为云 获取访问密钥并添加RES全局配置 创建OBS桶 开通相关资源 父主题: 用户指南(旧版)
obs-offline-data 用于存放用户行为表、用户属性表和物品属性表。 │ obs-customize-data 用于存放用户自定义列表“customize.csv”,该列表应用于召回策略的人工导入策略。 │ obs-filter-data 用于存放用户黑白名单,应用于过滤策略。
行条化策略(属性匹配召回作业、物品协同过滤召回作业、用户协同过滤召回作业需要提供此参数)。 match_type 否 String 匹配类型(属性匹配召回作业需提供此参数): UI,基于用户推荐物品 UU,基于用户推荐用户 II,基于物品推荐物品 IU,基于物品推荐用户 matrix_factorization
数据格式规范 推荐系统OBS文件夹规范 离线数据源 实时日志 全局特征信息文件 父主题: 用户指南(旧版)
DLI创建集群操作详请参见数据湖探索用户指南>Spark作业控制台>Spark集群管理>创建集群章节。 CloudTable创建集群操作详请参见表格存储服务用户指南> 集群模式> 集群操作指导> 创建集群章节。 DIS创建通道操作详请参见数据接入服务用户指南> 入门> 步骤1:开通DIS通道章节。