检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
o.json”的文件。 │ obs-general-data 用于存放经过特征工程处理的宽表,又名通用格式数据。 │ obs-pretrain-data 用于存放排序预处理任务生成的预训练数据。 │ obs-error-data 用于存放异常数据输出路径,来源于近线策略。
获取推荐结果 准备工作 已注册华为云帐号,并且账号为可用状态。 确保用户选择的属性在物品表存在相应的字段属性,若不存在,统一按照默认(不打散)处理。 用户已经创建自定义场景或新建自定义场景过程中。 创建数据源 参考数据源管理进行创建。 配置“在线服务”参数 如果用户已经创建自定义场景,可以直接修改“在线服务”相关参数。
实时日志 RES根据实时发送到DIS上的日志,进行数据计算和处理,更新用户的相关数据。用户发送到DIS上的数据具体如下: 实时行为日志 实时行为日志的作用包括: 更新用户的兴趣标签。 记录所选行为类型的历史记录。 更新用户的上下文信息。 召回候选集。 表1 实时行为日志字段描述 字段名
文本标签服务为用户提供自然语言处理工具,可用于关键词提取和命名实体识别。 排序 排序服务允许用户提供自己的候选集,使用RES的排序策略进行排序。 前提条件 已经有计算成功的离线作业并且已经生成候选集UUID。 您可以部署10个在线服务,每个在线服务可以创建2个在线流程 ,如需增加配额请您提工单处理。 由于在线运行需消耗资源,确保账户未欠费。
推荐引擎和排序引擎有什么区别? RES支持哪些自定义策略? 重新运行被在线服务所引用的召回策略,是否需要重新部署在线服务? 在线服务获得推荐的调用次数如何计算? 自定义场景关闭后,为什么会自动启动?
基础问题 什么是RES? 与其他云服务的关系 如何开始使用RES? 获取访问密钥(AK/SK) 推荐作业有哪几种创建方式? 创建的场景是否会立即发布? 最小在线并发规格支持弹性伸缩,是否设置最小规格即可? 是否有样例数据支撑我进一步了解RES? 什么是区域、可用区? API查询列表的接口返回结果是否支持分页?
“场景”信息可选择您在全局配置页面创建的场景。 完成该项配置后,单击“下一步”。 资源选择 您在使用RES时需要选择计算引擎、存储平台和数据源。计算引擎对数据进行计算,存储平台将处理的数据进行存储。其选择的服务资源即为“资源中心”绑定的资源。 在RES管理控制台完成“基本配置”之后,进入“资源选择”页签。
用户画像存储 指定存储用户画像的存储平台信息。服务名默认CloudTable,指定集群名称和表名用于存储更新后的用户画像。 不涉及。 物品画像存储 指定存储物品画像的存储平台信息。服务名默认CloudTable,指定集群名称和表名用于存储更新后的用户画像。 不涉及。 过滤存储 指定
用户属性kv串。不同属性之间用\002(ASCII值)分隔,属性的key和value之间用\003(ASCII值)分隔,多值枚举型属性的不同值之间以\004(ASCII值)分隔,kv数值型属性的不同键值对同样以\004(ASCII值)分隔,每一个键值对内部用冒号(:)将键和值分隔。 基本格式:k1
使用用区域和可用区来描述数据中心的位置,您可以在特定的区域、可用区创建资源。 区域(Region):从地理位置和网络时延维度划分,同一个Region内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。Region分为通用Region和专属Region,通用Region指面向公共租户提供通用
流程配置信息,请参见表5。 rank_uuid 否 String 排序策略生成的uuid。 feature_uuid 否 String 预处理的离线处理生成的uuid。 filter_uuid 否 String 过滤规则生成的uuid。 表4 rules参数说明 参数名称 是否必选 参数类型
data_source_config 参数说明 参数名称 是否必选 参数类型 说明 interval 是 Integer 近线策略流处理的窗口时间,单位为秒,10代表每隔10s进行一次。包括数据读取和处理的流计算。 表11 algorithm_config 参数说明 参数名称 是否必选 参数类型 说明 online_job_uuid
接口右侧的,复制接口地址,调用服务。 图3 获取预测接口 调用接口 Mozilla、Google都为REST提供了图形化的浏览器插件,发送处理请求消息。 预测接口的调用和接口参数请参见预测接口,更多接口信息请参见《推荐系统API参考》。 父主题: 在线服务
”。 “任务配置地址”:用于存放创建作业时自动生成的JSON格式的配置源文件存储路径。 “全局特征信息文件”:根据全局特征信息文件规范准备并上传的全局特征信息文件路径。 “通用格式数据”:经过特征工程处理的宽表路径。 “用户属性表”:离线数据用户属性表的OBS路径。 “物品属性表”:离线数据物品属性表的OBS路径。
参数类型 说明 item_profile_storage 是 JSON 请参见表28,用户画像存储信息。 user_profile_storage 是 JSON 请参见表28,用户画像存储信息。 表28 item_profile_storage、user_profile_storage参数说明
性能。 开通存储平台CloudTable CloudTable作为存储平台,用于用户推荐在线数据和推荐候选集的存储。在使用推荐系统之前,您需要开通表格存储服务(CloudTable Service)来创建集群。 登录华为云。在华为云“产品”页签,选择“大数据>表格存储服务Clou
RES操作流程 表1 使用流程说明 流程 子任务 说明 详细指导 数据源 准备离线数据源 需要您准备包含用户数据,物品数据,行为数据上传至对象存储服务(OBS)用于推荐系统的离线计算。 准备离线数据源 上传离线数据源至OBS 创建离线数据源 在使用RES之前,首先您需要创建一个数据源
基于您的业务需求,您需要开通RES相关服务,包括: 计算引擎DLI、ModelArts 存储平台CloudTable (可选)数据接入资源DIS 开通相关资源 绑定资源 针对您创建的集群等资源,需要完成绑定,才可以在创建作业时可选择绑定的集群进行计算存储等操作。 绑定资源 创建跨源链接 在使用DLI进行推荐系统
作业运行结束,检测完的数据将使用于离线作业。当离线作业的“状态”变为“计算失败”时,您可以单击作业的名称,进入详情页面,通过查看日志等手段处理问题。 父主题: 离线作业
创建数据源之前您需要自己手工创建整理这些表并存储到OBS,推荐数据目前支持JSON格式。 离线数据为初次对接RES的批量数据,供场景中的召回算法和排序算法进行计算。近线数据可实时更新、增加用户和物品表数据,同时实时行为数据,可作为后续近线召回计算,这些近线行为数据也会和离线行为数据进行汇总存储,供离线计算。 数据源管理流程及功能简介