检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
RES操作流程 操作流程 本章节介绍使用RES,从资源准备到在线服务完成推荐的全流程。RES流程图如图1所示。 图1 RES操作流程 表1 使用流程说明 流程 子任务 说明 详细指导 数据源 准备离线数据源 需要您准备包含用户数据,物品数据,行为数据上传至对象存储服务(OBS)用于推荐系统的离线计算。
RES操作流程 本章节介绍使用RES,从资源准备到在线服务完成推荐的全流程。RES流程图如图1所示。 图1 RES操作流程 表1 使用流程说明 流程 子任务 说明 详细指导 准备资源 开通相关资源 基于您的业务需求,您需要开通RES相关服务,包括: 计算引擎DLI、ModelArts
则的理解,自定义专属的推荐流程。当前只有华为云提供开放式推荐能力,其他友商主打场景式推荐。 场景式推荐 提供多维度的场景推荐,含猜你喜欢、关联推荐、热门推荐,一键式操作,降低客户接入门槛。 近线处理能力 支持实时数据的接入和更新、模型在线学习,近线处理实时训练兴趣模型。 全面的推荐实体
通过DLF进行作业监控及任务异常重新启动 推荐系统提供了查询作业详情API接口,可返回作业详情。返回体中的作业状态字段“jobs.job_status”表示了当前任务的状态。 重新执行作业的API用来将任务以相同的配置重新执行一次。 通过查询作业详情API和重新执行作业的API可
特征工程可对推荐系统的离线数据进行处理,它包含两个功能: 从离线数据中提取用户、物品画像和RES内部通用格式数据; 把RES内部通用格式数据处理成训练排序模型所需的训练数据、测试数据等。 与功能对应,特征工程的两个任务分别是: 初始用户画像-物品画像-标准宽表生成 排序样本预处理 图1 特征工程
、过滤、排序算子自由组合,训练形式上支持离线批处理、近线流处理、在线实时处理的三种数据处理方式,提供完备的一站式推荐平台,可快速设置运营规则进行AB测试。 功能优势: 全开放推荐流程,用户根据业务自定义推荐流程。 特征工程,特征处理多样化,支持自定义特征散列等。 丰富的推荐策略,提供丰富的召回、过滤、排序算子。
面向了解推荐算法等相关的用户,可自定义推荐中涉及算法的使用和组合,能够自定义开发推荐流程,提供推荐服务。 用户 推荐系统被推荐的对象,一般是指使用业务系统的客户。例如,某电商的客户。 物品 被推荐的内容,一般是指业务系统提供的给其用户的商品。例如,某视频网站的视频。 召回策略 召回策略是指通
推荐系统OBS文件夹规范 使用推荐系统时,需要在OBS创建桶并导入离线数据,同时作业所产生的数据也会保存在OBS中。为了方便您快速定位文件路径,建议您按照如下结构准备数据创建文件夹,并上传至OBS桶。 OBS文件夹示例 自定义OBS桶名 │ obs-offline-data
功能描述 阶段 相关文档 1 推荐系统2.0全新上线 推荐系统支持用户自定义场景和智能场景。智能场景根据场景类型预置好对应的智能算法,为匹配的场景提供智能推荐服务。自定义场景面向了解推荐算法等相关的用户,可自定义推荐中涉及算法的使用和组合,能够自定义开发推荐流程,提供推荐服务。 商用 智能场景
NFO为画像表中定义的基本属性字段,TAGS为画像表中定义的带权重的标签,Context为上下文属性。该文件用于说明数据字段信息,以便推荐系统识别用户离线数据,通过特征工程将对应的数据写入到画像中,同时用于排序训练和线上推理服务中使用。 文件数据信息请参见全局特征信息文件数据格式。
由浅入深,带您玩转RES 01 了解 推荐系统(Recommender System) ,提供媒资,短视频、电商等行业的推荐系统解决方案,帮助互联网企业降低构建推荐应用的技术门槛,提升点击率、留存率和用户体验。 产品介绍 什么是RES 推荐系统应用场景 推荐系统产品功能 推荐系统基本概念 02 入门
使用RES,从资源准备到在线服务完成推荐的全流程,如图1所示。 图1 RES操作流程 表1 使用流程说明 流程 子任务 说明 详细指导 数据源 准备离线数据源 需要您准备包含用户数据,物品数据,行为数据上传至对象存储服务(OBS)用于推荐系统的离线计算。 准备离线数据源 上传离线数据源至OBS
错误码 当您调用API时,如果遇到“APIGW”开头的错误码,请参见API网关错误码进行处理。 状态码 错误码 错误信息 描述 处理措施 400 RES.1001 Basic Error 请求参数({0})的值无效 请检查是否有非法的参数值输入。 400 RES.1002 Basic
绑定或解绑资源 在RES管理控制台界面,资源中心列表中会提供当前账号创建的DLI集群、CloudTable开启IAM认证的集群和DIS通道供用户选择进行绑定或解绑。 背景信息 绑定资源之后,将该资源应用于RES的作业训练及在线作业获取推荐结果。 解绑资源完成资源释放,已经解绑的资源不再应用于RES的相关计算。
由于请求的实体过大,服务器无法处理,因此拒绝请求。为防止客户端的连续请求,服务器可能会关闭连接。如果只是服务器暂时无法处理,则会包含一个Retry-After的响应信息。 414 Request-URI Too Large 请求的URI过长(URI通常为网址),服务器无法处理。 415 Unsupported
准备离线数据源 在使用RES创建数据源时,您需要准备以下的3种基础数据包并上传至OBS。如果使用近线流程,需先将业务系统埋点日志转换成推荐系统指定格式,并实时写入DIS相应通道。本章节介绍了RES当前离线数据源和近线数据源的数据格式,您可以参考本章节说明,准备相应的数据。 目前数
起始位置默认为latest。 窗口间隔(秒) 近线策略处理的窗口间隔,单位为秒,10代表每隔10s进行一次算。 10s。 算子参数 在线服务名:使用的在线服务的名称。该在线服务需满足前提条件的要求。 流程名:在线服务对应的在线流程名称。 异常数据输出路径:单击右侧的按钮,选择数据在
用户指南(旧版) 准备工作 RES操作流程 管理资源 全局配置 离线作业 近线作业 在线服务 服务总览信息 数据格式规范
例如:当系统DAU为10W,并且推荐接口在登录首页时触发,在线服务一般可配置为10TPS。 计费模式 RES目前提供按需、预付套餐包共2种计费方式。 按需购买:这种购买方式比较灵活,可以即开即停。 预付套餐包:客户预先购买一定的资源使用量配额,在按需使用过程中,系统优先扣减配额
行为类型:用户感兴趣的行为类型。 权重值:行为的初始权重。 衰减系数:用于衰减行为初始权重的系数。 有效时间:用户配置的行为发生时间与当前时间的间隔,以小时为单位。系统只处理在该时间范围内的行为记录。 基于用户相似度的实时召回 基于用户相似度的实时召回策略是根据用户间的相似度信息,找到相似用户短时间内行为数据