检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建OBS桶 RES使用对象存储服务(Object Storage Service,简称OBS)进行数据源以及黑白名单和用户数据的存储。因此,在使用RES之前您需要开通OBS服务并创建桶,然后在OBS桶中上传用户数据用于推荐作业的计算。 需要存放在OBS桶中的数据包括: 离线数据
创建离线数据源 在使用RES之前,首先您需要创建一个数据源,后续的操作,如修改数据源、创建自定义推荐,都是基于您创建的数据源进行的。 前提条件 已创建用于存储数据的OBS桶及文件夹,并且数据存储的OBS桶与RES在同一区域。 需要使用的数据已上传至OBS。 创建数据源 登录RES
准备离线数据源 在使用RES创建数据源时,您需要准备以下的3种基础数据包并上传至OBS。如果使用近线流程,需先将业务系统埋点日志转换成推荐系统指定格式,并实时写入DIS相应通道。本章节介绍了RES当前离线数据源和近线数据源的数据格式,您可以参考本章节说明,准备相应的数据。 目前数
推荐系统OBS文件夹规范 使用推荐系统时,需要在OBS创建桶并导入离线数据,同时作业所产生的数据也会保存在OBS中。为了方便您快速定位文件路径,建议您按照如下结构准备数据创建文件夹,并上传至OBS桶。 OBS文件夹示例 自定义OBS桶名 │ obs-offline-data
自定义场景简介 RES面向了解推荐算法等相关的用户,可自定义推荐中涉及算法的使用和组合,能够自定义开发推荐流程,提供推荐服务。您可以基于RES提供的多种推荐训练作业得到推荐候选集,用于在线服务计算得到推荐结果。 自定义场景功能说明 表1 功能说明 功能 说明 详细指导 创建自定义场景
更多接口信息请参见《推荐系统API参考》。 下载Postman软件并安装,您也可以直接在Chrome浏览器添加Postman扩展程序(也可使用其它支持发送post请求的软件)。 打开Postman,如图4所示。 图4 Postman界面 在Postman界面填写参数。 选择POS
域感知因子分解机是因子分解机的改进版本,因子分解机每个特征对其他域的隐向量都一致,而域感知因子分解机每个特征对其他每个域都会学习一个隐向量,能够达到更高的精度,但也更容易出现过拟合。单击查看域感知因子分解机详细信息。 表3 域感知因子分解机参数说明 参数名称 说明 计算节点信息 用户可使用的计算资源种类。“8核|1
数据探索是什么?近线实时数据如何在数据探索中的报告体现? 数据探索是针对当前数据源的数据进行挖掘和分析,主要聚焦在特征的分布范围、统计以及特征齐全度等,使用户能够更了解数据,进而指导在特征工程以及相关算法的配置。 数据探索是一个离线分析任务,任务有对应的启动时间,由于近线实时数据会实时入库,因
数据质量 数据质量检测算子,是用户在进行离线计算之前使用原始初始格式数据(离线数据源中的离线数据)或者通用格式数据检测输入数据是否合法。包括离线数据中是否包含特殊字符,数据类型是否正确,是否缺少必备信息等。 前提条件 已将离线数据上传至OBS桶中。 创建数据质量作业 创建数据质量操作步骤如下:
创建跨源连接 在使用DLI进行推荐系统的离线和近线计算时,建议创建跨源连接,用于访问CloudTable的数据源,提高读写性能。 前提条件 已开通计算引擎DLI服务,创建集群并完成资源绑定。 创建跨源链接 DLI集群绑定完成后,创建跨源链接。步骤如下: 登录RES管理控制台,在“
规格确认无误后,单击“去支付”,然后在支付页面完成付款,付款成功后即完成套餐包的购买。 RES目前只支持华北-北京四区域。 计费时将优先使用套餐包的额度,超出额度部分将以当月累计使用量所在的阶梯价计费。套餐包的额度为购买日起一年内的可用资源数。套餐包的有效时长为一年。 已购买套餐包不支持退订,购买前请确认。
物品协同过滤作业名称。 表6 RecallFiled 参数 是否必选 参数类型 描述 name 否 String 字段名称。 value 否 Integer 使用字段值的个数。 最小值:1 最大值:10 缺省值:1 表7 MatchFeaturePair 参数 是否必选 参数类型 描述 user_feature_name
删除离线作业 删除离线作业即清理离线作业产生的数据,数据清理完成后删除元数据。操作必须确保流程中没有使用该作业产生的UUID,可以参考以下操作完成。 删除离线作业 您可以对“计算成功”、“计算失败”等状态的作业进行删除,“启动中”、“计算中”状态的作业不支持删除操作。 登录RES
数据探索 数据探索介绍 数据探索是针对当前数据源的数据进行挖掘和分析,主要聚焦在特征的分布范围、统计以及特征齐全度等,使用户能够更了解数据,进而指导在特征工程以及相关算法的配置。 数据探索是一个离线分析任务,任务有对应的启动时间,由于增量数据会实时入库,因此可以通过定时执行数据探索任务来覆盖增量数据。
单击“确定”,完成RES工作空间的创建。 您可以在工作空间列表页面查看创建的工作空间,当显示为“状态正常”时,该工作空间可正常使用。也可以左侧导航栏“当前工作空间”下拉框中选择您需要使用的工作空间。 切换工作空间 按照创建工作空间步骤创建工作空间。 在左侧导航栏“当前工作空间”下拉框中单击目标工作空间名称进行切换。
果并不断调整您的作业参数。您还可以基于离线作业得到的推荐候选集,用于在线服务计算得到推荐结果。RES提供了多种推荐离线作业功能,您可以直接使用得到满意的推荐候选集。 用户通过数据质量作业对离线数据进行质量检测,然后将检测合格的数据通过特征工程处理为可用于召回策略、过滤规则、排序策
如果你开通了企业项目管理服务的权限,可以在创建工作空间的时候绑定企业项目,并在企业项目下添加用户组,为不同的用户组设置细粒度权限供组里的用户使用。 工作空间功能 表1 功能说明 功能 说明 创建工作空间 RES支持通过工作空间实现对项目资源隔离。 (可选)创建企业项目 为RES工作
物品协同过滤作业名称。 表8 RecallFiled 参数 参数类型 描述 name String 字段名称。 value Integer 使用字段值的个数。 最小值:1 最大值:10 缺省值:1 表9 MatchFeaturePair 参数 参数类型 描述 user_feature_name
推荐结果多样性打散 本实践针对用户的单次推荐预测请求,在返回的物品列表中,对规定的属性进行打散,避免推荐结果出现同一属性物品扎堆出现的现象。 本实践的基本流程如下: 准备工作 创建数据源 配置在线服务参数 获取推荐结果 准备工作 已注册华为云帐号,并且账号为可用状态。 确保用户选
删除自定义场景 针对不再使用的自定义场景,您可以删除已释放资源。 前提条件 已存在创建成功的自定义场景。 删除自定义场景 登录RES管理控制台,在左侧导航栏中选择“推荐业务 > 自定义场景”,进入自定义场景列表页面。 选择自定义场景列表中的目标场景,单击“操作”列的“删除”。 在