检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
因此,在使用RES之前您需要开通OBS服务并创建桶,然后在OBS桶中上传用户数据用于推荐作业的计算。 需要存放在OBS桶中的数据包括: 离线数据源:包含用户类数据,物品类数据,行为数据以及推荐候选列表。 黑名单和白名单:黑名单和白名单的过滤配置,便于用户快速得到有效数据。黑白名
数据源 准备离线数据源 需要您准备包含用户数据,物品数据,行为数据上传至对象存储服务(OBS)用于推荐系统的离线计算。 准备离线数据源 上传离线数据源至OBS 创建离线数据源 在使用RES之前,首先您需要创建一个数据源,后续的操作都是基于您创建的数据源进行的。 创建离线数据源 上传实时数据(可选)
绑定依赖资源 功能介绍 该接口用于绑定推荐系统所需的平台资源,绑定后可用于离线、近线、排序等作业的运行。 URI POST /v1/{project_id}/resources 参数说明请参见表1-URI参数说明。 表1 URI参数说明 名称 是否必选 类型 说明 project_id
工作空间简介 RES工作空间帮您实现离线作业、近线作业和在线服务隔离的功能,达到不同角色用户信息隔离管理的目的。 如果您未开通企业项目管理服务的权限,您可以在RES创建自己独立的工作空间。 如果你开通了企业项目管理服务的权限,可以在创建工作空间的时候绑定企业项目,并在企业项目下添
计费说明 计费项 RES服务根据用户使用的不同资源分别进行收费。 计费支持区域:华北-北京四。 由于RES使用的离线数据需存储在OBS中,数据存储产生的费用,请参见《OBS价格说明》。 表1 推荐系统计费项说明 计费项 说明 存储资源 应用于物品画像和用户画像的存储计费,对用户和物品的总条目数统计进行收费。
数据源 RES的离线数据源包括什么? 如何上传数据至OBS 如何上传实时数据? 离线数据和近线实时数据如何配合使用? 数据探索是什么?近线实时数据如何在数据探索中的报告体现? 如何确定近线数据源导入实时数据成功? 实时数据能否立即应用到推荐场景?
数据探索是针对当前数据源的数据进行挖掘和分析,主要聚焦在特征的分布范围、统计以及特征齐全度等,使用户能够更了解数据,进而指导在特征工程以及相关算法的配置。 数据探索是一个离线分析任务,任务有对应的启动时间,由于增量数据会实时入库,因此可以通过定时执行数据探索任务来覆盖增量数据。 操作步骤 在“执行步骤”页签,单
产品功能 数据源 数据源功能可以在用户上传数据后,将离线数据源经过数据特征抽取,生成推荐系统内部通用的数据格式。经过数据质量检测来确保数据的合法性。提供数据源智能检测,输出数据分布和数据质量信息等,智能完成特征工程。 智能场景 根据业务场景选择对应的智能推荐场景,快速搭建专属推荐
在推荐系统中,有一种常见的场景,最终推荐列表是否展示无库存或者已下架商品。针对此场景,RES系统在物品表中提供status字段来实现物品的上下架。 参考准备离线数据源中的物品表字段介绍,status置为0,代表该物品可被推荐。status置为1,代表该物品不可推荐,代替商品下架或者无货状态。此字段
获取访问密钥并添加RES全局配置 由于使用RES时,用户上传数据、进行离线计算等需要依赖其他服务,如果没有添加访问密钥则无法使用其他服务。因此,在使用RES前,您需要获取访问密钥并在RES管理控制台完成添加访问密钥的配置。 获取访问密钥 登录华为云,鼠标移动至页面右上方用户名,在
1],默认值为0.1。 lambda1 是 Double 叠加在模型的1范数之上,用来对模型值进行限制防止过拟合。取值范围[0,1],默认值为0。 lambda2 是 Double 叠加在模型的2范数之上,用来对模型值进行限制防止过拟合。取值范围[0,1],默认值为0。 learning_rate
提供多维度的场景推荐,含猜你喜欢、关联推荐、热门推荐,一键式操作,降低客户接入门槛。 近线处理能力 支持实时数据的接入和更新、模型在线学习,近线处理实时训练兴趣模型。 全面的推荐实体 支持以用户推荐物品、以用户推荐用户、以物品推荐物品、以物品推荐用户四种全面的推荐对象,用户根据场景选择不同的推荐实体。
ion)陆续发布,欢迎体验。 2020年9月 序号 功能名称 功能描述 阶段 相关文档 1 支持自定义行为类型 离线数据的行为类型支持自定义行为类型。 商用 准备离线数据源 数据结构 2020年6月 序号 功能名称 功能描述 阶段 相关文档 1 推荐系统2.0全新上线 推荐系统支
用户指南(旧版) 准备工作 RES操作流程 管理资源 全局配置 离线作业 近线作业 在线服务 服务总览信息 数据格式规范
数据格式规范 推荐系统OBS文件夹规范 离线数据源 实时日志 全局特征信息文件 父主题: 用户指南(旧版)
过查询ModelArts计算节点规格获取spec_id返回的值。 run_path 是 String 训练结果保存根路径,训练完成后,会将模型和日志文件保存在该路径下。不包含中文的文件夹。 training_data_path 是 String 训练数据的OBS路径。 test_data_path
BS路径下。 步骤2:创建离线数据源 数据下载并上传至OBS后,您需要创建一个数据源用于后续的计算。具体操作步骤如下: 登录RES管理控制台,在左侧菜单栏中选择“数据源”,进入“数据源”列表页面。 单击“创建”,在创建数据源页面,输入数据源名称,选择离线计算规格,然后单击选择数据的OBS存储路径。
load_widetable 否 Boolean 导入宽表(离线数据导入作业需要提供此参数)。 load_profile 否 Boolean 导入画像(离线数据导入作业需要提供此参数)。 save_mode 否 String 保留已有宽表(离线数据导入作业需要提供此参数): append,是
L1正则项系数(lambda1) 是 Double 叠加在模型的1范数之上,用来对模型值进行限制防止过拟合。取值范围[0,1],默认值为0。 L2正则项系数(lambda2) 是 Double 叠加在模型的2范数之上,用来对模型值进行限制防止过拟合。取值范围[0,1],默认值为0。 学习率(learning_rate)
object 计算规格配置。 表5 DataConfig 参数 是否必选 参数类型 描述 offline 是 Offline object 离线计算规格。 nearline 否 Nearline object 近线数据源。 表6 Offline 参数 是否必选 参数类型 描述 user_url