检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
time_type 是 String 时间类型: day,天 week,周 month,月 is_monday_first 否 Boolean 周一是否是第一天。 表19 SampleParam 参数 是否必选 参数类型 描述 divide_type 是 String 训练集测试集划分方式:
可用区(AZ,Availability Zone) 一个AZ是一个或多个物理数据中心的集合,有独立的风火水电,AZ内逻辑上再将计算、网络、存储等资源划分成多个集群。一个Region中的多个AZ间通过高速光纤相连,以满足用户跨AZ构建高可用性系统的需求。 项目 华为云的区域默认对应一个项目,这个项目由系统预置
创建桶的区域需要与RES所在的区域一致。RES目前只支持华北-北京四区域。例如:当前RES在华北-北京四区域,在对象存储服务创建桶时,请选择华北-北京四。 前提条件 请您按推荐系统要求准备离线数据源。 开通OBS服务,确保您使用的OBS目录与RES在同一区域。 已经获取访问密钥(AK/SK)。
登录OBS管理控制台,创建OBS桶。例如,创建名称为“obs-res”的OBS桶。 创建桶的区域需要与RES所在的区域一致。例如:当前RES在华北-北京一区域,在对象存储服务创建桶时,请选择华北-北京一。 通过OBS创建用于存放数据的文件夹 推荐的OBS文件夹结构请参见推荐系统OBS文件夹规范。推荐
分流”之和必须是100%。 完成该项配置后,单击“下一步”进入规格确认页面,核对无误后,单击“完成”。当您通过在线服务列表查看在线服务的状态由“初始化”、“部署中”变更为“运行中”时即完成在线服务的部署。在线服务一般需要运行一段时间,根据您的数据量和资源不同,运行时间将耗时几分钟到几十分钟不等,请您耐心等待。
业得到推荐候选集,用于在线服务计算得到推荐结果。 自定义场景功能说明 表1 功能说明 功能 说明 详细指导 创建自定义场景 自定义场景作为一个包含多个子任务的作业,通常用于多个召回、过滤、排序等任务。 创建自定义场景 召回策略 召回策略通过大数据计算或深度训练生成推荐候选集。 召回策略
互关系,需要与这些云服务协同工作,因此需要您创建云服务委托,完成授权后将操作权限委托给RES,让RES以您的身份使用这些云服务,代替您进行一些任务调度、资源运维等工作。下次再进入RES管理控制台首页时,系统不会再弹出访问授权的对话框。 父主题: 准备工作
面向了解推荐算法等相关的用户,可自定义推荐中涉及算法的使用和组合,能够自定义开发推荐流程,提供推荐服务。 用户 推荐系统被推荐的对象,一般是指使用业务系统的客户。例如,某电商的客户。 物品 被推荐的内容,一般是指业务系统提供的给其用户的商品。例如,某视频网站的视频。 召回策略 召回策略是指通过大数据计算或深度训练生成推荐候选集的算法策略。
创建集群章节。 DIS创建通道操作详请参见数据接入服务用户指南> 入门> 步骤1:开通DIS通道章节。 CloudTable集群需要开启IAM统一身份认证。 创建资源完成后,创建的资源会展示在“资源中心”列表中,如图1所示。 图1 CloudTable资源信息 父主题: 管理资源
ble”,进入CloudTable产品页。单击“立即使用”,进入CloudTable管理控制台。 CloudTable集群需要开启IAM统一身份认证。 (可选)开通数据接入资源DIS 在使用推荐系统之前,数据接入服务(Data Ingestion Service,简称DIS)采集
调用接口有如下两种认证方式,您可以选择其中一种进行认证鉴权。 Token认证:通过Token认证通用请求。 AK/SK认证:通过AK(Access Key ID)/SK(Secret Access Key)加密调用请求。 Token认证 Token的有效期为24小时,需要使用一个Token鉴权时,可以先缓存起来,避免频繁调用。
组合作业作为一个包含多个子任务的作业,通常用于多个召回、过滤、排序等任务。 组合作业 数据质量 数据质量是用户在进行离线计算之前使用原始初始格式数据或者通用格式数据检测输入数据是否合法。 数据质量 特征工程 特征工程常用于抽取用户、物品的特征和特定算法的特征生成,一般作为某些算法的前置输入条件。
至对象存储服务(OBS)用于推荐系统的离线计算。 准备离线数据源 上传离线数据源至OBS 创建离线数据源 在使用RES之前,首先您需要创建一个数据源,后续的操作都是基于您创建的数据源进行的。 创建离线数据源 上传实时数据(可选) RES通过SDK上传实时数据,进行数据计算和处理,更新用户的相关数据。
已注册华为帐号并开通华为云,且在使用RES前检查账号状态,账号不能处于欠费或冻结状态。 已在OBS服务中创建桶和文件夹,用于存放样例数据。确保您使用的OBS目录与RES在同一区域。 使用自定义场景获取推荐结果的步骤如下所示: 步骤1:准备数据 步骤2:创建离线数据源 步骤3:创建自定义场景 步骤4:发布自定义场景
数据质量检测日志的保存路径。包括错误数据输出及定位等。 全局特征信息文件 用户在使用数据质量检测算子之前,需要提供一份全局的特征信息文件,后续的特征工程、排序算法、在线服务都会用到该文件。全局特征信息文件需要和画像中字段一致,其中BASIC_INFO为画像表中定义的基本属性字段,TAGS为画像表中定义的带权
至对象存储服务(OBS)用于推荐系统的离线计算。 准备离线数据源 上传离线数据源至OBS 创建离线数据源 在使用RES之前,首先您需要创建一个数据源,后续的操作都是基于您创建的数据源进行的。 创建离线数据源 上传实时数据(可选) RES通过SDK上传实时数据,进行数据计算和处理,更新用户的相关数据。
图1 修改在线服务参数 修改“过滤(黑名单)”下面的参数。 “实时行为过滤” :“开启”。 “时间区间(天)”:配置为1,即可实现过滤用户近一天(预测请求的时间点前推24h)内浏览或者曝光过的物品。 “行为类型”:配置“view”和“click”。 图2 配置过滤条件 配置完成后,单击“确认”。
获取访问密钥(AK/SK) 推荐作业有哪几种创建方式? 创建的场景是否会立即发布? 最小在线并发规格支持弹性伸缩,是否设置最小规格即可? 是否有样例数据支撑我进一步了解RES? 什么是区域、可用区? API查询列表的接口返回结果是否支持分页?
查询当前推荐系统所提供的离线计算规格,实时计算规格和排序模型训练规格。在创建数据源和场景时,需要提供此信息。 数据源 创建数据源 在指定的工作空间下面创建一个新的数据源。 查询数据源列表 查询当前工作空间下的数据源列表。 查询数据源详情 查询指定数据源的详情信息。 修改数据源内容 修改指定数据源的配置内容。
user_attributes 是 List 需过滤的用户的属性(现只支持string和numerical特征的属性),例如:一线城市用户,则属性名为city,属性值为一线城市。 item_attributes 是 List 需过滤的物品的属性(现只支持string和numerical特