检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
数据导入介绍 数据导入即读取经过“数据结构”生成的数据,对每条数据进行校验。推荐系统保留字段需校验类型和数据合法性、自定义字段校验类型,输出错误报告。如果数据完全符合要求,会生成推荐系统所需要的宽表和画像数据。 宽表:推荐系统内部格式,以行为数据为主,将行为数据中涉及到的用户数据和物品数据整合成一条数据。
查询数据源列表 功能介绍 查询当前工作空间下的数据源列表。 调试 您可以在API Explorer中调试该接口。 URI GET /v2.0/{project_id}/workspaces/{workspace_id}/data-sources 表1 路径参数 参数 是否必选 参数类型
RES的离线数据源包括什么? 离线数据包括如下几张表: 用户属性表 物品属性表 用户操作行为表 每张表的字段描述和规范详情请参见《推荐系统用户指南》中准备离线数据源章节。 父主题: 数据源
文件为JSON格式,包含特征名、特征大类、特征值类型。 表1 全局特征信息文件字段描述 字段名 类型 描述 是否必选 user_features Array[Object] 用户特征,值为数组,其元素为json对象,参见表2。 是 item_features Array[Object]
、排序算法、在线服务都会用到该文件。全局特征信息文件需要和画像中字段一致,其中BASIC_INFO为画像表中定义的基本属性字段,TAGS为画像表中定义的带权重的标签,Context为上下文属性。该文件用于说明数据字段信息,以便推荐系统识别用户离线数据,通过特征工程将对应的数据写入
在推荐系统中,有一种常见的场景,最终推荐列表是否展示无库存或者已下架商品。针对此场景,RES系统在物品表中提供status字段来实现物品的上下架。 参考准备离线数据源中的物品表字段介绍,status置为0,代表该物品可被推荐。status置为1,代表该物品不可推荐,代替商品下架或者无货状态。此字段不为空时,在
请参见表1 基础数据表。 表1 基础数据表 数据类型 表名 用户类数据 用户属性表 物品类数据 物品属性表 行为类数据 用户操作行为表 用户需要自己手工创建整理这些表并存储到OBS上。 每张表的表结构必须符合推荐系统的要求,列名和字段类型需要和规范中保持一致(参考下面的表结构说明)。
被推送。 表1 物品数据中expireTime字段描述 字段名 类型 描述 是否必选 expireTime Long 失效时间,采用UTC标准时间,单位以秒计。当前服务器的时间大于该时间时,此物品将不会被推荐。如不设置,代表永不失效。 否 同时,expireTime字段和stat
请求参数暂不涉及。 响应消息 响应参数请参见表2。 表2 响应参数说明 参数名称 参数类型 说明 is_success Boolean 请求是否成功。 quotas object 请参见表3。 error_code String 请求失败时的错误码,请求成功时无此字段。 error_msg String
响应消息 响应参数请参见表2。 表2 响应参数说明 参数名称 是否必选 参数类型 说明 is_success 是 Boolean 是否成功。 message 是 String 提示消息。 error_code 是 String 请求失败时的错误码,请求成功时无此字段。 error_msg
准备相应的数据。 目前数据源只支持JSON格式,且单条数据长度不超过3000个字节。 用户数据 物品数据 行为数据 用户数据 表1 用户数据字段描述 字段名 类型 描述 是否必选 userId String 全局唯一用户ID。可输入的字符范围为1~64个字符。只能包含字母、数字、中划线、下划线和特殊字符(:
本实践针对用户的单次推荐预测请求,在返回的物品列表中,对规定的属性进行打散,避免推荐结果出现同一属性物品扎堆出现的现象。 本实践的基本流程如下: 准备工作 创建数据源 配置在线服务参数 获取推荐结果 准备工作 已注册华为云帐号,并且账号为可用状态。 确保用户选择的属性在物品表存在相应的字段属性,若不存在,统一按照默认(不打散)处理。
s,选中应用于兴趣属性。则在召回字段下拉栏中显示为“interested_tags”)。选中召回字段后,默认利用该字段中召回的字段值个数为1(可根据实际需求进行调整)。 限制1:1 <= 召回字段数量 <=5 限制2:1<= 召回字段中利用召回字段值的数量和 <=10 最大推荐结果数
通过DLF进行作业监控及任务异常重新启动 推荐系统提供了查询作业详情API接口,可返回作业详情。返回体中的作业状态字段“jobs.job_status”表示了当前任务的状态。 重新执行作业的API用来将任务以相同的配置重新执行一次。 通过查询作业详情API和重新执行作业的API可
请参见表9,算法参数。 表9 parameter参数说明 参数名称 是否必选 参数类型 说明 data_source 是 JSON 请参见表10,数据源参数。 实时流近线任务支持的推荐标准数据为用户操作行为表。 data_source_config 是 JSON 请参见表12,数据源参数配置。
在“test-data”文件夹下,将behavior.txt中的每条数据的actionTime字段的值修改到当前时间附近。将item.txt中的每条数据的publishTime字段的值修改到当前时间附近,将item.txt中的每条数据的expireTime字段的值修改成大于当前时间的值,避免数据因为过期被过滤掉。 查
响应消息 响应参数请参见表2。 表2 响应参数说明 参数名称 参数类型 说明 is_success Boolean 请求是否成功。 message String 成功响应的消息。 error_code String 请求失败时的错误码,请求成功时无此字段。 error_msg String
在线服务用来做线上推荐时的应用,每个服务之间是独立的。即根据不同的离线计算得到的候选集以及相关参数,提供不同的推荐服务。 表1 在线服务参数说明 参数名称 子参数 说明 召回池 “推荐候选集” “添加推荐候选集” 选择表名:添加离线、近线任务或者在线自定义检索召回策略生成的候选集进行融合。您可以单击添加推荐候选集,单击右侧的删除该候选集。
实时用户日志用于在实时流中对用户画像表进行写入。 表2 用户实时日志字段描述 字段名 类型 描述 是否必选 userId String 全局唯一用户ID。 是 BASICINFO Json 用户基本属性值。其中字段的值只能是数值型,字符串或字符串数组。 否 TAGS Json 用户的兴趣标签。其中字段的值只能是Map类型。
参数说明请参见表1。 表1 URI参数说明 名称 是否必选 类型 说明 project_id 是 String 项目编号,用于资源隔离。获取方法请参见获取项目ID。 job_id 是 String 训练作业ID。 请求消息 暂不涉及。 响应消息 响应参数请参见表2。 表2 响应参数说明