检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
数据探索是什么?近线实时数据如何在数据探索中的报告体现? 数据探索是针对当前数据源的数据进行挖掘和分析,主要聚焦在特征的分布范围、统计以及特征齐全度等,使用户能够更了解数据,进而指导在特征工程以及相关算法的配置。 数据探索是一个离线分析任务,任务有对应的启动时间,由于近线实时数据
batch模式计算速度快于full模式。 重新训练 对第一次训练无影响,仅影响任务重跑。 “是”:清空上一轮的模型结果后重新开始训练。 “否”:导入上一轮的训练结果继续训练。适用于欠拟合的情况。 批量大小 一次训练所选取的样本数。 训练数据集切分数量 将整个数据集切分成多个子数据集,依
调用RES之前,您需要准备3种基础数据包并上传至OBS,离线数据源目前支持CSV和JSON。具体数据包请参见表1 基础数据表。 表1 基础数据表 数据类型 表名 用户类数据 用户属性表 物品类数据 物品属性表 行为类数据 用户操作行为表 用户需要自己手工创建整理这些表并存储到OBS上。 每张表的表结构必须
的RS单元数量提升性能。 数据源 初始格式 选择提前已经存储在OBS上的如下数据源: 用户属性表 物品属性表 用户操作行为表 如上数据表的数据格式规范请参见离线数据源。 在对应表的“数据源”列中,单击选择数据的OBS存储路径。 在对应表的“数据格式”列中,数据格式可选:csv/json。
建议选择推荐候选集。 容错 容错用于数据请求异常时的固定人工输出召回集。需要在离线作业创建召回策略进行人工策略的计算。单击“选择”获取人工导入策略的任务别名和UUID。 离线过滤 过滤 过滤数据来源于过滤规则产生的候选集,单击“选择”获取过滤的任务别名和UUID。 在线过滤 【去重】物品属性
60字符。 rules 是 List 每个Flow配置不同流量和候选集的规则,请参见表4。 backup_uuid 否 String 人工导入召回策略生成的uuid。 need_preferences 否 Boolean 是否开启优选项功能,需匹配global_features_
重,可做修改。同时支持自定义行为类型。 如果当前场景只有用户关注人这一种行为,则此参数表示用户关注的对象是人。 如果当前场景只有用户关注物品这一种行为,则此参数表示用户关注的对象是物品。 说明: 自定义行为类型,行为名称需要符合以下要求,由数字、字母、下划线组成,长度为4-32。
到针对性的推荐效果提升。 前提条件 已经存在创建成功并完成数据探索的数据源。 由于训练作业运行需消耗资源,确保账户未欠费。 确保您使用的OBS目录与RES在同一区域。 基本信息 登录RES管理控制台,在左侧导航栏中选择“推荐业务>自定义场景”,默认进入“自定义场景”列表。 在自定
子任务 说明 详细指导 数据源 准备离线数据源 需要您准备包含用户数据,物品数据,行为数据上传至对象存储服务(OBS)用于推荐系统的离线计算。 准备离线数据源 上传离线数据源至OBS 创建离线数据源 在使用RES之前,首先您需要创建一个数据源,后续的操作都是基于您创建的数据源进行的。
管理属性配置 属性配置以键值对的方式进行存储,配置后的配置项可以用于整个服务。该配置项的值为用户指定的OBS路径,OBS相关操作请参见创建OBS桶。 前提条件 已开通OBS服务,并按照推荐系统OBS文件夹规范建议格式创建文件夹。 已上传离线数据。 创建场景 您可以根据自己的业务创建场景进行
推荐系统提供了REST(Representational State Transfer)风格API,支持您通过HTTPS请求调用,调用方法请参见如何调用API。 父主题: 使用前必读
如修改数据源、创建自定义推荐,都是基于您创建的数据源进行的。 前提条件 已创建用于存储数据的OBS桶及文件夹,并且数据存储的OBS桶与RES在同一区域。 需要使用的数据已上传至OBS。 创建数据源 登录RES管理控制台,在左侧菜单栏中选择“数据源”,进入“数据源”列表页面。 单
cluster_name 是 String 集群名称。 status 否 String 集群状态。 is_register 否 Boolean 是否注册。 示例 成功响应示例 { "is_success": true, "connections": [ {
cluster_name 是 String 集群名称。 status 否 String 集群状态。 is_register 否 Boolean 是否注册。 示例 成功响应示例 { "is_success": true, "clusters": [ {
请联系管理员检查IAM服务功能是否正常。 500 RES.3206 OBS Error 创建桶失败 请联系管理员检查OBS服务功能是否正常。 500 RES.3207 IAM Error 获取资源租户信息失败 请联系管理员检查IAM服务功能是否正常。 500 RES.3208 OBS Error 无法在桶中找到url
计费项 RES服务根据用户使用的不同资源分别进行收费。 计费支持区域:华北-北京四。 由于RES使用的离线数据需存储在OBS中,数据存储产生的费用,请参见《OBS价格说明》。 表1 推荐系统计费项说明 计费项 说明 存储资源 应用于物品画像和用户画像的存储计费,对用户和物品的总条目数统计进行收费。
user_features Array[Object] 用户特征,值为数组,其元素为json对象,参见表2。 是 item_features Array[Object] 物品特征,值为数组,其元素为json对象,参见表2。 是 表2 全局特征信息文件示例表 字段名 类型 描述 是否必选 feature_name
userId String 用户ID。 是 objectType String 发生行为对象的类型, item是用户和商品本身发生的行为。 是 actionObject String 对应行为发生的对象的值,如果是和商品发生关系:则是商品的id(itemId)的值。 是 actionType
是否必选 参数类型 说明 is_success 是 Boolean 是否成功。 jobs 是 List 请参见表3,返回的作业信息。 total_items 是 Integer 作业总条数。 表3 jobs参数说明 参数名称 是否必选 参数类型 说明 job_id 是 String 训练作业ID。
/v2.0/{project_id}/workspaces/{workspace_id}/resources/{resource_id}/jobs/{job_id}/schedule-job 表1 路径参数 参数 是否必选 参数类型 描述 job_id 是 String 作业id。 project_id