检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
最大值:1000 batch_size Integer 批量大小。 最小值:1 dataset_split_parts Integer 训练数据集切分数量。 最小值:1 最大值:10 restart_train Boolean 重新训练。 表22 Initial 参数 参数类型 描述
数据导入 数据导入介绍 数据导入即读取经过“数据结构”生成的数据,对每条数据进行校验。推荐系统保留字段需校验类型和数据合法性、自定义字段校验类型,输出错误报告。如果数据完全符合要求,会生成推荐系统所需要的宽表和画像数据。 宽表:推荐系统内部格式,以行为数据为主,将行为数据中涉及到的用户数据和物品数据整合成一条数据。
数据探索 数据探索介绍 数据探索是针对当前数据源的数据进行挖掘和分析,主要聚焦在特征的分布范围、统计以及特征齐全度等,使用户能够更了解数据,进而指导在特征工程以及相关算法的配置。 数据探索是一个离线分析任务,任务有对应的启动时间,由于增量数据会实时入库,因此可以通过定时执行数据探索任务来覆盖增量数据。
最大值:1000 batch_size 否 Integer 批量大小。 最小值:1 dataset_split_parts 否 Integer 训练数据集切分数量。 最小值:1 最大值:10 restart_train 否 Boolean 重新训练。 表20 Initial 参数 是否必选 参数类型
最大值:1000 batch_size 否 Integer 批量大小。 最小值:1 dataset_split_parts 否 Integer 训练数据集切分数量。 最小值:1 最大值:10 restart_train 否 Boolean 重新训练。 表20 Initial 参数 是否必选 参数类型
最大值:1000 batch_size Integer 批量大小。 最小值:1 dataset_split_parts Integer 训练数据集切分数量。 最小值:1 最大值:10 restart_train Boolean 重新训练。 表22 Initial 参数 参数类型 描述
数据结构 当数据源创建完成,您可以进入数据源详情页面进行数据质量管理操作。数据质量管理操作可以将离线数据源经过数据特征抽取,生成推荐系统内部通用的数据格式。经过数据质量检测来确保数据的合法性。 数据结构介绍 数据结构步骤的主要目的是读取用户上传的离线数据,解析用户特征和物品特征中
参数类型 描述 offline String 离线计算规格。 nearline String 实时计算规格。 rank String 深度学习计算规格。 online_tps Integer 在线服务最大并发数。 请求示例 查询场景详情 /v2.0/testuuidxxxxxxx
描述 offline 是 String 离线计算规格。 nearline 否 String 实时计算规格。 rank 否 String 深度学习计算规格。 online_tps 否 Integer 在线服务最大并发数。 响应参数 状态码: 200 表6 响应Body参数 参数 参数类型
对用户行为进行过滤使之不进入候选集。 单击打开按钮,进行行为过滤设置。例如对于用户过去3天内有过曝光行为的物品过滤,使之不进入候选集。可以对曝光过但是有购买行为的物品进行排除,使之依旧在候选集里。 时间区间:指定用户行为时间,取值1-7,默认为1。 行为类型:指定行为类型,对有该行为类型的物品进行过滤。最多选五种。
推荐引擎和排序引擎有什么区别? 推荐引擎 推荐引擎是以推荐为业务逻辑的引擎,即系统根据配置生成召回集作为起点,输出推荐结果集为终点的引擎。 排序引擎 排序引擎是以排序为业务逻辑的引擎,即用户提供排序集为输入,系统根据排序算法输出排序结果的引擎。 父主题: 自定义场景
描述 offline 是 String 离线计算规格。 nearline 否 String 实时计算规格。 rank 否 String 深度学习计算规格。 online_tps 否 Integer 在线服务最大并发数。 响应参数 状态码: 200 表7 响应Body参数 参数 参数类型
离线数据源 调用RES之前,您需要准备3种基础数据包并上传至OBS,离线数据源目前支持CSV和JSON。具体数据包请参见表1 基础数据表。 表1 基础数据表 数据类型 表名 用户类数据 用户属性表 物品类数据 物品属性表 行为类数据 用户操作行为表 用户需要自己手工创建整理这些表并存储到OBS上。
上传实时数据 RES通过DIS SDK上传实时数据,用户实时日数据并做近线处理。当前仅支持Java语言的SDK,示例请参见《数据接入服务SDK参考》。 前提条件 如果需要使用近线上传实时数据的用户,可以使用DIS SDK接口上传,请您按照需求下载DIS SDK,下载完之后按照下面的说明进行SDK升级。
数据探索是什么?近线实时数据如何在数据探索中的报告体现? 数据探索是针对当前数据源的数据进行挖掘和分析,主要聚焦在特征的分布范围、统计以及特征齐全度等,使用户能够更了解数据,进而指导在特征工程以及相关算法的配置。 数据探索是一个离线分析任务,任务有对应的启动时间,由于近线实时数据
项目为单位进行授权,用户可以访问您账号中该区域的所有资源。如果您希望进行更加精细的权限控制,可以在区域默认的项目中创建子项目,并在子项目中购买资源,然后以子项目为单位进行授权,使得用户仅能访问特定子项目中资源,使得资源的权限控制更加精确。 图1 项目隔离模型 同样在我的凭证下,您可以查看项目ID。
离线数据和近线实时数据如何配合使用? 在推荐系统初始化阶段,需要用户提供批量的离线数据源并按照推荐系统要求的数据格式上传至OBS,完成数据的检测和导入。 近线实时数据源推荐使用RES SDK上传,此操作所有的数据更新都是实时生效的。 父主题: 数据源
参数类型 描述 offline String 离线计算规格。 nearline String 实时计算规格。 rank String 深度学习计算规格。 online_tps Integer 在线服务最大并发数。 请求示例 查询当前工作空间下的场景列表 /v2.0/testuui
提交数据质量作业API 功能介绍 该接口用于提交数据质量作业并进行离线计算。 URI POST /v1/{project_id}/data-quality 参数说明请参见表1。 表1 URI参数说明 名称 是否必选 类型 说明 project_id 是 String 项目编号,用
创建离线数据源 在使用RES之前,首先您需要创建一个数据源,后续的操作,如修改数据源、创建自定义推荐,都是基于您创建的数据源进行的。 前提条件 已创建用于存储数据的OBS桶及文件夹,并且数据存储的OBS桶与RES在同一区域。 需要使用的数据已上传至OBS。 创建数据源 登录RES