检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
离线数据和近线实时数据如何配合使用? 在推荐系统初始化阶段,需要用户提供批量的离线数据源并按照推荐系统要求的数据格式上传至OBS,完成数据的检测和导入。 近线实时数据源推荐使用RES SDK上传,此操作所有的数据更新都是实时生效的。 父主题: 数据源
新建多个训练作业 功能介绍 批量新建作业。 调试 您可以在API Explorer中调试该接口。 URI POST /v2.0/{project_id}/workspaces/{workspace_id}/resources/{resource_id}/job-instances
数据质量 数据质量检测算子,是用户在进行离线计算之前使用原始初始格式数据(离线数据源中的离线数据)或者通用格式数据检测输入数据是否合法。包括离线数据中是否包含特殊字符,数据类型是否正确,是否缺少必备信息等。 前提条件 已将离线数据上传至OBS桶中。 创建数据质量作业 创建数据质量操作步骤如下:
和终端节点中查询所有服务的终端节点。 推荐系统的终端节点如表1所示,请您根据业务需要选择对应区域的终端节点。 表1 推荐系统的终端节点 区域名称 区域 终端节点(Endpoint) 华北-北京四 cn-north-4 res.cn-north-4.myhuaweicloud.com
该接口用于删除场景,删除之后不能恢复,请您谨慎操作。 训练作业 新建训练作业 新建训练作业元数据,新建成功之后可手动执行此任务。 新建多个训练作业 批量新建作业。 查询训练作业 查询resource_id(数据源id或场景id)下的指定类型的作业。 修改训练作业参数 修改指定作业的元数据信息。
需要和规范保持一致。 创建数据源之前您需要自己手工创建整理这些表并存储到OBS,推荐数据目前支持JSON格式。 离线数据为初次对接RES的批量数据,供场景中的召回算法和排序算法进行计算。近线数据可实时更新、增加用户和物品表数据,同时实时行为数据,可作为后续近线召回计算,这些近线行
对第一次训练无影响,仅影响任务重跑。 “是”:清空上一轮的模型结果后重新开始训练。 “否”:导入上一轮的训练结果继续训练。适用于欠拟合的情况。 批量大小 一次训练所选取的样本数。 训练数据集切分数量 将整个数据集切分成多个子数据集,依次训练,每个epoch训练一个子数据集。 DeepFM
URI-scheme:表示用于传输请求的协议,当前所有API均采用HTTPS协议。 Endpoint:指定承载REST服务端点的服务器域名或IP,不同服务不同区域的Endpoint不同,您可以从地区和终端节点中获取。例如RES服务在“华北-北京四”区域的Endpoint为“res
离线作业简介 RES提供了离线作业训练的功能,方便您根据业务需求查看作业结果并不断调整您的作业参数。您还可以基于离线作业得到的推荐候选集,用于在线服务计算得到推荐结果。RES提供了多种推荐离线作业功能,您可以直接使用得到满意的推荐候选集。 用户通过数据质量作业对离线数据进行质量检
产品功能 数据源 数据源功能可以在用户上传数据后,将离线数据源经过数据特征抽取,生成推荐系统内部通用的数据格式。经过数据质量检测来确保数据的合法性。提供数据源智能检测,输出数据分布和数据质量信息等,智能完成特征工程。 智能场景 根据业务场景选择对应的智能推荐场景,快速搭建专属推荐
查询数据源任务结果 功能介绍 查询指定数据源下离线任务的结果。其中包括数据格式,数据检测、数据探索及效果评估的内容。 调试 您可以在API Explorer中调试该接口。 URI GET /v2.0/{project_id}/workspaces/{workspace_id}/d
数据结构 当数据源创建完成,您可以进入数据源详情页面进行数据质量管理操作。数据质量管理操作可以将离线数据源经过数据特征抽取,生成推荐系统内部通用的数据格式。经过数据质量检测来确保数据的合法性。 数据结构介绍 数据结构步骤的主要目的是读取用户上传的离线数据,解析用户特征和物品特征中
修改或删除数据源 您可以对离线数据源进行重新编辑操作来更新数据源,如果该数据源不再使用,您可以删除数据源释放资源。 修改离线数据源 前提条件 已存在的离线数据源有修改或者更新并已经上传至OBS。 只有在数据源数据结构特征抽取人工复核确认之前才允许修改数据源。 注意事项 修改编辑之
early_stop_iterations 否 Integer 提前终止训练轮数。 最小值:1 最大值:1000 batch_size 否 Integer 批量大小。 最小值:1 dataset_split_parts 否 Integer 训练数据集切分数量。 最小值:1 最大值:10 restart_train
early_stop_iterations Integer 提前终止训练轮数。 最小值:1 最大值:1000 batch_size Integer 批量大小。 最小值:1 dataset_split_parts Integer 训练数据集切分数量。 最小值:1 最大值:10 restart_train
early_stop_iterations 否 Integer 提前终止训练轮数。 最小值:1 最大值:1000 batch_size 否 Integer 批量大小。 最小值:1 dataset_split_parts 否 Integer 训练数据集切分数量。 最小值:1 最大值:10 restart_train
early_stop_iterations 否 Integer 提前终止训练轮数。 最小值:1 最大值:1000 batch_size 否 Integer 批量大小。 最小值:1 dataset_split_parts 否 Integer 训练数据集切分数量。 最小值:1 最大值:10 restart_train
early_stop_iterations 否 Integer 提前终止训练轮数。 最小值:1 最大值:1000 batch_size 否 Integer 批量大小。 最小值:1 dataset_split_parts 否 Integer 训练数据集切分数量。 最小值:1 最大值:10 restart_train
early_stop_iterations 否 Integer 提前终止训练轮数。 最小值:1 最大值:1000 batch_size 否 Integer 批量大小。 最小值:1 dataset_split_parts 否 Integer 训练数据集切分数量。 最小值:1 最大值:10 restart_train
early_stop_iterations 否 Integer 提前终止训练轮数。 最小值:1 最大值:1000 batch_size 否 Integer 批量大小。 最小值:1 dataset_split_parts 否 Integer 训练数据集切分数量。 最小值:1 最大值:10 restart_train