检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
新建多个训练作业 功能介绍 批量新建作业。 调试 您可以在API Explorer中调试该接口。 URI POST /v2.0/{project_id}/workspaces/{workspace_id}/resources/{resource_id}/job-instances
algorithm_type 是 String 算法类型 UPDATE_INDEX_SCHEMA algorithm_parameters 是 JSON 算法参数。 UPDATE_INDEX_SCHEMA,请参见表6。 storage 是 JSON 请参见表5,存储平台。 offline_platform
专用Region。 可用区(AZ,Availability Zone):一个AZ是一个或多个物理数据中心的集合,有独立的风火水电,AZ内逻辑上再将计算、网络、存储等资源划分成多个集群。一个Region中的多个AZ间通过高速光纤相连,以满足用户跨AZ构建高可用性系统的需求。 图1阐明了区域和可用区之间的关系。
可用区(AZ,Availability Zone) 一个AZ是一个或多个物理数据中心的集合,有独立的风火水电,AZ内逻辑上再将计算、网络、存储等资源划分成多个集群。一个Region中的多个AZ间通过高速光纤相连,以满足用户跨AZ构建高可用性系统的需求。 项目 华为云的区域默认对应一个项目,这个项目由系统预置
创建离线数据源 在使用RES之前,首先您需要创建一个数据源,后续的操作,如修改数据源、创建自定义推荐,都是基于您创建的数据源进行的。 前提条件 已创建用于存储数据的OBS桶及文件夹,并且数据存储的OBS桶与RES在同一区域。 需要使用的数据已上传至OBS。 创建数据源 登录RES
情况。 批量大小 一次训练所选取的样本数。 训练数据集切分数量 将整个数据集切分成多个子数据集,依次训练,每个epoch训练一个子数据集。 融合多值特征 将多值特征的多个embedding融合成一个embedding。 融合线性部分 是否使用模型架构中的线性部分。 固定哈希结构
创建数据源 功能介绍 在指定的工作空间下面创建一个新的数据源。 调试 您可以在API Explorer中调试该接口。 URI POST /v2.0/{project_id}/workspaces/{workspace_id}/data-sources 表1 路径参数 参数 是否必选
数据探索是针对当前数据源的数据进行挖掘和分析,主要聚焦在特征的分布范围、统计以及特征齐全度等,使用户能够更了解数据,进而指导在特征工程以及相关算法的配置。 数据探索是一个离线分析任务,任务有对应的启动时间,由于近线实时数据会实时入库,因此可以通过定时执行数据探索任务来覆盖增量数据。 父主题: 数据源
选择功能,该功能指定为"keywords"。 响应消息 响应参数请参见表2。 表2 响应参数说明 参数名称 是否必选 参数类型 说明 result 是 String 一个由抽取出来的无序的关键词集合生成的字符串,以空格连接。 示例 请求示例 { "mode":"keywords", "title":[
用于在线服务计算得到推荐结果。 自定义场景功能说明 表1 功能说明 功能 说明 详细指导 创建自定义场景 自定义场景作为一个包含多个子任务的作业,通常用于多个召回、过滤、排序等任务。 创建自定义场景 召回策略 召回策略通过大数据计算或深度训练生成推荐候选集。 召回策略 过滤规则
推荐系统提供了重新执行作业的API,用来将任务以相同的配置重新执行一次,实现对离线任务生成结果的更新。以固定的周期定时调用此API,可保持结果处于一个较新的状态,以获得更好的推荐结果。 以上功能,我们也可以使用数据治理中心 DataArts Studio,通过拖拽的方式完成配置。具体操作步骤如下:
成,您可以通过效果评估检测推荐结果。 离线作业功能说明 表1 功能说明 离线作业 说明 详细指导 组合作业 组合作业作为一个包含多个子任务的作业,通常用于多个召回、过滤、排序等任务。 组合作业 数据质量 数据质量是用户在进行离线计算之前使用原始初始格式数据或者通用格式数据检测输入数据是否合法。
购买套餐包 套餐包说明 RES服务支持按需和购买套餐包,根据用户选择使用的资源进行收费。一个完整的推荐场景需要下面三种资源,均为必选项。套餐的数量可以根据实际业务按需购买。 计算资源:用于推荐作业的计算规格。涉及计费功能包含:数据源、自定义场景、智能场景中的离线计算和模型训练。
weight:该属性值的匹配权重,多个匹配条件做加权汇总后按分值从大到小给出候选集。 filter_info 搜索的过滤信息。 black_list:客体需要过滤的黑名单。 range:选定一个数值型属性(label),输出的候选集该值必须大于等于设定的值才不会被过滤掉。 category:选定一个字符串或
数据探索是针对当前数据源的数据进行挖掘和分析,主要聚焦在特征的分布范围、统计以及特征齐全度等,使用户能够更了解数据,进而指导在特征工程以及相关算法的配置。 数据探索是一个离线分析任务,任务有对应的启动时间,由于增量数据会实时入库,因此可以通过定时执行数据探索任务来覆盖增量数据。 操作步骤 在“执行步骤”页签
件夹,然后再进行数据的上传。创建OBS桶和上传文件夹的操作指导请参见创建桶和上传对象。 您在创建OBS桶时,需保证您的OBS桶与RES在同一个区域。 父主题: 数据源
的数据格式。经过数据质量检测来确保数据的合法性。 数据结构介绍 数据结构步骤的主要目的是读取用户上传的离线数据,解析用户特征和物品特征中每一个属性的数据格式、统计所有行为,然后保存解析生成的数据格式。 前提条件 已按照创建离线数据源操作指导完成数据源的创建。 操作步骤 登录RES
根据业务需要在下拉框中选择一个合适的策略。本章节以“基于交替最小二乘的矩阵分解推荐”为例进行创建,如图2所示。 图2 召回策略 表2 基于交替最小二乘的矩阵分解推荐参数说明 参数 说明 名称 根据业务自定义命名。 描述 根据业务自定义。例如,这是一个测试策略。 隐向量维度 在A
AK/SK认证:通过AK(Access Key ID)/SK(Secret Access Key)加密调用请求。 Token认证 Token的有效期为24小时,需要使用一个Token鉴权时,可以先缓存起来,避免频繁调用。 Token在计算机系统中代表令牌(临时)的意思,拥有Token就代表拥有某种权限。Tok
置调度的时间间隔。 基于UCB的召回策略 基于UCB的召回策略综合考虑了用户操作行为表中,物品发生的某几种行为类型及次数,然后给每一个物品都计算一个得分,最终返回得分最高的若干个物品。 表8 基于UCB的召回策略参数说明 参数名称 说明 名称 策略名称,由中文、英文、数字、下划线