检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
离线作业 离线作业简介 组合作业 数据质量 特征工程 召回策略 排序策略 过滤规则 效果评估 管理离线作业 删除离线作业 父主题: 用户指南(旧版)
格。在创建数据源和场景时,需要提供此信息。 数据源 创建数据源 在指定的工作空间下面创建一个新的数据源。 查询数据源列表 查询当前工作空间下的数据源列表。 查询数据源详情 查询指定数据源的详情信息。 修改数据源内容 修改指定数据源的配置内容。 修改数据源特征 修改数据源中的特征。
训练集测试集划分方式 数据划分方式按时间比例或个数比例划分训练集测试集。 “时间比例”:将全部数据的时间跨度按照时间比例划分成两段数据,训练数据为前一段时间中的数据,测试数据为后一段时间的数据,取值TIME。 “个数比例”:个数比例是将全部数据按个数比例随机划分成训练集和测试集传入值。取值RAMDOM。
是否需要重新执行任务。 以上功能,我们也可以使用数据治理中心 DataArts Studio,通过拖拽的方式完成配置。具体操作步骤如下: 登录数据治理中心 DataArts Studio管理控制台,在控制台的左侧导航栏,选择“数据开发 > 作业开发”。 在“工作区”页面的右侧,单击“新建作业”。
load_widetable 否 Boolean 导入宽表(离线数据导入作业需要提供此参数)。 load_profile 否 Boolean 导入画像(离线数据导入作业需要提供此参数)。 save_mode 否 String 保留已有宽表(离线数据导入作业需要提供此参数): append,是 new,否
String 平台名称,现支持CloudTable。 platform_parameter 是 JSON 请参见表29,数据存储参数。 表29 platform_parameter 参数说明 参数名称 是否必选 参数类型 说明 cluster_id 是 String 集群ID。 table_name
AutoGroup,AutoGroup作业 StreamRank,在线训练作业 DataStruct,识别数据结构作业 DataExploration,数据探索作业 DataImport,离线数据导入作业 Evaluate,效果评估作业 schedule 否 String 调度参数 表4 jobConfig
参数别名:用户指定参数别名应用于指标公式。 行为类型:选择需要进行评估的行为类型,如物品曝光。 阈值:阈值是用来衡量用户行为有效性的标准, 当数据源的actionMeasure的值大于阈值时, 当前用户行为有效。 去重:您可以单击勾选,根据用户对行为记录去重。 指标设置 指标名称:请您定义评估的指标名称。
查询工作空间详情 √ √ 查询工作空间列表 √ √ 修改工作空间 √ x 删除工作空间 √ x 新增数据源 √ x 查询数据源详情 √ √ 查询数据源列表 √ √ 修改数据源 √ x 删除数据源 √ x 新增场景 √ x 查询场景 √ √ 查询场景列表 √ √ 修改场景 √ x 删除场景
本实践的基本流程如下: 准备工作 创建数据源 配置在线服务参数 获取推荐结果 准备工作 已注册华为云帐号,并且账号为可用状态。 确保用户选择的属性在物品表存在相应的字段属性,若不存在,统一按照默认(不打散)处理。 用户已经创建自定义场景或新建自定义场景过程中。 创建数据源 参考数据源管理进行创建。 配置“在线服务”参数
API 在线服务 场景 工作空间 数据源 查询规格 训练作业 调度
查询训练规格 功能介绍 查询当前推荐系统所提供的离线计算规格,实时计算规格和排序模型训练规格。在创建数据源和场景时,需要提供此信息。 调试 您可以在API Explorer中调试该接口。 URI GET /v2.0/{project_id}/resource-specs 表1 路径参数
计费相关 如何查看RES正在收费的作业? 如何查看RES消费详情? 数据源如何收费? 智能场景和自定义场景如何收费?
作业相关API 提交组合作业 提交召回作业 提交过滤作业 提交特征工程作业 提交排序作业 提交实时流近线作业 提交流式训练作业 提交数据质量作业 策略参数说明 停止算子作业 查询作业列表 查询作业详情 重新执行作业 删除作业 提交效果评估任务 查询效果指标 编辑修改作业 更新索引结构
基础问题 什么是RES? 与其他云服务的关系 如何开始使用RES? 获取访问密钥(AK/SK) 推荐作业有哪几种创建方式? 创建的场景是否会立即发布? 最小在线并发规格支持弹性伸缩,是否设置最小规格即可? 是否有样例数据支撑我进一步了解RES? 什么是区域、可用区? API查询列表的接口返回结果是否支持分页?
创建工作空间 功能介绍 用于在推荐系统下面创建独立的工作空间,用于资源的隔离,用户可以在工作空间下面继续创建数据源、场景以及推荐任务等。是否有工作空间的操作权限取决于用户是否属于当前工作空间绑定的企业项目。 调试 您可以在API Explorer中调试该接口。 URI POST /v2
资源。 根据企业用户的职能,设置不同的访问权限,以达到用户之间的权限隔离。 将RES资源委托给更专业、高效的其他华为云帐号或者云服务,这些账号或者云服务可以根据权限进行代运维。 如果华为云帐号已经能满足您的要求,不需要创建独立的IAM用户,您可以跳过本章节,不影响您使用RES服务的其它功能。
计算引擎信息,选择指定服务名、集群名称、任务配置地址、资源名等信息。 数据源 数据源类型有初始格式和通用格式可以选择。 “初始格式” 用户操作行为表:初始数据中的用户操作行为表。 “通用格式” 通用格式数据:特征工程“初始用户画像-物品画像-标准宽表生成”算子生成的用户推荐系统的数据。从用户特征表
“否”:导入上一轮的训练结果继续训练。适用于欠拟合的情况。 批量大小 一次训练所选取的样本数。 训练数据集切分数量 将整个数据集切分成多个子数据集,依次训练,每个epoch训练一个子数据集。 DeepFM DeepFM,结合了FM和深度神经网络对于特征表达的学习,同时学习高阶和低阶特
创建离线数据源 上传实时数据(可选) RES通过SDK上传实时数据,进行数据计算和处理,更新用户的相关数据。 上传实时数据 数据质量管理 数据质量管理操作可以将数据源经过数据特征抽取,生成推荐系统内部通用的数据格式。 数据质量管理 选择并配置推荐业务 智能场景 针对对应的场景,由RE