搜索_华为云

自然周期调度之同周期依赖原理 - 数据治理中心 DataArts Studio

置的依赖作业调度周期总结如图1所示。图1 同周期作业依赖关系全景图分钟依赖分钟规则：分钟是最小调度粒度，没有自然分钟周期的概念，依赖策略是往前推一个调度周期找依赖实例。举例1：A依赖B，为同周期分钟作业，在同一时间点，B执行完后开始执行A。图2 分钟依赖分钟举例一举例

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据开发进阶实践 > 周期调度依赖策略
通过API工具调用IAM认证方式的API - 数据治理中心 DataArts Studio

} } 图2 调用接口获取Token 获取返回的响应消息头Header中“x-subject-token”值，此即为用户Token。有了Token之后，您就可以在调用API的时候将Token加到请求消息头，从而通过身份认证，获得调用API的权限。图3 获取Token 调用API

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 调用数据服务API > 通过不同方式调用API
创建MRS Hive连接器 - 数据治理中心 DataArts Studio

在CDM集群管理界面，单击集群后的“作业管理”，选择“连接管理 > 新建连接”，进入连接器类型的选择界面，如图1所示。图1 选择连接器类型连接器类型选择“MRS Hive”后单击“下一步”，配置MRS Hive连接的参数，如图2所示。图2 创建MRS Hive连接单击“显示高级属性”可查看更多可选参数，这里保持默认，必填参数如下表所示。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 使用教程
配置MySQL源端参数 - 数据治理中心 DataArts Studio

作业拆分为多少个子作业执行。 - 按表分区抽取从MySQL导出数据时，支持从分区表的各个分区并行抽取数据。启用该功能时，可以通过下面的“表分区”参数指定具体的MySQL表分区。该功能不支持非分区表。数据库用户需要具有系统视图dba_tab_partitions和dba_ta

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
配置PostgreSQL/SQL Server源端参数 - 数据治理中心 DataArts Studio

是否允许分区字段包含空值。是按表分区抽取支持从分区表的各个分区并行抽取数据。启用该功能时，可以通过下面的“表分区”参数指定具体的表分区。该功能不支持非分区表。仅支持源端数据源为PostgreSQL时配置该参数。数据库用户需要具有系统视图dba_tab_partitions和db

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
通过API工具调用APP认证方式的API - 数据治理中心 DataArts Studio

的传值变化的静态参数，因此无需在调用时输入，不需要关注。图2 保存调用地址、请求方法和入参信息获取JavaScript SDK包在数据服务页面，单击左侧导航栏的“SDK”，然后下载JavaScript SDK。图3 下载JavaScript SDK 进行SDK包完整性校验

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 调用数据服务API > 通过不同方式调用API
补数据场景使用介绍 - 数据治理中心 DataArts Studio

WHERE DATE = ${DATE}) 图1 开发脚本脚本编写完成后，保存并提交此脚本的最新版本。开发一个补数据的批处理作业。开发作业时，您需要配置节点属性参数和调度周期。在数据开发主界面的左侧导航栏，选择“数据开发 > 作业开发”。图2 节点参数如果作业所关联的SQL脚

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
新建整库迁移作业 - 数据治理中心 DataArts Studio

st，则目的端表名只能选择test。图2 字段映射关系单击“下一步”配置任务参数。图3 任务参数各参数说明如表3所示。表3 任务配置参数参数说明取值样例同时执行的表个数抽取时并发执行的表的数量。 3 抽取并发数当前任务从源端进行读取最大线程数。说明：由于

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业
操作环境与数据准备 - 数据治理中心 DataArts Studio

BS桶与DataArts Studio实例中的CDM集群的所在区域保持一致，企业项目也应相同。您需要在图引擎GES服务控制台，创建一个图，用于将图数据导入其中，并进行可视化图形分析。GES与DataArts Studio实例中的CDM集群的所在区域保持一致，企业项目也应相同。数据源准备

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 图数据自动化构建与分析
MySQL到DWS参数调优 - 数据治理中心 DataArts Studio

MySQL到DWS参数调优源端优化 MySQL抽取优化。可通过在作业任务配置参数单击中“添加自定义属性”来新增MySQL同步参数。图1 添加自定义属性可使用的调优参数具体如下：表1 全量阶段优化参数参数名类型默认值说明 scan.incremental.snapshot

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
补数据场景使用介绍 - 数据治理中心 DataArts Studio

WHERE DATE = ${DATE}) 图1 开发脚本脚本编写完成后，保存并提交此脚本的最新版本。开发一个补数据的批处理作业。开发作业时，您需要配置节点属性参数和调度周期。在数据开发主界面的左侧导航栏，选择“数据开发 > 作业开发”。图2 节点参数如果作业所关联的SQL脚

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据开发进阶实践
步骤3：数据集成 - 数据治理中心 DataArts Studio

M首页。图1 集群列表 “创建来源”列仅通过DataArts Studio服务进入数据集成界面可以看到。在左侧导航栏中单击“集群管理”进入“集群管理”页面。然后，在集群列表中找到所需要的集群，单击“作业管理”。图2 集群管理进入作业管理后，选择“连接管理”。图3 连接管理

 帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程
配置Oracle源端参数 - 数据治理中心 DataArts Studio

是否允许分区字段包含空值。是按表分区抽取从Oracle导出数据时，支持从分区表的各个分区并行抽取数据。启用该功能时，可以通过下面的“表分区”参数指定具体的Oracle表分区。该功能不支持非分区表。数据库用户需要具有系统视图dba_tab_partitions和dba_t

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
约束与限制 - 数据治理中心 DataArts Studio

跳过重复文件实现），但不支持断点续传。例如要迁移3个文件，第2个文件迁移到一半时由于网络原因失败，再次启动迁移任务时，会跳过第1个文件，从第2个文件开始重新传，但不能从第2个文件失败的位置重新传。文件迁移时，单个任务支持千万数量的文件，如果待迁移目录下文件过多，建议拆分到不同目录并创建多个任务。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业）
购买数据集成资源组增量包 - 数据治理中心 DataArts Studio

单击已开通实例卡片上的“购买增量包”。图1 购买增量包方式二：选择实例，单击“进入控制台”。单击右上角“购买增量包”，进入购买DataArts Studio增量包页面。方式三：选择实例，单击“更多 > 资源管理”，进入资源管理页面。图2 进入资源管理在“实时资源管理”

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > 购买DataArts Studio增量包
Hive连接参数说明 - 数据治理中心 DataArts Studio

您需要先创建当前账号的访问密钥，并获得对应的AK和SK。登录控制台，在用户名下拉列表中选择“我的凭证”。进入“我的凭证”页面，选择“访问密钥 > 新增访问密钥”，如图1所示。图1 单击新增访问密钥单击“确定”，根据浏览器提示，保存密钥文件。密钥文件会直接保存到浏览器默认的下载文件夹中。打开名称为“credentials

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
（推荐）通过SDK调用APP认证方式的API - 数据治理中心 DataArts Studio

是不随API调用者的传值变化的静态参数，因此无需在调用时输入，不需要关注。图2 保存调用地址、请求方法和入参信息获取SDK包在数据服务页面，单击左侧导航栏的“SDK”，然后下载Java SDK。图3 下载SDK 进行SDK包完整性校验。Windows操作系统下，打开本地命

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 调用数据服务API > 通过不同方式调用API
MySQL同步到Kafka作业配置 - 数据治理中心 DataArts Studio

Kafka。图1 选择数据连接类型选择集成作业类型：同步类型默认为实时，同步场景包含整库和分库分表场景。图2 选择集成作业类型同步场景相关介绍请参见同步场景。配置网络资源：选择已创建的MySQL、DMS Kafka数据连接和已配置好网络连接的资源组。图3 选择数据连接及资源组

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
步骤2：数据准备 - 数据治理中心 DataArts Studio

页面。在“数据连接”页面，单击“创建数据连接”按钮。图1 数据连接在弹出窗口中，配置数据连接参数，完成配置后，单击“确定”完成数据连接的创建。此处创建MapReduce服务（MRS Hive）数据连接，参数配置如图2所示。数据连接类型：MapReduce服务（MRS Hive）。

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程
购买并管理专享版集群 - 数据治理中心 DataArts Studio

在物理机纳管场景下，如果物理机纳管网段与集群网段不一致，需要配置路由。进入集群“基本信息”页面，单击配置路由项的“新建”按钮，新增物理机的IP地址，如图2所示。图2 基本信息操作步骤购买数据服务专享集群增量包，系统会按照您所选规格自动创建一个数据服务专享集群。单击已开通实例卡片上的“购买增量包”。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 开发数据服务API

总条数： 456

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

自然周期调度之同周期依赖原理 - 数据治理中心 DataArts Studio

通过API工具调用IAM认证方式的API - 数据治理中心 DataArts Studio

创建MRS Hive连接器 - 数据治理中心 DataArts Studio

配置MySQL源端参数 - 数据治理中心 DataArts Studio

配置PostgreSQL/SQL Server源端参数 - 数据治理中心 DataArts Studio

通过API工具调用APP认证方式的API - 数据治理中心 DataArts Studio

补数据场景使用介绍 - 数据治理中心 DataArts Studio

新建整库迁移作业 - 数据治理中心 DataArts Studio

操作环境与数据准备 - 数据治理中心 DataArts Studio

MySQL到DWS参数调优 - 数据治理中心 DataArts Studio

补数据场景使用介绍 - 数据治理中心 DataArts Studio

步骤3：数据集成 - 数据治理中心 DataArts Studio

配置Oracle源端参数 - 数据治理中心 DataArts Studio

约束与限制 - 数据治理中心 DataArts Studio

购买数据集成资源组增量包 - 数据治理中心 DataArts Studio

Hive连接参数说明 - 数据治理中心 DataArts Studio

（推荐）通过SDK调用APP认证方式的API - 数据治理中心 DataArts Studio

MySQL同步到Kafka作业配置 - 数据治理中心 DataArts Studio

步骤2：数据准备 - 数据治理中心 DataArts Studio

购买并管理专享版集群 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线