搜索_华为云

编排API简介 - 数据治理中心 DataArts Studio

编排API简介数据服务API编排是指将已经开发好的服务API接口，在无需编写复杂代码的情况下，根据特定的业务逻辑和流程进行可视化的重组和重构，从而实现在不影响原生接口的前提下进行简便的二次开发。API编排为您提供拖拽式、可视化的API工作流程编排能力，您可以按照业务逻辑，以串行

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 开发数据服务API > 编排API
新建作业 - 数据治理中心 DataArts Studio

新建作业作业由一个或多个节点组成，共同执行以完成对数据的一系列操作。开发作业前请先新建作业。前提条件作业在每个工作空间的最大配额为10000，作业目录最多5000个，目录层级最多为10层。请确保当前数量未达到最大配额。新建普通目录如果已存在可用的目录，则可以跳过当前操作。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
步骤1：流程设计 - 数据治理中心 DataArts Studio

步骤1：流程设计本入门指南以某市出租车出行数据为例，统计某出租车供应商2017年度的运营数据。基于需求分析和业务调研，数据治理业务流程设计如图1所示，后续的数据治理操作均基于本业务流程完成。图1 流程设计需求分析通过需求分析，可以提炼出数据治理流程的实现框架，支撑具体数据治理实施流程的设计。

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程
迁移作业原理 - 数据治理中心 DataArts Studio

迁移作业原理数据迁移模型 CDM数据迁移时，简化的迁移模型如图1所示。图1 CDM数据迁移模型 CDM通过数据迁移作业，将源端数据迁移到目的端数据源中。其中，主要运行逻辑如下：数据迁移作业提交运行后，CDM会根据作业配置中的“抽取并发数”参数，将每个作业拆分为多个Task，即作业分片。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 优化迁移性能
性能调优 - 数据治理中心 DataArts Studio

性能调优概述根据数据迁移模型分析，除了源端读取速度、目的端写入性能、带宽优化外，您也可以通过如下方式优化作业迁移速度：使用大规格CDM集群不同规格的CDM集群网卡带宽、集群最大抽取并发数等有所差异。如果您有较高的迁移速度需求，或当前CDM集群的CPU使用率、磁盘使用率、内

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 优化迁移性能
文件增量迁移 - 数据治理中心 DataArts Studio

文件增量迁移 CDM支持对文件类数据源进行增量迁移，全量迁移完成之后，第二次运行作业时可以导出全部新增的文件，或者只导出特定的目录/文件。目前CDM支持以下文件增量迁移方式：增量导出指定目录的文件适用场景：源端数据源为文件类型（OBS/HDFS/FTP/SFTP）。这种增量

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导 > 增量迁移原理介绍
配置API调用流控策略 - 数据治理中心 DataArts Studio

配置API调用流控策略操作场景 DataArts Studio数据服务的API流量控制基于指定规则对API的访问流量进行调节控制的限流策略，能够提供多种维度的后端服务保护功能。当前API流控支持通过用户、应用和时间段等不同维度限制API的调用次数。为了提供持续稳定的服务，您需

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 开发数据服务API
创建CDM与数据源之间的连接 - 数据治理中心 DataArts Studio

创建CDM与数据源之间的连接操作场景用户在创建数据迁移的任务前，需要先创建连接，让CDM集群能够读写数据源。一个迁移任务，需要建立两个连接，源连接和目的连接。不同的迁移方式（表或者文件迁移），哪些数据源支持导出（即作为源连接），哪些数据源支持导入（即作为目的连接），详情请参见支持的数据源。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接
PostgreSQL到DWS参数调优 - 数据治理中心 DataArts Studio

PostgreSQL到DWS参数调优源端优化 SQLServer抽取优化暂无优化配置项。目的端优化 DWS写入优化可通过在DWS的目的端配置中修改写入相关配置，且可以通过单击高级配置的“查看编辑”按钮，添加高级属性。图1 添加高级属性表1 DWS写入优化参数参数名类型

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
Oracle到DWS参数调优 - 数据治理中心 DataArts Studio

Oracle到DWS参数调优源端优化 Oracle抽取优化暂无优化配置项。目的端优化 DWS写入优化可通过在DWS的目的端配置中修改写入相关配置，且可以通过单击高级配置的“查看编辑”按钮，添加高级属性。图1 添加高级属性表1 DWS写入优化参数参数名类型默认值说明

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
文件增量迁移 - 数据治理中心 DataArts Studio

文件增量迁移 CDM支持对文件类数据源进行增量迁移，全量迁移完成之后，第二次运行作业时可以导出全部新增的文件，或者只导出特定的目录/文件。目前CDM支持以下文件增量迁移方式：增量导出指定目录的文件适用场景：源端数据源为文件类型（OBS/HDFS/FTP/SFTP）。这种增量

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践 > 增量迁移原理介绍
步骤2：数据准备 - 数据治理中心 DataArts Studio

步骤2：数据准备使用DataArts Studio前的准备如果您是第一次使用DataArts Studio，请参考购买并配置DataArts Studio章节完成注册华为账号、购买DataArts Studio实例（DataArts Studio企业版）、创建工作空间等一系列

 帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程
新增字段操作指导 - 数据治理中心 DataArts Studio

新增字段操作指导操作场景作业参数配置完成后，将进行字段映射的配置，您可以通过字段映射界面的可自定义新增字段。如果是文件类数据源（FTP/SFTP/HDFS/OBS）之间相互迁移数据，且源端“文件格式”配置为“二进制格式”（即不解析文件内容直接传输），则没有字段映射这一步骤。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导
管理文件水印 - 数据治理中心 DataArts Studio

管理文件水印本章主要介绍如何进行文件水印相关操作。对结构化数据文件（csv、xml和json）注入暗水印，水印内容不可见，需要进行水印提取。对非结构化数据文件（docx、pptx、xlsx和pdf）注入明水印，可在本地打开文件，查看水印内容。约束与限制结构化数据文件暗水

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据保护
CDM作业配置管理 - 数据治理中心 DataArts Studio

CDM作业配置管理 CDM作业管理界面的“配置管理”页签，主要操作如下：最大抽取并发数定时备份/恢复作业参数的环境变量最大抽取并发数最大抽取并发数即集群最大抽取并发数。此处的“最大抽取并发数”参数与集群配置处的“最大抽取并发数”参数同步，在任意一处修改即可生效。 CD

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业
构造请求 - 数据治理中心 DataArts Studio

构造请求本节介绍REST API请求的组成，并以调用IAM服务的管理员创建IAM用户接口为例说明如何调用API。该API用于管理员创建IAM用户。您还可以通过这个视频教程了解如何构造请求调用API：https://bbs.huaweicloud.com/videos/102987

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 如何调用API
ORACLE数据连接参数说明 - 数据治理中心 DataArts Studio

ORACLE数据连接参数说明表1 Oracle数据连接参数是否必选说明数据连接类型是 ORACLE连接固定选择为ORACLE。数据连接名称是数据连接的名称，只能包含字母、数字、下划线和中划线，且长度不超过100个字符。标签否标识数据连接的属性。设置标签后，便于统一管理。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
新增字段操作指导 - 数据治理中心 DataArts Studio

新增字段操作指导操作场景作业参数配置完成后，将进行字段映射的配置，您可以通过字段映射界面的可自定义新增字段。如果是文件类数据源（FTP/SFTP/HDFS/OBS）之间相互迁移数据，且源端“文件格式”配置为“二进制格式”（即不解析文件内容直接传输），则没有字段映射这一步骤。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
新增字段操作指导 - 数据治理中心 DataArts Studio

新增字段操作指导操作场景作业参数配置完成后，将进行字段映射的配置，您可以通过字段映射界面的可自定义新增字段。如果是文件类数据源（FTP/SFTP/HDFS/OBS）之间相互迁移数据，且源端“文件格式”配置为“二进制格式”（即不解析文件内容直接传输），则没有字段映射这一步骤。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业）
下载中心 - 数据治理中心 DataArts Studio

下载中心数据开发模块对于SQL脚本执行的结果支持直接下载和转储。SQL执行结果进行下载和转储后，可以通过下载中心查看下载和转储的结果。约束与限制仅SQL脚本和单任务SQL作业运行完成并且返回结果后，执行下载和转储，在下载中心生成记录，可以查看下载和转储的结果。下载中心下

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发

总条数： 493

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

编排API简介 - 数据治理中心 DataArts Studio

新建作业 - 数据治理中心 DataArts Studio

步骤1：流程设计 - 数据治理中心 DataArts Studio

迁移作业原理 - 数据治理中心 DataArts Studio

性能调优 - 数据治理中心 DataArts Studio

文件增量迁移 - 数据治理中心 DataArts Studio

配置API调用流控策略 - 数据治理中心 DataArts Studio

创建CDM与数据源之间的连接 - 数据治理中心 DataArts Studio

PostgreSQL到DWS参数调优 - 数据治理中心 DataArts Studio

Oracle到DWS参数调优 - 数据治理中心 DataArts Studio

文件增量迁移 - 数据治理中心 DataArts Studio

步骤2：数据准备 - 数据治理中心 DataArts Studio

新增字段操作指导 - 数据治理中心 DataArts Studio

管理文件水印 - 数据治理中心 DataArts Studio

CDM作业配置管理 - 数据治理中心 DataArts Studio

构造请求 - 数据治理中心 DataArts Studio

ORACLE数据连接参数说明 - 数据治理中心 DataArts Studio

新增字段操作指导 - 数据治理中心 DataArts Studio

新增字段操作指导 - 数据治理中心 DataArts Studio

下载中心 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线