搜索_华为云

新建整库迁移作业 - 数据治理中心 DataArts Studio

新建整库迁移作业操作场景 CDM支持在同构、异构数据源之间进行整库迁移，迁移原理与新建表/文件迁移作业相同，关系型数据库的每张表、Redis的每个键前缀、Elasticsearch的每个类型、MongoDB的每个集合都会作为一个子任务并发执行。整库迁移作业每次运行，会根据整库

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 在CDM集群中创建作业
新建作业 - 数据治理中心 DataArts Studio

新建作业作业由一个或多个节点组成，共同执行以完成对数据的一系列操作。开发作业前请先新建作业。前提条件作业在每个工作空间的最大配额为10000，作业目录最多5000个，目录层级最多为10层。请确保当前数量未达到最大配额。新建普通目录如果已存在可用的目录，则可以跳过当前操作。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
重启CDM集群 - 数据治理中心 DataArts Studio

您可以选择重启CDM服务进程或重启集群VM，选择完成并单击确认后即可完成集群重启操作。重启CDM服务进程：只重启CDM服务的进程，不会重启集群虚拟机。重启集群VM：业务进程会中断，并重启集群的虚拟机。父主题：创建并管理CDM集群

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 创建并管理CDM集群
配置HDFS目的端参数 - 数据治理中心 DataArts Studio

作业中目的连接为HDFS连接时，目的端作业参数如表1所示。表1 HDFS作为目的端时的作业参数参数名说明取值样例写入目录写入数据到HDFS服务器的目录。该参数支持配置为时间宏变量，且一个路径名中可以有多个宏定义变量。使用时间宏变量和定时任务配合，可以实现定期同步新增数据，详细说明请参见使用时间宏变量完成增量同步。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 在CDM集群中创建作业 > 配置CDM作业目的端参数
Hive连接参数说明 - 数据治理中心 DataArts Studio

时间卡住，可自定义operation超时时间（单位ms）。 Apache Hive Apache Hive连接适用于用户在本地数据中心或ECS上自建的第三方Hadoop，其中本地数据中心的Hadoop需通过专线连接。 Apache Hive的连接参数如表3所示。表3 Apache

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 在CDM集群中创建连接 > 配置连接参数
购买作业节点调度次数/天增量包 - 数据治理中心 DataArts Studio

购买作业节点调度次数/天增量包作业节点调度次数/天增量包用于扩充作业节点调度次数/天配额。不同版本的DataArts Studio实例，默认提供了不同的作业节点调度次数/天规格限制。该规格是以每天执行的数据开发作业、质量作业、对账作业、业务场景和元数据采集作业的调度次数之和计

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > 购买DataArts Studio增量包
DMS Kafka连接参数说明 - 数据治理中心 DataArts Studio

启用SSL认证后，Kafka会将Kafka Broker连接地址视做域名不断进行解析，导致性能消耗。建议修改CDM集群对应的ECS主机（通过集群IP查找对应的ECS主机）中的“/etc/hosts”文件，为其添加Broker连接地址的自映射，以便客户端能够快速解析实例的Broker。例如Kafka

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 在CDM集群中创建连接 > 配置连接参数
步骤2：数据准备 - 数据治理中心 DataArts Studio

步骤2：数据准备使用DataArts Studio前的准备如果您是第一次使用DataArts Studio，请参考购买并配置DataArts Studio章节完成注册华为账号、购买DataArts Studio实例（DataArts Studio企业版）、创建工作空间等一系列

 帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程
支持的数据源（2.9.2.200） - 数据治理中心 DataArts Studio

上表中非云服务的数据源，例如MySQL，既可以支持用户本地数据中心自建的MySQL，也可以是用户在ECS上自建的MySQL，还可以是第三方云的MySQL服务。整库迁移支持的数据源类型整库迁移适用于将本地数据中心或在ECS上自建的数据库，同步到云上的数据库服务或大数据服务中，适用于数据库离线迁移场景，不适用于在线实时迁移。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 支持的数据源
MRS Spark数据连接参数说明 - 数据治理中心 DataArts Studio

MRS Spark数据连接参数说明表1 MRS Spark数据连接参数是否必选说明数据连接类型是 MRS Spark连接固定选择为MapReduce服务（MRS Spark）。数据连接名称是数据连接的名称，只能包含字母、数字、下划线和中划线，且长度不超过100个字符。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
通过浏览器调用无认证方式的API - 数据治理中心 DataArts Studio

通过浏览器调用无认证方式的API 当无认证方式的API入参位置在Query或Path时，支持直接通过浏览器调用。无认证方式建议仅在测试接口时使用，不推荐正式使用。若调用方为不可信任用户，则存在数据库安全风险（如数据泄露、数据库高并发访问导致宕机、SQL注入等风险）。本章节以C

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 调用数据服务API > 通过不同方式调用API
配置离线处理集成作业 - 数据治理中心 DataArts Studio

配置离线处理集成作业数据集成支持创建离线作业，通过在界面勾选源端数据和目的端数据，并结合为其配置的参数，实现将源端单表、分库分表、整库的全量或增量数据周期性同步至目标数据表。本文为您介绍离线同步任务的常规配置，各数据源配置存在一定差异，请以配置作业源端参数及配置作业目的端参数为准。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 离线处理集成作业开发
开发实时处理单任务MRS Flink SQL作业 - 数据治理中心 DataArts Studio

开发实时处理单任务MRS Flink SQL作业对已新建的作业进行开发和配置。开发单任务模式的实时处理Flink SQL作业，请您参考开发SQL脚本、配置作业参数、保存作业和模板章节。前提条件已新建作业。当前用户已锁定该作业，否则需要通过“抢锁”锁定作业后才能继续开发作

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
Python - 数据治理中心 DataArts Studio

选择执行Python语句的主机。需确认该主机配有用于执行Python脚本的环境。须知： Shell或Python脚本可以在该ECS主机上运行的最大并发数由ECS主机的/etc/ssh/sshd_config文件中MaxSessions的配置值确定。请根据Shell或Python脚本

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
示例场景说明 - 数据治理中心 DataArts Studio

示例场景说明本示例是一个DataArts Studio全流程入门教程，旨在介绍如何在DataArts Studio平台完成端到端的全流程数据运营。本案例基于某市的出租车出行数据，选择MRS Hive作为数据湖底座，使用DataArts Studio实施全流程数据治理。期望通过实施数据治理达到以下目标：

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程
实时报警平台搭建 - 数据治理中心 DataArts Studio

实时报警平台搭建在本实践用户可以了解到如何搭建一个简单的实时报警平台，该平台将应用多个云服务，结合数据开发模块的作业编辑和作业调度功能来实现。假设客户有一个数据中心部署了很多应用，需要建立统一的运维系统，实时接收应用的告警信息。当告警级别达到严重及以上级别时，向用户发送一条消息。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践
导出导入作业 - 数据治理中心 DataArts Studio

导出导入作业导出作业，均是导出开发态的最新的已保存内容。导入作业，会覆盖开发态的内容并自动提交一个新版本。数据开发在跨时区导出导入作业时，需要手动修改expressionTimeZone字段为目标时区。导出作业参考访问DataArts Studio实例控制台，登录DataArts

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发 > （可选）管理作业
支持的数据源（2.9.3.300） - 数据治理中心 DataArts Studio

上表中非云服务的数据源，例如MySQL，既可以支持用户本地数据中心自建的MySQL，也可以是用户在ECS上自建的MySQL，还可以是第三方云的MySQL服务。整库迁移支持的数据源类型整库迁移适用于将本地数据中心或在ECS上自建的数据库，同步到云上的数据库服务或大数据服务中，适用于数据库离线迁移场景，不适用于在线实时迁移。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 支持的数据源
MRS Kafka数据连接参数说明 - 数据治理中心 DataArts Studio

MRS Kafka数据连接参数说明表1 MRS Kafka数据连接参数是否必选说明数据连接类型是 MRS Kafka连接固定选择为MapReduce服务（MRS Kafka）。数据连接名称是数据连接的名称，只能包含字母、数字、下划线和中划线，且长度不超过100个字符。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
MRS Clickhouse数据连接参数说明 - 数据治理中心 DataArts Studio

MRS Clickhouse数据连接参数说明表1 MRS Clickhouse数据连接参数是否必选说明数据连接类型是 MRS Clickhouse连接固定选择为MapReduce服务（MRS Clickhouse）。数据连接名称是数据连接的名称，只能包含字母、数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数

总条数： 224

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

新建整库迁移作业 - 数据治理中心 DataArts Studio

新建作业 - 数据治理中心 DataArts Studio

重启CDM集群 - 数据治理中心 DataArts Studio

配置HDFS目的端参数 - 数据治理中心 DataArts Studio

Hive连接参数说明 - 数据治理中心 DataArts Studio

购买作业节点调度次数/天增量包 - 数据治理中心 DataArts Studio

DMS Kafka连接参数说明 - 数据治理中心 DataArts Studio

步骤2：数据准备 - 数据治理中心 DataArts Studio

支持的数据源（2.9.2.200） - 数据治理中心 DataArts Studio

MRS Spark数据连接参数说明 - 数据治理中心 DataArts Studio

通过浏览器调用无认证方式的API - 数据治理中心 DataArts Studio

配置离线处理集成作业 - 数据治理中心 DataArts Studio

开发实时处理单任务MRS Flink SQL作业 - 数据治理中心 DataArts Studio

Python - 数据治理中心 DataArts Studio

示例场景说明 - 数据治理中心 DataArts Studio

实时报警平台搭建 - 数据治理中心 DataArts Studio

导出导入作业 - 数据治理中心 DataArts Studio

支持的数据源（2.9.3.300） - 数据治理中心 DataArts Studio

MRS Kafka数据连接参数说明 - 数据治理中心 DataArts Studio

MRS Clickhouse数据连接参数说明 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线