搜索_华为云

PostgreSQL/SQLServer连接参数说明 - 数据治理中心 DataArts Studio

连接PostgreSQL/SQLServer时，相关参数如表1所示，金仓和GaussDB数据源可通过PostgreSQL连接器进行连接，支持的迁移作业的源端、目的端情况与PostgreSQL数据源一致。作业运行中禁止修改密码或者更换用户。在作业运行过程中修改密码或者更换用户，密码不会立即生效且作业会运行失败。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
配置HBase/CloudTable目的端参数 - 数据治理中心 DataArts Studio

配置HBase/CloudTable目的端参数作业中目的连接为HBase连接或CloudTable连接时，即导入数据到以下数据源时，目的端作业参数如表1所示。表1 HBase/CloudTable作为目的端时的作业参数参数名说明取值样例表名写入数据的HBase表名。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业目的端参数
迁移文件时加解密 - 数据治理中心 DataArts Studio

目前只支持AES-256-GCM（NoPadding）。该加密算法在目的端为加密，在源端为解密，支持的源端与目的端数据源如下。源端支持的数据源：HDFS（使用二进制格式传输时支持）。目的端支持的数据源：HDFS（使用二进制格式传输时支持）。下面分别以HDFS导出加密文件时解密、导入文件到HDFS

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
文件增量迁移 - 数据治理中心 DataArts Studio

文件增量迁移 CDM支持对文件类数据源进行增量迁移，全量迁移完成之后，第二次运行作业时可以导出全部新增的文件，或者只导出特定的目录/文件。目前CDM支持以下文件增量迁移方式：增量导出指定目录的文件适用场景：源端数据源为文件类型（OBS/HDFS/FTP/SFTP）。这种增量

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导 > 增量迁移原理介绍
解绑/绑定CDM集群的EIP - 数据治理中心 DataArts Studio

Cloud，简称VPC）负责其计费。如果CDM需要访问本地数据源、Internet的数据源，或者跨VPC的云服务，则必须要为CDM集群绑定一个弹性IP，或者使用NAT网关让CDM集群与其他弹性云服务器共享弹性IP访问Internet，具体操作请见添加SNAT规则。如果用户对本地数据源的访问通道做了SSL加密，则CDM无法通过弹性IP连接数据源。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 创建并管理CDM集群
数仓规划 - 数据治理中心 DataArts Studio

SDI：Source Data Integration，又称贴源数据层。SDI是源系统数据的简单落地。 DWI：Data Warehouse Integration，又称数据整合层。DWI整合多个源系统数据，对源系统进来的数据进行整合、清洗，并基于三范式进行关系建模。物理模型设计时的考虑事项如下：

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 模型设计
CDM迁移作业的抽取并发数应该如何设置？ - 数据治理中心 DataArts Studio

CDM迁移作业的抽取并发数应该如何设置？ CDM通过数据迁移作业，将源端数据迁移到目的端数据源中。其中，主要运行逻辑如下：数据迁移作业提交运行后，CDM会根据作业配置中的“抽取并发数”参数，将每个作业拆分为多个Task，即作业分片。不同源端数据源的作业分片维度有所不同，因此某些作业可能出现未严格按作业“抽取并发数”参数分片的情况。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
实时作业概述 - 数据治理中心 DataArts Studio

功能概述实时集成作业支持多种数据源、多种场景下的实时数据同步，用户可根据自主需求，一次性全量加实时增量同步多个库表，功能总览如下图所示。图2 功能总览图表1 基本功能功能描述多种数据源间的数据同步支持多种数据源链路组合，您可以将多种输入及输出数据源搭配组成同步链路进行数据同步。详情请参见支持的数据源。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业）
迁移作业原理 - 数据治理中心 DataArts Studio

对于消息而言，消息内容越多，所占带宽越高，每秒事务（TPS）越低。源端读取速度取决于源端数据源的性能。如需优化，请参见源端数据源的相关说明文档。网络带宽 CDM集群与数据源之间可以通过内网、公网VPN、NAT或专线等方式互通。通过内网互通时，网络带宽是根据不同的CDM实例规格的带宽限制的。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 优化迁移性能
配置Hive源端参数 - 数据治理中心 DataArts Studio

段映射页面添加新字段。 JDBC方式读取数据时，支持使用WHERE条件进行数据过滤及在字段映射页面添加新字段。说明：源端为Hive数据源且使用JDBC方式读取数据时，CDM不支持多并发，即后续操作中抽取并发数只能设置为1。 HDFS 使用SQL语句导出关系型数据库的数据时，您可以选择使用自定义SQL语句导出。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
CDM不同集群规格对应并发的作业数是多少？ - 数据治理中心 DataArts Studio

CDM不同集群规格对应并发的作业数是多少？ CDM通过数据迁移作业，将源端数据迁移到目的端数据源中。其中，主要运行逻辑如下：数据迁移作业提交运行后，CDM会根据作业配置中的“抽取并发数”参数，将每个作业拆分为多个Task，即作业分片。不同源端数据源的作业分片维度有所不同，因此某些作业可能出现未严格按作业“抽取并发数”参数分片的情况。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
启用细粒度认证 - 数据治理中心 DataArts Studio

Studio数据开发组件执行脚本、测试运行作业时，数据源会使用数据连接上的账号进行认证鉴权。因此，即使已通过配置角色/权限集对用户进行权限管控，当用户在数据开发时，权限管控依然无法生效。而在配置细粒度认证后，在DataArts Studio数据开发执行脚本、测试运行作业或调度作业时，数据源将不再使用数据连接上的

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 统一权限治理 > 数据权限访问控制
新建整库迁移作业 - 数据治理中心 DataArts Studio

支持修改子任务后再重新运行主作业。支持整库迁移的数据源请参见支持的数据源。约束限制配置源端和目的端参数时，字段名不可包含&和%。前提条件已新建连接，详情请参见创建CDM与数据源之间的连接。 CDM集群与待迁移数据源可以正常通信。操作步骤进入CDM主界面，单击左侧导航

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业
参考：CDM性能实测数据 - 数据治理中心 DataArts Studio

多并发抽取/写入速率，定义为分别取作业抽取并发数为1、10、20、30、50时，最大的抽取/写入速率。数据源抽取写入性能实测数据常见数据源的性能实测结果分别如表1和表2所示。表1 读取性能实测数据数据源数据源规格版本单并发抽取速率（行/s）多并发抽取速率（行/s）云数据库 MySQL 8U

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 优化迁移性能
配置方式生成API - 数据治理中心 DataArts Studio

配置取数逻辑 “取数方式”选择“配置方式”：选择数据源、数据连接、数据库和数据表，获取到需要配置的表。数据服务仅支持部分数据源，详情请参见DataArts Studio支持的数据源。您需提前在DataArts Studio管理中心中配置好数据源，数据表支持表名搜索。配置参数字段。选择

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 开发数据服务API > 创建API
新建数据对账作业 - 数据治理中心 DataArts Studio

新建数据对账作业数据对账对于数据开发和数据迁移流程中的数据一致性至关重要，而跨源数据对账的能力是检验数据迁移或数据加工前后是否一致的关键指标。数据质量监控中的对账作业支持跨源数据对账能力，可将创建的规则应用到两张表中进行质量监控，并输出对账结果。创建作业在DataArts

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 数据质量监控
配置实时集成作业 - 数据治理中心 DataArts Studio

数据连接和资源组配置完成后需要测试整个迁移任务的网络连通性，可通过以下方式进行数据源和资源组之间的连通性测试。单击展开“源端配置”触发连通性测试，会对整个迁移任务的连通性做校验。单击源端和目的端数据源和资源组中的“测试”按钮进行检测。网络连通性检测异常可先参考数据源和资源组网络不通如何排查？章节进行排查。配置源端、目标端参数。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业）
产品功能 - 数据治理中心 DataArts Studio

产品功能数据集成：多种方式异构数据源高效接入数据集成提供30+同构/异构数据源之间数据集成的功能，帮助您实现数据自由流动。支持自建和云上的文件系统，关系数据库，数据仓库，NoSQL，大数据云服务，对象存储等数据源。数据集成基于分布式计算框架，利用并行化处理技术，支持用户稳定

 帮助中心 > 数据治理中心 DataArts Studio > 产品介绍
质量作业和对账作业有什么区别？ - 数据治理中心 DataArts Studio

解决方案质量作业可将创建的规则应用到建好的表中进行质量监控。对账作业支持跨源数据对账能力，可将创建的规则应用到两张表中进行质量监控，并输出对账结果。数据对账对于数据开发和数据迁移流程中的数据一致性至关重要，而跨源数据对账的能力是检验数据迁移或数据加工前后是否一致的关键指标。父主题：

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据质量
步骤4：元数据采集 - 数据治理中心 DataArts Studio

为了在DataArts Studio平台中对迁移到云上的原始数据进行管理和监控，我们必须先在DataArts Studio数据目录模块中对SDI贴源层数据进行元数据采集并监控。采集并监控元数据在DataArts Studio控制台首页，选择对应工作空间的“数据目录”模块，进入数据目录页面。

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程

总条数： 433

上一页
1
2
3
4
5
...
22
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

PostgreSQL/SQLServer连接参数说明 - 数据治理中心 DataArts Studio

配置HBase/CloudTable目的端参数 - 数据治理中心 DataArts Studio

迁移文件时加解密 - 数据治理中心 DataArts Studio

文件增量迁移 - 数据治理中心 DataArts Studio

解绑/绑定CDM集群的EIP - 数据治理中心 DataArts Studio

数仓规划 - 数据治理中心 DataArts Studio

CDM迁移作业的抽取并发数应该如何设置？ - 数据治理中心 DataArts Studio

实时作业概述 - 数据治理中心 DataArts Studio

迁移作业原理 - 数据治理中心 DataArts Studio

配置Hive源端参数 - 数据治理中心 DataArts Studio

CDM不同集群规格对应并发的作业数是多少？ - 数据治理中心 DataArts Studio

启用细粒度认证 - 数据治理中心 DataArts Studio

新建整库迁移作业 - 数据治理中心 DataArts Studio

参考：CDM性能实测数据 - 数据治理中心 DataArts Studio

配置方式生成API - 数据治理中心 DataArts Studio

新建数据对账作业 - 数据治理中心 DataArts Studio

配置实时集成作业 - 数据治理中心 DataArts Studio

产品功能 - 数据治理中心 DataArts Studio

质量作业和对账作业有什么区别？ - 数据治理中心 DataArts Studio

步骤4：元数据采集 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线