搜索_华为云

源端为PostgreSQL，目的端为DWS - 数据治理中心 DataArts Studio

源端为PostgreSQL，目的端为DWS 本章节适用于配置实时处理集成作业的PostgreSQL到DWS链路，期望将源端1个或多个PostgreSQL实例的数据实时同步到目的端为DWS数据库的场景。整库：适用于将1个源端为PostgreSQL实例上的多个数据库表实时同步到1个目标端为DWS实例的多个库表。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 实时处理集成作业开发 > 配置源端和目标端参数
目的端作业参数说明 - 数据治理中心 DataArts Studio

目的端作业参数说明目的端为关系数据库目的端为OBS 目的端为HDFS 目的端为Hive 目的端为HBase/CloudTable 目的端为DDS 目的端为Elasticsearch/云搜索服务目的端为DLI 目的端为DIS 父主题：附：公共数据结构

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构
配置离线处理集成作业 - 数据治理中心 DataArts Studio

字段映射关系：支持批量转换，添加字段，行移动等功能。批量转换器：批量转换源字段名。勾选需要转换的字段名，单击“批量转换器”，在弹出的转换器列表对话框中根据提示新建转换器。批量移除字段：源端配置使用SQL语句为是时不显示该参数，勾选需要移除的字段名，单击“批量移除字段”。已移除的字段可以

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 离线处理集成作业开发
源端为SQLServer，目的端为Hudi - 数据治理中心 DataArts Studio

与来源表同名：会迁移至目的端对应与来源表同名的表中。自定义：支持用户指定目的端表名，也支持通过内置参数#{source_table_name}给源表名添加前后缀，变成目的端Hudi表的表名。目标数据源配置：数据存储路径：Hudi数据存储的基础路径，只对自动建表生效。每张目的端表会在基础

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 实时处理集成作业开发 > 配置源端和目标端参数
如何降低CDM使用成本？ - 数据治理中心 DataArts Studio

IP），记录下CDM集群所在的VPC和子网。创建NAT网关，注意选择和CDM集群相同的VPC、子网。创建完NAT网关后，回到NAT网关控制台列表，单击创建好的网关名称，然后选择“添加SNAT规则”。图1 添加SNAT规则选择子网和弹性IP，如果没有弹性IP，需要先申请一个。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成
自动建表原理介绍 - 数据治理中心 DataArts Studio

自动建表原理介绍 CDM将根据源端的字段类型进行默认规则转换成目的端字段类型，并在目的端建数据表。自动建表时的字段类型映射 CDM在数据仓库服务（Data Warehouse Service，简称DWS）中自动建表时，DWS的表与源表的字段类型映射关系如图1所示。例如使用CDM

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 关键操作指导
源端为MySQL，目的端为DMS Kafka - 数据治理中心 DataArts Studio

partition策略：支持以下三种投递策略，源端无主键情况下，目的端默认投递到partition 0。按库名+表名的hash值投递到不同Partition。全部投递到Partition 0。按表的主键值hash值投递到不同的Partition。需要同步的数据库操作：支持同步的数据库操作为DDL和DML。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 实时处理集成作业开发 > 配置源端和目标端参数
字段映射界面无法显示所有列怎么处理？ - 数据治理中心 DataArts Studio

Table表的字段偶尔显示不全，无法与目的端字段一一匹配，造成导入到目的端的数据不完整。原因分析由于HBase/CloudTable无Schema，每条数据的列数不固定，在字段映射界面CDM通过获取样值的方式有较大概率无法获得所有列，此时作业执行完后会造成目的端的数据不全。这个问题，可以通过以下方法解决：

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成
源端为Apache Kafka，目的端为MRS Kafka - 数据治理中心 DataArts Studio

消息在第n个分区，则投递到目的端的第n个分区，该策略可以保证消息顺序。按轮询模式投递到不同的Partition：采用Kafka粘性分区策略均匀的投递到目的端主题的所有分区，该策略无法保证消息顺序。全部投递到Partition 0。新建Topic的Partition数量：设置

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 实时处理集成作业开发 > 配置源端和目标端参数
时间宏变量使用解析 - 数据治理中心 DataArts Studio

在创建表/文件迁移作业时，CDM支持在源端和目的端的以下参数中配置时间宏变量：源端的源目录或文件源端的表名 “通配符”过滤类型中的目录过滤器和文件过滤器 “时间过滤”中的起始时间和终止时间分区过滤条件和Where子句目的端的写入目录目的端的表名支持通过宏定义变量表示符“${}”来完成时间类型的宏定义，当

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成
创建CDM与数据源之间的连接 - 数据治理中心 DataArts Studio

在连接管理界面找到需要修改的连接：删除连接：单击操作列的“删除”删除该连接，或者勾选连接后单击列表上方的“删除连接”来批量删除未被任何作业使用的连接。编辑连接：单击该连接名称，或者单击操作列的“编辑”进入修改连接的界面，修改连接时需要重新输入数据源的登录密码。测试连通性：单击操作列的“测试连通性”，直接测试已保存连接的连通性。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 在CDM集群中创建连接
支持的数据类型 - 数据治理中心 DataArts Studio

smallint类型的数据占用了两个字节的存储空间，其中一个二进制位表示整数值的正负号，其它15个二进制位表示长度和大小，可以表示-2的15次方~2的15次方-1范围内的所有整数。 SMALLINT SMALLINT NUMBER tinyint tinyint类型的数据占用了一个字节的存储空

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 支持的数据源
HDFS连接参数说明 - 数据治理中心 DataArts Studio

说明：STANDALONE模式主要是用来解决版本冲突问题的运行模式。当同一种数据连接的源端或者目的端连接器的版本不一致时，存在jar包冲突的情况，这时需要将源端或目的端放在STANDALONE进程里，防止冲突导致迁移失败。若在一个CDM中同时连接两个及以上开启Kerberos认证且realm相同的集群，只能使用EM

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 在CDM集群中创建连接 > 配置连接参数
如何使用表达式方式获取当前时间？ - 数据治理中心 DataArts Studio

format(${timestamp()},"yyyy-MM-dd HH:mm:ss")表达式获取当前时间，更多表达式设置方式可以参考表达式转换。父主题：数据集成

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成
性能过慢处理方案 - 数据治理中心 DataArts Studio

单线程flush的FileGroup的数量 <= 5，推荐值2。单线程flush的FileGroup的数量 <= 10，推荐值5。单线程flush的FileGroup的数量 <= 25，推荐值10。单线程flush的FileGroup的数量 <= 50，推荐值20。单线程flush的FileGroup的数量

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 实时处理集成作业开发 > 性能调优参数配置
HBase连接参数说明 - 数据治理中心 DataArts Studio

如果需要创建快照，这里配置的用户需要HDFS系统的管理员权限。如果要创建MRS安全集群的数据连接，不能使用admin用户。因为admin用户是默认的管理页面用户，这个用户无法作为安全集群的认证用户来使用。您可以创建一个新的MRS用户，然后在创建MRS数据连接时，“用户名”和“密码”填写为新建的MRS用户及其密码。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 在CDM集群中创建连接 > 配置连接参数
MRS Hetu数据连接参数说明 - 数据治理中心 DataArts Studio

页面提示完成用户的创建。 MRS 3.1.0及之后版本集群，所创建的用户至少需具备Manager_viewer的角色权限才能在管理中心创建连接；如果需要对应组件的进行库、表、数据的操作，还需要添加对应组件的用户组权限。 MRS 3.1.0版本之前的集群，所创建的用户需要具备Man

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
ETL Job - 数据治理中心 DataArts Studio

单击配置需要转换的源端数据和目的端数据。当前支持的源端数据为DLI类型、OBS类型和MySQL类型。当源端数据为DLI类型时，支持的目的端数据类型为CloudTable（仅华北-北京一支持）、DWS、GES、CSS、OBS、DLI。当源端数据为MySQL类型时，支持的目的端数据类型为MySQL。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
API编排典型配置 - 数据治理中心 DataArts Studio

API编排典型配置 API编排的典型使用场景如下：对返回消息进行映射或格式转换：通过API编排的方式能够灵活实现消息映射及格式转换。数据请求依赖多个数据API：使用API编排后，可以降低调用次数，减少集成成本，提升调用效率。约束与限制仅3.0.6及以上版本的数据服务专享版集群支持API编排。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 开发数据服务API > 编排API
迁移作业原理 - 数据治理中心 DataArts Studio

通过VPN、NAT或专线互通时，网络带宽受到VPN、NAT或专线带宽的限制。目的端写入性能取决于目的端数据源的性能。如需优化，请参见目的端数据源的相关说明文档。父主题：优化迁移性能

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 优化迁移性能

总条数： 1416

上一页
1
2
3
4
5
...
71
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

源端为PostgreSQL，目的端为DWS - 数据治理中心 DataArts Studio

目的端作业参数说明 - 数据治理中心 DataArts Studio

配置离线处理集成作业 - 数据治理中心 DataArts Studio

源端为SQLServer，目的端为Hudi - 数据治理中心 DataArts Studio

如何降低CDM使用成本？ - 数据治理中心 DataArts Studio

自动建表原理介绍 - 数据治理中心 DataArts Studio

源端为MySQL，目的端为DMS Kafka - 数据治理中心 DataArts Studio

字段映射界面无法显示所有列怎么处理？ - 数据治理中心 DataArts Studio

源端为Apache Kafka，目的端为MRS Kafka - 数据治理中心 DataArts Studio

时间宏变量使用解析 - 数据治理中心 DataArts Studio

创建CDM与数据源之间的连接 - 数据治理中心 DataArts Studio

支持的数据类型 - 数据治理中心 DataArts Studio

HDFS连接参数说明 - 数据治理中心 DataArts Studio

如何使用表达式方式获取当前时间？ - 数据治理中心 DataArts Studio

性能过慢处理方案 - 数据治理中心 DataArts Studio

HBase连接参数说明 - 数据治理中心 DataArts Studio

MRS Hetu数据连接参数说明 - 数据治理中心 DataArts Studio

ETL Job - 数据治理中心 DataArts Studio

API编排典型配置 - 数据治理中心 DataArts Studio

迁移作业原理 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线