搜索_华为云

新建表/文件迁移作业 - 数据治理中心 DataArts Studio

新建表/文件迁移作业操作场景 CDM可以实现在同构、异构数据源之间进行表或文件级别的数据迁移，支持表/文件迁移的数据源请参见支持的数据源。约束限制记录脏数据功能依赖于OBS服务。作业导入时，JSON文件大小不超过1MB。单文件传输大小不超过1TB。配置源端和目的端参数时，字段名不可包含&和%。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业
MySQL整库迁移到RDS服务 - 数据治理中心 DataArts Studio

MySQL整库迁移到RDS服务操作场景本章节介绍使用CDM整库迁移功能，将本地MySQL数据库迁移到云服务RDS中。当前CDM支持将本地MySQL数据库，整库迁移到RDS上的MySQL、PostgreSQL或者Microsoft SQL Server任意一种数据库中。这里以

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 使用教程
记录数据迁移入库时间 - 数据治理中心 DataArts Studio

记录数据迁移入库时间 CDM在创建表/文件迁移的作业，支持连接器源端为关系型数据库时，在表字段映射中使用时间宏变量增加入库时间字段，用以记录关系型数据库的入库时间等用途。前提条件已创建连接器源端为关系型数据库，以及目的端数据连接。目的端数据表中已有时间日期字段或时间戳字段。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导
Oracle迁移到DWS报错ORA-01555 - 数据治理中心 DataArts Studio

Oracle迁移到DWS报错ORA-01555 问题描述使用CDM迁移Oracle数据至DWS，报错图1所示。图1 报错现象原因分析数据迁移，整表查询且该表数据量大，那么查询时间较长。查询过程中，其他用户频繁进行commit操作。 Oracel的RBS（rollbackspace

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
通过数据开发实现数据增量迁移 - 数据治理中心 DataArts Studio

由于CDM作业是异步运行的，运行作业的REST请求返回200，不代表数据已经迁移成功。后续有计算作业依赖CDM的迁移作业时，需要一个RestAPI节点去周期判断迁移是否成功，如果CDM迁移成功，再去做计算操作。查询CDM迁移是否成功的API，具体请参见《云数据迁移API参考》中“查询作业状态”章节。运行CD

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践
文件格式介绍 - 数据治理中心 DataArts Studio

录结构会保持原样。增量迁移文件使用CDM进行二进制传输文件时，目的端有一个参数“重复文件处理方式”，可以用作文件的增量迁移，具体请参见文件增量迁移。增量迁移文件的时候，选择“重复文件处理方式”为“跳过重复文件”，这样如果源端有新增的文件，或者是迁移过程中出现了失败，只需要再

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
通过CDM节点批量创建分表迁移作业 - 数据治理中心 DataArts Studio

ue或false从而导致迁移失败，此时可关闭配置避免迁移报错。 useCursorFetch=false：CDM作业默认打开了JDBC连接器与关系型数据库通信使用二进制协议开关，即useCursorFetch=true。部分第三方可能存在兼容问题导致迁移时间转换出错，可以关闭此开

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践
CDM是否支持动态数据实时迁移功能？ - 数据治理中心 DataArts Studio

CDM是否支持动态数据实时迁移功能？问题描述 CDM是否支持动态数据实时迁移功能？解决方案不支持。如果源端在迁移过程中写数据，可能会出现报错。父主题：数据集成（CDM作业）

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
字段转换器配置指导 - 数据治理中心 DataArts Studio

如果是文件类数据源（FTP/SFTP/HDFS/OBS）之间相互迁移数据，且源端“文件格式”配置为“二进制格式”（即不解析文件内容直接传输），则没有字段映射这一步骤。在创建表/文件迁移作业的字段映射界面，可新建字段转换器，如下图所示。图1 新建字段转换器 CDM可以在迁移过程中对字段进行转换，目前支持以下字段转换器：

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
性能调优 - 数据治理中心 DataArts Studio

建议您将迁移作业的运行时间错开，平摊在业务周期内，避免资源紧张导致迁移时间过长。调整抽取并发数对于低任务量场景，调整抽取并发数是性能调优的最佳方式。CDM迁移作业支持设置作业抽取并发数，同时也可以设置集群最大抽取并发数。 CDM通过数据迁移作业，将源端数据迁移到目的端数据源中。其中，主要运行逻辑如下：

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 优化迁移性能
数据集成概述 - 数据治理中心 DataArts Studio

绕大数据迁移上云和智能数据湖解决方案，提供了简单易用的迁移能力和多种数据源到数据湖的集成能力，降低了客户数据源迁移和集成的复杂性，有效的提高您数据迁移和集成的效率。数据集成即云数据迁移（Cloud Data Migration，后简称CDM）服务，本文中的“云数据迁移”、“CDM”均指“数据集成”。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业）
时间宏变量使用解析 - 数据治理中心 DataArts Studio

时间宏变量使用解析在创建表/文件迁移作业时，CDM支持在源端和目的端的以下参数中配置时间宏变量：源端的源目录或文件源端的表名 “通配符”过滤类型中的目录过滤器和文件过滤器 “时间过滤”中的起始时间和终止时间分区过滤条件和Where子句目的端的写入目录目的端的表名支持

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
新增字段操作指导 - 数据治理中心 DataArts Studio

型字段的写入，需修改为其他时间类型字段写入（如datetime）。当作业源端为OBS、迁移CSV文件时，并且配置“解析首行为列名”参数的场景下显示列名。当使用二进制格式进行文件到文件的迁移时，没有字段映射这一步。自动创表场景下，需在目的端表中提前手动新增字段，再在字段映射里新增字段。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
MD5校验文件一致性 - 数据治理中心 DataArts Studio

MD5校验文件一致性 CDM数据迁移以抽取-写入模式进行，CDM首先从源端抽取数据，然后将数据写入到目的端。在迁移文件到OBS时，迁移模式如图1所示。图1 迁移文件到OBS 在这个过程中，CDM支持使用MD5检验文件一致性。抽取时该功能支持源端为OBS、HDFS、FTP、S

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
不支持数据类型转换规避指导 - 数据治理中心 DataArts Studio

如果需要使用该字段，可在源端作业配置中使用SQL语句对字段类型进行转换，转换成CDM支持的类型，达到迁移数据的目的。操作步骤修改CDM迁移作业，通过使用SQL语句的方式迁移。 SQL语句格式为：“select id,cast(原字段名 as INT) as 新字段名可以和原字段名一样

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
Hive迁移作业长时间卡顿怎么办？ - 数据治理中心 DataArts Studio

Hive迁移作业长时间卡顿怎么办？问题描述 Hive迁移作业长时间卡顿怎么办？解决方案为避免Hive迁移作业长时间卡顿，可手动停止迁移作业后，通过编辑Hive连接增加如下属性设置：属性名称：hive.server2.idle.operation.timeout 值：10m

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
CDM迁移作业的抽取并发数应该如何设置？ - 数据治理中心 DataArts Studio

CDM迁移作业的抽取并发数应该如何设置？ CDM通过数据迁移作业，将源端数据迁移到目的端数据源中。其中，主要运行逻辑如下：数据迁移作业提交运行后，CDM会根据作业配置中的“抽取并发数”参数，将每个作业拆分为多个Task，即作业分片。不同源端数据源的作业分片维度有所不同，因此某

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
CDM迁移数据到DWS时如何选取分布列？ - 数据治理中心 DataArts Studio

CDM迁移数据到DWS时如何选取分布列？问题描述 CDM迁移数据到DWS时如何选取分布列？解决方案在使用CDM迁移数据到数据仓库服务（DWS）或者FusionInsight LibrA，且CDM在DWS端自动创建一个新表时，在创建作业的字段映射界面，需要选择分布列，如图1所示。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
MongoDB连接迁移失败时如何处理？ - 数据治理中心 DataArts Studio

MongoDB连接迁移失败时如何处理？问题描述 MongoDB连接迁移失败时如何处理？解决方案在默认情况下，userAdmin角色只具备对角色和用户的管理，不具备对库的读和写权限。当用户选择MongoDB连接迁移失败时，用户需查看MongoDB连接中用户的权限信息，确保对指定库具备ReadWrite权限。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
参考：作业分片维度 - 数据治理中心 DataArts Studio

MRS Kafka 支持按topic分片。搜索 Elasticsearch 不支持分片。云搜索服务（CSS）不支持分片。父主题：优化迁移性能

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 优化迁移性能

总条数： 497

上一页
1
2
3
4
5
...
25
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

新建表/文件迁移作业 - 数据治理中心 DataArts Studio

MySQL整库迁移到RDS服务 - 数据治理中心 DataArts Studio

记录数据迁移入库时间 - 数据治理中心 DataArts Studio

Oracle迁移到DWS报错ORA-01555 - 数据治理中心 DataArts Studio

通过数据开发实现数据增量迁移 - 数据治理中心 DataArts Studio

文件格式介绍 - 数据治理中心 DataArts Studio

通过CDM节点批量创建分表迁移作业 - 数据治理中心 DataArts Studio

CDM是否支持动态数据实时迁移功能？ - 数据治理中心 DataArts Studio

字段转换器配置指导 - 数据治理中心 DataArts Studio

性能调优 - 数据治理中心 DataArts Studio

数据集成概述 - 数据治理中心 DataArts Studio

时间宏变量使用解析 - 数据治理中心 DataArts Studio

新增字段操作指导 - 数据治理中心 DataArts Studio

MD5校验文件一致性 - 数据治理中心 DataArts Studio

不支持数据类型转换规避指导 - 数据治理中心 DataArts Studio

Hive迁移作业长时间卡顿怎么办？ - 数据治理中心 DataArts Studio

CDM迁移作业的抽取并发数应该如何设置？ - 数据治理中心 DataArts Studio

CDM迁移数据到DWS时如何选取分布列？ - 数据治理中心 DataArts Studio

MongoDB连接迁移失败时如何处理？ - 数据治理中心 DataArts Studio

参考：作业分片维度 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线