搜索_华为云

迁移作业原理 - 云数据迁移 CDM

数据迁移时，对于不同的数据结构，迁移速度也会受到一定影响。例如：对于表迁移，宽表的迁移速度较慢，字符串类型越多（字段大小）迁移速度越慢。对于文件而言，总大小相同时，大文件迁移较快，多个小文件迁移较慢。对于消息而言，消息内容越多，所占带宽越高，每秒事务（TPS）越低。源端读取速度取决于源端数据源的性能。

帮助中心 > 云数据迁移 CDM > 性能白皮书
增量迁移原理介绍 - 云数据迁移 CDM

增量迁移原理介绍文件增量迁移关系数据库增量迁移 HBase/CloudTable增量迁移 MongoDB/DDS增量迁移父主题：进阶实践

 帮助中心 > 云数据迁移 CDM > 最佳实践 > 进阶实践
Hudi源端的作业长时间处于BOOTING状态怎么解决？ - 云数据迁移 CDM

es页签，可以看到每条SQL的执行进度。 CDM在作业BOOTING阶段无法查看日志，如果找不到Yarn任务，请联系CDM运维查看后台日志，获取Application ID。日志形如：联系CDM运维查看后台日志。父主题：故障处理类

 帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
配置MRS Hudi目的端参数 - 云数据迁移 CDM

Hudi建表配置 Location 存储在OBS或HDFS上数据库表的文件路径。 - Hudi表类型 Hudi表存储类型。 MOR表：数据先写入avro格式的日志文件，读取时合并到parquet文件。 COW表：数据直接写入parquet文件。 MOR Hudi表主键对Hudi建表设置主键，多个值以逗号隔开。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业目的端参数
配置MongoDB目的端参数 - 云数据迁移 CDM

如果选择界面没有待选择的表，请确认表是否已经创建，或者对应连接里的账号是否有元数据查询的权限。 COLLECTION 迁移行为将记录迁移到MongoDB目的端时，选择需要进行的插入行为操作。新增：将文件记录直接插入指定的集合。有则新增，无则替换：以指定的过滤键作为查询条件。如果在集合中找到匹配的记录，则替换该记

 帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业目的端参数
在CDM集群中创建作业 - 云数据迁移 CDM

在CDM集群中创建作业新建表/文件迁移作业新建整库迁移作业配置CDM作业源端参数配置CDM作业目的端参数配置CDM作业字段映射配置CDM作业定时任务 CDM作业配置管理管理单个CDM作业批量管理CDM作业

 帮助中心 > 云数据迁移 CDM > 用户指南
创建源数据连接，一直报错用户名和密码错误，但是实际填的没有错 - 云数据迁移 CDM

创建源数据连接，一直报错用户名和密码错误，但是实际填的没有错问题描述创建Mysql链接，确认过用户名、密码没有错，同样的配置，在roma上建立数据连接能成功。故障分析查看后端日志，考虑用户Mysql侧有白名单限制，测试内网相通的另一台ECS Mysql客户端使用这个用户链接。解决方案再次核实账号密码无误

 帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
配置Hive目的端参数 - 云数据迁移 CDM

选择Hive表清理数据模式。 LOAD_OVERWRITE模式：将生成一个临时数据文件目录，使用Hive的load overwrite语法将临时目录加载到Hive表中。 TRUCATE模式：只清理分区下的数据文件，不删除分区。说明：目的端为分区表时，Hive表清理数据模式建议设置为L

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业目的端参数
通过数据开发使用参数传递灵活调度CDM作业 - 云数据迁移 CDM

保存并提交作业版本，单击“测试运行”，执行数据开发作业。数据开发作业执行成功后，单击右上角的“前往监控”，进入“作业监控”页面，查看生成的任务或实例是否符合需求，如图6所示。图6 查看运行结果

 帮助中心 > 云数据迁移 CDM > 最佳实践
配置分库源端参数 - 云数据迁移 CDM

对应第一个后端连接的表空间。用户也可以直接输入模式或表空间名称。如果选择界面没有待选择的模式或表空间，请确认对应连接里的账号是否有元数据查询的权限。该参数支持配置正则表达式，实现导出满足规则的所有数据库。例如：表名配置为user_[0-9]{1,2}，会匹配 user_0 到

 帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数
已购买包年包月的CDM套餐包，为什么还会产生按需计费的费用？ - 云数据迁移 CDM

域和规格，如果非相同区域和规格，则无法使用套餐包。CDM集群规格和区域可以通过进入CDM主界面，进入“集群管理”，单击集群列表中的集群名称查看。如果套餐包和实际的CDM集群具有相同区域和规格，则以下情况也会产生按需费用：如果您先购买按需计费增量包，再购买套餐包，则在购买套餐包

 帮助中心 > 云数据迁移 CDM > 常见问题 > 通用类
步骤3：创建并执行作业 - 云数据迁移 CDM

在集群管理界面，找到步骤1：创建集群章节创建的集群“cdm-aff1”。单击该CDM集群后的“作业管理”，进入作业管理界面。选择“表/文件迁移 > 新建作业”，配置作业基本信息。图1 新建作业作业名称：输入便于记忆、区分的作业名称，例如：“mysql2dws”。源端作业配置

 帮助中心 > 云数据迁移 CDM > 快速入门
通过数据开发实现数据增量迁移 - 云数据迁移 CDM

进入CDM主界面，创建一个DWS到OBS的表/文件迁移作业。在CDM“作业管理”界面的“表/文件迁移”页签下，找到已创建的作业，单击作业操作列的“更多 > 查看作业JSON”，如图1所示。您也可以使用其它已创建好的CDM作业JSON。图1 查看作业JSON 作业JSON就是创建CD

帮助中心 > 云数据迁移 CDM > 最佳实践
MRS中恢复HBase表 - 云数据迁移 CDM

<snapshotDir> [s0] hdfs dfs -createSnapshot test CDM通过HDFS Snapshot复制文件至MRS。CDM的作业配置： “源目录或文件”输入：/hbase/data/default/src_test/.snapshot/s0 目的端“写入目录”输入：

帮助中心 > 云数据迁移 CDM > 最佳实践 > 车联网大数据零丢失搬迁入湖
CDM有哪些优势？ - 云数据迁移 CDM

数据。多种数据源支持数据源类型繁杂，针对不同数据源开发不同的任务，脚本数量成千上万。支持数据库、Hadoop、NoSQL、数据仓库、文件等多种类型的数据源。多种网络环境支持随着云计算技术的发展，用户数据可能存在于各种环境中，例如公有云、自建/托管IDC、混合场景等。在异

 帮助中心 > 云数据迁移 CDM > 常见问题 > 通用类
源端为Kafka - 云数据迁移 CDM
源端为Kafka - 云数据迁移 CDM

Kafka导出数据，专享版请任意输入，标准版请输入有效的消费组ID。 fromJobConfig.dataFormat 是枚举解析数据时使用的格式： BINARY：适用于文件迁移场景，不解析数据内容原样传输。 CSV：以CSV格式解析源数据。 fromJobConfig.maxPollRecords 否 String

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
源端为DIS - 云数据迁移 CDM
源端为DIS - 云数据迁移 CDM

DIS分区ID，该参数支持输入多个分区ID，使用“,”分隔。 fromJobConfig.dataFormat 是枚举解析数据时使用的格式： BINARY：适用于文件迁移场景，不解析数据内容原样传输。 CSV：以CSV格式解析源数据。 fromJobConfig.separator 否 String 字段分隔符。

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
日志提示解析日期格式失败时怎么处理？ - 云数据迁移 CDM

新建转换器转换器类型选择“表达式转换”，目前表达式转换支持字符串和日期类型的函数，语法和Java的字符串和时间格式函数非常相似，可以查看表达式转换了解如何编写表达式。本例中源时间格式是“yyyy/MM/dd HH:mm:ss”，要将其转换成“yyyy-MM-dd HH:mm:ss.SSS

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
HBase/CloudTable增量迁移 - 云数据迁移 CDM

Studio数据开发调度CDM迁移作业时，系统会将时间宏变量替换为“数据开发作业计划启动时间-偏移量”，而不是“CDM作业实际启动时间-偏移量”。在创建CDM表/文件迁移的作业，源连接选择为HBase连接或CloudTable连接时，高级属性的可选参数中可以配置时间区间。图1 HBase时间区间起始

 帮助中心 > 云数据迁移 CDM > 最佳实践 > 进阶实践 > 增量迁移原理介绍
HBase/CloudTable增量迁移 - 云数据迁移 CDM

Studio数据开发调度CDM迁移作业时，系统会将时间宏变量替换为“数据开发作业计划启动时间-偏移量”，而不是“CDM作业实际启动时间-偏移量”。在创建CDM表/文件迁移的作业，源连接选择为HBase连接或CloudTable连接时，高级属性的可选参数中可以配置时间区间。图1 HBase时间区间起始

 帮助中心 > 云数据迁移 CDM > 用户指南 > 关键操作指导 > 增量迁移原理介绍

总条数： 312

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

迁移作业原理 - 云数据迁移 CDM

增量迁移原理介绍 - 云数据迁移 CDM

Hudi源端的作业长时间处于BOOTING状态怎么解决？ - 云数据迁移 CDM

配置MRS Hudi目的端参数 - 云数据迁移 CDM

配置MongoDB目的端参数 - 云数据迁移 CDM

在CDM集群中创建作业 - 云数据迁移 CDM

创建源数据连接，一直报错用户名和密码错误，但是实际填的没有错 - 云数据迁移 CDM

配置Hive目的端参数 - 云数据迁移 CDM

通过数据开发使用参数传递灵活调度CDM作业 - 云数据迁移 CDM

配置分库源端参数 - 云数据迁移 CDM

已购买包年包月的CDM套餐包，为什么还会产生按需计费的费用？ - 云数据迁移 CDM

步骤3：创建并执行作业 - 云数据迁移 CDM

通过数据开发实现数据增量迁移 - 云数据迁移 CDM

MRS中恢复HBase表 - 云数据迁移 CDM

CDM有哪些优势？ - 云数据迁移 CDM

源端为Kafka - 云数据迁移 CDM

源端为DIS - 云数据迁移 CDM

日志提示解析日期格式失败时怎么处理？ - 云数据迁移 CDM

HBase/CloudTable增量迁移 - 云数据迁移 CDM

HBase/CloudTable增量迁移 - 云数据迁移 CDM

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线