搜索_华为云

MD5校验文件一致性 - 云数据迁移 CDM

、SFTP、HTTP。可校验CDM抽取的文件，是否与源文件一致。该功能由源端作业参数“MD5文件名后缀”控制（“文件格式”为“二进制格式”时生效），配置为源端文件系统中的MD5文件名后缀。当源端数据文件同一目录下有对应后缀的保存md5值的文件，例如build.sh和build

帮助中心 > 云数据迁移 CDM > 最佳实践 > 进阶实践
参考：CDM性能实测数据 - 云数据迁移 CDM

10000W行100列。多并发抽取/写入速率，定义为分别取作业抽取并发数为1、10、20、30、50时，最大的抽取/写入速率。数据源抽取写入性能实测数据常见数据源的性能实测结果分别如表1和表2所示。表1 读取性能实测数据数据源数据源规格版本单并发抽取速率（行/s）

帮助中心 > 云数据迁移 CDM > 性能白皮书
新增字段操作指导 - 云数据迁移 CDM

当作业源端为OBS、迁移CSV文件时，并且配置“解析首行为列名”参数的场景下显示列名。当使用二进制格式进行文件到文件的迁移时，没有字段映射这一步。自动创表场景下，需在目的端表中提前手动新增字段，再在字段映射里新增字段。添加完字段后，新增的字段在界面不显示样值，不会影响字段值的传输，CDM会将字段值直接写入目的端。

帮助中心 > 云数据迁移 CDM > 用户指南 > 关键操作指导
配置MySQL/SQL Server/PostgreSQL目的端参数 - 云数据迁移 CDM

不存在时创建：当目的端的数据库没有“表名”参数中指定的表时，CDM会自动创建该表。如果“表名”参数配置的表已存在，则不创建，数据写入到已存在的表中。先删除后创建：CDM先删除“表名”参数中指定的表，然后再重新创建该表。不自动创建表名写入数据的目标表名，单击输入框后面的按钮可进入表的选择界面。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业目的端参数
配置MRS Hudi目的端参数 - 云数据迁移 CDM

不存在时创建：当目的端的数据库没有“表名”参数中指定的表时，CDM会自动创建该表。如果“表名”参数配置的表已存在，则不创建，数据写入到已存在的表中。不自动创表导入前清空数据选择目的端表中数据的处理方式：是：任务启动前会清除目标表中数据。否：导入前不清空目标表中的数据，如果选“否

 帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业目的端参数
配置Kafka/DMS Kafka源端参数 - 云数据迁移 CDM

从Kafka拉取数据时的初始偏移量：最新：最大偏移量，即拉取最新的数据。最早：最小偏移量，即拉取最早的数据。已提交：拉取已提交的数据。时间范围：拉取时间范围内的数据。最新抽取数据最大运行时间持续拉取数据时间。如天调度作业，根据每天topic产生的数据量，配置足够的拉取时间。单位：分钟。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数
目的端为HBase/CloudTable - 云数据迁移 CDM

当选取多个列做rowkey时，连接多列的分隔符，例如：“|”。 toJobConfig.isRowkeyRedundancy 否 Boolean 是否将选做Rowkey的数据同时写入HBase的列。 toJobConfig.algorithm 否枚举创建新HBase表时采用的压缩算法，支持SNAPPY和GZ算法，默认为“NONE”。

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 目的端作业参数说明
配置Oracle目的端参数 - 云数据迁移 CDM

Oracle作为目的端时的作业参数参数类型参数名说明取值样例基本参数模式或表空间待写入数据的数据库名称，支持自动创建Schema。单击输入框后面的按钮可选择模式或表空间。 schema 表名写入数据的目标表名，单击输入框后面的按钮可进入表的选择界面。该参数支持配

 帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业目的端参数
目的端为关系数据库 - 云数据迁移 CDM

数据时，用户选择的操作： DO_NOTHING：不自动建表。 CREATE_WHEN_NOT_EXIST：当目的端的数据库没有“tableName”参数中指定的表时，CDM会自动创建该表。 DROP_AND_CREATE：先删除“tableName”参数中指定的表，然后再重新创建该表。

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 目的端作业参数说明
源端为关系数据库 - 云数据迁移 CDM

表名支持配置通配符（*），实现导出以某一前缀开头或者以某一后缀结尾的所有表（要求表中的字段个数和类型都一样）。例如： table*表示导出所有以“table”开头的表。 *table表示导出所有以“table”结尾的表。 *table*表示表名中只要有“table”字符串，就全部导出。

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
目的端为Hive - 云数据迁移 CDM
目的端为Hive - 云数据迁移 CDM

写入表数据时，用户选择的操作： DO_NOTHING：不自动建表。 CREATE_WHEN_NOT_EXIST：当目的端的数据库没有“tableName”参数中指定的表时，CDM会自动创建该表。 DROP_AND_CREATE：先删除“tableName”参数中指定的表，然后再重新创建该表。

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 目的端作业参数说明
配置HDFS源端参数 - 云数据迁移 CDM

Parquet格式：以Parquet格式解析源文件，用于HDFS数据导到表的场景。 CSV格式列表文件当“文件格式”选择为“二进制格式”时，才有该参数。打开列表文件功能时，支持读取OBS桶中文件（如txt文件）的内容作为待迁移文件的列表。该文件中的内容应为待迁移文件的绝对路径（不支持目录），文件内容示例如下：

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数
配置HBase/CloudTable目的端参数 - 云数据迁移 CDM

不自动创建：不自动建表。不存在时创建：当目的端的数据库没有“表名”参数中指定的表时，CDM会自动创建该表。如果“表名”参数配置的表已存在，则不创建，数据写入到已存在的表中。说明： Hbase自动建表包含列族与协处理器Coprocessor信息。其他属性按默认值设置，不跟随源端。不自动创建 Row key拼接分隔符

 帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业目的端参数
配置MRS Hudi源端参数 - 云数据迁移 CDM

移量”。 TBL_E 高级属性 Where子句填写该参数表示指定抽取的Where子句，不指定则抽取整表。如果要迁移的表中没有Where子句的字段，则会迁移失败。该参数支持配置为时间宏变量，实现抽取指定日期的数据，详细说明请参见关系数据库增量迁移。说明：如果配置了时间宏变量，通过DataArts

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数
源端为Kafka - 云数据迁移 CDM
源端为Kafka - 云数据迁移 CDM

fromJobConfig.kafkaConsumerStrategy 是枚举从Kafka拉取数据时的初始偏移量设置： LATEST：最大偏移量，即最新的数据。 EARLIEST：最小偏移量，即最老的数据。 fromJobConfig.isPermanency 是 Boolean 是否永久运行。

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
源端为DIS - 云数据迁移 CDM
源端为DIS - 云数据迁移 CDM

String DIS的通道名。 fromJobConfig.disConsumerStrategy 是枚举设置从DIS拉取数据时的初始偏移量： LATEST：最大偏移量，即最新的数据。 FROM_LAST_STOP：从上次停止处继续拉取。 EARLIEST：最小偏移量，即最早的数据。 fromJobConfig

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
配置DLI源端参数 - 云数据迁移 CDM

示。表1 DLI作为源端时的作业参数参数名说明取值样例资源队列选择目的表所属的资源队列。 DLI的default队列无法在迁移作业中使用，您需要在DLI中新建SQL队列。 cdm 数据库名称写入数据的数据库名称。 dli 表名写入数据的表名。 car_detail

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数
配置Doris目的端参数 - 云数据迁移 CDM

表1 Doris作为目的端时的作业参数参数类型参数名说明取值样例基本参数模式或表空间待写入数据的数据库名称，支持自动创建Schema。单击输入框后面的按钮可选择模式或表空间。 schema 表名写入数据的目标表名，单击输入框后面的按钮可进入表的选择界面。该参数支持配

 帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业目的端参数
迁移MySql到DWS，TINYINT类型迁移报错 - 云数据迁移 CDM

根据以上截图分析，INT1就是DWS字段类型TINYINT的别名，确认字段映射是对的，没有问题。进一步确认DWS TINYINT是否支持范围，为什么报错提示不支持‘-1’的原因，找到DWS字段类型介绍发现DWS TINYINT类型，支持范围为[0,255]，不支持负数，Mysql的TINYINT类型支持范围是[-128

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
写ES报timeout waiting for connection from pool错误怎么解决？ - 云数据迁移 CDM

用户在迁移时有选择主键，也就是用它来替代 _id。计算出来的shard属同一个。 1. 建议用户不选主键，让es自动生成_id, 这样获的hash值比较分散。 2. 如果用户的应用必须用自有主键替代_id，则只能建议用性能更好的ES集群。父主题：故障处理类

 帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类

总条数： 374

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

MD5校验文件一致性 - 云数据迁移 CDM

参考：CDM性能实测数据 - 云数据迁移 CDM

新增字段操作指导 - 云数据迁移 CDM

配置MySQL/SQL Server/PostgreSQL目的端参数 - 云数据迁移 CDM

配置MRS Hudi目的端参数 - 云数据迁移 CDM

配置Kafka/DMS Kafka源端参数 - 云数据迁移 CDM

目的端为HBase/CloudTable - 云数据迁移 CDM

配置Oracle目的端参数 - 云数据迁移 CDM

目的端为关系数据库 - 云数据迁移 CDM

源端为关系数据库 - 云数据迁移 CDM

目的端为Hive - 云数据迁移 CDM

配置HDFS源端参数 - 云数据迁移 CDM

配置HBase/CloudTable目的端参数 - 云数据迁移 CDM

配置MRS Hudi源端参数 - 云数据迁移 CDM

源端为Kafka - 云数据迁移 CDM

源端为DIS - 云数据迁移 CDM

配置DLI源端参数 - 云数据迁移 CDM

配置Doris目的端参数 - 云数据迁移 CDM

迁移MySql到DWS，TINYINT类型迁移报错 - 云数据迁移 CDM

写ES报timeout waiting for connection from pool错误怎么解决？ - 云数据迁移 CDM

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线