搜索_华为云

步骤3：创建并执行作业 - 云数据迁移 CDM

导入到DWS时需要手动选择DWS的分布列，建议按如下顺序选取：有主键可以使用主键作为分布列。多个数据段联合做主键的场景，建议设置所有主键作为分布列。在没有主键的场景下，如果没有选择分布列，DWS会默认第一列作为分布列，可能会有数据倾斜风险。如果需要转换源端字段内容，可

 帮助中心 > 云数据迁移 CDM > 快速入门
MRS中恢复HBase表 - 云数据迁移 CDM

MRS中恢复HBase表 CDH HBase表目录已经迁移到MRS HBase后，可以使用命令恢复。对于那些会变化的数据，需要使用快照保证数据不变，然后再迁移并恢复。约束限制本方案仅支持迁移数据到MRS 1.x版本集群，2.x及之后版本无法通过HBase修复命令重建HBase表。

帮助中心 > 云数据迁移 CDM > 最佳实践 > 车联网大数据零丢失搬迁入湖
Hudi目的端的作业执行卡Running，读取行数写入行数相等且不再增加怎么解决？ - 云数据迁移 CDM

sql写到Hudi，写入行数统计的是写hive临时表的行数，当行数不再增长时，说明源端数据已经读完写到Hive表中，此时作业正在执行Spark SQL过程中，需要等Spark SQL执行完作业才会结束。原因分析打开日志，搜索insert into，找到如下的日志，根据日志中打印的Yarn ApplicationId到MRS

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
配置MongoDB目的端参数 - 云数据迁移 CDM

导入前准备语句执行任务前需要先执行的MongoDB查询语句。说明： “导入前准备语句”格式是json，只有两个键值对，第一个键值对是配置操作类别，key是"type"，value只支持"remove"和"drop"。第二个键值对是针对不同操作类别，需要配置的数据条件或者集合名称。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业目的端参数
HDFS连接 - 云数据迁移 CDM
HDFS连接 - 云数据迁移 CDM

HD时，需要配置Manager平台的IP地址。 linkConfig.port 否 String 连接FusionInsight HD时，需要配置Manager平台的端口。 linkConfig.casPort 否 String 连接FusionInsight HD时，需要配置与FusionInsight

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 连接参数说明
Mysql导入数据到DLI，快执行完时失败了提示Invoke DLI service api failed错误怎么解决？ - 云数据迁移 CDM

CDM集群，查看客户作业日志。根据分析步骤一报错，考虑是选错了队列类型，需要选择SQL队列。用户应该是先写到OBS文件，然后通过外表映射导入到DLI表。数据基本已经完成，最终映射时候报错，因为这种场景需要使用DLI的SQL队列。解决方案联系用户核实，确实选择队列不是SQL队

 帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
Oracle迁移到DWS报错ORA-01555 - 云数据迁移 CDM

tails/6432182。解决方案三种解决办法：调小每次查询的数据量。调大Oracle数据的RBS，需要修改数据库配置。减少频繁的commit操作，这个需要调整生产业务逻辑，基本不可能。父主题：故障处理类

 帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
配置MongoDB/DDS源端参数 - 云数据迁移 CDM

配置MongoDB/DDS源端参数从MongoDB、DDS迁移数据时，CDM会读取集合的首行数据作为字段列表样例，如果首行数据未包含该集合的所有字段，用户需要自己手工添加字段。作业中源连接为MongoDB连接时，即从本地MongoDB或DDS导出数据时，源端作业参数如表1所示。表1 MongoDB/DDS作为源端时的作业参数

 帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数
Hudi目的端的作业执行Spark SQL写入Hudi失败怎么办？ - 云数据迁移 CDM

write.partitionpath.field配置的列在源端数据中是否存在空值。可能数据倾斜导致executor使用内存超出限制，具体原因需要联系MRS定位。Yarn Application ID可以从日志中获取，日志搜索“Yarn Application Id”关键字，查询离报错信息最近的Yarn

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
删除连接 - 云数据迁移 CDM
删除连接 - 云数据迁移 CDM

String 项目ID，获取方法请参见项目ID和账号ID。 cluster_id 是 String 集群ID。 link_name 是 String 需要删除的连接名。请求参数表2 请求Header参数参数是否必选参数类型描述 X-Auth-Token 是 String 用户Token。

帮助中心 > 云数据迁移 CDM > API参考 > API > 连接管理
源端为HDFS - 云数据迁移 CDM
源端为HDFS - 云数据迁移 CDM

BINARY_FILE：二进制格式。当选择“BINARY_FILE”时，目的端也必须为文件系统。 fromJobConfig.columnList 否 String 需要抽取的列号，列号之间使用“&”分割，并由小到大排序，例如：“1&3&5”。 fromJobConfig.lineSeparator 否 String

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
配置HTTP源端参数 - 云数据迁移 CDM

选择“是”，将待上传的文本文件中所有URL对应的文件拉取到OBS，文本文件记录的是HDFS上的文件路径。是列表文件源连接文本文件存储在OBS桶中，这里需要选择已建立的OBS连接。 obs_link 列表文件OBS桶存储文本文件的OBS桶名称。 obs-cdm 列表文件或目录在OBS中存储

 帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数
配置DLI源端参数 - 云数据迁移 CDM

DLI作为源端时的作业参数参数名说明取值样例资源队列选择目的表所属的资源队列。 DLI的default队列无法在迁移作业中使用，您需要在DLI中新建SQL队列。 cdm 数据库名称写入数据的数据库名称。 dli 表名写入数据的表名。 car_detail 分区用于抽取分区的信息。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数
修改集群 - 云数据迁移 CDM
修改集群 - 云数据迁移 CDM

Content-Type 是 String 消息体的类型（格式），有Body体的情况下必选，没有Body体无需填写。如果请求消息体中含有中文字符，则需要通过charset=utf8指定中文字符集，例如取值为：application/json;charset=utf8。 X-Auth-Token

帮助中心 > 云数据迁移 CDM > API参考 > API > 集群管理
文件增量迁移 - 云数据迁移 CDM

配置作业定时自动执行，“重复周期”为1天。这样每天就可以把昨天生成的文件都导入到目的端目录，实现增量同步。文件增量迁移场景下，“路径过滤器”的使用方法同“文件过滤器”一样，需要路径名称里带有时间字段，这样可以定期增量同步指定目录下的所有文件。时间过滤参数位置：在创建表/文件迁移作业时，如果源端数据源为文件类型

 帮助中心 > 云数据迁移 CDM > 用户指南 > 关键操作指导 > 增量迁移原理介绍
配置Oracle源端参数 - 云数据迁移 CDM

参数指定具体的Oracle表分区。该功能不支持非分区表。数据库用户需要具有系统视图dba_tab_partitions和dba_tab_subpartitions的SELECT权限。否表分区输入需要迁移数据的Oracle表分区，多个分区以&分隔，不填则迁移所有分区。如果有子分区，以“分区

 帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数
作业任务参数说明 - 云数据迁移 CDM

是否定时执行：可选择作业是否定时自动启动。抽取并发数：可设置同时执行的抽取任务数。是否写入脏数据：如果需要将作业执行过程中处理失败的数据、或者被清洗过滤掉的数据写入OBS中，以便后面查看，可通过该参数配置，写入脏数据前需要先配置好OBS连接。作业运行完是否删除：可选择是否自动删除作业。 JSON样例

 帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构
源端为Redis - 云数据迁移 CDM
源端为Redis - 云数据迁移 CDM

值分隔符号，当“valueStoreType”为“STRING”时此参数有效，默认值为：“\tab”。 fromJobConfig.columnList 否 String 需要抽取的字段列表，字段名之间使用“&”分割，例如：“id&gid&name”。 fromJobConfig.formats 否数据结构时

 帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
配置PostgreSQL/SQL Server源端参数 - 云数据迁移 CDM

table drop table into outfile 如果SQL语句过长，会导致请求过长下发失败，继续创建作业系统会报错“错误请求”，此时您需要简化或清空SQL语句，再次尝试继续创建作业。 select id,name from sqoop.user; 模式或表空间 “使用SQL语

 帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数
配置MySQL源端参数 - 云数据迁移 CDM

table drop table into outfile 如果SQL语句过长，会导致请求过长下发失败，继续创建作业系统会报错“错误请求”，此时您需要简化或清空SQL语句，再次尝试继续创建作业。 select id,name from sqoop.user; 模式或表空间 “使用SQL语

 帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数

总条数： 281

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

步骤3：创建并执行作业 - 云数据迁移 CDM

MRS中恢复HBase表 - 云数据迁移 CDM

Hudi目的端的作业执行卡Running，读取行数写入行数相等且不再增加怎么解决？ - 云数据迁移 CDM

配置MongoDB目的端参数 - 云数据迁移 CDM

HDFS连接 - 云数据迁移 CDM

Mysql导入数据到DLI，快执行完时失败了提示Invoke DLI service api failed错误怎么解决？ - 云数据迁移 CDM

Oracle迁移到DWS报错ORA-01555 - 云数据迁移 CDM

配置MongoDB/DDS源端参数 - 云数据迁移 CDM

Hudi目的端的作业执行Spark SQL写入Hudi失败怎么办？ - 云数据迁移 CDM

删除连接 - 云数据迁移 CDM

源端为HDFS - 云数据迁移 CDM

配置HTTP源端参数 - 云数据迁移 CDM

配置DLI源端参数 - 云数据迁移 CDM

修改集群 - 云数据迁移 CDM

文件增量迁移 - 云数据迁移 CDM

配置Oracle源端参数 - 云数据迁移 CDM

作业任务参数说明 - 云数据迁移 CDM

源端为Redis - 云数据迁移 CDM

配置PostgreSQL/SQL Server源端参数 - 云数据迁移 CDM

配置MySQL源端参数 - 云数据迁移 CDM

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线