搜索_华为云

通过CDM从OBS迁移数据到DLI，同样的作业在新版本集群迁移失败？ - 云数据迁移 CDM

通过CDM从OBS迁移数据到DLI，同样的作业在新版本集群迁移失败？问题描述客户通过CDM从OBS迁移到DLI ，使用两个集群分别迁移，源端和目标端以及作业配置都一样，2.6.0版本的CDM集群作业可以迁移成功，2.8.6版本的集群迁移失败。报错作业日志如下图所示。原因分析

 帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
日志提示解析日期格式失败时怎么处理？ - 云数据迁移 CDM

使用原始日期格式来解析字符串，将字符串解析为一个日期对象。可以使用DateUtils.parseDate函数来解析，语法是：DateUtils.parseDate(String value, String format)。将日期对象格式化成目标格式的字符串，可以使用DateUtils

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
DMS Kafka连接 - 云数据迁移 CDM
DMS Kafka连接 - 云数据迁移 CDM

Kafka专享版。 linkConfig.brokerList 是 String DMS Endpoint格式为“host1:port1,host2:port2”。 linkConfig.isPlatinumInstance 是 Boolean 选择是否打开客户端连接Kafka专享版实例时SSL认证的开关。

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 连接参数说明
数据库写入OBS场景，表中小驼峰命名字段，提示字段不存在 - 云数据迁移 CDM

数据库写入OBS场景，表中小驼峰命名字段，提示字段不存在问题描述数据库写入OBS场景，表中小驼峰命名字段，提示字段不存在。故障分析查看日志报PG数据库表字段找不到所致，分析是字段命名使用小驼峰，而PG数据库区分大小写所以无法找到。解决方案让客户在连接配置高级属性添加包围符配置，问题解决。

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
Hudi目的端的作业自动建表报错：schema不匹配，建表失败怎么办？ - 云数据迁移 CDM

Hudi目的端的作业自动建表报错：schema不匹配，建表失败怎么办？问题描述 cdm迁移数据到hudi，hudi选择自动建表，执行建表语句报schema不匹配错误“org.apache.spark.sql.AnalysisException:Specified schema in

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
Kafka连接 - 云数据迁移 CDM
Kafka连接 - 云数据迁移 CDM

brokerList 是 String Apache Kafka 连接需配置此参数。Kafka broker列表，格式如：“host1:port1,host2:port2”。 llinkConfig.host 是 String MRS Manager的浮动IP地址，可以单击输入框后的“选择”

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 连接参数说明
DLI连接参数说明 - 云数据迁移 CDM

"obs:object:PutAccessLabel", "obs:bucket:ListBucket", "obs:bucket:GetBucketCORS", "obs:buc

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建连接 > 配置连接参数
Hudi目的端的作业执行卡Running，数据写入行数一直显示为0如何处理？ - 云数据迁移 CDM

Hudi目的端的作业执行卡Running，数据写入行数一直显示为0如何处理？问题描述打开日志，最后一行日志如下所示，则说明此时集群并发资源消耗殆尽，或者集群内存使用达到阈值，新提交的作业需要排队等待。 submit task attempt_local1847334969_1748_m_000003_0

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
作业配置表不存在时自动创建，目的端字段映射不出来怎么处理？ - 云数据迁移 CDM

作业配置表不存在时自动创建，目的端字段映射不出来怎么处理？问题描述迁移SQL Server数据到DWS，目的端配置了当表不存在时自动创建，目的端字段映射不出来，如下图所示。原因分析查看后端日志报：org.postgresql.util.PSQLException: ERROR:

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
正则表达式分隔半结构化文本 - 云数据迁移 CDM

隔。正则表达式参数在源端作业参数中配置，要求源连接为对象存储或者文件系统，且“文件格式”必须选择“CSV格式”。图1 正则表达式参数在迁移CSV格式的文件时，CDM支持使用正则表达式分隔字段，并按照解析后的结果写入目的端。正则表达式语法请参考对应的相关资料，这里举例下面几种日志文件的正则表达式的写法：

帮助中心 > 云数据迁移 CDM > 最佳实践 > 进阶实践
正则表达式分隔半结构化文本 - 云数据迁移 CDM

隔。正则表达式参数在源端作业参数中配置，要求源连接为对象存储或者文件系统，且“文件格式”必须选择“CSV格式”。图1 正则表达式参数在迁移CSV格式的文件时，CDM支持使用正则表达式分隔字段，并按照解析后的结果写入目的端。正则表达式语法请参考对应的相关资料，这里举例下面几种日志文件的正则表达式的写法：

帮助中心 > 云数据迁移 CDM > 用户指南 > 关键操作指导
参考：作业分片维度 - 云数据迁移 CDM

支持按HBase的Region分片。 Apache Hive HDFS读取方式时，支持按Hive文件分片。 JDBC读取方式时，不支持分片。对象存储对象存储服务（OBS）支持按文件分片。文件系统 FTP 支持按文件分片。 SFTP 支持按文件分片。 HTTP 支持按文件分片。关系型数据库

 帮助中心 > 云数据迁移 CDM > 性能白皮书
配置CDM作业定时任务 - 云数据迁移 CDM

结束时间：该参数为可选参数，表示停止自动执行定时任务的时间。如果没有配置，则表示一直自动执行。图5 重复周期为月例如上图表示：从2023年1月1日0点开始，每月5日、25日的0点自动执行作业，直到2023年12月31日23时59分不再自动执行。父主题：在CDM集群中创建作业

 帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业
Hudi目的端的作业执行卡Running，读取行数写入行数相等且不再增加怎么解决？ - 云数据迁移 CDM

Hudi目的端的作业执行卡Running，读取行数写入行数相等且不再增加怎么解决？问题描述 CDM写Hudi为两段式，先写到hive临时表，然后再执行spark sql写到Hudi，写入行数统计的是写hive临时表的行数，当行数不再增长时，说明源端数据已经读完写到Hive表中，此时作业正在执行Spark

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
启动作业 - 云数据迁移 CDM
启动作业 - 云数据迁移 CDM

启动作业，配置变量参数，作业配置无变量时，为空对象。响应参数状态码： 200 表4 响应Body参数参数参数类型描述 submissions Array of StartJobSubmission objects 作业运行信息，请参见submission参数说明。表5 StartJobSubmission

帮助中心 > 云数据迁移 CDM > API参考 > API > 作业管理
报错“配置项[linkConfig.createBackendLinks]不存在”或“配置项 [throttlingConfig.concurrentSubJobs] 不存在怎么办”？ - 云数据迁移 CDM

concurrentSubJobs] 不存在怎么办”？问题描述创建数据连接时报错“配置项[linkConfig.createBackendLinks]不存在”或创建作业时报错“配置项 [throttlingConfig.concurrentSubJobs] 不存在”。原因分析

 帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
数据迁移前后数据量不一致是什么问题？ - 云数据迁移 CDM

故障分析根据故障信息分析，考虑是作业配置限制，检查作业配置，发现目的端配置为导入开始前“不清除”，不清除可能存在多次操作，部分数据重复。解决方案目的端配置为导入开始前“清空全部数据”，验证后，源/目的端条数一致。父主题：故障处理类

 帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
作业配置添加字段，MongoDB字段映射存在问题 - 云数据迁移 CDM

document中的多个字段为一个JSON串（多个字段合并成一个json串，当做一个字段到目的端）。目的端数据库把同步过去数据，通过SQL分解处理。如下图。这里不影响作业映射已有字段，combine()中是包含所有新增字段的json串，目的端sql进行处理即可获取数据。父主题：故障处理类

 帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
Hudi目的端的作业执行过程中，由于源端连接闪断、超时或主动终止连接导致作业执行失败怎么处理？ - 云数据迁移 CDM

Hudi目的端的作业执行过程中，由于源端连接闪断、超时或主动终止连接导致作业执行失败怎么处理？问题描述作业执行过程中，由于源端连接闪断、超时或者源端主动终止了连接导致作业执行失败。问题分析日志中出现源端的read timeout报错，或者terminate by xxx之类的报错。

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
新建整库迁移作业 - 云数据迁移 CDM

脏数据要写入的连接，目前只支持写入到OBS连接。 obs_link OBS桶当“脏数据写入连接”为OBS类型的连接时，才显示该参数。写入脏数据的OBS桶的名称。 dirtydata 脏数据目录 “是否写入脏数据”选择为“是”时，该参数才显示。 OBS上存储脏数据的目录，只有在配置了脏数据目录的情况下才会记录脏数据。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业

总条数： 315

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

通过CDM从OBS迁移数据到DLI，同样的作业在新版本集群迁移失败？ - 云数据迁移 CDM

日志提示解析日期格式失败时怎么处理？ - 云数据迁移 CDM

DMS Kafka连接 - 云数据迁移 CDM

数据库写入OBS场景，表中小驼峰命名字段，提示字段不存在 - 云数据迁移 CDM

Hudi目的端的作业自动建表报错：schema不匹配，建表失败怎么办？ - 云数据迁移 CDM

Kafka连接 - 云数据迁移 CDM

DLI连接参数说明 - 云数据迁移 CDM

Hudi目的端的作业执行卡Running，数据写入行数一直显示为0如何处理？ - 云数据迁移 CDM

作业配置表不存在时自动创建，目的端字段映射不出来怎么处理？ - 云数据迁移 CDM

正则表达式分隔半结构化文本 - 云数据迁移 CDM

正则表达式分隔半结构化文本 - 云数据迁移 CDM

参考：作业分片维度 - 云数据迁移 CDM

配置CDM作业定时任务 - 云数据迁移 CDM

Hudi目的端的作业执行卡Running，读取行数写入行数相等且不再增加怎么解决？ - 云数据迁移 CDM

启动作业 - 云数据迁移 CDM

报错“配置项[linkConfig.createBackendLinks]不存在”或“配置项 [throttlingConfig.concurrentSubJobs] 不存在怎么办”？ - 云数据迁移 CDM

数据迁移前后数据量不一致是什么问题？ - 云数据迁移 CDM

作业配置添加字段，MongoDB字段映射存在问题 - 云数据迁移 CDM

Hudi目的端的作业执行过程中，由于源端连接闪断、超时或主动终止连接导致作业执行失败怎么处理？ - 云数据迁移 CDM

新建整库迁移作业 - 云数据迁移 CDM

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线