搜索_华为云

DLI外表(OBS文件)迁移DWS某字段转义，带有“\” - 云数据迁移 CDM

”引号，等特殊符号，jdbc驱动会字段转义，导致目的端显示带有转义符号。 DLI外表及OBS桶存储，及文件到表迁移，可以考虑源端作业配置加上包围符号即可，包围符双引号“，单个双引号。解决方案在OBS作业源端参数配置中，配置开启使用包围符号，单个双引号“，开启使用包围符，选择“是”即可。父主题：故障处理类

 帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
CSV数据类型插入MySQL报错invalid utf-8 charater string '' - 云数据迁移 CDM

后台排查sqoop日志，考虑源端数据类型格式问题导致异常。分析源端数据类型，发现数据类型中有脏数据，源端数据类型有问题。客户CDM界面配置脏数据功能，作业重跑成功，OBS桶排查脏数据类型存在问题，格式不匹配。父主题：故障处理类

 帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
源端为对象存储 - 云数据迁移 CDM

CSV_FILE：CSV格式，用于迁移文件到数据表的场景。 JSON_FILE：JSON格式，一般都是用于迁移文件到数据表的场景。 BINARY_FILE：二进制格式，不解析文件内容直接传输，不要求文件格式必须为二进制。适用于文件到文件的原样复制。当选择“BINARY_FILE”时，目的端也必须为文件系统。

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
获取集群列表为空/没有权限访问/操作时报当前策略不允许执行？ - 云数据迁移 CDM

执行启动作业/重启集群等操作时，报错当前策略不允许执行，如图2所示。图1 没有权限访问图2 不允许创建连接原因分析以上所列的问题均属于权限配置问题。解决方案如果是作为DataArts Studio服务CDM组件使用：检查用户是否添加DAYU Administrator或DAYU

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
Oracle迁移到DWS报错ORA-01555 - 云数据迁移 CDM

Oracel的RBS（rollbackspace 回滚时使用的表空间）较小，造成迁移任务没有完成，源库已更新，回滚超时。建议与总结调小每次查询的数据量。通过修改数据库配置调大Oracle的RBS。父主题：故障处理类

 帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
Hudi源端的作业长时间处于BOOTING状态怎么解决？ - 云数据迁移 CDM

除去Yarn队列资源问题，一般作业是卡在执行Spark SQL读Hudi写Hive临时表，这步执行的速度取决于Hudi表的数据量与Yarn队列剩余资源。作业配置了导入前清空数据，dws表存量数据多，卡在truncate table操作步骤中，默认5分钟超时。解决方案查看Yarn任务，搜索Spark

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
时间宏变量使用解析 - 云数据迁移 CDM

返回当前整小时的时间戳。 1508115600000 路径和表名的时间宏变量如图1所示，如果将：源端的“表名”配置为“CDM_/${dateformat(yyyy-MM-dd)}”。目的端的“写入目录”配置为“/opt/ttxx/${timestamp()}”。经过宏定义转换，这个作业表示：将Oracle数据库的“SQOOP

帮助中心 > 云数据迁移 CDM > 最佳实践 > 进阶实践
CDM迁移近一个月的数据 - 云数据迁移 CDM

文件格式：同源端相同，选择“二进制格式”。其它可选参数保持默认即可。单击“下一步”进行任务配置，其中抽取并发数默认为3，适当增加可以增加迁移速率，本例中设置为8，其它参数保持默认即可。重复上述步骤创建其它迁移目录的作业，参数配置都相同。2个CDM集群的作业个数平均分配，并发执行。作业执行完成后，

帮助中心 > 云数据迁移 CDM > 最佳实践 > 车联网大数据零丢失搬迁入湖
源端为FTP/SFTP - 云数据迁移 CDM
源端为FTP/SFTP - 云数据迁移 CDM

CSV_FILE：CSV格式，用于迁移文件到数据表的场景。 JSON_FILE：JSON格式，一般都是用于迁移文件到数据表的场景。 BINARY_FILE：二进制格式，不解析文件内容直接传输，不要求文件格式必须为二进制。适用于文件到文件的原样复制。当选择“BINARY_FILE”时，目的端也必须为文件系统。

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
Hudi目的端的作业执行Spark SQL写入Hudi失败怎么办？ - 云数据迁移 CDM

Hudi不支持并发写，会产生commit冲突。解决方案在DataArts Studio或者Hue或者spark-beeline上执行drop table将表从metastore中删除，然后作业配置 “不存在时创建”重跑作业。或者删除后自己执行建表语句重建一个Hudi表。对于MOR表来说，删表需要把r

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
迁移作业原理 - 云数据迁移 CDM

数据迁移作业提交运行后，CDM会根据作业配置中的“抽取并发数”参数，将每个作业拆分为多个Task，即作业分片。不同源端数据源的作业分片维度有所不同，因此某些作业可能出现未严格按作业“抽取并发数”参数分片的情况。 CDM依次将Task提交给运行池运行。根据集群配置管理中的“最大抽取并发数”参数，超出规格的Task排队等待运行。

帮助中心 > 云数据迁移 CDM > 性能白皮书
MD5校验文件一致性 - 云数据迁移 CDM

MD5校验文件一致性 CDM数据迁移以抽取-写入模式进行，CDM首先从源端抽取数据，然后将数据写入到目的端。在迁移文件到OBS时，迁移模式如图1所示。图1 迁移文件到OBS 在这个过程中，CDM支持使用MD5检验文件一致性。抽取时该功能支持源端为OBS、HDFS、FTP、S

帮助中心 > 云数据迁移 CDM > 用户指南 > 关键操作指导
时间宏变量使用解析 - 云数据迁移 CDM

返回当前整小时的时间戳。 1508115600000 路径和表名的时间宏变量如图1所示，如果将：源端的“表名”配置为“CDM_/${dateformat(yyyy-MM-dd)}”。目的端的“写入目录”配置为“/opt/ttxx/${timestamp()}”。经过宏定义转换，这个作业表示：将Oracle数据库的“SQOOP

帮助中心 > 云数据迁移 CDM > 用户指南 > 关键操作指导
作业任务参数说明 - 云数据迁移 CDM

抽取并发数：可设置同时执行的抽取任务数。是否写入脏数据：如果需要将作业执行过程中处理失败的数据、或者被清洗过滤掉的数据写入OBS中，以便后面查看，可通过该参数配置，写入脏数据前需要先配置好OBS连接。作业运行完是否删除：可选择是否自动删除作业。 JSON样例 "driver-config-values": {

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构
CDM迁移DWS数据报错Read timedout怎么处理？ - 云数据迁移 CDM

参数，保证在每次抽取写入数据间隔，CDM一直保持正常会话。解决方案通过增大jdbc连接超时时间的控制，重新迁移作业。通过作业配置中的源端和目标端连接名称，进入到cdm作业管理—>连接管理，找到该连接器名称。编辑连接器，显示高级属性—>连接属性—>添加：属性名称socketTimeout

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
定时任务失败，检查连接器连接存在问题 - 云数据迁移 CDM

问题描述 CDM任务检查网络连通性，源端数据库连接问题，测试连通性提示如下问题： “请检查IP、主机名、端口填写是否正确，检查网络安全组和防火墙配置是否正确，参考数据库返回消息进行定位。” 故障分析查询集群信息，获取公网IP，从CDM集群curl源端数据库的地址，如下所示。从结果看

 帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
MD5校验文件一致性 - 云数据迁移 CDM

MD5校验文件一致性 CDM数据迁移以抽取-写入模式进行，CDM首先从源端抽取数据，然后将数据写入到目的端。在迁移文件到OBS时，迁移模式如图1所示。图1 迁移文件到OBS 在这个过程中，CDM支持使用MD5检验文件一致性。抽取时该功能支持源端为OBS、HDFS、FTP、S

帮助中心 > 云数据迁移 CDM > 最佳实践 > 进阶实践
记录数据迁移入库时间 - 云数据迁移 CDM

创建表/文件迁移作业在创建表/文件迁移作业时，选择已创建的源端连接器、目的端连接器。图1 配置作业单击“下一步”，进入“字段映射”配置页面后，单击源字段图标。图2 配置字段映射选择“自定义字段”页签，填写字段名称及字段值后单击“确认”按钮，例如：名称：InputTime。

帮助中心 > 云数据迁移 CDM > 最佳实践 > 进阶实践
目的端为HDFS - 云数据迁移 CDM
目的端为HDFS - 云数据迁移 CDM

encryption”（加密方式）选择“AES-256-GCM”时有该参数，密钥由长度64的十六进制数组成。请您牢记这里配置的密钥，解密时的密钥与这里配置的必须一致。如果不一致系统不会报异常，只是解密出来的数据会错误。 toJobConfig.iv 否 String 初始化向量，“toJobConfig

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 目的端作业参数说明
事务模式迁移 - 云数据迁移 CDM

参数位置：创建表/文件迁移的作业时，如果目的端为关系型数据库，在目的端作业配置的高级属性中，可以通过“先导入阶段表”参数选择是否启用事务模式。参数原理：如果启用，在作业执行时CDM会自动创建临时表，先将数据导入到该临时表，导入成功后再通过数据库的事务模式将数据迁移到目标表中；导入失败则将目的表回滚到作业开始之前的状态。

帮助中心 > 云数据迁移 CDM > 用户指南 > 关键操作指导

总条数： 323

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

DLI外表(OBS文件)迁移DWS某字段转义，带有“\” - 云数据迁移 CDM

CSV数据类型插入MySQL报错invalid utf-8 charater string '' - 云数据迁移 CDM

源端为对象存储 - 云数据迁移 CDM

获取集群列表为空/没有权限访问/操作时报当前策略不允许执行？ - 云数据迁移 CDM

Oracle迁移到DWS报错ORA-01555 - 云数据迁移 CDM

Hudi源端的作业长时间处于BOOTING状态怎么解决？ - 云数据迁移 CDM

时间宏变量使用解析 - 云数据迁移 CDM

CDM迁移近一个月的数据 - 云数据迁移 CDM

源端为FTP/SFTP - 云数据迁移 CDM

Hudi目的端的作业执行Spark SQL写入Hudi失败怎么办？ - 云数据迁移 CDM

迁移作业原理 - 云数据迁移 CDM

MD5校验文件一致性 - 云数据迁移 CDM

时间宏变量使用解析 - 云数据迁移 CDM

作业任务参数说明 - 云数据迁移 CDM

CDM迁移DWS数据报错Read timedout怎么处理？ - 云数据迁移 CDM

定时任务失败，检查连接器连接存在问题 - 云数据迁移 CDM

MD5校验文件一致性 - 云数据迁移 CDM

记录数据迁移入库时间 - 云数据迁移 CDM

目的端为HDFS - 云数据迁移 CDM

事务模式迁移 - 云数据迁移 CDM

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线