搜索_华为云

计费说明 - 云数据迁移 CDM
计费说明 - 云数据迁移 CDM

经产生的费用按“按需计费”计费，购买折扣套餐之后的费用按“折扣套餐”计费。各折扣套餐包在不同规格下的具体价格，请参见产品价格详情。变更配置在开通CDM时有4种集群规格供您选择，您可根据业务需要选择合适的实例规格。当集群创建成功后，无法对集群进行规格变更，不过您可以通过删除集群后重建集群，实现变更。

帮助中心 > 云数据迁移 CDM > 产品介绍
应用示例 - 云数据迁移 CDM
应用示例 - 云数据迁移 CDM

应用示例本节通过cURL调用CDM API，迁移本地MySQL数据库中的数据到云上服务DWS为例，介绍使用CDM API的基本流程。获取token 获取用户的token，因为在后续的请求中需要将token放到请求消息头中作为认证。创建CDM集群如果您已经创建过CDM集群，

帮助中心 > 云数据迁移 CDM > API参考
是否支持批量创建作业？ - 云数据迁移 CDM

CDM可以通过批量导入的功能，实现批量创建作业，方法如下：手动创建一个作业。导出作业，将作业的JSON文件保存到本地。编辑JSON文件，参考该作业的配置，在JSON文件中批量复制出更多作业。将JSON文件导入CDM集群，实现批量创建作业。您也可以参考通过CDM算子批量创建分表迁移作业，配合For

帮助中心 > 云数据迁移 CDM > 常见问题 > 功能类
源端为HDFS - 云数据迁移 CDM
源端为HDFS - 云数据迁移 CDM

否 String 路径过滤器，过滤类型为通配符时配置，用于过滤文件目录，例如：“*input”。 fromJobConfig.fileFilter 否 String 文件过滤器，过滤类型为通配符时配置，用于过滤目录下的文件，支持配置多个文件，中间使用“,”分隔，例如：“*.csv

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
Oracle迁移到DWS报错ORA-01555 - 云数据迁移 CDM

Oracel的RBS（rollbackspace 回滚时使用的表空间）较小，造成迁移任务没有完成，源库已更新，回滚超时。建议与总结调小每次查询的数据量。通过修改数据库配置调大Oracle的RBS。父主题：故障处理类

 帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
Hudi源端的作业长时间处于BOOTING状态怎么解决？ - 云数据迁移 CDM

除去Yarn队列资源问题，一般作业是卡在执行Spark SQL读Hudi写Hive临时表，这步执行的速度取决于Hudi表的数据量与Yarn队列剩余资源。作业配置了导入前清空数据，dws表存量数据多，卡在truncate table操作步骤中，默认5分钟超时。解决方案查看Yarn任务，搜索Spark

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
CSV数据类型插入MySQL报错invalid utf-8 charater string '' - 云数据迁移 CDM

后台排查sqoop日志，考虑源端数据类型格式问题导致异常。分析源端数据类型，发现数据类型中有脏数据，源端数据类型有问题。客户CDM界面配置脏数据功能，作业重跑成功，OBS桶排查脏数据类型存在问题，格式不匹配。父主题：故障处理类

 帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
创建源数据连接，一直报错用户名和密码错误，但是实际填的没有错 - 云数据迁移 CDM

创建源数据连接，一直报错用户名和密码错误，但是实际填的没有错问题描述创建Mysql链接，确认过用户名、密码没有错，同样的配置，在roma上建立数据连接能成功。故障分析查看后端日志，考虑用户Mysql侧有白名单限制，测试内网相通的另一台ECS Mysql客户端使用这个用户链接。

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
时间宏变量使用解析 - 云数据迁移 CDM

返回当前整小时的时间戳。 1508115600000 路径和表名的时间宏变量如图1所示，如果将：源端的“表名”配置为“CDM_/${dateformat(yyyy-MM-dd)}”。目的端的“写入目录”配置为“/opt/ttxx/${timestamp()}”。经过宏定义转换，这个作业表示：将Oracle数据库的“SQOOP

帮助中心 > 云数据迁移 CDM > 最佳实践 > 进阶实践
源端为FTP/SFTP - 云数据迁移 CDM
源端为FTP/SFTP - 云数据迁移 CDM

否 String 路径过滤器，过滤类型为通配符时配置，用于过滤文件目录，例如：“*input”。 fromJobConfig.fileFilter 否 String 文件过滤器，过滤类型为通配符时配置，用于过滤目录下的文件，支持配置多个文件，中间使用“,”分隔，例如：“*.csv

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
Hudi目的端的作业执行Spark SQL写入Hudi失败怎么办？ - 云数据迁移 CDM

hoodie目录。可能删表的时候只删了文件而没有drop table。设置为主键或者预聚合键的列有空值，写入hoodie会失败。查看作业配置，查看表属性中hoodie.datasource.write.recordkey.field、hoodie.datasource.write

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
迁移作业原理 - 云数据迁移 CDM

数据迁移作业提交运行后，CDM会根据作业配置中的“抽取并发数”参数，将每个作业拆分为多个Task，即作业分片。不同源端数据源的作业分片维度有所不同，因此某些作业可能出现未严格按作业“抽取并发数”参数分片的情况。 CDM依次将Task提交给运行池运行。根据集群配置管理中的“最大抽取并发数”参数，超出规格的Task排队等待运行。

帮助中心 > 云数据迁移 CDM > 性能白皮书
权限及授权项说明 - 云数据迁移 CDM

1/{project_id}/clusters/{cluster_id}/action cdm:cluster:operate √ × 修改集群配置 POST /v1.1/{project_id}/cluster/modify/{cluster_id} cdm:cluster:modify

帮助中心 > 云数据迁移 CDM > API参考
MRS Hive，MRS Kafka，MRS Hudi数据源创建连接时IP长度校验不通过，如何处理？ - 云数据迁移 CDM

MRS Hive，MRS Kafka，MRS Hudi数据源创建连接时IP长度校验不通过，如何处理？ MRS Hive，MRS Kafka，MRS Hudi数据源在创建连接时，单击“选择”选定MRS集群，Manager IP获取到IP如果长度校验不通过，如下图所示。解决方法单

 帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
时间宏变量使用解析 - 云数据迁移 CDM

返回当前整小时的时间戳。 1508115600000 路径和表名的时间宏变量如图1所示，如果将：源端的“表名”配置为“CDM_/${dateformat(yyyy-MM-dd)}”。目的端的“写入目录”配置为“/opt/ttxx/${timestamp()}”。经过宏定义转换，这个作业表示：将Oracle数据库的“SQOOP

帮助中心 > 云数据迁移 CDM > 用户指南 > 关键操作指导
MD5校验文件一致性 - 云数据迁移 CDM

该功能由源端作业参数“MD5文件名后缀”控制（“文件格式”为“二进制格式”时生效），配置为源端文件系统中的MD5文件名后缀。当源端数据文件同一目录下有对应后缀的保存md5值的文件，例如build.sh和build.sh.md5在同一目录下。若配置了“MD5文件名后缀”，则只迁移有MD5值的文件至目的端，

帮助中心 > 云数据迁移 CDM > 最佳实践 > 进阶实践
作业任务参数说明 - 云数据迁移 CDM

抽取并发数：可设置同时执行的抽取任务数。是否写入脏数据：如果需要将作业执行过程中处理失败的数据、或者被清洗过滤掉的数据写入OBS中，以便后面查看，可通过该参数配置，写入脏数据前需要先配置好OBS连接。作业运行完是否删除：可选择是否自动删除作业。 JSON样例 "driver-config-values": {

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构
MD5校验文件一致性 - 云数据迁移 CDM

该功能由源端作业参数“MD5文件名后缀”控制（“文件格式”为“二进制格式”时生效），配置为源端文件系统中的MD5文件名后缀。当源端数据文件同一目录下有对应后缀的保存md5值的文件，例如build.sh和build.sh.md5在同一目录下。若配置了“MD5文件名后缀”，则只迁移有MD5值的文件至目的端，

帮助中心 > 云数据迁移 CDM > 用户指南 > 关键操作指导
事务模式迁移 - 云数据迁移 CDM

败时，将数据回滚到作业开始之前的状态，自动清理目的表中的数据。参数位置：创建表/文件迁移的作业时，如果目的端为关系型数据库，在目的端作业配置的高级属性中，可以通过“先导入阶段表”参数选择是否启用事务模式。参数原理：如果启用，在作业执行时CDM会自动创建临时表，先将数据导入到该

 帮助中心 > 云数据迁移 CDM > 用户指南 > 关键操作指导
正则表达式分隔半结构化文本 - 云数据迁移 CDM

复杂的半结构化文本，由于字段值也包含了分隔符，所以无法使用分隔符进行字段分隔，此时可以使用正则表达式分隔。正则表达式参数在源端作业参数中配置，要求源连接为对象存储或者文件系统，且“文件格式”必须选择“CSV格式”。图1 正则表达式参数在迁移CSV格式的文件时，CDM支持使用

 帮助中心 > 云数据迁移 CDM > 用户指南 > 关键操作指导

总条数： 338

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

计费说明 - 云数据迁移 CDM

应用示例 - 云数据迁移 CDM

是否支持批量创建作业？ - 云数据迁移 CDM

源端为HDFS - 云数据迁移 CDM

Oracle迁移到DWS报错ORA-01555 - 云数据迁移 CDM

Hudi源端的作业长时间处于BOOTING状态怎么解决？ - 云数据迁移 CDM

CSV数据类型插入MySQL报错invalid utf-8 charater string '' - 云数据迁移 CDM

创建源数据连接，一直报错用户名和密码错误，但是实际填的没有错 - 云数据迁移 CDM

时间宏变量使用解析 - 云数据迁移 CDM

源端为FTP/SFTP - 云数据迁移 CDM

Hudi目的端的作业执行Spark SQL写入Hudi失败怎么办？ - 云数据迁移 CDM

迁移作业原理 - 云数据迁移 CDM

权限及授权项说明 - 云数据迁移 CDM

MRS Hive，MRS Kafka，MRS Hudi数据源创建连接时IP长度校验不通过，如何处理？ - 云数据迁移 CDM

时间宏变量使用解析 - 云数据迁移 CDM

MD5校验文件一致性 - 云数据迁移 CDM

作业任务参数说明 - 云数据迁移 CDM

MD5校验文件一致性 - 云数据迁移 CDM

事务模式迁移 - 云数据迁移 CDM

正则表达式分隔半结构化文本 - 云数据迁移 CDM

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线