搜索_华为云

性能调优 - 云数据迁移 CDM
性能调优 - 云数据迁移 CDM

图1 集群最大抽取并发数配置作业抽取并发数的配置原则如下：迁移的目的端为文件时，CDM不支持多并发，此时应配置为单进程抽取数据。表中每行数据大小为1MB以下的可以设置多并发抽取，超过1MB的建议单线程抽取数据。作业抽取并发数可参考集群最大抽取并发数配置，但不建议超过集群最大抽取并发数上限。

帮助中心 > 云数据迁移 CDM > 性能白皮书
HBase连接 - 云数据迁移 CDM
HBase连接 - 云数据迁移 CDM

linkConfig.user 否 String 登录Manager平台的用户名，使用集群配置时不用配置 linkConfig.password 否 String 登录Manager平台的密码，使用集群配置时不用配置 linkConfig.authType 否枚举认证类型，分为以下两种：

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 连接参数说明
管理单个CDM作业 - 云数据迁移 CDM

编辑作业JSON：选择作业操作列的“更多 > 编辑作业JSON”，可直接编辑该作业的JSON文件，作用等同于修改作业的参数配置。配置定时任务：选择作业操作列的“更多 > 配置定时任务”，可选择在有效期内周期性启动作业，具体请参考配置CDM作业定时任务。日志：选择作业操作列的“更多 > 日志”，可查看该作业最近的一次日志。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业
整库迁移到Hive，报错Identifier name is too long如何处理？ - 云数据迁移 CDM

迁移任务报错表名太长，但表名实际没有这么长。原因分析在任务迁移时，导入数据前会先创建一个实际表名+阶段表后缀的阶段表，最终导致的作业异常。解决方案在作业配置高级属性将导入阶段表设置为否，这样就不会先导入阶段表。缩短实际表的表名长度。父主题：故障处理类

 帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
新建MRS Hive连接时，提示：CORE_0031:Connect time out. (Cdm.0523) 怎么解决？ - 云数据迁移 CDM

Hive连接时，提示：CORE_0031:Connect time out. (Cdm.0523) 。解决方案新建MRS Hive连接时，提示无法下载配置文件，实际是用户权限不足。建议您新建一个业务用户，给对应的权限后重试即可。如果要创建MRS安全集群的数据连接，不能使用admin用户。因

 帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
通过json方式导入的作业，sql server迁移到hive，执行作业报错 - 云数据迁移 CDM

通过修改作业json的方式将作业并发数设置为1即可，参数："throttlingConfig.numExtractors"。在作业配置界面，源端参数配置的高级属性中，给 “抽取分区字段”配置项指定字段即可（建议为源端表的主键或者递增的字段）。父主题：故障处理类

 帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
认证证书 - 云数据迁移 CDM
认证证书 - 云数据迁移 CDM

认证证书合规证书华为云服务及平台通过了多项国内外权威机构（ISO/SOC/PCI等）的安全合规认证，用户可自行申请下载合规资质证书。图1 合规证书下载资源中心华为云还提供以下资源来帮助用户满足合规性要求，具体请查看资源中心。图2 资源中心销售许可证&软件著作权证书

 帮助中心 > 云数据迁移 CDM > 产品介绍 > 安全
源端为HDFS - 云数据迁移 CDM
源端为HDFS - 云数据迁移 CDM

否 String 路径过滤器，过滤类型为通配符时配置，用于过滤文件目录，例如：“*input”。 fromJobConfig.fileFilter 否 String 文件过滤器，过滤类型为通配符时配置，用于过滤目录下的文件，支持配置多个文件，中间使用“,”分隔，例如：“*.csv

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
迁移数据到DLI时有数据丢失怎么处理？ - 云数据迁移 CDM

迁移数据到DLI时有数据丢失怎么处理？问题描述目的端是DLI的迁移作业执行成功后，显示迁移的数据条数和DLI表中查询的数量对不上，存在数据丢失。原因分析查看客户的作业配置，客户并发数设置的是3，如图所示。查看DLI官网文档不建议同时对一张表并发插入数据。解决方案将作业的抽取并发数改成1 ，重跑作业问题解决。

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
参考：作业分片维度 - 云数据迁移 CDM

云数据库 MySQL 支持按表字段分片。仅当配置“按表分区抽取”时，按表分区分片。云数据库 PostgreSQL 支持按表字段分片。仅当配置“按表分区抽取”时，按表分区分片。云数据库 SQL Server 支持按表字段分片。仅当配置“按表分区抽取”时，按表分区分片。 MySQL

帮助中心 > 云数据迁移 CDM > 性能白皮书
DLI外表(OBS文件)迁移DWS某字段转义，带有“\” - 云数据迁移 CDM

义，导致目的端显示带有转义符号。 DLI外表及OBS桶存储，及文件到表迁移，可以考虑源端作业配置加上包围符号即可，包围符双引号“，单个双引号。解决方案在OBS作业源端参数配置中，配置开启使用包围符号，单个双引号“，开启使用包围符，选择“是”即可。父主题：故障处理类

 帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
是否支持批量创建作业？ - 云数据迁移 CDM

CDM可以通过批量导入的功能，实现批量创建作业，方法如下：手动创建一个作业。导出作业，将作业的JSON文件保存到本地。编辑JSON文件，参考该作业的配置，在JSON文件中批量复制出更多作业。将JSON文件导入CDM集群，实现批量创建作业。您也可以参考通过CDM算子批量创建分表迁移作业，配合For

帮助中心 > 云数据迁移 CDM > 常见问题 > 功能类
CSV数据类型插入MySQL报错invalid utf-8 charater string '' - 云数据迁移 CDM

后台排查sqoop日志，考虑源端数据类型格式问题导致异常。分析源端数据类型，发现数据类型中有脏数据，源端数据类型有问题。客户CDM界面配置脏数据功能，作业重跑成功，OBS桶排查脏数据类型存在问题，格式不匹配。父主题：故障处理类

 帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
获取集群列表为空/没有权限访问/操作时报当前策略不允许执行？ - 云数据迁移 CDM

执行启动作业/重启集群等操作时，报错当前策略不允许执行，如图2所示。图1 没有权限访问图2 不允许创建连接原因分析以上所列的问题均属于权限配置问题。解决方案如果是作为DataArts Studio服务CDM组件使用：检查用户是否添加DAYU Administrator或DAYU

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
Oracle迁移到DWS报错ORA-01555 - 云数据迁移 CDM

Oracel的RBS（rollbackspace 回滚时使用的表空间）较小，造成迁移任务没有完成，源库已更新，回滚超时。建议与总结调小每次查询的数据量。通过修改数据库配置调大Oracle的RBS。父主题：故障处理类

 帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
Hudi源端的作业长时间处于BOOTING状态怎么解决？ - 云数据迁移 CDM

除去Yarn队列资源问题，一般作业是卡在执行Spark SQL读Hudi写Hive临时表，这步执行的速度取决于Hudi表的数据量与Yarn队列剩余资源。作业配置了导入前清空数据，dws表存量数据多，卡在truncate table操作步骤中，默认5分钟超时。解决方案查看Yarn任务，搜索Spark

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
车联网大数搬迁入湖简介场景介绍 - 云数据迁移 CDM

车联网大数搬迁入湖简介场景介绍场景描述为搭建H公司车联网业务集团级的云管理平台，统一管理、部署硬件资源和通用类软件资源，实现IT应用全面服务化、云化，CDM（Cloud Data Migration，简称CDM）助力H公司做到代码“0”改动、数据“0”丢失迁移上云。约束限制

 帮助中心 > 云数据迁移 CDM > 最佳实践 > 车联网大数据零丢失搬迁入湖
时间宏变量使用解析 - 云数据迁移 CDM

返回当前整小时的时间戳。 1508115600000 路径和表名的时间宏变量如图1所示，如果将：源端的“表名”配置为“CDM_/${dateformat(yyyy-MM-dd)}”。目的端的“写入目录”配置为“/opt/ttxx/${timestamp()}”。经过宏定义转换，这个作业表示：将Oracle数据库的“SQOOP

帮助中心 > 云数据迁移 CDM > 最佳实践 > 进阶实践
查询作业 - 云数据迁移 CDM
查询作业 - 云数据迁移 CDM

name String 配置名称：源端作业的配置名称为“fromJobConfig”。目的端作业的配置名称为“toJobConfig”，连接的配置名称固定为“linkConfig”。 id Integer 配置ID，由系统生成，用户无需填写。 type String 配置类型，由系统生成

 帮助中心 > 云数据迁移 CDM > API参考 > API > 作业管理
源端为FTP/SFTP - 云数据迁移 CDM
源端为FTP/SFTP - 云数据迁移 CDM

否 String 路径过滤器，过滤类型为通配符时配置，用于过滤文件目录，例如：“*input”。 fromJobConfig.fileFilter 否 String 文件过滤器，过滤类型为通配符时配置，用于过滤目录下的文件，支持配置多个文件，中间使用“,”分隔，例如：“*.csv

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明

总条数： 336

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

性能调优 - 云数据迁移 CDM

HBase连接 - 云数据迁移 CDM

管理单个CDM作业 - 云数据迁移 CDM

整库迁移到Hive，报错Identifier name is too long如何处理？ - 云数据迁移 CDM

新建MRS Hive连接时，提示：CORE_0031:Connect time out. (Cdm.0523) 怎么解决？ - 云数据迁移 CDM

通过json方式导入的作业，sql server迁移到hive，执行作业报错 - 云数据迁移 CDM

认证证书 - 云数据迁移 CDM

源端为HDFS - 云数据迁移 CDM

迁移数据到DLI时有数据丢失怎么处理？ - 云数据迁移 CDM

参考：作业分片维度 - 云数据迁移 CDM

DLI外表(OBS文件)迁移DWS某字段转义，带有“\” - 云数据迁移 CDM

是否支持批量创建作业？ - 云数据迁移 CDM

CSV数据类型插入MySQL报错invalid utf-8 charater string '' - 云数据迁移 CDM

获取集群列表为空/没有权限访问/操作时报当前策略不允许执行？ - 云数据迁移 CDM

Oracle迁移到DWS报错ORA-01555 - 云数据迁移 CDM

Hudi源端的作业长时间处于BOOTING状态怎么解决？ - 云数据迁移 CDM

车联网大数搬迁入湖简介场景介绍 - 云数据迁移 CDM

时间宏变量使用解析 - 云数据迁移 CDM

查询作业 - 云数据迁移 CDM

源端为FTP/SFTP - 云数据迁移 CDM

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线