搜索_华为云

性能调优 - 云数据迁移 CDM
性能调优 - 云数据迁移 CDM

需要用于数据迁移作业，又需要作为DataArts Studio管理中心连接代理时，建议各配置至少一个CDM集群。待迁移任务库表较多，迁移量较大。此时可以使用多个CDM集群同时作业，提升迁移效率。当前CDM集群的CPU使用率、磁盘使用率、内存使用率等指标经常在较高区间运行。此时建议使用多个CDM集群进行业务分流。

帮助中心 > 云数据迁移 CDM > 性能白皮书
CDM作业配置管理 - 云数据迁移 CDM

如OBS桶名、文件路径等）、参数中的某个字段、或者字段中的某个字符，都支持配置为一个全局变量，方便您批量更改作业中的参数值，以及作业导出/导入后进行批量替换。这里以批量替换作业中OBS桶名为例进行介绍。在CDM作业管理界面，单击“配置管理”页签，配置环境变量。 bucket_1=A

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业
Hudi目的端的作业执行Spark SQL写入Hudi失败怎么办？ - 云数据迁移 CDM

Hudi目的端的作业执行Spark SQL写入Hudi失败怎么办？问题描述报错：hoodie table path not found。报错：写入记录中存在空值，写入失败。报错：killed by external signal。报错：java.lang.IllegalArgumentException。

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
查询支持的版本 - 云数据迁移 CDM

响应Body参数参数参数类型描述 datastores Array of CdmClusterDatastore objects 数据库列表。表4 CdmClusterDatastore 参数参数类型描述 id String 服务ID，用于区分不同服务。 name String

帮助中心 > 云数据迁移 CDM > API参考 > API > 集群管理
基本概念 - 云数据迁移 CDM
基本概念 - 云数据迁移 CDM

基本概念账号用户注册时的账号，账号对其所拥有的资源及云服务具有完全的访问权限，可以重置用户密码、分配用户权限等。由于账号是付费主体，为了确保账号安全，建议您不要直接使用账号进行日常管理工作，而是创建IAM用户并使用他们进行日常管理工作。 IAM用户由账号在IAM中创建的用户

 帮助中心 > 云数据迁移 CDM > API参考 > 使用前必读
项目ID和账号ID - 云数据迁移 CDM

项目ID表示租户的资源，账号ID对应当前账号，IAM用户ID对应当前用户。用户可在对应页面下查看不同Region对应的项目ID、账号ID和用户ID。注册并登录管理控制台。在用户名的下拉列表中单击“我的凭证”。在“API凭证”页面，查看账号名和账号ID、IAM用户名和IAM用户ID，在项目列表中查看项目和项目ID。

帮助中心 > 云数据迁移 CDM > API参考 > 使用前必读
车联网大数搬迁入湖简介场景介绍 - 云数据迁移 CDM

era Hadoop） HBase集群中共有854张表约400TB，备HBase集群中共有149张表，约10TB数据。最近一个月新增的数据量是60TB。使用CDM将CDH集群中的HBase HFile抽取出来存入到MRS（MapReduce） HDFS中，再通过HBase修复命

 帮助中心 > 云数据迁移 CDM > 最佳实践 > 车联网大数据零丢失搬迁入湖
Hudi目的端的作业执行卡Running，读取行数写入行数相等且不再增加怎么解决？ - 云数据迁移 CDM

Hudi目的端的作业执行卡Running，读取行数写入行数相等且不再增加怎么解决？问题描述 CDM写Hudi为两段式，先写到hive临时表，然后再执行spark sql写到Hudi，写入行数统计的是写hive临时表的行数，当行数不再增长时，说明源端数据已经读完写到Hive表中，此时作业正在执行Spark

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
Hudi源端作业，读Hudi作业字段映射多了一列col，作业执行失败怎么处理？ - 云数据迁移 CDM

Hudi源端作业，读Hudi作业字段映射多了一列col，作业执行失败怎么处理？问题描述读Hudi作业字段映射多了一列col，作业执行失败。原因分析使用Spark SQL写数据入hudi表，由于配置问题，表schema中会自动增加一列类型为array<string>，名称为col的列。

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
不支持数据类型转换规避指导 - 云数据迁移 CDM

不支持数据类型转换规避指导操作场景 CDM在配置字段映射时提示字段的数据类型不支持，要求删除该字段。如果需要使用该字段，可在源端作业配置中使用SQL语句对字段类型进行转换，转换成CDM支持的类型，达到迁移数据的目的。操作步骤修改CDM迁移作业，通过使用SQL语句的方式迁移。

帮助中心 > 云数据迁移 CDM > 用户指南 > 关键操作指导
Hudi目的端的作业自动建表报错：schema不匹配，建表失败怎么办？ - 云数据迁移 CDM

Hudi目的端的作业自动建表报错：schema不匹配，建表失败怎么办？问题描述 cdm迁移数据到hudi，hudi选择自动建表，执行建表语句报schema不匹配错误“org.apache.spark.sql.AnalysisException:Specified schema in

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
查询集群实例信息 - 云数据迁移 CDM

说明。 datastore Datastore object 集群信息，请参见datastore参数说明。 dbuser String 数据库用户，这里为cdm。 payModel Integer 付费模式： 0：按需。 1：包周期。 publicIp String 集群绑定的公网地址。

帮助中心 > 云数据迁移 CDM > API参考 > API > 集群管理
查询集群列表 - 云数据迁移 CDM

objects 集群的节点信息，请参见instances参数说明。 azName String az名称。 dbuser String 数据库用户。 flavorName String 规格名称。 recentEvent Integer 事件数。 isAutoOff Boolean

帮助中心 > 云数据迁移 CDM > API参考 > API > 集群管理
查询集群详情 - 云数据迁移 CDM

failedReasons FailedReasons object 失败原因。集群处于正常状态时不返回。 dbuser String 数据库用户。 links Array of ClusterLinks objects 集群连接信息。 clusterMode String 集群模式：sharding(分片集群)。

帮助中心 > 云数据迁移 CDM > API参考 > API > 集群管理
创建CDM集群 - 云数据迁移 CDM
创建CDM集群 - 云数据迁移 CDM

xlarge：超大规格，16核CPU、32G内存的虚拟机，最大带宽/基准带宽为10/4 Gbps，集群作业并发数上限为32，适合使用10GE高速带宽进行TB级以上的数据量迁移。 cdm.4xlarge：4倍超大规格，64核CPU、128G内存的虚拟机，最大带宽/基准带宽为40/36 Gbps，集群作业并发数上限为128。

帮助中心 > 云数据迁移 CDM > 用户指南 > 创建并管理CDM集群
创建集群 - 云数据迁移 CDM
创建集群 - 云数据迁移 CDM

6ddb1072-c5d7-40e0-a874-8a032e81a698：表示cdm.xlarge规格，16核CPU、32G内存的虚拟机。需要10GE高速带宽进行TB以上的数据量迁移时使用。 type 是 String 节点类型，当前只有“cdm”一种类型。表6 nics 参数是否必选参数类型描述 securityGroupId

帮助中心 > 云数据迁移 CDM > API参考 > API > 集群管理
当Hudi表属性和hoodie.properties文件中分区信息不一致时，会导致数据写入失败怎么解决？ - 云数据迁移 CDM

当Hudi表属性和hoodie.properties文件中分区信息不一致时，会导致数据写入失败怎么解决？问题描述当Hudi表属性和hoodie.properties文件中分区信息不一致时，会导致数据写入失败。解决方案执行如下spark-sql语句修改hoodie.properties文件信息。

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
配置LogHub（SLS）源端参数 - 云数据迁移 CDM

配置LogHub（SLS）源端参数作业中源连接为LogHub（SLS）连接时，源端作业参数如表1所示。表1 LogHub（SLS）作为源端时的作业参数参数名说明取值样例源连接名称选择已配置的LogHub（SLS）连接。 sls_link 日志库目标日志库的名称。 -

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数
新建MRS Hive连接时，提示：CORE_0031:Connect time out. (Cdm.0523) 怎么解决？ - 云数据迁移 CDM

新建MRS Hive连接时，提示：CORE_0031:Connect time out. (Cdm.0523) 怎么解决？问题描述新建MRS Hive连接时，提示：CORE_0031:Connect time out. (Cdm.0523) 。解决方案新建MRS Hive

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
Kafka连接参数说明 - 云数据迁移 CDM

Kafka连接参数说明 MRS Kafka 连接MRS上的Kafka数据源时，相关参数如表1所示。作业运行中禁止修改密码或者更换用户。在作业运行过程中修改密码或者更换用户，密码不会立即生效且作业会运行失败。表1 MRS Kafka连接参数参数名说明取值样例名称连接的

 帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建连接 > 配置连接参数

总条数： 263

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

性能调优 - 云数据迁移 CDM

CDM作业配置管理 - 云数据迁移 CDM

Hudi目的端的作业执行Spark SQL写入Hudi失败怎么办？ - 云数据迁移 CDM

查询支持的版本 - 云数据迁移 CDM

基本概念 - 云数据迁移 CDM

项目ID和账号ID - 云数据迁移 CDM

车联网大数搬迁入湖简介场景介绍 - 云数据迁移 CDM

Hudi目的端的作业执行卡Running，读取行数写入行数相等且不再增加怎么解决？ - 云数据迁移 CDM

Hudi源端作业，读Hudi作业字段映射多了一列col，作业执行失败怎么处理？ - 云数据迁移 CDM

不支持数据类型转换规避指导 - 云数据迁移 CDM

Hudi目的端的作业自动建表报错：schema不匹配，建表失败怎么办？ - 云数据迁移 CDM

查询集群实例信息 - 云数据迁移 CDM

查询集群列表 - 云数据迁移 CDM

查询集群详情 - 云数据迁移 CDM

创建CDM集群 - 云数据迁移 CDM

创建集群 - 云数据迁移 CDM

当Hudi表属性和hoodie.properties文件中分区信息不一致时，会导致数据写入失败怎么解决？ - 云数据迁移 CDM

配置LogHub（SLS）源端参数 - 云数据迁移 CDM

新建MRS Hive连接时，提示：CORE_0031:Connect time out. (Cdm.0523) 怎么解决？ - 云数据迁移 CDM

Kafka连接参数说明 - 云数据迁移 CDM

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线