搜索_华为云

目的端为Elasticsearch/云搜索服务 - 云数据迁移 CDM

d&name”。 toJobConfig.pipeLine 否 String 需要先在kibana中创建管道ID，这里才可以选择，该参数用于数据传到云搜索服务/Elasticsearch后，通过Elasticsearch的数据转换pipeline进行数据格式变换。 toJobConfig

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 目的端作业参数说明
CloudTable连接参数说明 - 云数据迁移 CDM

参数名说明取值样例名称连接的名称，根据连接的数据源类型，用户可自定义便于记忆、区分的连接名。 cloudtable_link ZK链接地址可通过CloudTable服务的集群管理界面获取该参数值。 cloudtable-cdm-zk1.cloudtable.com:2181

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建连接 > 配置连接参数
CloudTable连接 - 云数据迁移 CDM
CloudTable连接 - 云数据迁移 CDM

linkConfig.zookeeperQuorum 是 String 连接“CloudTable”时必选，表示CloudTable的ZooKeeper链接地址。 linkConfig.iamAuth 是 Boolean 当选择IAM统一身份认证时，需要输入用户名、AK和SK。 linkConfig

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 连接参数说明
作业任务参数说明 - 云数据迁移 CDM

抽取并发数：可设置同时执行的抽取任务数。是否写入脏数据：如果需要将作业执行过程中处理失败的数据、或者被清洗过滤掉的数据写入OBS中，以便后面查看，可通过该参数配置，写入脏数据前需要先配置好OBS连接。作业运行完是否删除：可选择是否自动删除作业。 JSON样例 "driver-config-values":

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构
配置Oracle源端参数 - 云数据迁移 CDM

“使用SQL语句”选择“是”时，您可以在这里输入自定义的SQL语句，CDM将根据该语句导出数据。说明： SQL语句只能查询数据，支持join和嵌套写法，但不能有多条查询语句，比如 select * from table a; select * from table b。不支持with语句。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数
CDM可以跨账户使用吗？ - 云数据迁移 CDM

用户组。用户登录并验证权限新创建的用户登录控制台，切换至授权区域，验证权限：在“服务列表”中选择“云数据迁移服务”，进入CDM主界面查看集群，若未提示权限不足，表示“CDM ReadOnlyAccess”已生效。在“服务列表”中选择除CDM服务外的任一服务，若提示权限不足，表示“CDM

帮助中心 > 云数据迁移 CDM > 常见问题 > 通用类
源端为HTTP/HTTPS - 云数据迁移 CDM

fromCompression 否枚举选择对应压缩格式的源文件进行迁移： NONE：表示传输所有格式的文件。 GZIP：表示只传输GZIP格式的文件。 ZIP：表示只传输ZIP格式的文件。 TAR.GZ：表示只传输TAR.GZ格式的文件。 fromJobConfig.compressedFileSuffix

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
性能调优 - 云数据迁移 CDM
性能调优 - 云数据迁移 CDM

规格的Task排队等待运行。因此作业抽取并发数和集群最大抽取并发数参数设置为适当的值可以有效提升迁移速度。关于如何调整抽取并发数，详情请参考如何调整抽取并发数。如何调整抽取并发数集群最大抽取并发数的设置与CDM集群规格有关，并发数上限建议配置为vCPU核数*2，如表1所示。

帮助中心 > 云数据迁移 CDM > 性能白皮书
目的端为HDFS - 云数据迁移 CDM
目的端为HDFS - 云数据迁移 CDM

REPLACE：替换重复文件。 SKIP：跳过重复文件。 ABANDON：发现重复文件停止任务。 toJobConfig.compression 否枚举写入文件后，选择对文件的压缩格式。支持以下压缩格式： NONE：不压缩。 DEFLATE：压缩为DEFLATE格式。 GZIP：压缩为GZIP格式。 BZIP2：压缩为BZIP2格式。

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 目的端作业参数说明
配置DLI目的端参数 - 云数据迁移 CDM

"obs:bucket:DeleteDirectColdAccessConfiguration", "obs:object:AbortMultipartUpload", "obs:bucket:PutBucketLogging",

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业目的端参数
基本概念 - 云数据迁移 CDM
基本概念 - 云数据迁移 CDM

他们进行日常管理工作。 IAM用户由账号在IAM中创建的用户，是云服务的使用人员，具有身份凭证（密码和访问密钥）。在我的凭证下，您可以查看账号ID和用户ID。通常在调用API的鉴权过程中，您需要用到账号、用户和密码等信息。项目区域默认对应一个项目，这个项目由系统预置，用来

 帮助中心 > 云数据迁移 CDM > API参考 > 使用前必读
CDM集群Hive连接无法查询库和表的内容 - 云数据迁移 CDM

CDM集群Hive连接无法查询库和表的内容问题描述 cdm集群hive连接无法查询到数据库和表的内容，手动配置库和表后字段可以显示，但报错hive 客户端初始化失败，无效的方案： get_table_req。解决方案用户的MRS集群是1.8.1，CDM为2.6.0。报错看CDM封装的Hive

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
新建整库迁移作业 - 云数据迁移 CDM

OBS上存储脏数据的目录，只有在配置了脏数据目录的情况下才会记录脏数据。用户可以进入脏数据目录，查看作业执行过程中处理失败的数据或者被清洗过滤掉的数据，针对该数据可以查看源数据中哪些数据不符合转换、清洗规则。 /user/dirtydir 单个分片的最大错误记录数当“是否写入脏数据”为“是”才显示该参数。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业
配置HTTP源端参数 - 云数据迁移 CDM

文件迁移场景。二进制格式压缩格式选择对应压缩格式的源文件进行迁移：无：表示传输所有格式的文件。 GZIP：表示只传输GZIP格式的文件。 ZIP：表示只传输ZIP格式的文件。 TAR.GZ：表示只传输TAR.GZ格式的文件。无压缩文件后缀压缩格式非无时，显示该参数。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数
Mysql导入数据到DLI，快执行完时失败了提示Invoke DLI service api failed错误怎么解决？ - 云数据迁移 CDM

问题描述导入了4000W数据，快执行完时报如下错误。故障分析结合报错，考虑是DLI目的端写入问题。但因日志截图不全，进入CDM集群，查看客户作业日志。根据分析步骤一报错，考虑是选错了队列类型，需要选择SQL队列。用户应该是先写到OBS文件，然后通过外表映射导入到DLI表。

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
创建IAM用户并授权使用CDM - 云数据迁移 CDM

用户组。用户登录并验证权限新创建的用户登录控制台，切换至授权区域，验证权限：在“服务列表”中选择“云数据迁移服务”，进入CDM主界面查看集群，若未提示权限不足，表示“CDM ReadOnlyAccess”已生效。在“服务列表”中选择除CDM服务外的任一服务，若提示权限不足，表示“CDM

帮助中心 > 云数据迁移 CDM > 用户指南 > IAM权限管理
Hudi目的端的作业执行Spark SQL写入Hudi失败怎么办？ - 云数据迁移 CDM

Application Id”关键字，查询离报错信息最近的Yarn Application ID即可。自主排查方式登录yarn，根据applicationId查询到yarn任务，打开ApplicationManager。打开stage->查看fail状态的task，通过日志或者

 帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
通过数据开发使用参数传递灵活调度CDM作业 - 云数据迁移 CDM

保存并提交作业版本，单击“测试运行”，执行数据开发作业。数据开发作业执行成功后，单击右上角的“前往监控”，进入“作业监控”页面，查看生成的任务或实例是否符合需求，如图6所示。图6 查看运行结果

 帮助中心 > 云数据迁移 CDM > 最佳实践
Hudi目的端的作业失败，日志报错Read Timeout怎么解决？ - 云数据迁移 CDM

sql，则多半是队列资源限制，打开yarn，搜索租户的队列，查看Spark2x-JDBCServer2x的yarn任务，此时可能会搜索不到yarn任务，或者State为ACCEPTED，这两种情况都是资源不足起不了yarn任务的现象。打开yarn的schedule，查看队列资源，关注以下几个参数： Used

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
CDM不同集群规格对应并发的作业数是多少？ - 云数据迁移 CDM

数”参数分片的情况。 CDM依次将Task提交给运行池运行。根据集群配置管理中的“最大抽取并发数”参数，超出规格的Task排队等待运行。如何调整抽取并发数集群最大抽取并发数的设置与CDM集群规格有关，并发数上限建议配置为vCPU核数*2，如表1所示。表1 集群最大抽取并发数配置建议

 帮助中心 > 云数据迁移 CDM > 常见问题 > 通用类

总条数： 292

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

目的端为Elasticsearch/云搜索服务 - 云数据迁移 CDM

CloudTable连接参数说明 - 云数据迁移 CDM

CloudTable连接 - 云数据迁移 CDM

作业任务参数说明 - 云数据迁移 CDM

配置Oracle源端参数 - 云数据迁移 CDM

CDM可以跨账户使用吗？ - 云数据迁移 CDM

源端为HTTP/HTTPS - 云数据迁移 CDM

性能调优 - 云数据迁移 CDM

目的端为HDFS - 云数据迁移 CDM

配置DLI目的端参数 - 云数据迁移 CDM

基本概念 - 云数据迁移 CDM

CDM集群Hive连接无法查询库和表的内容 - 云数据迁移 CDM

新建整库迁移作业 - 云数据迁移 CDM

配置HTTP源端参数 - 云数据迁移 CDM

Mysql导入数据到DLI，快执行完时失败了提示Invoke DLI service api failed错误怎么解决？ - 云数据迁移 CDM

创建IAM用户并授权使用CDM - 云数据迁移 CDM

Hudi目的端的作业执行Spark SQL写入Hudi失败怎么办？ - 云数据迁移 CDM

通过数据开发使用参数传递灵活调度CDM作业 - 云数据迁移 CDM

Hudi目的端的作业失败，日志报错Read Timeout怎么解决？ - 云数据迁移 CDM

CDM不同集群规格对应并发的作业数是多少？ - 云数据迁移 CDM

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线