搜索_华为云

创建集群 - 云数据迁移 CDM
创建集群 - 云数据迁移 CDM

large规格，8核CPU、16G内存的虚拟机。适合单张表规模≥1000万条的场景。 6ddb1072-c5d7-40e0-a874-8a032e81a698：表示cdm.xlarge规格，16核CPU、32G内存的虚拟机。需要10GE高速带宽进行TB以上的数据量迁移时使用。 type 是

 帮助中心 > 云数据迁移 CDM > API参考 > API > 集群管理
Cassandra连接参数说明 - 云数据迁移 CDM

取值样例名称连接的名称，根据连接的数据源类型，用户可自定义便于记忆、区分的连接名。 mongodb_link 服务节点一个或者多个节点的地址，以“;”分隔。建议同时配置多个节点。 192.168.0.1;192.168.0.2 端口连接的Cassandra节点的端口号。 9042

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建连接 > 配置连接参数
记录数据迁移入库时间 - 云数据迁移 CDM

单击“保存并运行”，回到作业管理的表/文件迁移界面，在作业管理界面可查看作业执行进度和结果。作业执行成功后，单击作业操作列的“历史记录”，可查看该作业的历史执行记录、读取和写入的统计数据。在历史记录界面单击“日志”，可查看作业的日志信息。前往目的端数据源查看数据迁移的入库时间。父主题：

帮助中心 > 云数据迁移 CDM > 最佳实践 > 进阶实践
随机集群创建作业并执行 - 云数据迁移 CDM

源连接名称，即为通过“创建连接”接口创建的连接对应的连接名。 creation-user 否 String 创建作业的用户。由系统生成，用户无需填写。 creation-date 否 Long 作业创建的时间，单位：毫秒。由系统生成，用户无需填写。 update-date 否 Long 作业最后更新的时间，单位：毫秒。由系统生成，用户无需填写。

帮助中心 > 云数据迁移 CDM > API参考 > API > 作业管理
DIS连接参数说明 - 云数据迁移 CDM

取值样例名称连接的名称，根据连接的数据源类型，用户可自定义便于记忆、区分的连接名。 dis_link 区域 DIS所在的区域。 - 终端节点待连接DIS的URL，URL一般格式为：https://Endpoint。终端节点（Endpoint）即调用API的请求地址，不同服务

 帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建连接 > 配置连接参数
创建连接 - 云数据迁移 CDM
创建连接 - 云数据迁移 CDM

objects 输入参数列表，列表中的每个参数为“name,value”结构，请参考inputs数据结构参数说明。在“from-config-values”数据结构中，不同的源连接类型有不同的“inputs”参数列表，请参见源端作业参数说明下的章节。在“to-config-val

帮助中心 > 云数据迁移 CDM > API参考 > API > 连接管理
作业任务参数说明 - 云数据迁移 CDM

作业分组：CDM支持对作业进行分组，分组后的作业可以按组显示、按组批量删除作业、按组批量启动作业、按组导出等。是否定时执行：可选择作业是否定时自动启动。抽取并发数：可设置同时执行的抽取任务数。是否写入脏数据：如果需要将作业执行过程中处理失败的数据、或者被清洗过滤掉的数据写入OBS中，以便后面

 帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构
源端为Elasticsearch/云搜索服务 - 云数据迁移 CDM

index 是 String 抽取数据的索引，类似关系数据库中的数据库名称。 fromJobConfig.type 是 String 抽取数据的类型，类似关系数据库中的表名。 fromJobConfig.columnList 否 String 需要抽取的字段列表，字段名之间使用“&”分隔，例如：“id&gid&name”。

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
源端为Kafka - 云数据迁移 CDM
源端为Kafka - 云数据迁移 CDM

fromJobConfig.kafkaConsumerStrategy 是枚举从Kafka拉取数据时的初始偏移量设置： LATEST：最大偏移量，即最新的数据。 EARLIEST：最小偏移量，即最老的数据。 fromJobConfig.isPermanency 是 Boolean 是否永久运行。

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
目的端为Hive - 云数据迁移 CDM
目的端为Hive - 云数据迁移 CDM

toJobConfig.hive 否 String 写入数据的数据源。 toJobConfig.database 否 String 写入数据的数据库名称，例如：“default”。 toJobConfig.table 是 String 写入数据的表名。 toJobConfig.tablePreparation

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 目的端作业参数说明
配置Hive源端参数 - 云数据迁移 CDM

读取方式为JDBC时，单击“显示高级属性”后显示此参数。填写该参数表示指定抽取的WHERE子句，不指定则抽取整表。如果要迁移的表中没有WHERE子句的字段，则会迁移失败。该参数支持配置为时间宏变量，实现抽取指定日期的数据，详细说明请参见关系数据库增量迁移。说明：如果配置了时间宏变量，通过DataArts

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数
CDM迁移DWS数据报错Read timedout怎么处理？ - 云数据迁移 CDM

迁移作业是CDM作为客户端先从源数据中抽取部分数据，写到目标端，再进行下一次部分数据抽取，写入目标端，往复执行，直到抽取到写入完成。因此可以添加高级属性：socketTimeout 参数，保证在每次抽取写入数据间隔，CDM一直保持正常会话。解决方案通过增大jdbc连接超时时间的控制，重新迁移作业。

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
正则表达式分隔半结构化文本 - 云数据迁移 CDM

”必须选择“CSV格式”。图1 正则表达式参数在迁移CSV格式的文件时，CDM支持使用正则表达式分隔字段，并按照解析后的结果写入目的端。正则表达式语法请参考对应的相关资料，这里举例下面几种日志文件的正则表达式的写法： Log4J日志 Log4J审计日志 Tomcat日志 Django日志

 帮助中心 > 云数据迁移 CDM > 最佳实践 > 进阶实践
源端为DIS - 云数据迁移 CDM
源端为DIS - 云数据迁移 CDM

String DIS的通道名。 fromJobConfig.disConsumerStrategy 是枚举设置从DIS拉取数据时的初始偏移量： LATEST：最大偏移量，即最新的数据。 FROM_LAST_STOP：从上次停止处继续拉取。 EARLIEST：最小偏移量，即最早的数据。 fromJobConfig

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
正则表达式分隔半结构化文本 - 云数据迁移 CDM

”必须选择“CSV格式”。图1 正则表达式参数在迁移CSV格式的文件时，CDM支持使用正则表达式分隔字段，并按照解析后的结果写入目的端。正则表达式语法请参考对应的相关资料，这里举例下面几种日志文件的正则表达式的写法： Log4J日志 Log4J审计日志 Tomcat日志 Django日志

 帮助中心 > 云数据迁移 CDM > 用户指南 > 关键操作指导
记录数据迁移入库时间 - 云数据迁移 CDM

单击“保存并运行”，回到作业管理的表/文件迁移界面，在作业管理界面可查看作业执行进度和结果。作业执行成功后，单击作业操作列的“历史记录”，可查看该作业的历史执行记录、读取和写入的统计数据。在历史记录界面单击“日志”，可查看作业的日志信息。前往目的端数据源查看数据迁移的入库时间。父主题：

帮助中心 > 云数据迁移 CDM > 用户指南 > 关键操作指导
CloudTable连接参数说明 - 云数据迁移 CDM

有效。此参数用于选择用户已经创建好的集群配置。集群配置的创建方法请参见管理集群配置。 hadoop_01 单击“显示高级属性”，然后单击“添加”，您可以添加客户端的配置属性。所添加的每个属性需配置属性名称和值。对于不再需要的属性，可单击属性后的“删除”按钮进行删除。父主题：配置连接参数

 帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建连接 > 配置连接参数
CDM与其他数据迁移服务有什么区别，如何选择？ - 云数据迁移 CDM

Migration，简称CDM）是一种高效、易用的数据集成服务。CDM围绕大数据迁移上云和智能数据湖解决方案，提供了简单易用的迁移能力和多种数据源到数据湖的集成能力，降低了客户数据源迁移和集成的复杂性，有效的提高您数据迁移和集成的效率。更多详情请参见云数据迁移服务。 CDM进行数

 帮助中心 > 云数据迁移 CDM > 常见问题 > 通用类
入门实践 - 云数据迁移 CDM
入门实践 - 云数据迁移 CDM

据自身的业务需求使用CDM提供的一系列常用实践。表1 常用最佳实践实践描述使用教程创建MRS Hive连接器 MRS Hive连接适用于MapReduce服务，本最佳实践为您介绍如何创建MRS Hive连接器。 MySQL数据迁移到OBS CDM支持表到OBS的迁移，本

 帮助中心 > 云数据迁移 CDM > 快速入门
查询作业 - 云数据迁移 CDM
查询作业 - 云数据迁移 CDM

源连接名称，即为通过“创建连接”接口创建的连接对应的连接名。 creation-user String 创建作业的用户。由系统生成，用户无需填写。 creation-date Long 作业创建的时间，单位：毫秒。由系统生成，用户无需填写。 update-date Long 作业最后更新的时间，单位：毫秒。由系统生成，用户无需填写。

帮助中心 > 云数据迁移 CDM > API参考 > API > 作业管理

总条数： 225

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建集群 - 云数据迁移 CDM

Cassandra连接参数说明 - 云数据迁移 CDM

记录数据迁移入库时间 - 云数据迁移 CDM

随机集群创建作业并执行 - 云数据迁移 CDM

DIS连接参数说明 - 云数据迁移 CDM

创建连接 - 云数据迁移 CDM

作业任务参数说明 - 云数据迁移 CDM

源端为Elasticsearch/云搜索服务 - 云数据迁移 CDM

源端为Kafka - 云数据迁移 CDM

目的端为Hive - 云数据迁移 CDM

配置Hive源端参数 - 云数据迁移 CDM

CDM迁移DWS数据报错Read timedout怎么处理？ - 云数据迁移 CDM

正则表达式分隔半结构化文本 - 云数据迁移 CDM

源端为DIS - 云数据迁移 CDM

正则表达式分隔半结构化文本 - 云数据迁移 CDM

记录数据迁移入库时间 - 云数据迁移 CDM

CloudTable连接参数说明 - 云数据迁移 CDM

CDM与其他数据迁移服务有什么区别，如何选择？ - 云数据迁移 CDM

入门实践 - 云数据迁移 CDM

查询作业 - 云数据迁移 CDM

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线