搜索_华为云

HBase/CloudTable增量迁移 - 云数据迁移 CDM

CDM作业实际启动时间-偏移量”。在创建CDM表/文件迁移的作业，源连接选择为HBase连接或CloudTable连接时，高级属性的可选参数中可以配置时间区间。图1 HBase时间区间起始时间（包含该值），格式为“yyyy-MM-dd HH:mm:ss”，表示只抽取该时间及以后的数据。

帮助中心 > 云数据迁移 CDM > 最佳实践 > 进阶实践 > 增量迁移原理介绍
HBase/CloudTable增量迁移 - 云数据迁移 CDM

CDM作业实际启动时间-偏移量”。在创建CDM表/文件迁移的作业，源连接选择为HBase连接或CloudTable连接时，高级属性的可选参数中可以配置时间区间。图1 HBase时间区间起始时间（包含该值），格式为“yyyy-MM-dd HH:mm:ss”，表示只抽取该时间及以后的数据。

帮助中心 > 云数据迁移 CDM > 用户指南 > 关键操作指导 > 增量迁移原理介绍
功能类 - 云数据迁移 CDM
功能类 - 云数据迁移 CDM

如何将云下内网或第三方云上的私网与CDM连通？ CDM是否支持参数或者变量？ CDM迁移作业的抽取并发数应该如何设置？ CDM是否支持动态数据实时迁移功能？ CDM是否支持集群关机功能？如何使用表达式方式获取当前时间？在创建迁移作业时，where语句参数中的时间格式是怎样的？ CDM作业可以将源表中的字段注释迁移到目标端表吗？

帮助中心 > 云数据迁移 CDM > 常见问题
创建MySQL连接器 - 云数据迁移 CDM

新建连接”，进入连接器类型的选择界面，如图1所示。图1 选择连接器类型连接器类型选择“MySQL”后单击“下一步”，配置MySQL连接的参数。表1 MySQL连接参数参数名说明取值样例名称输入便于记忆和区分的连接名称。 mysqllink 数据库服务器 MySQL数据库的IP地址或域名。

帮助中心 > 云数据迁移 CDM > 最佳实践 > 使用教程
MySQL迁移时报错“JDBC连接超时”怎么办？ - 云数据迁移 CDM

单击“连接管理”，在“操作”列中，单击“连接”进行编辑。图3 连接打开高级属性，在“连接属性”中建议新增“connectTimeout”与“socketTimeout”参数及参数值，单击“保存”。图4 编辑高级属性父主题：故障处理类

 帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
通过json方式导入的作业，sql server迁移到hive，执行作业报错 - 云数据迁移 CDM

支持min运算所以会报错。解决方案通过修改作业json的方式将作业并发数设置为1即可，参数："throttlingConfig.numExtractors"。在作业配置界面，源端参数配置的高级属性中，给 “抽取分区字段”配置项指定字段即可（建议为源端表的主键或者递增的字段）。

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
如何使用Java调用CDM的Rest API创建数据迁移作业？ - 云数据迁移 CDM

*JSON消息体中一般只需要替换连接名、导入和导出的表名、导入导出表的字段列表、源表中用于分区的字段。**/ String json = "{\r\n"+ "\"jobs\": [\r\n"+ "{\r\n"+ "\"from-connector-name\": \"generic-jdbc-connector\"

帮助中心 > 云数据迁移 CDM > 常见问题 > 功能类
Elasticsearch整库迁移到云搜索服务 - 云数据迁移 CDM

选择连接器类型连接器类型选择“Elasticsearch”后单击“下一步”，配置Elasticsearch连接参数，Elasticsearch连接参数与云搜索服务的连接参数一样：名称：用户自定义连接名称，例如“es_link”。 Elasticsearch服务器列表：配置为本地E

帮助中心 > 云数据迁移 CDM > 最佳实践 > 使用教程
字段映射界面无法显示所有列怎么处理？ - 云数据迁移 CDM

“fromJobConfig.columns”、“toJobConfig.columnList”这2个参数）。导出作业的JSON文件到本地，在本地手动修改JSON文件中的参数后（原理同2相同），再导回CDM。推荐使用方法1，下面以HBase导到DWS为例进行说明。解决方法一：CDM的字段映射界面增加字段

 帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
性能调优 - 云数据迁移 CDM
性能调优 - 云数据迁移 CDM

数据迁移作业提交运行后，CDM会根据作业配置中的“抽取并发数”参数，将每个作业拆分为多个Task，即作业分片。不同源端数据源的作业分片维度有所不同，因此某些作业可能出现未严格按作业“抽取并发数”参数分片的情况。 CDM依次将Task提交给运行池运行。根据集群配置管理中的“最大抽取并发数”参数，超出规格的Task排队等待运行。

帮助中心 > 云数据迁移 CDM > 性能白皮书
如何将云下内网或第三方云上的私网与CDM连通？ - 云数据迁移 CDM

Translation）或端口转发，以代理的方式访问。这里重点介绍如何通过端口转发工具来实现访问内部数据，流程如下：找一台windows机器作为网关，该机器必须可以直接访问Internet，同时可以访问内网。在该机器上安装端口映射工具（IPOP）。通过端口映射工具（IPOP）配置端口映射。长时间将内网数据库

 帮助中心 > 云数据迁移 CDM > 常见问题 > 功能类
创建CDM集群 - 云数据迁移 CDM
创建CDM集群 - 云数据迁移 CDM

云服务的网络互通，只有企业项目一致的云服务才能打通网络。操作步骤进入购买云数据迁移服务界面。配置CDM集群参数，各参数说明如表1所示。表1 CDM集群参数参数名称样例说明当前区域华北-北京一选择CDM集群的区域，不同区域的资源之间内网不互通。可用区可用区2

帮助中心 > 云数据迁移 CDM > 用户指南 > 创建并管理CDM集群
参考：作业分片维度 - 云数据迁移 CDM

支持按HBase的Region分片。 Apache Hive HDFS读取方式时，支持按Hive文件分片。 JDBC读取方式时，不支持分片。对象存储对象存储服务（OBS）支持按文件分片。文件系统 FTP 支持按文件分片。 SFTP 支持按文件分片。 HTTP 支持按文件分片。关系型数据库云数据库 MySQL

帮助中心 > 云数据迁移 CDM > 性能白皮书
在CDM集群中创建连接 - 云数据迁移 CDM

在CDM集群中创建连接创建CDM与数据源之间的连接配置连接参数上传CDM连接驱动新建Hadoop集群配置

 帮助中心 > 云数据迁移 CDM > 用户指南
Elasticsearch整库迁移到云搜索服务 - 云数据迁移 CDM

选择连接器类型连接器类型选择“Elasticsearch”后单击“下一步”，配置Elasticsearch连接参数，Elasticsearch连接参数与云搜索服务的连接参数一样：名称：用户自定义连接名称，例如“es_link”。 Elasticsearch服务器列表：配置为本地E

帮助中心 > 云数据迁移 CDM > 用户指南 > 使用教程
API概览 - 云数据迁移 CDM
API概览 - 云数据迁移 CDM

20次/min 连接管理API 创建连接连接指定的数据源。 120次/min 查询连接查询连接列表。 120次/min 修改连接修改连接的参数。 120次/min 删除连接删除指定连接。 120次/min 作业管理API 指定集群创建作业在指定的CDM集群上创建数据迁移任务，作业不会启动。

帮助中心 > 云数据迁移 CDM > API参考
查看并修改CDM集群配置 - 云数据迁移 CDM

议根据集群规格进行配置，建议值详见最大抽取并发数。过高的并发数可能导致内存溢出，请谨慎修改。此处的“最大抽取并发数”参数与作业配置管理处的“最大抽取并发数”参数同步，在任意一处修改即可生效。前提条件已创建CDM集群。查看集群基本信息登录CDM管理控制台。单击左侧导航上的“集群管理”，进入集群管理界面。

帮助中心 > 云数据迁移 CDM > 用户指南 > 创建并管理CDM集群
CDM迁移DWS数据报错Read timedout怎么处理？ - 云数据迁移 CDM

分数据，写到目标端，再进行下一次部分数据抽取，写入目标端，往复执行，直到抽取到写入完成。因此可以添加高级属性：socketTimeout 参数，保证在每次抽取写入数据间隔，CDM一直保持正常会话。解决方案通过增大jdbc连接超时时间的控制，重新迁移作业。通过作业配置中的源端

 帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
Hudi目的端的作业失败，日志报错Read Timeout怎么解决？ - 云数据迁移 CDM

者State为ACCEPTED，这两种情况都是资源不足起不了yarn任务的现象。打开yarn的schedule，查看队列资源，关注以下几个参数： Used Resources: 已使用的内存与CPU核数 Max Resources：队列中最大可供使用的内存与CPU核数 Used Application

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
Hudi目的端的作业执行Spark SQL写入Hudi失败怎么办？ - 云数据迁移 CDM

在作业管理界面选择“更多-失败重试”，尝试重新执行Spark SQL。通过DataArts Studio执行Spark SQL，设置执行参数或者调整SQL。调整Spark切片大小： set spark.sql.files.maxPartitionBytes=xxM；默认值为128M，可适当调整为64M或者32M。

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类

总条数： 286

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

HBase/CloudTable增量迁移 - 云数据迁移 CDM

HBase/CloudTable增量迁移 - 云数据迁移 CDM

功能类 - 云数据迁移 CDM

创建MySQL连接器 - 云数据迁移 CDM

MySQL迁移时报错“JDBC连接超时”怎么办？ - 云数据迁移 CDM

通过json方式导入的作业，sql server迁移到hive，执行作业报错 - 云数据迁移 CDM

如何使用Java调用CDM的Rest API创建数据迁移作业？ - 云数据迁移 CDM

Elasticsearch整库迁移到云搜索服务 - 云数据迁移 CDM

字段映射界面无法显示所有列怎么处理？ - 云数据迁移 CDM

性能调优 - 云数据迁移 CDM

如何将云下内网或第三方云上的私网与CDM连通？ - 云数据迁移 CDM

创建CDM集群 - 云数据迁移 CDM

参考：作业分片维度 - 云数据迁移 CDM

在CDM集群中创建连接 - 云数据迁移 CDM

Elasticsearch整库迁移到云搜索服务 - 云数据迁移 CDM

API概览 - 云数据迁移 CDM

查看并修改CDM集群配置 - 云数据迁移 CDM

CDM迁移DWS数据报错Read timedout怎么处理？ - 云数据迁移 CDM

Hudi目的端的作业失败，日志报错Read Timeout怎么解决？ - 云数据迁移 CDM

Hudi目的端的作业执行Spark SQL写入Hudi失败怎么办？ - 云数据迁移 CDM

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线