搜索_华为云

新增字段操作指导 - 云数据迁移 CDM

如果是导入到数据仓库服务（DWS），则还需在目的字段中选择分布列，建议按如下顺序选取分布列：有主键可以使用主键作为分布列。多个数据段联合做主键的场景，建议设置所有主键作为分布列。在没有主键的场景下，如果没有选择分布列，DWS会默认第一列作为分布列，可能会有数据倾斜风险。如CDM不支持源端迁移

 帮助中心 > 云数据迁移 CDM > 用户指南 > 关键操作指导
记录数据迁移入库时间 - 云数据迁移 CDM

已创建连接器源端为关系型数据库，以及目的端数据连接。目的端数据表中已有时间日期字段或时间戳字段。如自动创表场景下，需提前在目的端表中手动创建时间日期字段或时间戳字段。创建表/文件迁移作业在创建表/文件迁移作业时，选择已创建的源端连接器、目的端连接器。图1 配置作业单击“下

 帮助中心 > 云数据迁移 CDM > 用户指南 > 关键操作指导
文件格式介绍 - 云数据迁移 CDM

启动作业标识文件为“ok.txt”，在源端生成文件成功后，再在文件目录下生成“ok.txt”，这样CDM就能读取到完整的文件。另外，可以设置超时时间，在超时时间内，CDM会周期去查询标识文件是否存在，超时后标识文件还不存在的话，则作业任务失败。启动作业标识文件本身不会被迁移。

帮助中心 > 云数据迁移 CDM > 最佳实践 > 进阶实践
正则表达式分隔半结构化文本 - 云数据迁移 CDM

隔。正则表达式参数在源端作业参数中配置，要求源连接为对象存储或者文件系统，且“文件格式”必须选择“CSV格式”。图1 正则表达式参数在迁移CSV格式的文件时，CDM支持使用正则表达式分隔字段，并按照解析后的结果写入目的端。正则表达式语法请参考对应的相关资料，这里举例下面几种日志文件的正则表达式的写法：

帮助中心 > 云数据迁移 CDM > 用户指南 > 关键操作指导
MySQL数据迁移到MRS Hive分区表 - 云数据迁移 CDM

ava-5.1.48.jar，然后进行上传。 - 单击“保存”回到连接管理界面。如果保存时出错，一般是由于MySQL数据库的安全设置问题，需要设置允许CDM集群的EIP访问MySQL数据库。创建Hive连接单击CDM集群后的“作业管理”，进入作业管理界面，再选择“连接管理 >

帮助中心 > 云数据迁移 CDM > 最佳实践 > 使用教程
迁移MySql到DWS，TINYINT类型迁移报错 - 云数据迁移 CDM

alue '-1'is out of range for 8 b-bit integer”。故障分析根据问题现象，目的端类型不支持值为“-1”插入，检查目的端字段映射，排查映射问题。根据上一步字段映射情况判断，进一步排查建表语句。根据以上截图分析，INT1就是DWS字段类

 帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
自动建表原理介绍 - 云数据迁移 CDM

自动建表原理介绍 CDM将根据源端的字段类型进行默认规则转换成目的端字段类型，并在目的端建数据表。自动建表时的字段类型映射 CDM在数据仓库服务（Data Warehouse Service，简称DWS）中自动建表时，DWS的表与源表的字段类型映射关系如图1所示。例如使用CDM

帮助中心 > 云数据迁移 CDM > 用户指南 > 关键操作指导
创建CDM集群 - 云数据迁移 CDM
创建CDM集群 - 云数据迁移 CDM

虚拟私有云 vpc1 CDM集群所属VPC、子网、安全组，需确保CDM集群与待连接的数据源能正常通信。用户可以根据CDM迁移的数据源端、目的端所处网络进行选择：如果CDM集群与待连接的数据源所属不同的VPC，或者待连接的为本地数据源时，CDM集群需要绑定EIP，通过公网通信。

帮助中心 > 云数据迁移 CDM > 用户指南 > 创建并管理CDM集群
关系数据库增量迁移 - 云数据迁移 CDM

后，可以增量迁移指定时间段内的数据（例如每天晚上0点导出前一天新增的数据）。增量迁移指定时间段内的数据适用场景：源端为关系型数据库，目的端没有要求。关键配置：Where子句+定时执行作业。前提条件：数据表中有时间日期字段或时间戳字段。关系数据库增量迁移方式，只对数据表追加写入，不会更新或删除已存在的记录。

帮助中心 > 云数据迁移 CDM > 最佳实践 > 进阶实践 > 增量迁移原理介绍
如何使用表达式方式获取当前时间？ - 云数据迁移 CDM

您可以在字段映射界面使用DateUtils.format(${timestamp()},"yyyy-MM-dd HH:mm:ss")表达式获取当前时间，更多表达式设置方式可以参考表达式转换。父主题：功能类

 帮助中心 > 云数据迁移 CDM > 常见问题 > 功能类
CDM迁移性能如何？ - 云数据迁移 CDM

CDM迁移性能如何？单个cdm.large规格实例理论上可以支持1TB～8TB/天的数据迁移，实际传输速率受公网带宽、集群规格、文件读写速度、作业并发数设置、磁盘读写性能等因素影响。更多详情请参见性能白皮书。父主题：通用类

 帮助中心 > 云数据迁移 CDM > 常见问题 > 通用类
Hive迁移作业长时间卡顿怎么办？ - 云数据迁移 CDM

问题描述 Hive迁移作业长时间卡顿怎么办？解决方案为避免Hive迁移作业长时间卡顿，可手动停止迁移作业后，通过编辑Hive连接增加如下属性设置：属性名称：hive.server2.idle.operation.timeout 值：10m 如图所示：父主题：故障处理类

 帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
应用示例 - 云数据迁移 CDM
应用示例 - 云数据迁移 CDM

user_dws 密码访问DWS数据库的用户密码。 dws_password 获取token 调用其他API前，需要获取token，并设置成环境变量。 curl -H "Content-Type:application/json" https://{iam_endpoint}/v3/auth/tokens

帮助中心 > 云数据迁移 CDM > API参考
Elasticsearch连接参数说明 - 云数据迁移 CDM

Elasticsearch连接参数说明 Elasticsearch连接适用于第三方云的Elasticsearch服务，以及用户在本地数据中心或ECS上自建的Elasticsearch。 Elasticsearch连接器仅支持非安全模式的Elasticsearch集群。作业运行中

 帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建连接 > 配置连接参数
入门实践 - 云数据迁移 CDM
入门实践 - 云数据迁移 CDM

入门实践当您参考创建集群、创建连接等一系列操作后，可以根据自身的业务需求使用CDM提供的一系列常用实践。表1 常用最佳实践实践描述使用教程创建MRS Hive连接器 MRS Hive连接适用于MapReduce服务，本最佳实践为您介绍如何创建MRS Hive连接器。 MySQL数据迁移到OBS

帮助中心 > 云数据迁移 CDM > 快速入门
整库迁移到Hive，报错Identifier name is too long如何处理？ - 云数据迁移 CDM

原因分析在任务迁移时，导入数据前会先创建一个实际表名+阶段表后缀的阶段表，最终导致的作业异常。解决方案在作业配置高级属性将导入阶段表设置为否，这样就不会先导入阶段表。缩短实际表的表名长度。父主题：故障处理类

 帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
迁移数据到DLI时有数据丢失怎么处理？ - 云数据迁移 CDM

目的端是DLI的迁移作业执行成功后，显示迁移的数据条数和DLI表中查询的数量对不上，存在数据丢失。原因分析查看客户的作业配置，客户并发数设置的是3，如图所示。查看DLI官网文档不建议同时对一张表并发插入数据。解决方案将作业的抽取并发数改成1 ，重跑作业问题解决。父主题：

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
MongoDB连接参数说明 - 云数据迁移 CDM

MongoDB连接参数说明 MongoDB连接适用于第三方云MongoDB服务，以及用户在本地数据中心或ECS上自建的MongoDB，常用于从MongoDB同步数据到大数据平台。连接本地MongoDB数据库时，相关参数如表1所示。作业运行中禁止修改密码或者更换用户。在作业运行

 帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建连接 > 配置连接参数
配置MRS Hudi目的端参数 - 云数据迁移 CDM

型在线进行压缩的场景。说明：运行-失败重试期间不允许修改此模式。是批次数据大小 “全量模式写Hoodie”设置为“否”时，使用微批模式呈现此参数。用于设置单个批次写Hoodie的数据行数，默认100000行。 100000 使用入库时间字段将一个字段标记为入库时间字段

 帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业目的端参数
迁移Mysql到DWS报错“Lost connection to MySQL server during query”怎么处理？ - 云数据迁移 CDM

con:192.168.XX.XX.”。故障分析考虑用户数据量大，或连接中断异常导致报错，检查客户连接高级属性配置，是否配置超时时间参数设置及设置情况：用户连接参数超时时间“6000000”毫秒，已经足够大。进一步排查客户Mysql数据库是否异常，将日志中打印查询源端的sql在M

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类

总条数： 221

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

新增字段操作指导 - 云数据迁移 CDM

记录数据迁移入库时间 - 云数据迁移 CDM

文件格式介绍 - 云数据迁移 CDM

正则表达式分隔半结构化文本 - 云数据迁移 CDM

MySQL数据迁移到MRS Hive分区表 - 云数据迁移 CDM

迁移MySql到DWS，TINYINT类型迁移报错 - 云数据迁移 CDM

自动建表原理介绍 - 云数据迁移 CDM

创建CDM集群 - 云数据迁移 CDM

关系数据库增量迁移 - 云数据迁移 CDM

如何使用表达式方式获取当前时间？ - 云数据迁移 CDM

CDM迁移性能如何？ - 云数据迁移 CDM

Hive迁移作业长时间卡顿怎么办？ - 云数据迁移 CDM

应用示例 - 云数据迁移 CDM

Elasticsearch连接参数说明 - 云数据迁移 CDM

入门实践 - 云数据迁移 CDM

整库迁移到Hive，报错Identifier name is too long如何处理？ - 云数据迁移 CDM

迁移数据到DLI时有数据丢失怎么处理？ - 云数据迁移 CDM

MongoDB连接参数说明 - 云数据迁移 CDM

配置MRS Hudi目的端参数 - 云数据迁移 CDM

迁移Mysql到DWS报错“Lost connection to MySQL server during query”怎么处理？ - 云数据迁移 CDM

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线