搜索_华为云

步骤3：创建并执行作业 - 云数据迁移 CDM

由于MySQL和DWS存储中文时编码不一样，所需的长度也不一样，一个中文字符在UTF-8编码下可能要占3个字节。该参数选择为“是”后，在DWS中自动创表时，会将字符类型的字段长度设置为原表的3倍，避免出现DWS表的字符字段长度不够的报错。其他可选参数保持默认即可，详细说明可参见配置DWS目的端参数。

帮助中心 > 云数据迁移 CDM > 快速入门
CDM迁移近一个月的数据 - 云数据迁移 CDM

包，可以跳过这部分内容。如果您需要再创建新的CDM集群，请参考购买批量数据迁移增量包章节，完成购买数据集成增量包的操作。集群规格选择“cdm.xlarge”。集群所属的VPC与MRS所属的VPC一致，同时也要与云专线连通的VPC的一致。其它参数可以自定义，或者保持默认。创建CDH

帮助中心 > 云数据迁移 CDM > 最佳实践 > 车联网大数据零丢失搬迁入湖
记录数据迁移入库时间 - 云数据迁移 CDM

单击“保存并运行”，回到作业管理的表/文件迁移界面，在作业管理界面可查看作业执行进度和结果。作业执行成功后，单击作业操作列的“历史记录”，可查看该作业的历史执行记录、读取和写入的统计数据。在历史记录界面单击“日志”，可查看作业的日志信息。前往目的端数据源查看数据迁移的入库时间。父主题：

帮助中心 > 云数据迁移 CDM > 用户指南 > 关键操作指导
记录数据迁移入库时间 - 云数据迁移 CDM

单击“保存并运行”，回到作业管理的表/文件迁移界面，在作业管理界面可查看作业执行进度和结果。作业执行成功后，单击作业操作列的“历史记录”，可查看该作业的历史执行记录、读取和写入的统计数据。在历史记录界面单击“日志”，可查看作业的日志信息。前往目的端数据源查看数据迁移的入库时间。父主题：

帮助中心 > 云数据迁移 CDM > 最佳实践 > 进阶实践
Hudi目的端的作业执行Spark SQL写入Hudi失败怎么办？ - 云数据迁移 CDM

表，或者表在metastore中存在，但是表目录不存在，根因是在表目录下没有.hoodie目录。可能删表的时候只删了文件而没有drop table。设置为主键或者预聚合键的列有空值，写入hoodie会失败。查看作业配置，查看表属性中hoodie.datasource.write

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
配置HTTP源端参数 - 云数据迁移 CDM

传输多个文件时，CDM使用这里配置的文件分隔符来区分各个文件，默认为|。列表文件选择“是”时，不显示该参数。 | QUERY参数该参数设置为“是”时，上传到OBS的对象使用的对象名，为去掉query参数后的字符。该参数设置为“否”时，上传到OBS的对象使用的对象名，包含query参数。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数
功能类 - 云数据迁移 CDM
功能类 - 云数据迁移 CDM

如何解决HANA集群只有部分节点和CDM集群网络互通？如何使用Java调用CDM的Rest API创建数据迁移作业？如何将云下内网或第三方云上的私网与CDM连通？ CDM是否支持参数或者变量？ CDM迁移作业的抽取并发数应该如何设置？ CDM是否支持动态数据实时迁移功能？ CDM是否支持集群关机功能？

帮助中心 > 云数据迁移 CDM > 常见问题
CDM作业配置管理 - 云数据迁移 CDM

数据迁移作业提交运行后，CDM会根据作业配置中的“抽取并发数”参数，将每个作业拆分为多个Task，即作业分片。不同源端数据源的作业分片维度有所不同，因此某些作业可能出现未严格按作业“抽取并发数”参数分片的情况。 CDM依次将Task提交给运行池运行。根据集群配置管理中的“最大抽取并发数”参数，超出规格的Task排队等待运行。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业
如何使用表达式方式获取当前时间？ - 云数据迁移 CDM

您可以在字段映射界面使用DateUtils.format(${timestamp()},"yyyy-MM-dd HH:mm:ss")表达式获取当前时间，更多表达式设置方式可以参考表达式转换。父主题：功能类

 帮助中心 > 云数据迁移 CDM > 常见问题 > 功能类
作业配置表不存在时自动创建，目的端字段映射不出来怎么处理？ - 云数据迁移 CDM

集群开启沙箱所导致的，后端对集群取消沙箱，重启CDM 集群后问题依然存在。查看CDM迁移作业，源端数据库表名全部为小写，但是迁移的表中是包含有大写字母，将所要迁移的表名跟数据库中保持一致，目的端字段就可以映射出来了，问题解决。解决方案在作业设置中，源端配置中迁移的数据库表名应按

 帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
Hive迁移作业长时间卡顿怎么办？ - 云数据迁移 CDM

问题描述 Hive迁移作业长时间卡顿怎么办？解决方案为避免Hive迁移作业长时间卡顿，可手动停止迁移作业后，通过编辑Hive连接增加如下属性设置：属性名称：hive.server2.idle.operation.timeout 值：10m 如图所示：父主题：故障处理类

 帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
配置Redis目的端参数 - 云数据迁移 CDM

写入前将相同的键删除写入前将相同的键删除。否：如果原来Redis已存在类型不同的同名key，则迁移作业会跳过该key。是：Redis会先删除原有的同名key，再执行迁移。否键分隔符用来分隔关系型数据库的表和列名。 _ 值分隔符以STRING方式存储时，列之间的分隔符。 ;

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业目的端参数
目的端为Hive - 云数据迁移 CDM
目的端为Hive - 云数据迁移 CDM

写入表数据时，用户选择的操作： DO_NOTHING：不自动建表。 CREATE_WHEN_NOT_EXIST：当目的端的数据库没有“tableName”参数中指定的表时，CDM会自动创建该表。 DROP_AND_CREATE：先删除“tableName”参数中指定的表，然后再重新创建该表。

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 目的端作业参数说明
源端为Kafka - 云数据迁移 CDM
源端为Kafka - 云数据迁移 CDM

fromJobConfig.kafkaConsumerStrategy 是枚举从Kafka拉取数据时的初始偏移量设置： LATEST：最大偏移量，即最新的数据。 EARLIEST：最小偏移量，即最老的数据。 fromJobConfig.isPermanency 是 Boolean 是否永久运行。

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
源端为DIS - 云数据迁移 CDM
源端为DIS - 云数据迁移 CDM

String DIS的通道名。 fromJobConfig.disConsumerStrategy 是枚举设置从DIS拉取数据时的初始偏移量： LATEST：最大偏移量，即最新的数据。 FROM_LAST_STOP：从上次停止处继续拉取。 EARLIEST：最小偏移量，即最早的数据。 fromJobConfig

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
源端为HBase/CloudTable - 云数据迁移 CDM

table 是 String 需要抽取数据的表名，例如“cdm”。 fromJobConfig.columnFamilies 否 String 抽取数据所属的列族。 fromJobConfig.columns 否 String 需要抽取的列，列号之间使用“&”分割，列族与列之间用

 帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
作业任务参数说明 - 云数据迁移 CDM

作业分组：CDM支持对作业进行分组，分组后的作业可以按组显示、按组批量删除作业、按组批量启动作业、按组导出等。是否定时执行：可选择作业是否定时自动启动。抽取并发数：可设置同时执行的抽取任务数。是否写入脏数据：如果需要将作业执行过程中处理失败的数据、或者被清洗过滤掉的数据写入OBS中，以便后面

 帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构
文件格式介绍 - 云数据迁移 CDM

字段分隔符用于分隔CSV文件中的列的字符，支持单字符和多字符，也支持特殊字符，详见表1。编码类型文件的编码类型，默认是UTF-8，中文的编码有时会采用GBK。如果源端指定该参数，则使用指定的编码类型去解析文件；目的端指定该参数，则写入文件的时候，以指定的编码类型写入。使用包围符

 帮助中心 > 云数据迁移 CDM > 最佳实践 > 进阶实践
文件格式介绍 - 云数据迁移 CDM

字段分隔符用于分隔CSV文件中的列的字符，支持单字符和多字符，也支持特殊字符，详见表1。编码类型文件的编码类型，默认是UTF-8，中文的编码有时会采用GBK。如果源端指定该参数，则使用指定的编码类型去解析文件；目的端指定该参数，则写入文件的时候，以指定的编码类型写入。使用包围符

 帮助中心 > 云数据迁移 CDM > 用户指南 > 关键操作指导
配置FTP/SFTP源端参数 - 云数据迁移 CDM

标识文件名选择开启作业标识文件的功能时，需要指定启动作业的标识文件名。指定文件后，只有在源端路径下存在该文件的情况下才会运行任务。该文件本身不会被迁移。 ok.txt 等待时间选择开启作业标识文件的功能时，如果源路径下不存在启动作业的标识文件，作业挂机等待的时长，当超时后任务会失败。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数

总条数： 273

上一页
1
...
8
9
10
...
14
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

步骤3：创建并执行作业 - 云数据迁移 CDM

CDM迁移近一个月的数据 - 云数据迁移 CDM

记录数据迁移入库时间 - 云数据迁移 CDM

记录数据迁移入库时间 - 云数据迁移 CDM

Hudi目的端的作业执行Spark SQL写入Hudi失败怎么办？ - 云数据迁移 CDM

配置HTTP源端参数 - 云数据迁移 CDM

功能类 - 云数据迁移 CDM

CDM作业配置管理 - 云数据迁移 CDM

如何使用表达式方式获取当前时间？ - 云数据迁移 CDM

作业配置表不存在时自动创建，目的端字段映射不出来怎么处理？ - 云数据迁移 CDM

Hive迁移作业长时间卡顿怎么办？ - 云数据迁移 CDM

配置Redis目的端参数 - 云数据迁移 CDM

目的端为Hive - 云数据迁移 CDM

源端为Kafka - 云数据迁移 CDM

源端为DIS - 云数据迁移 CDM

源端为HBase/CloudTable - 云数据迁移 CDM

作业任务参数说明 - 云数据迁移 CDM

文件格式介绍 - 云数据迁移 CDM

文件格式介绍 - 云数据迁移 CDM

配置FTP/SFTP源端参数 - 云数据迁移 CDM

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线