搜索_华为云

Hudi目的端的作业执行Spark SQL写入Hudi失败怎么办？ - 云数据迁移 CDM

metastore中存在，但是表目录不存在，根因是在表目录下没有.hoodie目录。可能删表的时候只删了文件而没有drop table。设置为主键或者预聚合键的列有空值，写入hoodie会失败。查看作业配置，查看表属性中hoodie.datasource.write.recordkey

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
配置Kafka/DMS Kafka源端参数 - 云数据迁移 CDM

开始时间(>=) “偏移量参数”选择为“时间范围”时配置。拉取数据的开始时间，包含设置时间点的数据。 2020-12-20 12:00:00 结束时间(<) “偏移量参数”选择为“时间范围”时配置。拉取数据的结束时间，不包含设置时间点的数据。 2020-12-20 20:00:00 字段分隔符

 帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数
配置HTTP源端参数 - 云数据迁移 CDM

隔符来区分各个文件，默认为|。列表文件选择“是”时，不显示该参数。 | QUERY参数该参数设置为“是”时，上传到OBS的对象使用的对象名，为去掉query参数后的字符。该参数设置为“否”时，上传到OBS的对象使用的对象名，包含query参数。否忽略不存在原路径/文件如

 帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数
计费说明 - 云数据迁移 CDM
计费说明 - 云数据迁移 CDM

在您使用CDM的过程中，可能还会产生以下相关服务的费用，敬请知悉： OBS服务：数据迁移时，CDM可能会将脏数据写入到OBS服务中，则会产生对象存储服务费用，收费标准请参见OBS价格详情。 EIP服务：如果您为CDM集群开通了公网IP，则会产生弹性公网IP服务费用，收费标准请参见EIP价格详情。

帮助中心 > 云数据迁移 CDM > 产品介绍
作业配置表不存在时自动创建，目的端字段映射不出来怎么处理？ - 云数据迁移 CDM

查看CDM迁移作业，源端数据库表名全部为小写，但是迁移的表中是包含有大写字母，将所要迁移的表名跟数据库中保持一致，目的端字段就可以映射出来了，问题解决。解决方案在作业设置中，源端配置中迁移的数据库表名应按照数据库中的名称填写或者通过搜索选择表名，问题解决。父主题：故障处理类

 帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
CDM作业配置管理 - 云数据迁移 CDM

CDM依次将Task提交给运行池运行。根据集群配置管理中的“最大抽取并发数”参数，超出规格的Task排队等待运行。因此作业抽取并发数和集群最大抽取并发数参数设置为适当的值可以有效提升迁移速度，您可参考下文有效配置抽取并发数。集群最大抽取并发数的上限建议为vCPU核数*2，如表1所示。表1 集群最大抽取并发数配置建议

 帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业
源端为HBase/CloudTable - 云数据迁移 CDM

选择是否拆分Rowkey，例如“true”。 fromJobConfig.delimiter 否 String 用于切分Rowkey的分隔符，若不设置则不切分，例如“|”。 fromJobConfig.startTime 否 String 时间区间左边界（包含该值），格式为“yyyy-MM-dd

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
作业任务参数说明 - 云数据迁移 CDM

作业分组：CDM支持对作业进行分组，分组后的作业可以按组显示、按组批量删除作业、按组批量启动作业、按组导出等。是否定时执行：可选择作业是否定时自动启动。抽取并发数：可设置同时执行的抽取任务数。是否写入脏数据：如果需要将作业执行过程中处理失败的数据、或者被清洗过滤掉的数据写入OBS中，以便后面查看，可通过该

 帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构
目的端为OBS - 云数据迁移 CDM
目的端为OBS - 云数据迁移 CDM

NONE：不加密，直接写入数据。 KMS：使用数据加密服务中的KMS进行加密。如果启用KMS加密则无法进行数据的MD5校验。 toJobConfig.kmsID 否 String 上传时加密使用的密钥。需先在密钥管理服务中创建密钥。 toJobConfig.projectID 否

 帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 目的端作业参数说明
源端为对象存储 - 云数据迁移 CDM

waitTime 否 String 选择开启作业标识文件的功能时，如果源路径下不存在启动作业的标识文件，作业挂机等待的时长，当超时后任务会失败。等待时间设置为0时，当源端路径下不存在标识文件，任务会立即失败。单位：秒。 fromJobConfig.filterType 否枚举选择过滤器类型：

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
新建整库迁移作业 - 云数据迁移 CDM

例如：{HTTPStatusCode:{$gt:"400",$lt:"500"},HTTPMethod:"GET"}。 - 配置目的端作业参数，根据待导入数据的云服务配置对应参数，如表2所示。表2 目的端作业参数目的端数据库类型目的端参数参数说明取值样例云数据库MySQL 云数据库PostgreSQL

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业
配置HBase/CloudTable源端参数 - 云数据迁移 CDM

切分Rowkey 可选参数，选择是否拆分Rowkey，默认为“否”。是 Rowkey分隔符可选参数，用于拆分Rowkey的分隔符，若不设置则不切分。 | 起始时间可选参数，起始时间（包含该值），格式为“yyyy-MM-dd HH:mm:ss”，表示只抽取该时间及以后的数据。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数
查询集群列表 - 云数据迁移 CDM

REBOOT_FAILURE：重启失败。 type String 节点类型，只支持一种类型“cdm”。 id String 节点的虚拟机ID。 name String 节点的虚拟机名称。 isFrozen String 节点是否冻结：0：否。1：是。 components String 组件。 config_status

帮助中心 > 云数据迁移 CDM > API参考 > API > 集群管理
CDM迁移近一个月的数据 - 云数据迁移 CDM

文件格式：同源端相同，选择“二进制格式”。其它可选参数保持默认即可。单击“下一步”进行任务配置，其中抽取并发数默认为3，适当增加可以增加迁移速率，本例中设置为8，其它参数保持默认即可。重复上述步骤创建其它迁移目录的作业，参数配置都相同。2个CDM集群的作业个数平均分配，并发执行。作业执行完

 帮助中心 > 云数据迁移 CDM > 最佳实践 > 车联网大数据零丢失搬迁入湖
配置Hive源端参数 - 云数据迁移 CDM

过滤及在字段映射页面添加新字段。说明：源端为Hive数据源且使用JDBC方式读取数据时，CDM不支持多并发，即后续操作中抽取并发数只能设置为1。 HDFS 使用SQL语句导出关系型数据库的数据时，您可以选择使用自定义SQL语句导出。否 SQL语句 “使用SQL语句”选择“

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数
配置OBS源端参数 - 云数据迁移 CDM

列名不支持“&”字符，否则会导致作业迁移失败，需修改CSV文件“&”字符即可正常迁移。是编码类型文件编码类型，例如：“UTF-8”或“GBK”。只有文本文件可以设置编码类型，当“文件格式”选择为“二进制格式”时，该参数值无效。 GBK 压缩格式选择对应压缩格式的源文件：无：表示传输所有格式的文件。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数
文件格式介绍 - 云数据迁移 CDM

启动作业标识文件为“ok.txt”，在源端生成文件成功后，再在文件目录下生成“ok.txt”，这样CDM就能读取到完整的文件。另外，可以设置超时时间，在超时时间内，CDM会周期去查询标识文件是否存在，超时后标识文件还不存在的话，则作业任务失败。启动作业标识文件本身不会被迁移。

帮助中心 > 云数据迁移 CDM > 最佳实践 > 进阶实践
文件格式介绍 - 云数据迁移 CDM

启动作业标识文件为“ok.txt”，在源端生成文件成功后，再在文件目录下生成“ok.txt”，这样CDM就能读取到完整的文件。另外，可以设置超时时间，在超时时间内，CDM会周期去查询标识文件是否存在，超时后标识文件还不存在的话，则作业任务失败。启动作业标识文件本身不会被迁移。

帮助中心 > 云数据迁移 CDM > 用户指南 > 关键操作指导
配置HDFS源端参数 - 云数据迁移 CDM

M会将CSV文件的前N行数据作为标题行，不写入目的端的表。否编码类型文件编码类型，例如：“UTF-8”或“GBK”。只有文本文件可以设置编码类型，当“文件格式”选择为“二进制格式”时，该参数值无效。 GBK 启动作业标识文件选择是否开启作业标识文件的功能。当源端路径下存在

 帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数
源端为Elasticsearch/云搜索服务 - 云数据迁移 CDM

源端为Elasticsearch/云搜索服务 JSON样例 "from-config-values": { "configs": [ { "inputs": [

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明

总条数： 312

上一页
1
...
9
10
11
...
16
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi目的端的作业执行Spark SQL写入Hudi失败怎么办？ - 云数据迁移 CDM

配置Kafka/DMS Kafka源端参数 - 云数据迁移 CDM

配置HTTP源端参数 - 云数据迁移 CDM

计费说明 - 云数据迁移 CDM

作业配置表不存在时自动创建，目的端字段映射不出来怎么处理？ - 云数据迁移 CDM

CDM作业配置管理 - 云数据迁移 CDM

源端为HBase/CloudTable - 云数据迁移 CDM

作业任务参数说明 - 云数据迁移 CDM

目的端为OBS - 云数据迁移 CDM

源端为对象存储 - 云数据迁移 CDM

新建整库迁移作业 - 云数据迁移 CDM

配置HBase/CloudTable源端参数 - 云数据迁移 CDM

查询集群列表 - 云数据迁移 CDM

CDM迁移近一个月的数据 - 云数据迁移 CDM

配置Hive源端参数 - 云数据迁移 CDM

配置OBS源端参数 - 云数据迁移 CDM

文件格式介绍 - 云数据迁移 CDM

文件格式介绍 - 云数据迁移 CDM

配置HDFS源端参数 - 云数据迁移 CDM

源端为Elasticsearch/云搜索服务 - 云数据迁移 CDM

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线