搜索_华为云

源端为DIS - 云数据迁移 CDM
源端为DIS - 云数据迁移 CDM

fromJobConfig.streamName 是 String DIS的通道名。 fromJobConfig.disConsumerStrategy 是枚举设置从DIS拉取数据时的初始偏移量： LATEST：最大偏移量，即最新的数据。 FROM_LAST_STOP：从上次停止处继续拉取。 EARLIEST：最小偏移量，即最早的数据。

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
源端为Kafka - 云数据迁移 CDM
源端为Kafka - 云数据迁移 CDM

topic列表，可以为多个topic，以“,”作为分隔符。 fromJobConfig.kafkaConsumerStrategy 是枚举从Kafka拉取数据时的初始偏移量设置： LATEST：最大偏移量，即最新的数据。 EARLIEST：最小偏移量，即最老的数据。 fromJobConfig.isPermanency

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
执行Postgresql-to-Hive迁移作业报错“Error occurs during loader run” - 云数据迁移 CDM

执行Postgresql-to-Hive迁移作业报错“Error occurs during loader run” 问题描述用户使用CDM服务，从源端pg迁移数据到目的端hive界面报错提示“Error occurs during loader run”。故障分析排查客户

 帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
入门实践 - 云数据迁移 CDM
入门实践 - 云数据迁移 CDM

入门实践当您参考创建集群、创建连接等一系列操作后，可以根据自身的业务需求使用CDM提供的一系列常用实践。表1 常用最佳实践实践描述使用教程创建MRS Hive连接器 MRS Hive连接适用于MapReduce服务，本最佳实践为您介绍如何创建MRS Hive连接器。 MySQL数据迁移到OBS

帮助中心 > 云数据迁移 CDM > 快速入门
字段转换器配置指导 - 云数据迁移 CDM

如果是导入到数据仓库服务（DWS），则还需在目的字段中选择分布列，建议按如下顺序选取分布列：有主键可以使用主键作为分布列。多个数据段联合做主键的场景，建议设置所有主键作为分布列。在没有主键的场景下，如果没有选择分布列，DWS会默认第一列作为分布列，可能会有数据倾斜风险。脱敏隐藏字符串中的关

 帮助中心 > 云数据迁移 CDM > 最佳实践 > 进阶实践
字段转换器配置指导 - 云数据迁移 CDM

如果是导入到数据仓库服务（DWS），则还需在目的字段中选择分布列，建议按如下顺序选取分布列：有主键可以使用主键作为分布列。多个数据段联合做主键的场景，建议设置所有主键作为分布列。在没有主键的场景下，如果没有选择分布列，DWS会默认第一列作为分布列，可能会有数据倾斜风险。脱敏隐藏字符串中的关

 帮助中心 > 云数据迁移 CDM > 用户指南 > 关键操作指导
源端为HBase/CloudTable - 云数据迁移 CDM

选择是否拆分Rowkey，例如“true”。 fromJobConfig.delimiter 否 String 用于切分Rowkey的分隔符，若不设置则不切分，例如“|”。 fromJobConfig.startTime 否 String 时间区间左边界（包含该值），格式为“yyyy-MM-dd

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
作业任务参数说明 - 云数据迁移 CDM

作业分组：CDM支持对作业进行分组，分组后的作业可以按组显示、按组批量删除作业、按组批量启动作业、按组导出等。是否定时执行：可选择作业是否定时自动启动。抽取并发数：可设置同时执行的抽取任务数。是否写入脏数据：如果需要将作业执行过程中处理失败的数据、或者被清洗过滤掉的数据写入OBS中，以便后面查看，可通过该

 帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构
配置CDM作业字段映射 - 云数据迁移 CDM

如果是导入到数据仓库服务（DWS），则还需在目的字段中选择分布列，建议按如下顺序选取分布列：有主键可以使用主键作为分布列。多个数据段联合做主键的场景，建议设置所有主键作为分布列。在没有主键的场景下，如果没有选择分布列，DWS会默认第一列作为分布列，可能会有数据倾斜风险。如CDM不支持源端迁移

 帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业
DLI连接参数说明 - 云数据迁移 CDM

DLI连接参数说明连接数据湖探索（DLI）服务时，相关参数如表1所示。作业运行中禁止修改密码或者更换用户。在作业运行过程中修改密码或者更换用户，密码不会立即生效且作业会运行失败。迁移数据到DLI时，DLI要在OBS的dli-trans*内部临时桶生成数据文件，因此在需要赋予

 帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建连接 > 配置连接参数
认证鉴权 - 云数据迁移 CDM
认证鉴权 - 云数据迁移 CDM

认证鉴权调用接口有如下两种认证方式，您可以选择其中一种进行认证鉴权。 Token认证：通过Token认证通用请求。 AK/SK认证：通过AK（Access Key ID）/SK（Secret Access Key）加密调用请求。仅当创建IAM用户时的访问方式勾选“编程访问”后

 帮助中心 > 云数据迁移 CDM > API参考 > 如何调用API
配置HBase/CloudTable源端参数 - 云数据迁移 CDM

切分Rowkey 可选参数，选择是否拆分Rowkey，默认为“否”。是 Rowkey分隔符可选参数，用于拆分Rowkey的分隔符，若不设置则不切分。 | 起始时间可选参数，起始时间（包含该值），格式为“yyyy-MM-dd HH:mm:ss”，表示只抽取该时间及以后的数据。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数
配置Hive目的端参数 - 云数据迁移 CDM

是：任务启动前会清除目标表中数据。否：导入前不清空目标表中的数据，如果选“否”且表中有数据，则数据会追加到已有的表中。是待清空分区 “导入前清空数据”设置为“是”时，呈现此参数。填写待清空分区信息后，表示清空该分区的数据。单分区：year=2020,location=sun; 多分区：['year=2020

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业目的端参数
配置Hive源端参数 - 云数据迁移 CDM

过滤及在字段映射页面添加新字段。说明：源端为Hive数据源且使用JDBC方式读取数据时，CDM不支持多并发，即后续操作中抽取并发数只能设置为1。 HDFS 使用SQL语句导出关系型数据库的数据时，您可以选择使用自定义SQL语句导出。否 SQL语句 “使用SQL语句”选择“

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数
Hive连接 - 云数据迁移 CDM
Hive连接 - 云数据迁移 CDM

Hive连接介绍通过Hive连接，可以对MRS的Hive数据源进行抽取、加载数据。连接样例本示例为连接样例消息体。在实际使用中，AK（accessKey）和SK（securityKey）建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。 { "links":

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 连接参数说明
配置OBS源端参数 - 云数据迁移 CDM

列名不支持“&”字符，否则会导致作业迁移失败，需修改CSV文件“&”字符即可正常迁移。是编码类型文件编码类型，例如：“UTF-8”或“GBK”。只有文本文件可以设置编码类型，当“文件格式”选择为“二进制格式”时，该参数值无效。 GBK 压缩格式选择对应压缩格式的源文件：无：表示传输所有格式的文件。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数
查询连接 - 云数据迁移 CDM
查询连接 - 云数据迁移 CDM

查询连接功能介绍查询连接接口。调用方法请参见如何调用API。 URI GET /v1.1/{project_id}/clusters/{cluster_id}/cdm/link/{link_name} 表1 路径参数参数是否必选参数类型描述 project_id 是

 帮助中心 > 云数据迁移 CDM > API参考 > API > 连接管理
源端为对象存储 - 云数据迁移 CDM

waitTime 否 String 选择开启作业标识文件的功能时，如果源路径下不存在启动作业的标识文件，作业挂机等待的时长，当超时后任务会失败。等待时间设置为0时，当源端路径下不存在标识文件，任务会立即失败。单位：秒。 fromJobConfig.filterType 否枚举选择过滤器类型：

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
修改连接 - 云数据迁移 CDM
修改连接 - 云数据迁移 CDM

修改连接功能介绍修改连接接口。调用方法请参见如何调用API。 URI PUT /v1.1/{project_id}/clusters/{cluster_id}/cdm/link/{link_name} 表1 路径参数参数是否必选参数类型描述 project_id 是

 帮助中心 > 云数据迁移 CDM > API参考 > API > 连接管理
源端为FTP/SFTP - 云数据迁移 CDM
源端为FTP/SFTP - 云数据迁移 CDM

waitTime 否 String 选择开启作业标识文件的功能时，如果源路径下不存在启动作业的标识文件，作业挂机等待的时长，当超时后任务会失败。等待时间设置为0时，当源端路径下不存在标识文件，任务会立即失败。单位：秒。 fromJobConfig.filterType 否枚举选择过滤器类型：

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明

总条数： 184

上一页
1
...
6
7
8
9
10
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

源端为DIS - 云数据迁移 CDM

源端为Kafka - 云数据迁移 CDM

执行Postgresql-to-Hive迁移作业报错“Error occurs during loader run” - 云数据迁移 CDM

入门实践 - 云数据迁移 CDM

字段转换器配置指导 - 云数据迁移 CDM

字段转换器配置指导 - 云数据迁移 CDM

源端为HBase/CloudTable - 云数据迁移 CDM

作业任务参数说明 - 云数据迁移 CDM

配置CDM作业字段映射 - 云数据迁移 CDM

DLI连接参数说明 - 云数据迁移 CDM

认证鉴权 - 云数据迁移 CDM

配置HBase/CloudTable源端参数 - 云数据迁移 CDM

配置Hive目的端参数 - 云数据迁移 CDM

配置Hive源端参数 - 云数据迁移 CDM

Hive连接 - 云数据迁移 CDM

配置OBS源端参数 - 云数据迁移 CDM

查询连接 - 云数据迁移 CDM

源端为对象存储 - 云数据迁移 CDM

修改连接 - 云数据迁移 CDM

源端为FTP/SFTP - 云数据迁移 CDM

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线