搜索_华为云

配置HBase/CloudTable源端参数 - 云数据迁移 CDM

切分Rowkey 可选参数，选择是否拆分Rowkey，默认为“否”。是 Rowkey分隔符可选参数，用于拆分Rowkey的分隔符，若不设置则不切分。 | 起始时间可选参数，起始时间（包含该值），格式为“yyyy-MM-dd HH:mm:ss”，表示只抽取该时间及以后的数据。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数
日志提示解析日期格式失败时怎么处理？ - 云数据迁移 CDM

ate_test”和“test1”在云搜索服务中不存在时，CDM会在云搜索服务中自动创建该索引和类型），则CDM默认会将时间类型字段的格式设置为“yyyy-MM-dd HH:mm:ss.SSS Z”的标准格式，例如“2018-01-08 08:08:08.666 +0800”。图2

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
什么是云数据迁移 - 云数据迁移 CDM

脏数据归档支持将迁移过程中处理失败的、被清洗过滤掉的、不符合字段转换或者不符合清洗规则的数据单独归档到脏数据日志中，便于用户查看。并支持设置脏数据比例阈值，来决定任务是否成功。

帮助中心 > 云数据迁移 CDM > 产品介绍
Hive连接 - 云数据迁移 CDM
Hive连接 - 云数据迁移 CDM

不用配置 linkConfig.uri 否 String 连接Apache Hadoop时的Namenode URI地址，格式为“ip:port” linkConfig.hiveMsUris 否 String 连接Apache Hadoop时的Hive元数据地址，参考 hive.metastore

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 连接参数说明
配置HBase/CloudTable目的端参数 - 云数据迁移 CDM

置的表已存在，则不创建，数据写入到已存在的表中。说明： Hbase自动建表包含列族与协处理器Coprocessor信息。其他属性按默认值设置，不跟随源端。不自动创建 Row key拼接分隔符可选参数，用于多列合并作为rowkey，默认为空格。 , Rowkey冗余可选参数

 帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业目的端参数
新增字段操作指导 - 云数据迁移 CDM

如果是导入到数据仓库服务（DWS），则还需在目的字段中选择分布列，建议按如下顺序选取分布列：有主键可以使用主键作为分布列。多个数据段联合做主键的场景，建议设置所有主键作为分布列。在没有主键的场景下，如果没有选择分布列，DWS会默认第一列作为分布列，可能会有数据倾斜风险。如CDM不支持源端迁移

 帮助中心 > 云数据迁移 CDM > 用户指南 > 关键操作指导
查询集群列表 - 云数据迁移 CDM

查询集群列表功能介绍查询集群列表接口。调用方法请参见如何调用API。 URI GET /v1.1/{project_id}/clusters 表1 路径参数参数是否必选参数类型描述 project_id 是 String 项目ID，获取方法请参见项目ID和账号ID。请求参数

 帮助中心 > 云数据迁移 CDM > API参考 > API > 集群管理
配置Hive源端参数 - 云数据迁移 CDM

过滤及在字段映射页面添加新字段。说明：源端为Hive数据源且使用JDBC方式读取数据时，CDM不支持多并发，即后续操作中抽取并发数只能设置为1。 HDFS 使用SQL语句导出关系型数据库的数据时，您可以选择使用自定义SQL语句导出。否 SQL语句 “使用SQL语句”选择“

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数
计费说明 - 云数据迁移 CDM
计费说明 - 云数据迁移 CDM

当集群创建成功后，无法对集群进行规格变更，不过您可以通过删除集群后重建集群，实现变更。续费资源包到期后，您可以进行续费以延长资源包的有效期，也可以设置到期自动续费。到期与欠费折扣套餐资源包到期后，自动转为按需计费。转按需后如果账号欠费，会根据“客户等级”和“订购方式”定义不同的宽限期

 帮助中心 > 云数据迁移 CDM > 产品介绍
目的端为OBS - 云数据迁移 CDM
目的端为OBS - 云数据迁移 CDM

时，才有该参数。选择“是”后，迁移对象文件时会复制源文件的Content-Type属性，主要用于静态网站的迁移场景。归档存储的桶不支持设置Content-Type属性，所以如果开启了该参数，目的端选择写入的桶时，必须选择非归档存储的桶。 toJobConfig.quoteChar

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 目的端作业参数说明
查询作业 - 云数据迁移 CDM
查询作业 - 云数据迁移 CDM

查询作业功能介绍查询作业接口。调用方法请参见如何调用API。 URI GET /v1.1/{project_id}/clusters/{cluster_id}/cdm/job/{job_name} 表1 路径参数参数是否必选参数类型描述 project_id 是 String

帮助中心 > 云数据迁移 CDM > API参考 > API > 作业管理
源端为对象存储 - 云数据迁移 CDM

waitTime 否 String 选择开启作业标识文件的功能时，如果源路径下不存在启动作业的标识文件，作业挂机等待的时长，当超时后任务会失败。等待时间设置为0时，当源端路径下不存在标识文件，任务会立即失败。单位：秒。 fromJobConfig.filterType 否枚举选择过滤器类型：

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
新建Hadoop集群配置 - 云数据迁移 CDM

获取下载的tar包，此即为FusionInsight集群Keytab文件。针对MRS 2.x及之前版本集群：登录MRS服务的Manager，单击“系统设置”。在“权限配置”区域，单击“用户管理”。在需导出keytab文件用户所在的行，选择“更多 > 下载认证凭据”下载认证文件，待文件自动生成后指定保存位置，并妥善保管该文件。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建连接
源端为FTP/SFTP - 云数据迁移 CDM
源端为FTP/SFTP - 云数据迁移 CDM

waitTime 否 String 选择开启作业标识文件的功能时，如果源路径下不存在启动作业的标识文件，作业挂机等待的时长，当超时后任务会失败。等待时间设置为0时，当源端路径下不存在标识文件，任务会立即失败。单位：秒。 fromJobConfig.filterType 否枚举选择过滤器类型：

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
新建整库迁移作业 - 云数据迁移 CDM

、清洗规则。 /user/dirtydir 单个分片的最大错误记录数当“是否写入脏数据”为“是”才显示该参数。单个map的错误记录超过设置的最大错误记录数则任务自动结束，已经导入的数据不支持回退。推荐使用临时表作为导入的目标表，待导入成功后再改名或合并到最终数据表。 0 单击“保存”，或者“保存并运行”。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业
如何使用Java调用CDM的Rest API创建数据迁移作业？ - 云数据迁移 CDM

API创建、启动、查询、删除该CDM作业。需要提前准备以下数据：云账号的用户名、账号名和项目ID。创建一个CDM集群，并获取集群ID。获取方法：在集群管理界面，单击CDM集群名称可查看集群ID，例如“c110beff-0f11-4e75-8b10-da7cd882b0ef”。创

 帮助中心 > 云数据迁移 CDM > 常见问题 > 功能类
修改作业 - 云数据迁移 CDM
修改作业 - 云数据迁移 CDM

修改作业功能介绍修改作业接口。调用方法请参见如何调用API。 URI PUT /v1.1/{project_id}/clusters/{cluster_id}/cdm/job/{job_name} 表1 路径参数参数是否必选参数类型描述 project_id 是 String

帮助中心 > 云数据迁移 CDM > API参考 > API > 作业管理
随机集群创建作业并执行 - 云数据迁移 CDM

随机集群创建作业并执行接口。调用方法请参见如何调用API。 URI POST /v1.1/{project_id}/clusters/job 表1 路径参数参数是否必选参数类型描述 project_id 是 String 项目ID，获取方法请参见项目ID和账号ID。请求参数

 帮助中心 > 云数据迁移 CDM > API参考 > API > 作业管理
指定集群创建作业 - 云数据迁移 CDM

指定集群创建作业接口。调用方法请参见如何调用API。 URI POST /v1.1/{project_id}/clusters/{cluster_id}/cdm/job 表1 路径参数参数是否必选参数类型描述 project_id 是 String 项目ID，获取方法请参见项目ID和账号ID。

帮助中心 > 云数据迁移 CDM > API参考 > API > 作业管理
字段转换器配置指导 - 云数据迁移 CDM

如果是导入到数据仓库服务（DWS），则还需在目的字段中选择分布列，建议按如下顺序选取分布列：有主键可以使用主键作为分布列。多个数据段联合做主键的场景，建议设置所有主键作为分布列。在没有主键的场景下，如果没有选择分布列，DWS会默认第一列作为分布列，可能会有数据倾斜风险。脱敏隐藏字符串中的关

 帮助中心 > 云数据迁移 CDM > 最佳实践 > 进阶实践

总条数： 202

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置HBase/CloudTable源端参数 - 云数据迁移 CDM

日志提示解析日期格式失败时怎么处理？ - 云数据迁移 CDM

什么是云数据迁移 - 云数据迁移 CDM

Hive连接 - 云数据迁移 CDM

配置HBase/CloudTable目的端参数 - 云数据迁移 CDM

新增字段操作指导 - 云数据迁移 CDM

查询集群列表 - 云数据迁移 CDM

配置Hive源端参数 - 云数据迁移 CDM

计费说明 - 云数据迁移 CDM

目的端为OBS - 云数据迁移 CDM

查询作业 - 云数据迁移 CDM

源端为对象存储 - 云数据迁移 CDM

新建Hadoop集群配置 - 云数据迁移 CDM

源端为FTP/SFTP - 云数据迁移 CDM

新建整库迁移作业 - 云数据迁移 CDM

如何使用Java调用CDM的Rest API创建数据迁移作业？ - 云数据迁移 CDM

修改作业 - 云数据迁移 CDM

随机集群创建作业并执行 - 云数据迁移 CDM

指定集群创建作业 - 云数据迁移 CDM

字段转换器配置指导 - 云数据迁移 CDM

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线