搜索_华为云

入门实践 - 云数据迁移 CDM
入门实践 - 云数据迁移 CDM

创建MRS Hive连接器 MRS Hive连接适用于MapReduce服务，本最佳实践为您介绍如何创建MRS Hive连接器。 MySQL数据迁移到OBS CDM支持表到OBS的迁移，本最佳实践介绍如何通过CDM将MySQL表数据迁移到OBS中。参数传递通过数据开发使用参数传递灵活调度CDM作业

 帮助中心 > 云数据迁移 CDM > 快速入门
关系数据库连接 - 云数据迁移 CDM

IGNORE 修饰符用于处理与现有行具有相同唯一键值（PRIMARY KEY或UNIQUE索引值）的新输入的行。约束冲突处理配置为"replace into"或"local"，使用REPLACE，与现有行中的唯一键值具有相同值的新行将替换现有行。约束冲突处理配置为"insert

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 连接参数说明
性能调优 - 云数据迁移 CDM
性能调优 - 云数据迁移 CDM

规格的Task排队等待运行。因此作业抽取并发数和集群最大抽取并发数参数设置为适当的值可以有效提升迁移速度。关于如何调整抽取并发数，详情请参考如何调整抽取并发数。如何调整抽取并发数集群最大抽取并发数的设置与CDM集群规格有关，并发数上限建议配置为vCPU核数*2，如表1所示。

帮助中心 > 云数据迁移 CDM > 性能白皮书
配置MySQL/SQL Server/PostgreSQL目的端参数 - 云数据迁移 CDM

置，配置后导入前根据where条件删除目的表的数据。 age > 18 and age <= 60 约束冲突处理导入数据到云数据库 MySQL且当迁移数据出现冲突时的处理方式。 insert into：当存在主键、唯一性索引冲突时，数据无法写入并将以脏数据的形式存在。 replace

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业目的端参数
配置HBase/CloudTable目的端参数 - 云数据迁移 CDM

量替换为“数据开发作业计划启动时间-偏移量”，而不是“CDM作业实际启动时间-偏移量”。 TBL_2 导入前清空数据选择目的端表中数据的处理方式。是：任务启动前会清除目标表中数据。否：导入前不清空目标表中的数据，如果选“否”且表中有数据，则数据会追加到已有的表中。是自动创表

 帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业目的端参数
目的端为HDFS - 云数据迁移 CDM
目的端为HDFS - 云数据迁移 CDM

在目的端恢复文件。 toJobConfig.duplicateFileOpType 否枚举重复文件处理方式，只有文件名和文件大小都相同才会判定为重复文件。重复文件支持以下处理方式： REPLACE：替换重复文件。 SKIP：跳过重复文件。 ABANDON：发现重复文件停止任务。

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 目的端作业参数说明
支持的数据源（2.9.2.200） - 云数据迁移 CDM

NoSQL：表格存储服务（CloudTable）搜索：Elasticsearch，云搜索服务（CSS） Elasticsearch仅支持非安全模式。云搜索服务（CSS）导入数据到CSS推荐使用Logstash，请参见使用Logstash导入数据到Elasticsearch。

帮助中心 > 云数据迁移 CDM > 用户指南 > 支持的数据源
支持的数据源（2.9.2.200） - 云数据迁移 CDM

NoSQL：表格存储服务（CloudTable）搜索：Elasticsearch，云搜索服务（CSS） Elasticsearch仅支持非安全模式。云搜索服务（CSS）导入数据到CSS推荐使用Logstash，请参见使用Logstash导入数据到Elasticsearch。

帮助中心 > 云数据迁移 CDM > 产品介绍 > 支持的数据源
CDM不同集群规格对应并发的作业数是多少？ - 云数据迁移 CDM

数”参数分片的情况。 CDM依次将Task提交给运行池运行。根据集群配置管理中的“最大抽取并发数”参数，超出规格的Task排队等待运行。如何调整抽取并发数集群最大抽取并发数的设置与CDM集群规格有关，并发数上限建议配置为vCPU核数*2，如表1所示。表1 集群最大抽取并发数配置建议

 帮助中心 > 云数据迁移 CDM > 常见问题 > 通用类
目的端为OBS - 云数据迁移 CDM
目的端为OBS - 云数据迁移 CDM

过大，单位为MB。 toJobConfig.duplicateFileOpType 否枚举重复文件处理方式，只有文件名和文件大小都相同才会判定为重复文件。重复文件支持以下处理方式： REPLACE：替换重复文件。 SKIP：跳过重复文件。 ABANDON：发现重复文件停止任务。

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 目的端作业参数说明
配置HDFS目的端参数 - 云数据迁移 CDM

”只能选择与源端的文件格式一致。 CSV格式重复文件处理方式当源端为文件类数据源（HTTP/FTP/SFTP/HDFS/OBS）时配置。只有文件名和文件大小都相同才会判定为重复文件。写入时如果出现文件重复，可选择如下处理方式：替换重复文件跳过重复文件停止任务停止任务

 帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业目的端参数
支持的数据源（2.9.3.300） - 云数据迁移 CDM

NoSQL：表格存储服务（CloudTable）搜索：Elasticsearch，云搜索服务（CSS） Elasticsearch仅支持非安全模式。云搜索服务（CSS）导入数据到CSS推荐使用Logstash，请参见使用Logstash导入数据到Elasticsearch。

帮助中心 > 云数据迁移 CDM > 用户指南 > 支持的数据源
配置Doris目的端参数 - 云数据迁移 CDM

数。对于使用了Unique模型或者聚合函数replace等对插入顺序有要求的情况下，不建议使用并发能力。并发场景下有如下限制：约束冲突处理策略不支持"replace into"或"on duplicate key update"。 1 父主题：配置CDM作业目的端参数

 帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业目的端参数
支持的数据源（2.9.3.300） - 云数据迁移 CDM

NoSQL：表格存储服务（CloudTable）搜索：Elasticsearch，云搜索服务（CSS） Elasticsearch仅支持非安全模式。云搜索服务（CSS）导入数据到CSS推荐使用Logstash，请参见使用Logstash导入数据到Elasticsearch。

帮助中心 > 云数据迁移 CDM > 产品介绍 > 支持的数据源
YASHAN连接参数说明 - 云数据迁移 CDM

可选参数，连接引用表名或列名时的分隔符号，参考对应数据库的产品文档进行配置。 " 驱动版本不同类型的关系数据库，需要适配不同的驱动，更多详情请参见如何获取驱动。 - 单次请求行数可选参数，单击“显示高级属性”后显示。指定每次请求获取的行数，根据数据源端和作业数据规模的大小配置该参数。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建连接 > 配置连接参数
支持的数据源（2.10.0.300） - 云数据迁移 CDM

Server 搜索：Elasticsearch 公测中：表格存储服务（CloudTable），云搜索服务（CSS） Elasticsearch仅支持非安全模式。公测中表格存储服务（CloudTable HBase）数据仓库：数据仓库服务（DWS），数据湖探索（DLI） Hadoop：MRS

帮助中心 > 云数据迁移 CDM > 用户指南 > 支持的数据源
配置Oracle目的端参数 - 云数据迁移 CDM

条SQL语句。 merge into loader线程数每个loader内部启动的线程数，可以提升写入并发数。说明：不支持“约束冲突处理”策略为“replace into”或“on duplicate key update”的并发场景。 1 父主题：配置CDM作业目的端参数

 帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业目的端参数
源端为FTP/SFTP - 云数据迁移 CDM
源端为FTP/SFTP - 云数据迁移 CDM

并发任务数中指定“throttlingConfig.numExtractors”（抽取并发数）为“2”，则会分两个分片，一个处理9个10M的文件，一个处理1个200M的文件。 fromJobConfig.jsonReferenceNode 否 String 记录节点，当文件格式为

 帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
支持的数据源（2.10.0.300） - 云数据迁移 CDM

Server 搜索：Elasticsearch 公测中：表格存储服务（CloudTable），云搜索服务（CSS） Elasticsearch仅支持非安全模式。公测中表格存储服务（CloudTable HBase）数据仓库：数据仓库服务（DWS），数据湖探索（DLI） Hadoop：MRS

帮助中心 > 云数据迁移 CDM > 产品介绍 > 支持的数据源
源端为HDFS - 云数据迁移 CDM
源端为HDFS - 云数据迁移 CDM

并发任务数中指定“throttlingConfig.numExtractors”（抽取并发数）为“2”，则会分两个分片，一个处理9个10M的文件，一个处理1个200M的文件。 fromJobConfig.useMarkerFile 否 Boolean 选择是否开启作业标识文件的功

 帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明

总条数： 254

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

入门实践 - 云数据迁移 CDM

关系数据库连接 - 云数据迁移 CDM

性能调优 - 云数据迁移 CDM

配置MySQL/SQL Server/PostgreSQL目的端参数 - 云数据迁移 CDM

配置HBase/CloudTable目的端参数 - 云数据迁移 CDM

目的端为HDFS - 云数据迁移 CDM

支持的数据源（2.9.2.200） - 云数据迁移 CDM

支持的数据源（2.9.2.200） - 云数据迁移 CDM

CDM不同集群规格对应并发的作业数是多少？ - 云数据迁移 CDM

目的端为OBS - 云数据迁移 CDM

配置HDFS目的端参数 - 云数据迁移 CDM

支持的数据源（2.9.3.300） - 云数据迁移 CDM

配置Doris目的端参数 - 云数据迁移 CDM

支持的数据源（2.9.3.300） - 云数据迁移 CDM

YASHAN连接参数说明 - 云数据迁移 CDM

支持的数据源（2.10.0.300） - 云数据迁移 CDM

配置Oracle目的端参数 - 云数据迁移 CDM

源端为FTP/SFTP - 云数据迁移 CDM

支持的数据源（2.10.0.300） - 云数据迁移 CDM

源端为HDFS - 云数据迁移 CDM

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线