搜索_华为云

配置HDFS源端参数 - 云数据迁移 CDM

传输数据时所用的文件格式，可选择以下文件格式： CSV格式：以CSV格式解析源文件，用于迁移文件到数据表的场景。二进制格式：选择“二进制格式”时不解析文件内容直接传输，不要求文件格式必须为二进制。适用于文件到文件的原样复制。 Parquet格式：以Parquet格式解析源文件，用于HDFS数据导到表的场景。 CSV格式

 帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数
贸易数据上云场景介绍 - 云数据迁移 CDM

易详单数据和基础信息数据），基于CDM+OBS+DLI完成贸易统计分析。图1 场景方案 DLI创建OBS外表，对OBS表数据存储格式有所要求：使用DataSource语法创建OBS表时，支持orc，parquet，json，csv，carbon，avro类型。使用Hive语法创建OBS表时，支持TEXTFILE

帮助中心 > 云数据迁移 CDM > 最佳实践 > 贸易数据极简上云与统计分析
CDM迁移数据到DWS时如何选取分布列？ - 云数据迁移 CDM

LibrA时，建议您在此处手动选择分布列，如果您没有选择，CDM会自动选择一个分布列。关于分布列的更多信息，请参见数据仓库服务。 DWS主键或表只有一个字段时，要求字段类型必须是如下常用的字符串、数值、日期类型。从其他数据库迁移到DWS时，如果选择自动建表，主键必须为以下类型，未设置主键的情况下至少要

 帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
云数据迁移安全简介 - 云数据迁移 CDM

端抽取数据然后将数据写入到目的端，数据访问操作均由CDM主动发起，对于数据源（如RDS数据源）支持SSL时，会使用SSL加密传输。迁移过程要求用户提供源端和目的端数据源的用户名和密码，这些信息将存储在CDM实例的数据库中。保护这些信息对于CDM安全至关重要。图1 CDM迁移原理

 帮助中心 > 云数据迁移 CDM > 安全白皮书
配置FTP/SFTP源端参数 - 云数据迁移 CDM

指CDM以哪种格式解析数据，可选择以下格式： CSV格式：以CSV格式解析源文件，用于迁移文件到数据表的场景。二进制格式：选择“二进制格式”时不解析文件内容直接传输，不要求文件格式必须为二进制。适用于文件到文件的原样复制。 JSON格式：以JSON格式解析源文件，一般都是用于迁移文件到数据表的场景。说明：

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数
通过数据开发使用参数传递灵活调度CDM作业 - 云数据迁移 CDM

文、“-”、“_”、“.”，且长度为1～128个字符。作业类型选择作业的类型。批处理作业：按调度计划定期处理批量数据，主要用于实时性要求低的场景。批作业是由一个或多个节点组成的流水线，以流水线作为一个整体被调度。被调度触发后，任务执行一段时间必须结束，即任务不能无限时间持续运行。

帮助中心 > 云数据迁移 CDM > 最佳实践
创建IAM用户并授权使用CDM - 云数据迁移 CDM

隔离。将CDM资源委托给更专业、高效的其他华为云账号或者云服务，这些账号或者云服务可以根据权限进行代运维。如果华为云账号已经能满足您的要求，不需要创建独立的IAM用户，您可以跳过本章节，不影响您使用CDM服务的其它功能。本章节为您介绍对用户授权的方法，操作流程如图1所示。前提条件

 帮助中心 > 云数据迁移 CDM > 用户指南 > IAM权限管理
配置Doris目的端参数 - 云数据迁移 CDM

loader线程数每个loader内部启动的线程数，可以提升写入并发数。对于使用了Unique模型或者聚合函数replace等对插入顺序有要求的情况下，不建议使用并发能力。并发场景下有如下限制：约束冲突处理策略不支持"replace into"或"on duplicate key

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业目的端参数
源端为关系数据库 - 云数据迁移 CDM

String 表名，例如：“TBL_EXAMPLE”。说明：表名支持配置通配符（*），实现导出以某一前缀开头或者以某一后缀结尾的所有表（要求表中的字段个数和类型都一样）。例如： table*表示导出所有以“table”开头的表。 *table表示导出所有以“table”结尾的表。

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
配置OBS源端参数 - 云数据迁移 CDM

指CDM以哪种格式解析数据，可选择以下格式： CSV格式：以CSV格式解析源文件，用于迁移文件到数据表的场景。二进制格式：选择“二进制格式”时不解析文件内容直接传输，不要求文件格式必须为二进制。适用于文件到文件的原样复制。 JSON格式：以JSON格式解析源文件，一般都是用于迁移文件到数据表的场景。 CSV格式

 帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数
约束与限制 - 云数据迁移 CDM
约束与限制 - 云数据迁移 CDM

CDM自动创建的索引，字段类型为date时，要求数据格式为“yyyy-MM-dd HH:mm:ss.SSS Z”，即“2018-08-08 08:08:08.888 +08:00”。迁移数据到云搜索服务时如果date字段的原始数据不满足格式要求，可以通过CDM的字段转换功能转换为上述格式。

帮助中心 > 云数据迁移 CDM > 产品介绍
配置HBase/CloudTable源端参数 - 云数据迁移 CDM

CDM会无法解析。从HBase/CloudTable导出数据时，由于HBase/CloudTable是无Schema的存储系统，CDM要求源端数值型字段是以字符串格式存储，而不能是二进制格式，例如数值100需存储格式是字符串“100”，不能是二进制“01100100”。表1

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数
CDM有哪些优势？ - 云数据迁移 CDM

7*24小时人工值守。高效率在迁移过程中，数据读写过程都是由一个单一任务完成的，受限于资源，整体性能较低，对于海量数据场景通常不能满足要求。 CDM任务基于分布式计算框架，自动将任务切分为独立的子任务并行执行，能够极大提高数据迁移的效率。针对Hive、HBase、MySQL、

帮助中心 > 云数据迁移 CDM > 常见问题 > 通用类
产品优势 - 云数据迁移 CDM
产品优势 - 云数据迁移 CDM

7X24小时人工值守。高效率在迁移过程中，数据读写过程都是由一个单一任务完成的，受限于资源，整体性能较低，对于海量数据场景通常不能满足要求。 CDM任务基于分布式计算框架，自动将任务切分为独立的子任务并行执行，能够极大提高数据迁移的效率。针对Hive、HBase、MySQL、

帮助中心 > 云数据迁移 CDM > 产品介绍
记录数据迁移入库时间 - 云数据迁移 CDM

添加完字段后，新增的字段在界面不显示样值，不会影响字段值的传输，CDM会将字段值直接写入目的端。这里“添加字段”中“自定义字段”的功能，要求源端连接器为JDBC连接器、HBase连接器、MongoDB连接器、ElasticSearch连接器、Kafka连接器，或者目的端为HBase连接器。

帮助中心 > 云数据迁移 CDM > 最佳实践 > 进阶实践
如何将云下内网或第三方云上的私网与CDM连通？ - 云数据迁移 CDM

心私网。图1 网络拓扑样例操作步骤找一台Windows机器作为网关机，该机器同时配置内网和外网IP。通过以下测试来确保网关机器的服务要求：在该机器上ping内网MySQL地址可以ping通，例如：ping 192.168.1.8。在另外一台可上网的机器上ping网关机的公网地址可以ping通，例如ping

帮助中心 > 云数据迁移 CDM > 常见问题 > 功能类
上传存量数据 - 云数据迁移 CDM

xlarge”，该实例类型适用大部分迁移场景。虚拟私有云：CDM集群的VPC，选择用户本地数据中心与云专线连通的VPC。子网、安全组：这里没有要求，分别任选一个即可。集群创建完成后，选择集群后面的“作业管理 > 连接管理 > 新建连接”，进入选择连接类型的界面，如图1所示。图1 选择连接器类型

 帮助中心 > 云数据迁移 CDM > 最佳实践 > 贸易数据极简上云与统计分析 > 使用CDM上传数据到OBS
记录数据迁移入库时间 - 云数据迁移 CDM

添加完字段后，新增的字段在界面不显示样值，不会影响字段值的传输，CDM会将字段值直接写入目的端。这里“添加字段”中“自定义字段”的功能，要求源端连接器为JDBC连接器、HBase连接器、MongoDB连接器、ElasticSearch连接器、Kafka连接器，或者目的端为HBase连接器。

帮助中心 > 云数据迁移 CDM > 用户指南 > 关键操作指导
配置MRS Hudi目的端参数 - 云数据迁移 CDM

”表示微批模式。全量模式为异步分片写入Hoodie，适用于一次全量写入场景。微批模式为异步分批写入Hoodie，适用于对入库时间SLA要求较为严格的场景，以及对资源消耗较小，对MOR表存储类型在线进行压缩的场景。说明：运行-失败重试期间不允许修改此模式。是批次数据大小

 帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业目的端参数
配置神通（ST）源端参数 - 云数据迁移 CDM

偏移量”，而不是“CDM作业实际启动时间-偏移量”。说明：表名支持配置通配符（*），实现导出以某一前缀开头或者以某一后缀结尾的所有表（要求表中的字段个数和类型都一样）。例如： table*表示导出所有以“table”开头的表。 *table表示导出所有以“table”结尾的表。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数

总条数： 51

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置HDFS源端参数 - 云数据迁移 CDM

贸易数据上云场景介绍 - 云数据迁移 CDM

CDM迁移数据到DWS时如何选取分布列？ - 云数据迁移 CDM

云数据迁移安全简介 - 云数据迁移 CDM

配置FTP/SFTP源端参数 - 云数据迁移 CDM

通过数据开发使用参数传递灵活调度CDM作业 - 云数据迁移 CDM

创建IAM用户并授权使用CDM - 云数据迁移 CDM

配置Doris目的端参数 - 云数据迁移 CDM

源端为关系数据库 - 云数据迁移 CDM

配置OBS源端参数 - 云数据迁移 CDM

约束与限制 - 云数据迁移 CDM

配置HBase/CloudTable源端参数 - 云数据迁移 CDM

CDM有哪些优势？ - 云数据迁移 CDM

产品优势 - 云数据迁移 CDM

记录数据迁移入库时间 - 云数据迁移 CDM

如何将云下内网或第三方云上的私网与CDM连通？ - 云数据迁移 CDM

上传存量数据 - 云数据迁移 CDM

记录数据迁移入库时间 - 云数据迁移 CDM

配置MRS Hudi目的端参数 - 云数据迁移 CDM

配置神通（ST）源端参数 - 云数据迁移 CDM

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线