搜索_华为云

应用场景 - 云数据迁移 CDM
应用场景 - 云数据迁移 CDM

大数据迁移上云本地数据是指存储在用户自建或者租用的IDC中的数据，或者第三方云环境中的数据，包括关系型数据库、NoSQL数据库、OLAP数据库、文件系统等。这个场景是用户希望利用云上的计算和存储资源，需要先将本地数据迁移上云。该场景下，需要保证本地网络与云上网络是连通的。图1 大数据迁移上云

 帮助中心 > 云数据迁移 CDM > 产品介绍
FTP/SFTP连接参数说明 - 云数据迁移 CDM

FTP/SFTP连接参数说明 FTP/SFTP连接适用于从线下文件服务器或ECS服务器上迁移文件到数据库。当前仅支持Linux操作系统的FTP 服务器。作业运行中禁止修改密码或者更换用户。在作业运行过程中修改密码或者更换用户，密码不会立即生效且作业会运行失败。连接FTP或S

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建连接 > 配置连接参数
什么是云数据迁移 - 云数据迁移 CDM

DM迁移作业。关于离线集成作业的更多介绍，请您参考离线集成作业概述。离线处理集成作业功能当前需申请白名单后才能使用。如需使用该特性，请联系客服或技术支持人员。 CDM服务基于分布式计算框架，利用并行化处理技术，支持用户稳定高效地对海量数据进行移动，实现不停服数据迁移，快速构建所需的数据架构。

帮助中心 > 云数据迁移 CDM > 产品介绍
配置HDFS目的端参数 - 云数据迁移 CDM

”只能选择与源端的文件格式一致。 CSV格式重复文件处理方式当源端为文件类数据源（HTTP/FTP/SFTP/HDFS/OBS）时配置。只有文件名和文件大小都相同才会判定为重复文件。写入时如果出现文件重复，可选择如下处理方式：替换重复文件跳过重复文件停止任务停止任务

 帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业目的端参数
如何查看审计日志 - 云数据迁移 CDM

Service，CTS）可以记录CDM相关的操作事件，用于支撑安全分析、合规审计、资源管理和问题定位等常见应用场景。在您开启了云审计服务后，系统开始记录CDM的相关操作，云审计服务的管理控制台保存最近7天的操作记录。前提条件已开通云审计服务。开通方式请参见开通云审计服务。操作步骤

 帮助中心 > 云数据迁移 CDM > 用户指南 > 查看审计日志
创建CDM自定义策略 - 云数据迁移 CDM

创建CDM自定义策略如果系统预置的CDM权限策略，不满足您的授权要求，可以创建自定义策略。自定义策略中可以添加的授权项（Action）请参考策略和授权项。目前华为云支持以下两种方式创建自定义策略：可视化视图创建自定义策略：无需了解策略语法，按可视化视图导航栏选择云服务、操作

 帮助中心 > 云数据迁移 CDM > 用户指南 > IAM权限管理
MySQL数据迁移到MRS Hive分区表 - 云数据迁移 CDM

拥有MySQL数据库的读、写和删除权限的用户。 admin 密码用户的密码。 - 使用本地API 使用数据库本地API加速（系统会尝试启用MySQL数据库的local_infile系统变量）。是使用Agent Agent功能待下线，无需配置。 - local_infile字符集 MySQL

帮助中心 > 云数据迁移 CDM > 用户指南 > 使用教程
MySQL数据迁移到MRS Hive分区表 - 云数据迁移 CDM

拥有MySQL数据库的读、写和删除权限的用户。 admin 密码用户的密码。 - 使用本地API 使用数据库本地API加速（系统会尝试启用MySQL数据库的local_infile系统变量）。是使用Agent Agent功能待下线，无需配置。 - local_infile字符集 MySQL

帮助中心 > 云数据迁移 CDM > 最佳实践 > 使用教程
正则表达式分隔半结构化文本 - 云数据迁移 CDM

含了分隔符，所以无法使用分隔符进行字段分隔，此时可以使用正则表达式分隔。正则表达式参数在源端作业参数中配置，要求源连接为对象存储或者文件系统，且“文件格式”必须选择“CSV格式”。图1 正则表达式参数在迁移CSV格式的文件时，CDM支持使用正则表达式分隔字段，并按照解析后的

 帮助中心 > 云数据迁移 CDM > 最佳实践 > 进阶实践
源端为HDFS - 云数据迁移 CDM
源端为HDFS - 云数据迁移 CDM

并发任务数中指定“throttlingConfig.numExtractors”（抽取并发数）为“2”，则会分两个分片，一个处理9个10M的文件，一个处理1个200M的文件。 fromJobConfig.useMarkerFile 否 Boolean 选择是否开启作业标识文件的功

 帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
上传存量数据 - 云数据迁移 CDM

连接H公司本地的Apache Hadoop HDFS文件系统时，连接类型选择“Apache HDFS”，然后单击“下一步”。图2 创建HDFS连接名称：用户自定义连接名称，例如“hdfs_link”。 URI：配置为H公司HDFS文件系统的Namenode URI地址。认证类型：安全

 帮助中心 > 云数据迁移 CDM > 最佳实践 > 贸易数据极简上云与统计分析 > 使用CDM上传数据到OBS
正则表达式分隔半结构化文本 - 云数据迁移 CDM

含了分隔符，所以无法使用分隔符进行字段分隔，此时可以使用正则表达式分隔。正则表达式参数在源端作业参数中配置，要求源连接为对象存储或者文件系统，且“文件格式”必须选择“CSV格式”。图1 正则表达式参数在迁移CSV格式的文件时，CDM支持使用正则表达式分隔字段，并按照解析后的

 帮助中心 > 云数据迁移 CDM > 用户指南 > 关键操作指导
上传增量数据 - 云数据迁移 CDM

勾选“是否定时执行”，配置定时任务： “重复周期”配置为1天。 “开始时间”配置为每天凌晨0点1分执行。这样CDM每天凌晨自动执行全量迁移，但因为“重复文件处理方式”选择了“跳过重复文件”，相同名称且相同大小的文件不迁移，所以只会上传每天新增的文件。单击“保存”，完成CDM的增量同步配置。父主题：

帮助中心 > 云数据迁移 CDM > 最佳实践 > 贸易数据极简上云与统计分析 > 使用CDM上传数据到OBS
配置HBase/CloudTable目的端参数 - 云数据迁移 CDM

如果配置了时间宏变量，通过DataArts Studio数据开发调度CDM迁移作业时，系统会将时间宏变量替换为“数据开发作业计划启动时间-偏移量”，而不是“CDM作业实际启动时间-偏移量”。 TBL_2 导入前清空数据选择目的端表中数据的处理方式。是：任务启动前会清除目标表中数据。否：导入前不清空目

 帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业目的端参数
贸易数据极简上云与统计分析 - 云数据迁移 CDM

贸易数据极简上云与统计分析贸易数据上云场景介绍操作流程概述使用CDM上传数据到OBS 分析数据

 帮助中心 > 云数据迁移 CDM > 最佳实践
目的端为OBS - 云数据迁移 CDM
目的端为OBS - 云数据迁移 CDM

过大，单位为MB。 toJobConfig.duplicateFileOpType 否枚举重复文件处理方式，只有文件名和文件大小都相同才会判定为重复文件。重复文件支持以下处理方式： REPLACE：替换重复文件。 SKIP：跳过重复文件。 ABANDON：发现重复文件停止任务。

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 目的端作业参数说明
配置MySQL/SQL Server/PostgreSQL目的端参数 - 云数据迁移 CDM

置，配置后导入前根据where条件删除目的表的数据。 age > 18 and age <= 60 约束冲突处理导入数据到云数据库 MySQL且当迁移数据出现冲突时的处理方式。 insert into：当存在主键、唯一性索引冲突时，数据无法写入并将以脏数据的形式存在。 replace

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业目的端参数
配置Doris目的端参数 - 云数据迁移 CDM

详细说明请参见使用时间宏变量完成增量同步。说明：如果配置了时间宏变量，通过DataArts Studio数据开发调度CDM迁移作业时，系统会将时间宏变量替换为（数据开发作业计划启动时间-偏移量），而不是（CDM作业实际启动时间-偏移量）。 table 导入开始前导入数据前，选择是否清除目的表的数据：

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业目的端参数
配置Oracle目的端参数 - 云数据迁移 CDM

详细说明请参见使用时间宏变量完成增量同步。说明：如果配置了时间宏变量，通过DataArts Studio数据开发调度CDM迁移作业时，系统会将时间宏变量替换为“数据开发作业计划启动时间-偏移量”，而不是“CDM作业实际启动时间-偏移量”。 table 导入开始前导入数据前，选择是否清除目的表的数据：

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业目的端参数
源端为FTP/SFTP - 云数据迁移 CDM
源端为FTP/SFTP - 云数据迁移 CDM

并发任务数中指定“throttlingConfig.numExtractors”（抽取并发数）为“2”，则会分两个分片，一个处理9个10M的文件，一个处理1个200M的文件。 fromJobConfig.jsonReferenceNode 否 String 记录节点，当文件格式为

 帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明

总条数： 248

上一页
1
...
6
7
8
...
13
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

应用场景 - 云数据迁移 CDM

FTP/SFTP连接参数说明 - 云数据迁移 CDM

什么是云数据迁移 - 云数据迁移 CDM

配置HDFS目的端参数 - 云数据迁移 CDM

如何查看审计日志 - 云数据迁移 CDM

创建CDM自定义策略 - 云数据迁移 CDM

MySQL数据迁移到MRS Hive分区表 - 云数据迁移 CDM

MySQL数据迁移到MRS Hive分区表 - 云数据迁移 CDM

正则表达式分隔半结构化文本 - 云数据迁移 CDM

源端为HDFS - 云数据迁移 CDM

上传存量数据 - 云数据迁移 CDM

正则表达式分隔半结构化文本 - 云数据迁移 CDM

上传增量数据 - 云数据迁移 CDM

配置HBase/CloudTable目的端参数 - 云数据迁移 CDM

贸易数据极简上云与统计分析 - 云数据迁移 CDM

目的端为OBS - 云数据迁移 CDM

配置MySQL/SQL Server/PostgreSQL目的端参数 - 云数据迁移 CDM

配置Doris目的端参数 - 云数据迁移 CDM

配置Oracle目的端参数 - 云数据迁移 CDM

源端为FTP/SFTP - 云数据迁移 CDM

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线