搜索_华为云

创建MRS Hive连接器 - 云数据迁移 CDM

SIMPLE：非安全模式选择Simple鉴权。 KERBEROS：安全模式选择Kerberos鉴权。 SIMPLE Hive版本 Hive的版本。根据服务端Hive版本设置。 HIVE_3_X 用户名选择KERBEROS鉴权时，需要配置MRS Manager的用户名和密码。从HDFS导出目录时，如果需要创建

 帮助中心 > 云数据迁移 CDM > 最佳实践 > 使用教程
创建MRS Hive连接器 - 云数据迁移 CDM

SIMPLE：非安全模式选择Simple鉴权。 KERBEROS：安全模式选择Kerberos鉴权。 SIMPLE Hive版本 Hive的版本。根据服务端Hive版本设置。 HIVE_3_X 用户名选择KERBEROS鉴权时，需要配置MRS Manager的用户名和密码。从HDFS导出目录时，如果需要创建

 帮助中心 > 云数据迁移 CDM > 用户指南 > 使用教程
查询集群实例信息 - 云数据迁移 CDM

h:mm:ssZ。 name String 实例名称。 id String 实例ID。 flavor flavor object 节点的虚拟机规格，请参见flavor参数说明。 datastore Datastore object 集群信息，请参见datastore参数说明。 dbuser

帮助中心 > 云数据迁移 CDM > API参考 > API > 集群管理
迁移Mysql到DWS报错“Lost connection to MySQL server during query”怎么处理？ - 云数据迁移 CDM

con:192.168.XX.XX.”。故障分析考虑用户数据量大，或连接中断异常导致报错，检查客户连接高级属性配置，是否配置超时时间参数设置及设置情况：用户连接参数超时时间“6000000”毫秒，已经足够大。进一步排查客户Mysql数据库是否异常，将日志中打印查询源端的sql在M

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
入门实践 - 云数据迁移 CDM
入门实践 - 云数据迁移 CDM

入门实践当您参考创建集群、创建连接等一系列操作后，可以根据自身的业务需求使用CDM提供的一系列常用实践。表1 常用最佳实践实践描述使用教程创建MRS Hive连接器 MRS Hive连接适用于MapReduce服务，本最佳实践为您介绍如何创建MRS Hive连接器。 MySQL数据迁移到OBS

帮助中心 > 云数据迁移 CDM > 快速入门
迁移作业原理 - 云数据迁移 CDM

创建CDM迁移作业时，支持设置该作业的抽取并发数。该参数设置为适当的值可以有效提升迁移速度，过小则会限制迁移速度，过大则会导致任务过载、迁移失败。迁移的目的端为文件时，CDM不支持多并发，此时应配置为单进程抽取数据。表中每行数据大小为1MB以下的可以设置多并发抽取，超过1MB的建议单线程抽取数据。

帮助中心 > 云数据迁移 CDM > 性能白皮书
性能调优 - 云数据迁移 CDM
性能调优 - 云数据迁移 CDM

避免资源紧张导致迁移时间过长。调整抽取并发数对于低任务量场景，调整抽取并发数是性能调优的最佳方式。CDM迁移作业支持设置作业抽取并发数，同时也可以设置集群最大抽取并发数。 CDM通过数据迁移作业，将源端数据迁移到目的端数据源中。其中，主要运行逻辑如下：数据迁移作业提交运行

 帮助中心 > 云数据迁移 CDM > 性能白皮书
源端为对象存储 - 云数据迁移 CDM

waitTime 否 String 选择开启作业标识文件的功能时，如果源路径下不存在启动作业的标识文件，作业挂机等待的时长，当超时后任务会失败。等待时间设置为0时，当源端路径下不存在标识文件，任务会立即失败。单位：秒。 fromJobConfig.filterType 否枚举选择过滤器类型：

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
启动集群 - 云数据迁移 CDM
启动集群 - 云数据迁移 CDM

启动集群功能介绍启动集群接口。调用方法请参见如何调用API。 URI POST /v1.1/{project_id}/clusters/{cluster_id}/action 表1 路径参数参数是否必选参数类型描述 project_id 是 String 项目ID，获取方法请参见项目ID和账号ID。

帮助中心 > 云数据迁移 CDM > API参考 > API > 集群管理
新建整库迁移作业 - 云数据迁移 CDM

、清洗规则。 /user/dirtydir 单个分片的最大错误记录数当“是否写入脏数据”为“是”才显示该参数。单个map的错误记录超过设置的最大错误记录数则任务自动结束，已经导入的数据不支持回退。推荐使用临时表作为导入的目标表，待导入成功后再改名或合并到最终数据表。 0 单击“保存”，或者“保存并运行”。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业
源端为FTP/SFTP - 云数据迁移 CDM
源端为FTP/SFTP - 云数据迁移 CDM

waitTime 否 String 选择开启作业标识文件的功能时，如果源路径下不存在启动作业的标识文件，作业挂机等待的时长，当超时后任务会失败。等待时间设置为0时，当源端路径下不存在标识文件，任务会立即失败。单位：秒。 fromJobConfig.filterType 否枚举选择过滤器类型：

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
管理并查看CDM监控指标 - 云数据迁移 CDM

管理并查看CDM监控指标 CDM支持的监控指标设置CDM告警规则查看CDM监控指标父主题：创建并管理CDM集群

 帮助中心 > 云数据迁移 CDM > 用户指南 > 创建并管理CDM集群
重启集群 - 云数据迁移 CDM
重启集群 - 云数据迁移 CDM

SOFTLY：一般重启。默认值为“IMMEDIATELY”。强制重启业务进程会中断，并重启集群的虚拟机。 restartLevel 否 String 重启级别： SERVICE：重启服务。 VM：重启虚拟机。默认值为“SERVICE”。 type 是 String 集群节点类型，只支持“cdm”。

帮助中心 > 云数据迁移 CDM > API参考 > API > 集群管理
配置DIS源端参数 - 云数据迁移 CDM

DIS的通道名。 dis 是否持久运行用户自定义是否永久运行。设置为长久运行的任务，如果DIS系统发生中断，任务也会失败结束。是 DIS分区ID DIS分区ID，该参数支持输入多个分区ID，使用英文逗号（,）分隔。 0,1,2 偏移量参数设置从DIS拉取数据时的初始偏移量：最新：最大偏移量，即拉取最新的数据。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数
CloudTable连接参数说明 - 云数据迁移 CDM

cloudtable.com:2181 IAM统一身份认证如果所需连接的CloudTable集群在创建时开启了“IAM统一身份认证”，该参数需设置为“是”，否则设置为“否”。当选择IAM统一身份认证时，需要输入用户名、AK和SK。否用户名登录CloudTable集群的用户名。 admin

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建连接 > 配置连接参数
CDM不同集群规格对应并发的作业数是多少？ - 云数据迁移 CDM

CDM依次将Task提交给运行池运行。根据集群配置管理中的“最大抽取并发数”参数，超出规格的Task排队等待运行。如何调整抽取并发数集群最大抽取并发数的设置与CDM集群规格有关，并发数上限建议配置为vCPU核数*2，如表1所示。表1 集群最大抽取并发数配置建议规格名称 vCPUs/内存集群并发数上限参考

 帮助中心 > 云数据迁移 CDM > 常见问题 > 通用类
CDM迁移数据到DWS时如何选取分布列？ - 云数据迁移 CDM

FusionInsight LibrA过程中，建议按如下顺序选取分布列：有主键可以使用主键作为分布列。多个数据段联合做主键的场景，建议设置所有主键作为分布列。在没有主键的场景下，如果没有选择分布列，DWS会默认第一列作为分布列，可能会有数据倾斜风险。因此，在单表或整库导入到DWS/FusionInsight

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
目的端为关系数据库 - 云数据迁移 CDM

先导入阶段表，如果设置为“true”，数据导入目的表之前会把数据先导入阶段表，如果成功导入阶段表，则再从阶段表导入到目的表，这样避免导入过程失败，在目的表遗留部分成功数据。 toJobConfig.extendCharLength 否 Boolean 扩大字符字段长度，如果设置为“tru

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 目的端作业参数说明
源端为HTTP/HTTPS - 云数据迁移 CDM

个文件，默认为|。 fromJobConfig.useQuery 否 Boolean 该参数设置为“true”时，上传到OBS的对象使用的对象名，为去掉query参数后的字符。该参数设置为“false”时，上传到OBS的对象使用的对象名，包含query参数。 fromJobConfig

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
字段转换器配置指导 - 云数据迁移 CDM

如果是导入到数据仓库服务（DWS），则还需在目的字段中选择分布列，建议按如下顺序选取分布列：有主键可以使用主键作为分布列。多个数据段联合做主键的场景，建议设置所有主键作为分布列。在没有主键的场景下，如果没有选择分布列，DWS会默认第一列作为分布列，可能会有数据倾斜风险。脱敏隐藏字符串中的关

 帮助中心 > 云数据迁移 CDM > 最佳实践 > 进阶实践

总条数： 206

上一页
1
...
6
7
8
...
11
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建MRS Hive连接器 - 云数据迁移 CDM

创建MRS Hive连接器 - 云数据迁移 CDM

查询集群实例信息 - 云数据迁移 CDM

迁移Mysql到DWS报错“Lost connection to MySQL server during query”怎么处理？ - 云数据迁移 CDM

入门实践 - 云数据迁移 CDM

迁移作业原理 - 云数据迁移 CDM

性能调优 - 云数据迁移 CDM

源端为对象存储 - 云数据迁移 CDM

启动集群 - 云数据迁移 CDM

新建整库迁移作业 - 云数据迁移 CDM

源端为FTP/SFTP - 云数据迁移 CDM

管理并查看CDM监控指标 - 云数据迁移 CDM

重启集群 - 云数据迁移 CDM

配置DIS源端参数 - 云数据迁移 CDM

CloudTable连接参数说明 - 云数据迁移 CDM

CDM不同集群规格对应并发的作业数是多少？ - 云数据迁移 CDM

CDM迁移数据到DWS时如何选取分布列？ - 云数据迁移 CDM

目的端为关系数据库 - 云数据迁移 CDM

源端为HTTP/HTTPS - 云数据迁移 CDM

字段转换器配置指导 - 云数据迁移 CDM

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线