搜索_华为云

迁移作业原理 - 云数据迁移 CDM

创建CDM迁移作业时，支持设置该作业的抽取并发数。该参数设置为适当的值可以有效提升迁移速度，过小则会限制迁移速度，过大则会导致任务过载、迁移失败。迁移的目的端为文件时，CDM不支持多并发，此时应配置为单进程抽取数据。表中每行数据大小为1MB以下的可以设置多并发抽取，超过1MB的建议单线程抽取数据。

帮助中心 > 云数据迁移 CDM > 性能白皮书
管理并查看CDM监控指标 - 云数据迁移 CDM

管理并查看CDM监控指标 CDM支持的监控指标设置CDM告警规则查看CDM监控指标父主题：创建并管理CDM集群

 帮助中心 > 云数据迁移 CDM > 用户指南 > 创建并管理CDM集群
如何将云下内网或第三方云上的私网与CDM连通？ - 云数据迁移 CDM

如何将云下内网或第三方云上的私网与CDM连通？很多企业会把关键数据源建设在内网，例如数据库、文件服务器等。由于CDM运行在云上，如果要通过CDM迁移内网数据到云上的话，可以通过以下几种方式连通内网和CDM的网络：如果目标数据源为云下的数据库，则需要通过公网或者专线打通网络。通

 帮助中心 > 云数据迁移 CDM > 常见问题 > 功能类
达梦数据库 DM连接参数说明 - 云数据迁移 CDM

达梦数据库 DM连接参数说明连接达梦数据库 DM时，相关参数如表1所示。作业运行中禁止修改密码或者更换用户。在作业运行过程中修改密码或者更换用户，密码不会立即生效且作业会运行失败。表1 达梦数据库 DM连接参数参数名说明取值样例名称连接的名称，根据连接的数据源类型，用户可自定义便于记忆、区分的连接名。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建连接 > 配置连接参数
CDM作业配置管理 - 云数据迁移 CDM

CDM依次将Task提交给运行池运行。根据集群配置管理中的“最大抽取并发数”参数，超出规格的Task排队等待运行。因此作业抽取并发数和集群最大抽取并发数参数设置为适当的值可以有效提升迁移速度，您可参考下文有效配置抽取并发数。集群最大抽取并发数的上限建议为vCPU核数*2，如表1所示。表1 集群最大抽取并发数配置建议

 帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业
CDM不同集群规格对应并发的作业数是多少？ - 云数据迁移 CDM

CDM依次将Task提交给运行池运行。根据集群配置管理中的“最大抽取并发数”参数，超出规格的Task排队等待运行。如何调整抽取并发数集群最大抽取并发数的设置与CDM集群规格有关，并发数上限建议配置为vCPU核数*2，如表1所示。表1 集群最大抽取并发数配置建议规格名称 vCPUs/内存集群并发数上限参考

 帮助中心 > 云数据迁移 CDM > 常见问题 > 通用类
配置DIS源端参数 - 云数据迁移 CDM

DIS的通道名。 dis 是否持久运行用户自定义是否永久运行。设置为长久运行的任务，如果DIS系统发生中断，任务也会失败结束。是 DIS分区ID DIS分区ID，该参数支持输入多个分区ID，使用英文逗号（,）分隔。 0,1,2 偏移量参数设置从DIS拉取数据时的初始偏移量：最新：最大偏移量，即拉取最新的数据。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数
Hive连接参数说明 - 云数据迁移 CDM

SIMPLE：非安全模式选择Simple鉴权。 KERBEROS：安全模式选择Kerberos鉴权。 SIMPLE Hive版本 Hive的版本。根据服务端Hive版本设置。 HIVE_3_X 用户名选择KERBEROS鉴权时，需要配置MRS Manager的用户名和密码。从HDFS导出目录时，如果需要创建

 帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建连接 > 配置连接参数
目的端为关系数据库 - 云数据迁移 CDM

先导入阶段表，如果设置为“true”，数据导入目的表之前会把数据先导入阶段表，如果成功导入阶段表，则再从阶段表导入到目的表，这样避免导入过程失败，在目的表遗留部分成功数据。 toJobConfig.extendCharLength 否 Boolean 扩大字符字段长度，如果设置为“tru

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 目的端作业参数说明
源端为HTTP/HTTPS - 云数据迁移 CDM

个文件，默认为|。 fromJobConfig.useQuery 否 Boolean 该参数设置为“true”时，上传到OBS的对象使用的对象名，为去掉query参数后的字符。该参数设置为“false”时，上传到OBS的对象使用的对象名，包含query参数。 fromJobConfig

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
应用示例 - 云数据迁移 CDM
应用示例 - 云数据迁移 CDM

user_dws 密码访问DWS数据库的用户密码。 dws_password 获取token 调用其他API前，需要获取token，并设置成环境变量。 curl -H "Content-Type:application/json" https://{iam_endpoint}/v3/auth/tokens

帮助中心 > 云数据迁移 CDM > API参考
CDM迁移近一个月的数据 - 云数据迁移 CDM

文件格式：同源端相同，选择“二进制格式”。其它可选参数保持默认即可。单击“下一步”进行任务配置，其中抽取并发数默认为3，适当增加可以增加迁移速率，本例中设置为8，其它参数保持默认即可。重复上述步骤创建其它迁移目录的作业，参数配置都相同。2个CDM集群的作业个数平均分配，并发执行。作业执行完

 帮助中心 > 云数据迁移 CDM > 最佳实践 > 车联网大数据零丢失搬迁入湖
步骤3：创建并执行作业 - 云数据迁移 CDM

样，所需的长度也不一样，一个中文字符在UTF-8编码下可能要占3个字节。该参数选择为“是”后，在DWS中自动创表时，会将字符类型的字段长度设置为原表的3倍，避免出现DWS表的字符字段长度不够的报错。其他可选参数保持默认即可，详细说明可参见配置DWS目的端参数。单击“下一步”进

 帮助中心 > 云数据迁移 CDM > 快速入门
什么是云数据迁移 - 云数据迁移 CDM

脏数据归档支持将迁移过程中处理失败的、被清洗过滤掉的、不符合字段转换或者不符合清洗规则的数据单独归档到脏数据日志中，便于用户查看。并支持设置脏数据比例阈值，来决定任务是否成功。

帮助中心 > 云数据迁移 CDM > 产品介绍
新建Hadoop集群配置 - 云数据迁移 CDM

获取下载的tar包，此即为FusionInsight集群Keytab文件。针对MRS 2.x及之前版本集群：登录MRS服务的Manager，单击“系统设置”。在“权限配置”区域，单击“用户管理”。在需导出keytab文件用户所在的行，选择“更多 > 下载认证凭据”下载认证文件，待文件自动生成后指定保存位置，并妥善保管该文件。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建连接
Hudi目的端的作业执行Spark SQL写入Hudi失败怎么办？ - 云数据迁移 CDM

metastore中存在，但是表目录不存在，根因是在表目录下没有.hoodie目录。可能删表的时候只删了文件而没有drop table。设置为主键或者预聚合键的列有空值，写入hoodie会失败。查看作业配置，查看表属性中hoodie.datasource.write.recordkey

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
配置HTTP源端参数 - 云数据迁移 CDM

隔符来区分各个文件，默认为|。列表文件选择“是”时，不显示该参数。 | QUERY参数该参数设置为“是”时，上传到OBS的对象使用的对象名，为去掉query参数后的字符。该参数设置为“否”时，上传到OBS的对象使用的对象名，包含query参数。否忽略不存在原路径/文件如

 帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数
功能类 - 云数据迁移 CDM
功能类 - 云数据迁移 CDM

API创建数据迁移作业？如何将云下内网或第三方云上的私网与CDM连通？ CDM是否支持参数或者变量？ CDM迁移作业的抽取并发数应该如何设置？ CDM是否支持动态数据实时迁移功能？ CDM是否支持集群关机功能？如何使用表达式方式获取当前时间？在创建迁移作业时，where语句参数中的时间格式是怎样的？

帮助中心 > 云数据迁移 CDM > 常见问题
作业配置表不存在时自动创建，目的端字段映射不出来怎么处理？ - 云数据迁移 CDM

查看CDM迁移作业，源端数据库表名全部为小写，但是迁移的表中是包含有大写字母，将所要迁移的表名跟数据库中保持一致，目的端字段就可以映射出来了，问题解决。解决方案在作业设置中，源端配置中迁移的数据库表名应按照数据库中的名称填写或者通过搜索选择表名，问题解决。父主题：故障处理类

 帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
源端为Kafka - 云数据迁移 CDM
源端为Kafka - 云数据迁移 CDM

topic列表，可以为多个topic，以“,”作为分隔符。 fromJobConfig.kafkaConsumerStrategy 是枚举从Kafka拉取数据时的初始偏移量设置： LATEST：最大偏移量，即最新的数据。 EARLIEST：最小偏移量，即最老的数据。 fromJobConfig.isPermanency

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明

总条数： 170

上一页
1
...
4
5
6
...
9
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

迁移作业原理 - 云数据迁移 CDM

管理并查看CDM监控指标 - 云数据迁移 CDM

如何将云下内网或第三方云上的私网与CDM连通？ - 云数据迁移 CDM

达梦数据库 DM连接参数说明 - 云数据迁移 CDM

CDM作业配置管理 - 云数据迁移 CDM

CDM不同集群规格对应并发的作业数是多少？ - 云数据迁移 CDM

配置DIS源端参数 - 云数据迁移 CDM

Hive连接参数说明 - 云数据迁移 CDM

目的端为关系数据库 - 云数据迁移 CDM

源端为HTTP/HTTPS - 云数据迁移 CDM

应用示例 - 云数据迁移 CDM

CDM迁移近一个月的数据 - 云数据迁移 CDM

步骤3：创建并执行作业 - 云数据迁移 CDM

什么是云数据迁移 - 云数据迁移 CDM

新建Hadoop集群配置 - 云数据迁移 CDM

Hudi目的端的作业执行Spark SQL写入Hudi失败怎么办？ - 云数据迁移 CDM

配置HTTP源端参数 - 云数据迁移 CDM

功能类 - 云数据迁移 CDM

作业配置表不存在时自动创建，目的端字段映射不出来怎么处理？ - 云数据迁移 CDM

源端为Kafka - 云数据迁移 CDM

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线