搜索_华为云

什么是云数据迁移 - 云数据迁移 CDM

当前DataArts Studio已提供全新的离线集成作业能力。离线集成作业作为数据开发组件的一个作业类型，支持跨集群下发数据集成作业，实现常用的批作业迁移能力。相比于传统的依靠CDM集群进行生命周期管理CDM迁移作业，离线集成作业依靠数据开发组件的生命周期管理，由数据开发进

 帮助中心 > 云数据迁移 CDM > 产品介绍
字段映射界面无法显示所有列怎么处理？ - 云数据迁移 CDM

由于HBase/CloudTable无Schema，每条数据的列数不固定，在字段映射界面CDM通过获取样值的方式有较大概率无法获得所有列，此时作业执行完后会造成目的端的数据不全。这个问题，可以通过以下方法解决：在CDM的字段映射界面增加字段。在CDM的作业管理界面直接编辑作业的JSON（修改“fromJobConfig

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
Hive迁移作业长时间卡顿怎么办？ - 云数据迁移 CDM

Hive迁移作业长时间卡顿怎么办？问题描述 Hive迁移作业长时间卡顿怎么办？解决方案为避免Hive迁移作业长时间卡顿，可手动停止迁移作业后，通过编辑Hive连接增加如下属性设置：属性名称：hive.server2.idle.operation.timeout 值：10m 如图所示：父主题：故障处理类

 帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
CDM迁移近一个月的数据 - 云数据迁移 CDM

录。文件格式：同源端相同，选择“二进制格式”。其它可选参数保持默认即可。单击“下一步”进行任务配置，其中抽取并发数默认为3，适当增加可以增加迁移速率，本例中设置为8，其它参数保持默认即可。重复上述步骤创建其它迁移目录的作业，参数配置都相同。2个CDM集群的作业个数平均分配，并发执行。

帮助中心 > 云数据迁移 CDM > 最佳实践 > 车联网大数据零丢失搬迁入湖
Hudi源端的作业长时间处于BOOTING状态怎么解决？ - 云数据迁移 CDM

在Hudi源端读Hudi作业长时间处于BOOTING状态。原因分析除去Yarn队列资源问题，一般作业是卡在执行Spark SQL读Hudi写Hive临时表，这步执行的速度取决于Hudi表的数据量与Yarn队列剩余资源。作业配置了导入前清空数据，dws表存量数据多，卡在truncate

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
配置HBase/CloudTable目的端参数 - 云数据迁移 CDM

Hbase自动建表包含列族与协处理器Coprocessor信息。其他属性按默认值设置，不跟随源端。不自动创建 Row key拼接分隔符可选参数，用于多列合并作为rowkey，默认为空格。 , Rowkey冗余可选参数，是否将选做Rowkey的数据同时写入HBase的列，默认值“否”。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业目的端参数
查询集群的企业项目ID - 云数据迁移 CDM

查询集群的企业项目ID 功能介绍查询指定集群的企业项目ID。调用方法请参见如何调用API。 URI GET /v1.1/{project_id}/clusters/{cluster_id}/enterprise-projects 表1 路径参数参数是否必选参数类型描述

 帮助中心 > 云数据迁移 CDM > API参考 > API > 集群管理
查询支持的版本 - 云数据迁移 CDM

查询支持的版本功能介绍查询CDM集群支持的版本。调用方法请参见如何调用API。 URI GET /v1.1/{project_id}/datastores 表1 路径参数参数是否必选参数类型描述 project_id 是 String 项目ID，获取方法请参见项目ID和账号ID。

帮助中心 > 云数据迁移 CDM > API参考 > API > 集群管理
SDK概述 - 云数据迁移 CDM
SDK概述 - 云数据迁移 CDM

应编程语言类型的SDK代码，如图1所示。图1 获取SDK代码示例 SDK列表表1提供了CDM服务支持的SDK列表，您可以在GitHub仓库查看SDK更新历史、获取安装包以及查看指导文档。表1 SDK列表编程语言 Github地址参考文档 Java huaweicloud-sdk-java-v3

帮助中心 > 云数据迁移 CDM > SDK参考
字段转换器配置指导 - 云数据迁移 CDM

如果是导入到数据仓库服务（DWS），则还需在目的字段中选择分布列，建议按如下顺序选取分布列：有主键可以使用主键作为分布列。多个数据段联合做主键的场景，建议设置所有主键作为分布列。在没有主键的场景下，如果没有选择分布列，DWS会默认第一列作为分布列，可能会有数据倾斜风险。脱敏隐藏字符串中的

 帮助中心 > 云数据迁移 CDM > 最佳实践 > 进阶实践
字段转换器配置指导 - 云数据迁移 CDM

如果是导入到数据仓库服务（DWS），则还需在目的字段中选择分布列，建议按如下顺序选取分布列：有主键可以使用主键作为分布列。多个数据段联合做主键的场景，建议设置所有主键作为分布列。在没有主键的场景下，如果没有选择分布列，DWS会默认第一列作为分布列，可能会有数据倾斜风险。脱敏隐藏字符串中的

 帮助中心 > 云数据迁移 CDM > 用户指南 > 关键操作指导
Hudi目的端的作业执行卡Running，数据写入行数一直显示为0如何处理？ - 云数据迁移 CDM

Hudi目的端的作业执行卡Running，数据写入行数一直显示为0如何处理？问题描述打开日志，最后一行日志如下所示，则说明此时集群并发资源消耗殆尽，或者集群内存使用达到阈值，新提交的作业需要排队等待。 submit task attempt_local1847334969_1748_m_000003_0

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
批量管理CDM作业 - 云数据迁移 CDM

然后参考该作业配置，在JSON文件中批量复制出更多作业，最后导入CDM以实现批量创建作业。操作步骤进入CDM主界面，单击左侧导航上的“集群管理”，选择集群后的“作业管理”。单击“表/文件迁移”显示作业列表，提供以下批量操作：作业分组 CDM支持对分组进行新增、修改、查找、

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业
配置Hive目的端参数 - 云数据迁移 CDM

执行Analyze语句可能会对Hive造成压力。是内部写队列内存最大值当出现内存不足场景时，请酌情修改该参数，当参数过小时，会影响迁移速率。取值范围是1-128，默认为空，不做限制，单位为MB，超出范围会设置为不限制。 16 内部转换队列内存最大值当出现内存不足场景时，请酌情修改该参数，当参数过小时，会影响迁移速率。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业目的端参数
配置HDFS目的端参数 - 云数据迁移 CDM

用于将数据库的表迁移到文件系统的场景。选择“是”时，如果源端数据表中的某一个字段内容包含字段分隔符或换行符，写入目的端时CDM会使用双引号（"）作为包围符将该字段内容括起来，作为一个整体存储，避免其中的字段分隔符误将一个字段分隔成两个，或者换行符误将字段换行。例如：数据库中某字段为hello

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业目的端参数
查询作业 - 云数据迁移 CDM
查询作业 - 云数据迁移 CDM

Array of Input objects 输入参数列表，列表中的每个参数为“name,value”结构，请参考inputs数据结构参数说明。在“from-config-values”数据结构中，不同的源连接类型有不同的“inputs”参数列表，请参见源端作业参数说明下的章节。在“to-

帮助中心 > 云数据迁移 CDM > API参考 > API > 作业管理
文件增量迁移 - 云数据迁移 CDM

详见时间宏变量使用解析）。图1 文件过滤配置作业定时自动执行，“重复周期”为1天。这样每天就可以把昨天生成的文件都导入到目的端目录，实现增量同步。文件增量迁移场景下，“路径过滤器”的使用方法同“文件过滤器”一样，需要路径名称里带有时间字段，这样可以定期增量同步指定目录下的所有文件。

帮助中心 > 云数据迁移 CDM > 用户指南 > 关键操作指导 > 增量迁移原理介绍
OBS连接参数说明 - 云数据迁移 CDM

AK和SK分别为登录OBS服务器的访问标识与密钥。您需要先创建当前账号的访问密钥，并获得对应的AK和SK。您可以通过如下方式获取访问密钥。登录控制台，在用户名下拉列表中选择“我的凭证”。进入“我的凭证”页面，选择“访问密钥 > 新增访问密钥”，如图1所示。图1 单击新增访问密钥单击“确定”，根据浏

 帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建连接 > 配置连接参数
定时任务失败，检查连接器连接存在问题 - 云数据迁移 CDM

CDM任务检查网络连通性，源端数据库连接问题，测试连通性提示如下问题： “请检查IP、主机名、端口填写是否正确，检查网络安全组和防火墙配置是否正确，参考数据库返回消息进行定位。” 故障分析查询集群信息，获取公网IP，从CDM集群curl源端数据库的地址，如下所示。从结果看考虑

 帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
权限管理 - 云数据迁移 CDM
权限管理 - 云数据迁移 CDM

删除CDM集群等高危操作的权限，那么您可以使用IAM为员工创建IAM用户，通过授予仅能使用CDM服务，但是不允许删除CDM集群的权限策略，实现控制其对CDM的使用范围。如果云账号已经能满足您的要求，不需要创建独立的IAM用户进行权限管理，您可以跳过本章节，不影响您使用CDM的其它功能。

帮助中心 > 云数据迁移 CDM > 产品介绍

总条数： 256

上一页
1
...
8
9
10
...
13
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

什么是云数据迁移 - 云数据迁移 CDM

字段映射界面无法显示所有列怎么处理？ - 云数据迁移 CDM

Hive迁移作业长时间卡顿怎么办？ - 云数据迁移 CDM

CDM迁移近一个月的数据 - 云数据迁移 CDM

Hudi源端的作业长时间处于BOOTING状态怎么解决？ - 云数据迁移 CDM

配置HBase/CloudTable目的端参数 - 云数据迁移 CDM

查询集群的企业项目ID - 云数据迁移 CDM

查询支持的版本 - 云数据迁移 CDM

SDK概述 - 云数据迁移 CDM

字段转换器配置指导 - 云数据迁移 CDM

字段转换器配置指导 - 云数据迁移 CDM

Hudi目的端的作业执行卡Running，数据写入行数一直显示为0如何处理？ - 云数据迁移 CDM

批量管理CDM作业 - 云数据迁移 CDM

配置Hive目的端参数 - 云数据迁移 CDM

配置HDFS目的端参数 - 云数据迁移 CDM

查询作业 - 云数据迁移 CDM

文件增量迁移 - 云数据迁移 CDM

OBS连接参数说明 - 云数据迁移 CDM

定时任务失败，检查连接器连接存在问题 - 云数据迁移 CDM

权限管理 - 云数据迁移 CDM

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线