搜索_华为云

Hudi源端的作业长时间处于BOOTING状态怎么解决？ - 云数据迁移 CDM

原因分析除去Yarn队列资源问题，一般作业是卡在执行Spark SQL读Hudi写Hive临时表，这步执行的速度取决于Hudi表的数据量与Yarn队列剩余资源。作业配置了导入前清空数据，dws表存量数据多，卡在truncate table操作步骤中，默认5分钟超时。解决方案查看Yarn任务，搜索Spark

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
贸易数据上云场景介绍 - 云数据迁移 CDM

统计分析。图1 场景方案 DLI创建OBS外表，对OBS表数据存储格式有所要求：使用DataSource语法创建OBS表时，支持orc，parquet，json，csv，carbon，avro类型。使用Hive语法创建OBS表时，支持TEXTFILE, AVRO, ORC,

帮助中心 > 云数据迁移 CDM > 最佳实践 > 贸易数据极简上云与统计分析
源端为对象存储 - 云数据迁移 CDM

fromJobConfig.regexSeparator 否 Boolean 是否使用正则表达式分割字段，当文件格式为“CSV_FILE”时此参数有效。 fromJobConfig.regex 否 String 正则表达式，当选择使用正则表达式分割字段时，此参数有效。 fromJobConfig.fieldSeparator

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
配置HBase/CloudTable目的端参数 - 云数据迁移 CDM

作业参数如表1所示。表1 HBase/CloudTable作为目的端时的作业参数参数名说明取值样例表名写入数据的HBase表名。如果是创建新HBase表，支持从源端复制字段名。单击输入框后面的按钮可进入表的选择界面。该参数支持配置为时间宏变量，且一个路径名中可以有多

 帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业目的端参数
配置MongoDB/DDS源端参数 - 云数据迁移 CDM

参数类型参数名说明取值样例基本参数数据库名称选择待迁移的数据库。 mongodb 集合名称相当于关系数据库的表名。单击输入框后面的按钮可进入选择集合名的界面，用户也可以直接输入集合名称。如果选择界面没有待选择的表，请确认表是否已经创建，或者对应连接里的账号是否有元数据查询的权限。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数
Hudi目的端的作业执行Spark SQL写入Hudi失败怎么办？ - 云数据迁移 CDM

lang.IllegalArgumentException。原因分析表在metastore中存在，但不是Huid表，或者表在metastore中存在，但是表目录不存在，根因是在表目录下没有.hoodie目录。可能删表的时候只删了文件而没有drop table。设置为主键或者预聚合键的列有空值，写入hoodie会失败。

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
CDM迁移近一个月的数据 - 云数据迁移 CDM

写入目录：选择MRS HBase的目录，例如“/hbase/data/default/table_20180815/”。这个目录必须带有表名（例如这里的表名是table_20180815），如果该目录不存在，CDM会自动创建该目录。文件格式：同源端相同，选择“二进制格式”。其它可选参数保持默认即可。

帮助中心 > 云数据迁移 CDM > 最佳实践 > 车联网大数据零丢失搬迁入湖
配置FTP/SFTP源端参数 - 云数据迁移 CDM

使用正则表达式分隔字段选择是否使用正则表达式分隔字段，当选择“是”时，“字段分隔符”参数无效。当“文件格式”选择为“CSV格式”时，才有该参数。是正则表达式当“使用正则表达式分隔字段”选择为“是”时，才有该参数。分隔字段的正则表达式，正则表达式写法请参考正则表达式分隔半结构化文本。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数
删除连接 - 云数据迁移 CDM
删除连接 - 云数据迁移 CDM

environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"]

帮助中心 > 云数据迁移 CDM > API参考 > API > 连接管理
如何降低CDM使用成本？ - 云数据迁移 CDM

完成之后，就可以到CDM控制台，通过Internet迁移公网的数据上云了。例如：迁移本地数据中心FTP服务器上的文件到OBS、迁移第三方云上关系型数据库到云服务RDS。父主题：通用类

 帮助中心 > 云数据迁移 CDM > 常见问题 > 通用类
API概览 - 云数据迁移 CDM
API概览 - 云数据迁移 CDM

查询并显示集群实例信息。 20次/min 修改集群修改指定CDM集群。 20次/min 启动集群开启指定CDM集群。 20次/min 连接管理API 创建连接连接指定的数据源。 120次/min 查询连接查询连接列表。 120次/min 修改连接修改连接的参数。 120次/min 删除连接

 帮助中心 > 云数据迁移 CDM > API参考
配置HDFS源端参数 - 云数据迁移 CDM

properties 是列表文件源连接当“列表文件”选择为“是”时，才有该参数。可选择列表文件所在的OBS连接。 OBS_test_link 列表文件OBS桶当“列表文件”选择为“是”时，才有该参数。该参数表示列表文件所在的OBS桶名。 01 列表文件或目录当“列表文件”选择为“是”

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数
CDM迁移性能如何？ - 云数据迁移 CDM

large规格实例理论上可以支持1TB～8TB/天的数据迁移，实际传输速率受公网带宽、集群规格、文件读写速度、作业并发数设置、磁盘读写性能等因素影响。更多详情请参见性能白皮书。父主题：通用类

 帮助中心 > 云数据迁移 CDM > 常见问题 > 通用类
迁移原理 - 云数据迁移 CDM
迁移原理 - 云数据迁移 CDM

供三级保护机制。 CDM在本地数据库中存储经过AES-256加密的密码，确保用户隔离。本地数据库使用用户Ruby运行，数据库仅侦听127.0.0.1，用户没有远程访问数据库的权限。用户实例发放完毕后，CDM将虚拟机的root和Ruby用户密码更改为随机密码且不会保存在任何地方，

帮助中心 > 云数据迁移 CDM > 产品介绍
配置DLI目的端参数 - 云数据迁移 CDM

略。表1 DLI作为目的端时的作业参数参数名说明取值样例资源队列选择目的表所属的资源队列。 DLI的default队列无法在迁移作业中使用，您需要在DLI中新建SQL队列。新建队列操作请参考创建队列。 cdm 数据库名称写入数据的数据库名称。 dli 表名写入数据的表名。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业目的端参数
查询支持的版本 - 云数据迁移 CDM

ubject-Token的值。响应参数状态码： 200 表3 响应Body参数参数参数类型描述 datastores Array of CdmClusterDatastore objects 数据库列表。表4 CdmClusterDatastore 参数参数类型描述

 帮助中心 > 云数据迁移 CDM > API参考 > API > 集群管理
分析数据 - 云数据迁移 CDM
分析数据 - 云数据迁移 CDM

如果原始数据表存储格式不满足要求，您可以通过CDM将原始数据直接导入到DLI中进行分析，无需上传OBS。通过DLI分析数据进入数据湖探索DLI控制台，参考DLI用户指南中的创建数据库创建数据库。参考创建OBS表创建OBS外表，包括贸易统计数据库、贸易详单信息表和基础信息表。基于

 帮助中心 > 云数据迁移 CDM > 最佳实践 > 贸易数据极简上云与统计分析
新建Hadoop集群配置 - 云数据迁移 CDM

前提条件已创建集群。已参见表1获取相应Hadoop集群配置文件和Keytab文件。获取集群配置文件和Keytab文件不同Hadoop类型的集群配置文件和Keytab文件获取方式有所不同，请参见表1获取相应Hadoop集群配置文件和Keytab文件。表1 集群配置文件和Keytab文件获取方式

 帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建连接
源端为HDFS - 云数据迁移 CDM
源端为HDFS - 云数据迁移 CDM

移CSV文件到表时，CDM默认是全部写入，当该参数选择“true”时，CDM会将CSV文件的第一行数据作为标题行，不写入目的端的表。 fromJobConfig.fromCompression 否枚举压缩格式，表示选择只传输对应压缩格式的源文件。“NONE”表示传输所有格式的文件。

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
MRS中恢复HBase表 - 云数据迁移 CDM

目的端“写入目录”输入：/hbase/data/default/表名执行fixMeta和fixAssignments等命令恢复表，参考使用命令恢复历史不变的数据。在CDH集群中删除快照： hdfs dfs -deleteSnapshot <snapshotDir> s0 恢复表时的问题处理执行完fixMeta命令后，报错显示“xx

帮助中心 > 云数据迁移 CDM > 最佳实践 > 车联网大数据零丢失搬迁入湖

总条数： 300

上一页
1
...
10
11
12
...
15
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi源端的作业长时间处于BOOTING状态怎么解决？ - 云数据迁移 CDM

贸易数据上云场景介绍 - 云数据迁移 CDM

源端为对象存储 - 云数据迁移 CDM

配置HBase/CloudTable目的端参数 - 云数据迁移 CDM

配置MongoDB/DDS源端参数 - 云数据迁移 CDM

Hudi目的端的作业执行Spark SQL写入Hudi失败怎么办？ - 云数据迁移 CDM

CDM迁移近一个月的数据 - 云数据迁移 CDM

配置FTP/SFTP源端参数 - 云数据迁移 CDM

删除连接 - 云数据迁移 CDM

如何降低CDM使用成本？ - 云数据迁移 CDM

API概览 - 云数据迁移 CDM

配置HDFS源端参数 - 云数据迁移 CDM

CDM迁移性能如何？ - 云数据迁移 CDM

迁移原理 - 云数据迁移 CDM

配置DLI目的端参数 - 云数据迁移 CDM

查询支持的版本 - 云数据迁移 CDM

分析数据 - 云数据迁移 CDM

新建Hadoop集群配置 - 云数据迁移 CDM

源端为HDFS - 云数据迁移 CDM

MRS中恢复HBase表 - 云数据迁移 CDM

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线