-
创建FusionInsight HDFS连接报错get filesystem怎么解决? - 云数据迁移 CDM
创建FusionInsight HDFS连接报错get filesystem怎么解决? 问题描述 创建FusionInsight HDFS数据连接时,测试连通性提示获取文件系统失败的问题。 解决方案 客户使用的管理ip有误,正确的ip使用的是集群的一个浮动ip,端口使用HDFS的webui的端口即可解决。
-
停止集群(待下线) - 云数据迁移 CDM
停止集群(待下线) 功能介绍 停止集群接口。 调用方法 请参见如何调用API。 URI POST /v1.1/{project_id}/clusters/{cluster_id}/action 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
-
是否支持批量创建作业? - 云数据迁移 CDM
是否支持批量创建作业? CDM可以通过批量导入的功能,实现批量创建作业,方法如下: 手动创建一个作业。 导出作业,将作业的JSON文件保存到本地。 编辑JSON文件,参考该作业的配置,在JSON文件中批量复制出更多作业。 将JSON文件导入CDM集群,实现批量创建作业。 您也可以
-
创建数据连接时报错“配置项[linkConfig.createBackendLinks]不存在”或创建作业时报错“配置项 [throttlingConfig.concurrentSubJobs] 不存在”怎么办? - 云数据迁移 CDM
创建数据连接时报错“配置项[linkConfig.createBackendLinks]不存在”或创建作业时报错“配置项 [throttlingConfig.concurrentSubJobs] 不存在”怎么办? 当同时存在多个不同版本的集群,先在低版本CDM集群创建数据连接或保
-
配置LogHub(SLS)源端参数 - 云数据迁移 CDM
目标日志库的名称。 - 单次查询数据条数 一次从日志服务查询的数据条数。 128 数据消费开始时间 数据消费的开始时间位点,即日志数据到达LogHub(SLS)的时间,yyyyMMddHHmmss格式的时间字符串。 说明: “数据消费开始时间”和“数据消费结束时间”需要互相组合配套使用,时间范围左闭右开。
-
如何备份CDM作业? - 云数据迁移 CDM
如何备份CDM作业? 用户可以先通过CDM的批量导出功能,把所有作业脚本保存到本地,仅在需要的时候再重新创建集群、重新导入作业,实现作业备份。 父主题: 功能类
-
配置FTP/SFTP源端参数 - 云数据迁移 CDM
使用时间宏变量和定时任务配合,可以实现定期同步新增数据,详细说明请参见使用时间宏变量完成增量同步。 说明: 如果配置了时间宏变量,通过DataArts Studio数据开发调度CDM迁移作业时,系统会将时间宏变量替换为“数据开发作业计划启动时间-偏移量”,而不是“CDM作业实际启动时间-偏移量”。
-
创建IAM用户并授权使用CDM - 云数据迁移 CDM
创建IAM用户并授权使用CDM 如果您需要对您所拥有的数据集成服务(CDM)进行精细的权限管理,您可以使用统一身份认证服务(Identity and Access Management,简称IAM),通过IAM,您可以: 根据企业的业务组织,在您的华为云账号中,给企业中不同职能部
-
配置OBS源端参数 - 云数据迁移 CDM
基本参数 桶名 待迁移数据所在的桶名。 BUCKET_2 源目录或文件 “列表文件”选择为“否”时,才有该参数。 待迁移数据的目录或单个文件路径。文件路径支持输入多个文件(最多50个),默认以“|”分隔,也可以自定义文件分隔符,具体请参见文件列表迁移。 待迁移数据的目录,将迁移目录下
-
配置MongoDB目的端参数 - 云数据迁移 CDM
说明 取值样例 数据库名称 选择待导入数据的数据库。 mddb 集合名称 选择待导入数据的集合,相当于关系数据库的表名。单击输入框后面的按钮可进入表的选择界面,用户也可以直接输入表名称。 如果选择界面没有待选择的表,请确认表是否已经创建,或者对应连接里的账号是否有元数据查询的权限。 COLLECTION
-
CDM是否支持集群关机功能? - 云数据迁移 CDM
CDM是否支持集群关机功能? 从2022年4月开始,CDM已不再支持集群关机功能。当集群关机时,其底层资源可能会被占用,导致集群可能无法正常开机使用。 父主题: 功能类
-
Hudi源端案例库 - 云数据迁移 CDM
Hudi源端案例库 读Hudi作业长时间出于BOOTING状态怎么解决? 读Hudi作业字段映射多了一列col,作业执行失败怎么处理? 父主题: 故障处理类
-
查看集群基本信息/修改集群配置 - 云数据迁移 CDM
Studio服务进入数据集成界面可以看到。 单击集群名称,可查看集群的基本信息。 图2 CDM集群的配置信息 修改集群配置 登录CDM管理控制台。单击左侧导航上的“集群管理”,进入集群管理界面。 图3 集群列表 “创建来源”列仅通过DataArts Studio服务进入数据集成界面可以看到。
-
整库迁移到Hive,报错Identifier name is too long如何处理? - 云数据迁移 CDM
整库迁移到Hive,报错Identifier name is too long如何处理? 问题描述 迁移任务报错表名太长,但表名实际没有这么长。 原因分析 在任务迁移时,导入数据前会先创建一个实际表名+阶段表后缀的阶段表,最终导致的作业异常。 解决方案 在作业配置高级属性将导入阶段表设置为否,这样就不会先导入阶段表。
-
执行作业后(非失败重试),作业执行卡Running,但是数据写入行数一直显示为0如何处理? - 云数据迁移 CDM
执行作业后(非失败重试),作业执行卡Running,但是数据写入行数一直显示为0如何处理? 问题排查 打开日志,最后一行日志如下所示,则说明此时集群并发资源消耗殆尽,或者集群内存使用达到阈值,新提交的作业需要排队等待。 submit task attempt_local18473
-
作业执行卡Running,读取行数写入行数相等且不再增加怎么解决? - 云数据迁移 CDM
CDM写Hudi为两段式,先写到hive临时表,然后再执行spark sql写到Hudi,写入行数统计的是写hive临时表的行数,当行数不再增长时,说明源端数据已经读完写到Hive表中,此时作业正在执行Spark SQL过程中,需要等Spark SQL执行完作业才会结束。 问题排查 打开日志,搜索insert
-
如何查看套餐包的剩余时长? - 云数据迁移 CDM
如何查看套餐包的剩余时长? 您可以进入华为云官网,在用户名下拉列表中选择“费用中心”,然后进入“订单管理-续费管理”查看对应套餐包的剩余时长。 父主题: 通用类
-
是否支持同步作业到其他集群? - 云数据迁移 CDM
是否支持同步作业到其他集群? CDM虽然不支持直接在不同集群间迁移作业,但是通过批量导出、批量导入作业的功能,可以间接实现集群间的作业迁移,方法如下: 将CDM集群1中的所有作业批量导出,将作业的JSON文件保存到本地。 由于安全原因,CDM导出作业时没有导出连接密码,连接密码全部使用“Add
-
DLI外表(OBS文件)迁移DWS某字段转义,带有“\” - 云数据迁移 CDM
DLI外表(OBS文件)迁移DWS某字段转义,带有“\” 问题描述 DLI 外表CDM服务将数据迁移到DWS(GaussDB)时候,有个字段迁移后多了一对引号,字段本身的引号多了转义符,其他字段没问题。 源端: 目的端: 故障分析 根据截图可以看出,源端样值中有符号:{ 括号 ”
-
迁移HDFS文件,报错无法获取块怎么处理? - 云数据迁移 CDM
taNode状态为停止会获取不到块,以及cdm和DataNode节点的网络是否正常。 注:9866端口是HDFS文件系统DataNode的数据传输接口。 解决方案 因为DataNode节点防火墙为开启状态,CDM在与Datanode建立连接时失败导致获取块失败。关闭Datanode节点的防火墙后问题解决。