搜索_华为云

Hudi源端作业，读Hudi作业字段映射多了一列col，作业执行失败怎么处理？ - 云数据迁移 CDM

行失败怎么处理？问题描述读Hudi作业字段映射多了一列col，作业执行失败。原因分析使用Spark SQL写数据入hudi表，由于配置问题，表schema中会自动增加一列类型为array<string>，名称为col的列。解决方案字段映射中删去此列，如果是自动建表，SQL中也要把此列删去。

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
CloudTable连接 - 云数据迁移 CDM
CloudTable连接 - 云数据迁移 CDM

是 String 登录CloudTable集群的访问标识。建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。 linkConfig.securityKey 是 String 登录CloudTable集群的密钥。建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 连接参数说明
HBase连接 - 云数据迁移 CDM
HBase连接 - 云数据迁移 CDM

URI地址，格式为“ip:port”。 llinkConfig.host 否 String 连接MRS或FusionInsight HD时，需要配置Manager平台的IP地址。 linkConfig.port 否 String 连接FusionInsight HD时，需要配置Manager平台的端口。

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 连接参数说明
在CDM集群中创建连接 - 云数据迁移 CDM

在CDM集群中创建连接创建CDM与数据源之间的连接配置连接参数上传CDM连接驱动新建Hadoop集群配置

 帮助中心 > 云数据迁移 CDM > 用户指南
目的端为HDFS - 云数据迁移 CDM
目的端为HDFS - 云数据迁移 CDM

REPLACE：替换重复文件。 SKIP：跳过重复文件。 ABANDON：发现重复文件停止任务。 toJobConfig.compression 否枚举写入文件后，选择对文件的压缩格式。支持以下压缩格式： NONE：不压缩。 DEFLATE：压缩为DEFLATE格式。 GZIP：压缩为GZIP格式。 BZIP2：压缩为BZIP2格式。

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 目的端作业参数说明
审计与日志 - 云数据迁移 CDM
审计与日志 - 云数据迁移 CDM

云审计服务并创建和配置追踪器后，CTS开始记录操作事件用于审计，用户可查看CTS保存最近7天的审计日志。 CTS支持配置关键操作通知。用户可将与IAM相关的高危敏感操作，作为关键操作加入到CTS的实时监控列表中进行监控跟踪。当用户使用CDM服务时，如果触发了监控列表中的关键操作，

帮助中心 > 云数据迁移 CDM > 产品介绍 > 安全
正则表达式分隔半结构化文本 - 云数据迁移 CDM

半结构化文本，由于字段值也包含了分隔符，所以无法使用分隔符进行字段分隔，此时可以使用正则表达式分隔。正则表达式参数在源端作业参数中配置，要求源连接为对象存储或者文件系统，且“文件格式”必须选择“CSV格式”。图1 正则表达式参数在迁移CSV格式的文件时，CDM支持使用正则表

 帮助中心 > 云数据迁移 CDM > 用户指南 > 关键操作指导
日志提示解析日期格式失败时怎么处理？ - 云数据迁移 CDM

08:08:08.666 +0800”。图2 作业配置此时，从其他数据源导入数据到云搜索服务时，如果源端数据中的日期格式不完全满足标准格式，例如“2018/01/05 15:15:46”，则CDM作业会执行失败，日志提示无法解析日期格式。需要通过CDM配置字段转换器，将日期字段的格式转换为云搜索服务的目的端格式。

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
OBS连接 - 云数据迁移 CDM
OBS连接 - 云数据迁移 CDM

linkConfig.accessKey 是 String 访问标识（AK）。建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。 linkConfig.securityKey 是 String 密钥（SK）。建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。父主题：

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 连接参数说明
分析数据 - 云数据迁移 CDM
分析数据 - 云数据迁移 CDM

中进行分析，无需上传OBS。通过DLI分析数据进入数据湖探索DLI控制台，参考DLI用户指南中的创建数据库创建数据库。参考创建OBS表创建OBS外表，包括贸易统计数据库、贸易详单信息表和基础信息表。基于业务需求，在DLI控制台中开发相应的SQL脚本进行贸易统计分析。父主题：

帮助中心 > 云数据迁移 CDM > 最佳实践 > 贸易数据极简上云与统计分析
作业任务参数说明 - 云数据迁移 CDM

抽取并发数：可设置同时执行的抽取任务数。是否写入脏数据：如果需要将作业执行过程中处理失败的数据、或者被清洗过滤掉的数据写入OBS中，以便后面查看，可通过该参数配置，写入脏数据前需要先配置好OBS连接。作业运行完是否删除：可选择是否自动删除作业。 JSON样例 "driver-config-values": {

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构
是否支持字段转换？ - 云数据迁移 CDM

例如“ipList”。表达式：CommonUtils.setCache("ipList",HttpsUtils.downloadMap("url")) 取出缓存的IP与地址映射对象。表达式：CommonUtils.getCache("ipList") 判断是否有IP与地址映射缓存。

帮助中心 > 云数据迁移 CDM > 常见问题 > 功能类
源端为对象存储 - 云数据迁移 CDM

压缩格式，当文件格式为“CSV_FILE”或“JSON”时此参数有效。选择对应压缩格式的源文件： NONE：表示传输所有格式的文件。 GZIP：表示只传输GZIP格式的文件。 ZIP：表示只传输ZIP格式的文件。 fromJobConfig.jsonReferenceNode 否 String 记录节点，当文

 帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
Redis连接 - 云数据迁移 CDM
Redis连接 - 云数据迁移 CDM

连接参数参数是否必选类型说明 linkConfig.deploymentMode 是枚举 Redis部署方式： Single：表示单机部署。 Cluster：表示集群部署。 linkConfig.serverlist 是 String 服务器地址列表，格式如：“host1:port1;host2:port2”。

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 连接参数说明
Hudi源端的作业长时间处于BOOTING状态怎么解决？ - 云数据迁移 CDM

除去Yarn队列资源问题，一般作业是卡在执行Spark SQL读Hudi写Hive临时表，这步执行的速度取决于Hudi表的数据量与Yarn队列剩余资源。作业配置了导入前清空数据，dws表存量数据多，卡在truncate table操作步骤中，默认5分钟超时。解决方案查看Yarn任务，搜索Spark

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
源端为FTP/SFTP - 云数据迁移 CDM
源端为FTP/SFTP - 云数据迁移 CDM

压缩格式，当文件格式为“CSV_FILE”或“JSON”时此参数有效。选择对应压缩格式的源文件： NONE：表示传输所有格式的文件。 GZIP：表示只传输GZIP格式的文件。 ZIP：表示只传输ZIP格式的文件。 fromJobConfig.splitType 否枚举指定任务分片方式，选择按文件或文件大小进行分割。

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
源端为HTTP/HTTPS - 云数据迁移 CDM

fromCompression 否枚举选择对应压缩格式的源文件进行迁移： NONE：表示传输所有格式的文件。 GZIP：表示只传输GZIP格式的文件。 ZIP：表示只传输ZIP格式的文件。 TAR.GZ：表示只传输TAR.GZ格式的文件。 fromJobConfig.compressedFileSuffix

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
源端为Elasticsearch/云搜索服务 - 云数据迁移 CDM

说明 fromJobConfig.index 是 String 抽取数据的索引，类似关系数据库中的数据库名称。 fromJobConfig.type 是 String 抽取数据的类型，类似关系数据库中的表名。 fromJobConfig.columnList 否 String 需要抽

 帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
通过json方式导入的作业，sql server迁移到hive，执行作业报错 - 云数据迁移 CDM

通过修改作业json的方式将作业并发数设置为1即可，参数："throttlingConfig.numExtractors"。在作业配置界面，源端参数配置的高级属性中，给 “抽取分区字段”配置项指定字段即可（建议为源端表的主键或者递增的字段）。父主题：故障处理类

 帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
查询集群的企业项目ID - 云数据迁移 CDM

表2 请求Header参数参数是否必选参数类型描述 X-Auth-Token 是 String 用户Token，使用Token认证时必选。通过调用IAM服务的“获取用户Token”接口获取响应消息头中X-Subject-Token的值。响应参数状态码： 200 表3 响应Body参数

 帮助中心 > 云数据迁移 CDM > API参考 > API > 集群管理

总条数： 290

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi源端作业，读Hudi作业字段映射多了一列col，作业执行失败怎么处理？ - 云数据迁移 CDM

CloudTable连接 - 云数据迁移 CDM

HBase连接 - 云数据迁移 CDM

在CDM集群中创建连接 - 云数据迁移 CDM

目的端为HDFS - 云数据迁移 CDM

审计与日志 - 云数据迁移 CDM

正则表达式分隔半结构化文本 - 云数据迁移 CDM

日志提示解析日期格式失败时怎么处理？ - 云数据迁移 CDM

OBS连接 - 云数据迁移 CDM

分析数据 - 云数据迁移 CDM

作业任务参数说明 - 云数据迁移 CDM

是否支持字段转换？ - 云数据迁移 CDM

源端为对象存储 - 云数据迁移 CDM

Redis连接 - 云数据迁移 CDM

Hudi源端的作业长时间处于BOOTING状态怎么解决？ - 云数据迁移 CDM

源端为FTP/SFTP - 云数据迁移 CDM

源端为HTTP/HTTPS - 云数据迁移 CDM

源端为Elasticsearch/云搜索服务 - 云数据迁移 CDM

通过json方式导入的作业，sql server迁移到hive，执行作业报错 - 云数据迁移 CDM

查询集群的企业项目ID - 云数据迁移 CDM

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线