搜索_华为云

查询Spark作业日志 - 数据湖探索 DLI

System）是对象存储服务（Object Storage Service，OBS）提供的一种经过优化的高性能文件系统，提供毫秒级别访问时延，以及TB/s级别带宽和百万级别的IOPS，能够快速处理高性能计算（HPC）工作负载。并行文件系统的详细介绍和使用说明，请参见《并行文件系统特性指南》。配置DLI作业桶在DLI控制台左侧导航栏中单击“全局配置

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
设置普通队列的弹性扩缩容定时任务 - 数据湖探索 DLI

如果只设定扩容或者缩容，只需创建一个弹性扩缩容定时任务。设定“任务名称”、“最终CUs”和“执行时间”即可，具体请参考表1。如果需要同时设定扩容和缩容，则需要创建两个弹性扩缩容定时任务，分别设定扩容和缩容的“任务名称”、“最终CUs”和“执行时间”，具体请参考表1。操作步骤如下：在DLI管理控制台左侧，选择“资源管理

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
手动在OBS表的分区目录下添加了数据，但是无法查询到数据怎么办？ - 数据湖探索 DLI

MSCK REPAIR TABLE table_name; 执行完上述命令后，再执行对应OBS分区表的数据查询即可。父主题： DLI数据库和表类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
执行作业的用户数据库和表权限不足导致作业运行失败 - 数据湖探索 DLI

执行作业的用户数据库和表权限不足导致作业运行失败问题现象 Spark作业运行报数据库权限不足，报错信息如下： org.apache.spark.sql.AnalysisException: org.apache.hadoop.hive.ql.metadata.HiveException:

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
查询Flink作业日志 - 数据湖探索 DLI

System）是对象存储服务（Object Storage Service，OBS）提供的一种经过优化的高性能文件系统，提供毫秒级别访问时延，以及TB/s级别带宽和百万级别的IOPS，能够快速处理高性能计算（HPC）工作负载。并行文件系统的详细介绍和使用说明，请参见《并行文件系统特性指南》。配置DLI作业桶在DLI控制台左侧导航栏中单击“全局配置

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
LakeFormation资源权限支持列表与策略项 - 数据湖探索 DLI

LakeFormation资源权限支持列表与策略项 LakeFormation SQL资源权限支持列表 DLI支持SQL资源鉴权的操作列表请参考数据权限列表。 LakeFormation SQL资源权限支持列表请参考表1。表1 LakeFormation SQL资源权限支持列表

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 创建并使用LakeFormation元数据
执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

在执行Group By聚合操作时，如果某些分组键对应的数据量特别大，而其他分组键对应的数据量很小，在聚合过程中，数据量大的分组会占用更多的计算资源和时间，导致处理速度变慢，出现数据倾斜。 JOIN 操作倾斜在执行表JOIN操作时，参与JOIN的键在某个表中分布极不均匀，导致大量数据集中

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
为什么insert overwrite覆盖分区表数据的时候，覆盖了全量数据？ - 数据湖探索 DLI

dynamicPartitionOverwrite.enabled”默认值为“false”，在不配置时它会覆盖整张表的数据。详细说明请参考插入数据。父主题： DLI数据库和表类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
Flink Opensource SQL从RDS数据库读取的时间和RDS数据库存储的时间为什么会不一致？ - 数据湖探索 DLI

SQL从RDS数据库读取的时间和RDS数据库存储的时间为什么会不一致？问题描述 Flink Opensource SQL从RDS数据库读取的时间和RDS数据库存储的时间为不一致根因分析该问题的根因是数据库设置的时区不合理，通常该问题出现时Flink读取的时间和RDS数据库的时间会相差13小时。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
提交SQL作业（推荐） - 数据湖探索 DLI

点的内存不足，并触发频繁的Full GC。在这种情况下，可以配置该参数为false即禁用动态分区修剪优化，有助于减少内存使用，避免内存溢出和频繁的Full GC。但禁用此优化可能会降低查询性能，禁用后Spark将不会自动修剪掉那些不满足条件的分区。表4 tags参数参数名称

 帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
跨源连接RDS表中create_date字段类型是datetime，为什么DLI中查出来的是时间戳呢？ - 数据湖探索 DLI

create_date>'2221-12-01 00:00:00'； TIMESTAMP类型详细可参考TIMESTAMP数据类型。父主题： DLI数据库和表类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

enabled”，值设置为“false”。图1 参数设置上述步骤参数设置完成后，则可以进行全表查询，不用查询表的时候要包含分区字段。父主题： DLI数据库和表类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
Upsert Kafka结果表 - 数据湖探索 DLI

(none) String 用于对Kafka消息中key部分序列化和反序列化的格式。key字段由PRIMARY KEY语法指定。支持的格式如下： csv json avro 请参考Format页面以获取更多详细信息和格式参数。 key.fields-prefix 否 (none) String

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
获取项目ID - 数据湖探索 DLI
获取项目ID - 数据湖探索 DLI

获取项目ID的接口为“GET https://{Endpoint}/v3/projects”，其中{Endpoint}为IAM的终端节点，可以从地区和终端节点获取。响应示例如下，例如DLI服务部署的区域为“cn-north-4”，相应消息体中查找“name”为“cn-north-4”，其

 帮助中心 > 数据湖探索 DLI > API参考 > 公共参数
开启Flink作业动态扩缩容 - 数据湖探索 DLI

SQL作业和Flink Jar作业。登录DLI管理控制台。单击“作业管理 > Flink作业”。选择要开启动态扩缩容的作业，单击操作列下的编辑。 Flink Opensource SQL作业单击“自定义配置”，配置动态扩缩容参数。 Flink Jar作业单击“优化参数”框，配置动态扩缩容参数。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
创建OBS外表，由于OBS文件中的某字段存在换行符导致表字段数据错误怎么办？ - 数据湖探索 DLI

"obs://dli-test-001/test.csv"); test.csv文件内容如下： Jordon,88,"aa bb" 因为最后一个字段的aa和bb之间存在回车换行。创建OBS外表后，查询test06表数据内容显示如下： name id classno Jordon 88 aa bb"

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
Flink Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

second=3600 flink.dli.job.agency.name=*** Flink Jar作业示例。环境准备已安装和配置IntelliJ IDEA等开发工具以及安装JDK和Maven。 pom文件配置中依赖包 <properties> <flink.version>1

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink作业委托场景开发指导
原生数据类型 - 数据湖探索 DLI

超过了长度指定数，那么这个STRING会被自动缩短。和STRING类型一样，VARCHAR末尾的空格数是有意义的，会影响比较结果。DLI中实际存储为STRING类型。 DATE DATE类型只能和DATE、TIMESTAMP和STRING进行显式转换（cast），具体如表2所示。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据类型
Flink作业推荐配置指导 - 数据湖探索 DLI

机发送消息通知，方便客户及时感知异常。图4 作业异常告警勾选“开启Checkpoint”，依据自身业务情况调整Checkpoint间隔和模式。Flink Checkpoint机制可以保证Flink任务突然失败时，能够从最近的Checkpoint进行状态恢复重启。图5 checkpoint参数

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
SQL作业如何指定表的部分字段进行表数据的插入 - 数据湖探索 DLI

但是DLI目前不支持直接在INSERT INTO语句中指定部分列字段进行数据插入，您需要确保在SELECT子句中选择的字段数量和类型与目标表的Schema信息匹配。即确保源表和目标表的数据类型和列字段个数相同，以避免插入失败。如果目标表中的某些字段在SELECT子句中没有被指定，那么这些字段也可能

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类

总条数： 840

上一页
1
...
7
8
9
...
42
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查询Spark作业日志 - 数据湖探索 DLI

设置普通队列的弹性扩缩容定时任务 - 数据湖探索 DLI

手动在OBS表的分区目录下添加了数据，但是无法查询到数据怎么办？ - 数据湖探索 DLI

执行作业的用户数据库和表权限不足导致作业运行失败 - 数据湖探索 DLI

查询Flink作业日志 - 数据湖探索 DLI

LakeFormation资源权限支持列表与策略项 - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

为什么insert overwrite覆盖分区表数据的时候，覆盖了全量数据？ - 数据湖探索 DLI

Flink Opensource SQL从RDS数据库读取的时间和RDS数据库存储的时间为什么会不一致？ - 数据湖探索 DLI

提交SQL作业（推荐） - 数据湖探索 DLI

跨源连接RDS表中create_date字段类型是datetime，为什么DLI中查出来的是时间戳呢？ - 数据湖探索 DLI

DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

Upsert Kafka结果表 - 数据湖探索 DLI

获取项目ID - 数据湖探索 DLI

开启Flink作业动态扩缩容 - 数据湖探索 DLI

创建OBS外表，由于OBS文件中的某字段存在换行符导致表字段数据错误怎么办？ - 数据湖探索 DLI

Flink Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

原生数据类型 - 数据湖探索 DLI

Flink作业推荐配置指导 - 数据湖探索 DLI

SQL作业如何指定表的部分字段进行表数据的插入 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线