搜索_华为云

SQL作业相关API - 数据湖探索 DLI

提交SQL作业（推荐）取消作业（推荐）查询所有作业预览SQL作业查询结果导出查询结果查询作业状态查询作业详细信息检查SQL语法查询作业执行进度信息

 帮助中心 > 数据湖探索 DLI > API参考
查询所有队列 - 数据湖探索 DLI

管理子网的网段。 cidr_in_subnet 否 String 子网网段。 resource_mode 否 Integer 资源模式。 0：共享队列 1：专属队列 platform 否 String 队列计算资源的cpu架构。 x86_64 aarch64 is_restarting

帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
DLI Spark 3.1.1版本停止服务（EOS）公告 - 数据湖探索 DLI

committer小文件写性能提升对象存储服务（OBS）在处理小文件写入时的性能，提高数据传输效率。动态Executor shuffle数据优化提升资源扩缩容的稳定性，当shuffle文件不需要时清理Executor。支持配置小文件合并使用SQL过程中，生成的小文件过多时，会导

 帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
DLI Spark 2.3.2版本停止服务（EOS）公告 - 数据湖探索 DLI

committer小文件写性能提升对象存储服务（OBS）在处理小文件写入时的性能，提高数据传输效率。动态Executor shuffle数据优化提升资源扩缩容的稳定性，当shuffle文件不需要时清理Executor。支持配置小文件合并使用SQL过程中，生成的小文件过多时，会导

 帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
计费概述 - 数据湖探索 DLI
计费概述 - 数据湖探索 DLI

支持包年包月+按需组合使用（超出包周期规格按需计费）；支持套餐包+按需计费组合使用（超出套餐包使用量按需计费）。存储计费按照存储在DLI服务中的表数据存储量（单位为“GB”）收取存储费用。在估算存储费用时，请特别注意，DLI采用压缩存储，通常能压缩到原文件大小的 1/5 。DLI存储按照压缩后的大小计费。

帮助中心 > 数据湖探索 DLI > 计费说明
Print结果表 - 数据湖探索 DLI
Print结果表 - 数据湖探索 DLI

若为true，则表示输出数据到taskmanager的error文件中。若为false，则表示输出数据到taskmanager的out中。示例从kafka中读取数据输出到taskmanager的out文件中，可以在taskmanager的out文件中看到输出结果。 create table kafkaSource(

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
队列赋权（废弃） - 数据湖探索 DLI

REVOKE_PRIVILEGE：权限回收 SHOW_PRIVILEGES：查看其它用户具备的权限 RESTART：重启队列 SCALE_QUEUE：规格变更说明：若需更新的权限列表为空，则表示回收用户在该队列的所有权限。响应消息表3 响应参数参数名称是否必选参数类型说明 is_success

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 权限相关API（废弃）
典型场景示例：迁移RDS数据至DLI - 数据湖探索 DLI

参考CDM管理驱动下载MySQL的驱动包到本地，将下载后驱动包本地解压，获取驱动的jar包文件。例如，当前下载MySQL驱动包压缩文件为“mysql-connector-java-5.1.48.zip”，解压后获取驱动文件“mysql-connector-java-5.1.48.jar”。返回

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
查看Flink作业详情 - 数据湖探索 DLI

展示用户Flink作业字节的输出总数。单位：字节。 Flink作业CPU使用率展示用户Flink作业的CPU使用率。单位：%。 Flink作业内存使用率展示用户Flink作业的内存使用率。单位：%。 Flink作业最大算子延迟展示用户Flink作业的最大算子延迟时间，单位ms。 Flink作业最大算子反压

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
扫描量计费 - 数据湖探索 DLI
扫描量计费 - 数据湖探索 DLI

若计算任务超时或失败，则当次计算不收取费用。数据的存储方式（包括格式，是否压缩）对计算费用有直接的影响。假设Parquet格式文件为原CSV文件大小的1/4，则数据扫描费用为原CSV文件扫描费用的1/4。计费规则表1 数据扫描量计费规则类型资源说明数据扫描数据扫描量仅default

帮助中心 > 数据湖探索 DLI > 计费说明
Hudi Archive操作说明 - 数据湖探索 DLI

Archive用户清理Hudi表的元数据文件（位于.hoodie目录下，格式为 ${时间戳}.${操作类型}.${操作状态}，比如20240622143023546.deltacommit.request）。对Hudi表进行的每次操作都会产生元数据文件，而元数据文件过多会导致性能问题，所以元数据文件数量最好控制在1000以内。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

jar作业时选择自定义镜像。打开管理控制台的Spark作业或者Flink作业编辑页面，在自定义镜像列表中选择已上传并共享的镜像，运行作业，即可使用自定义镜像运行作业。如果选择的镜像不是共享镜像，自定义镜像处会提示该镜像未授权，则需要授权后才可以使用。具体可以参考图3，提示处单击“立即授权”即

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
Hudi Clean操作说明 - 数据湖探索 DLI

Hudi Clean操作说明什么是Clean Cleaning用于清理Hudi表不再需要的老版本数据文件 (parquet文件或者log文件)，减轻存储压力，提升list操作效率。如何执行Clean 写完数据后clean Spark SQL（设置如下参数，随后执行任意写入SQL时，在满足条件时触发）

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
Doris源表 - 数据湖探索 DLI
Doris源表 - 数据湖探索 DLI

后续查看作业日志。认证用的username和password等硬编码到代码中或者明文存储都有很大的安全风险，建议使用DEW管理凭证。配置文件或者环境变量中密文存放，使用时解密，确保安全。Flink Opensource SQL使用DEW管理访问凭据集群未启用Kerberos认证（普通模式）

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Doris
Hudi Compaction操作说明 - 数据湖探索 DLI

Plan一个一个去执行，一直到全部都执行完。对于Merge-On-Read表，数据使用列式Parquet文件和行式Avro文件存储，更新被记录到增量文件，然后进行同步/异步compaction生成新版本的列式文件。Merge-On-Read表可减少数据摄入延迟，因而进行不阻塞摄入的异步Compaction很有意义。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
使用Spark作业访问sftp中的文件，作业运行失败，日志显示访问目录异常 - 数据湖探索 DLI

使用Spark作业访问sftp中的文件，作业运行失败，日志显示访问目录异常 Spark作业不支持访问sftp，建议将文件数据上传到OBS，再通过Spark作业进行读取和分析。上传数据到OBS桶：通过OBS管理控制台或者使用命令行工具将存储在sftp中的文件数据上传到OBS桶中。 Sp

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

单击所建桶“obs1”，进入“对象”页面。勾选左侧列表中的“对象”，选择“上传对象”，将需要上传的文件“sampledata.csv”上传到指定目录，单击“上传”。 “sampledata.csv”样例文件可以通过新建“sampledata.txt”，复制如下英文逗号分隔的文本内容，再另存为“sampledata

帮助中心 > 数据湖探索 DLI > 快速入门
Delta清理和优化 - 数据湖探索 DLI

前创建的数据文件。 VACUUM delta_table0; VACUUM delta_table0 RETAIN 168 HOURS;--单位只支持HOURS 优化Delta表为了提高查询速度，Delta Lake支持优化数据在存储中的布局，这会将许多较小的文件压缩为较大的文件。

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考
Hudi表使用约束 - 数据湖探索 DLI

写时复制表也简称COW表，使用parquet文件存储数据，内部的更新操作需要通过重写原始parquet文件完成。优点：读取时，只读取对应分区的一个数据文件即可，较为高效。缺点：数据写入的时候，需要复制一个先前的副本再在其基础上生成新的数据文件，这个过程比较耗时。且由于耗时，读请求读取到的数据相对就会滞后。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
创建队列定时扩缩容计划（废弃） - 数据湖探索 DLI

创建队列定时扩缩容计划（废弃）功能介绍该API用于创建队列定时扩缩容计划，对指定的队列创建定时规格变更计划。当前接口已废弃，不推荐使用。调试您可以在API Explorer中调试该接口。 URI URI格式： POST /v1/{project_id}/queues/{queue_name}/plans

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 队列相关API（废弃）

总条数： 409

上一页
1
...
5
6
7
...
21
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

SQL作业相关API - 数据湖探索 DLI

查询所有队列 - 数据湖探索 DLI

DLI Spark 3.1.1版本停止服务（EOS）公告 - 数据湖探索 DLI

DLI Spark 2.3.2版本停止服务（EOS）公告 - 数据湖探索 DLI

计费概述 - 数据湖探索 DLI

Print结果表 - 数据湖探索 DLI

队列赋权（废弃） - 数据湖探索 DLI

典型场景示例：迁移RDS数据至DLI - 数据湖探索 DLI

查看Flink作业详情 - 数据湖探索 DLI

扫描量计费 - 数据湖探索 DLI

Hudi Archive操作说明 - 数据湖探索 DLI

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

Hudi Clean操作说明 - 数据湖探索 DLI

Doris源表 - 数据湖探索 DLI

Hudi Compaction操作说明 - 数据湖探索 DLI

使用Spark作业访问sftp中的文件，作业运行失败，日志显示访问目录异常 - 数据湖探索 DLI

使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

Delta清理和优化 - 数据湖探索 DLI

Hudi表使用约束 - 数据湖探索 DLI

创建队列定时扩缩容计划（废弃） - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线