搜索_华为云

（推荐）DLI SDK V3 - 数据湖探索 DLI

SDK列表表1提供了DLI云服务支持的SDK列表，您可以在GitHub仓库查看SDK更新历史、获取安装包以及查看指导文档。表1 SDK列表编程语言 Github地址参考文档视频指导 Java huaweicloud-sdk-java-v3 Java SDK使用指导 Java SDK视频指导

 帮助中心 > 数据湖探索 DLI > SDK参考
CREATE FUNCTION语句 - 数据湖探索 DLI

JAVA|SCALA Language tag 用于指定 Flink runtime 如何执行这个函数。目前，只支持 JAVA 和 SCALA，且函数的默认语言为 JAVA。示例创建一个名为STRINGBACK的函数 create function STRINGBACK as 'com.dli

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > SQL语法约束与定义 > 语法定义 > DDL语法定义
REFRESH TABLE刷新表元数据 - 数据湖探索 DLI

REFRESH TABLE刷新表元数据功能描述 Spark为了提高性能会缓存Parquet的元数据信息。当更新了Parquet表时，缓存的元数据信息未更新，导致Spark SQL查询不到新插入的数据作业执行报错，报错信息参考如下： DLI.0002: FileNotFoundException:

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
OPTIMIZE - 数据湖探索 DLI
OPTIMIZE - 数据湖探索 DLI

OPTIMIZE命令用于优化数据在存储中的布局，提高查询速度。注意事项由于Optimize是一项耗时的活动，因此需要根据更好的最终用户查询性能与优化计算时间之间的权衡来确定运行Optimized的频率。分区表优化需要设置参数spark.sql.forcePartitionPre

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
产品优势 - 数据湖探索 DLI
产品优势 - 数据湖探索 DLI

自建大数据生态的调度工具，如Airflow。企业级多租户基于表的权限管理，可以精细化到列权限。基于文件的权限管理。高性能性能基于软硬件一体化的深度垂直优化。大数据开源版本性能。跨源分析支持多种数据格式，云上多种数据源、ECS自建数据库以及线下数据库，数据无需搬迁，即可实现对云上

 帮助中心 > 数据湖探索 DLI > 产品介绍
BlackHole结果表 - 数据湖探索 DLI

BlackHole结果表功能描述 BlackHole Connector允许接收所有输入记录，常用于高性能测试和UDF 输出，其不是实质性Sink。Blackhole结果表是系统内置的Connector。例如，如果您在注册其他类型的Connector结果表时报错，但您不确定是

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
BlackHole - 数据湖探索 DLI
BlackHole - 数据湖探索 DLI

BlackHole 功能描述 BlackHole Connector允许接收所有输入记录，常用于高性能测试和UDF输出，其不是实质性Sink。Blackhole结果表是系统内置的Connector。例如，如果您在注册其他类型的Connector结果表时报错，但您不确定是系统问题

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
CREATE FUNCTION语句 - 数据湖探索 DLI

JAVA|SCALA Language tag 用于指定 Flink runtime 如何执行这个函数。目前，只支持 JAVA 和 SCALA，且函数的默认语言为 JAVA。示例创建一个名为STRINGBACK的函数 create function STRINGBACK as 'com.dli

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > SQL语法约束与定义 > 语法定义 > DDL语法定义
Hudi Archive操作说明 - 数据湖探索 DLI

${操作状态}，比如20240622143023546.deltacommit.request）。对Hudi表进行的每次操作都会产生元数据文件，而元数据文件过多会导致性能问题，所以元数据文件数量最好控制在1000以内。如何执行Archive 写完数据后archive Spark SQL（set设置如下参数，写数据时触发）

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
调用说明 - 数据湖探索 DLI
调用说明 - 数据湖探索 DLI

若API为异步操作，可根据响应消息中的“job_id”，执行查询作业状态API，从而获取该异步操作API最终是否执行成功。同时数据湖探索还提供多种编程语言的SDK供您使用，SDK的使用方法请参见华为云开发工具包（SDK）。父主题： API使用前必读

 帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读
Spark 3.3.1版本说明 - 数据湖探索 DLI

版本主要的功能特性。更多版本新特性及性能优化请参考Release Notes - Spark 3.3.1。表1 Spark 3.3.1版本优势特性说明 Native性能加速 Spark查询语句性能提升。元数据访问性能提升提升Spark在处理大数据时的元数据访问性能，提高数据处理流程效率。

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
CONVERT TO DELTA - 数据湖探索 DLI
CONVERT TO DELTA - 数据湖探索 DLI

事务日志来跟踪这些文件，并通过读取所有 Parquet 文件的页脚来自动推断数据架构。转换过程会收集统计信息，以提升转换后的 Delta 表的查询性能。如果提供表名，则元存储也将更新，以反映该表现在是 Delta 表。注意事项分区表转换需要设置参数spark.sql.forcePa

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DDL语法说明
DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

Performance Council) 组织制定的用来模拟决策支持类应用的一个测试集。目前，在学术界和工业界普遍用来评价决策支持技术方面应用的性能。这种商业测试可以全方位评测系统的整体商业计算综合能力，对厂商的要求更高，同时也具有普遍的商业实用意义，目前在银行信贷分析和信用卡分析、电

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
OBS表压缩率较高怎么办？ - 数据湖探索 DLI

当您在提交导入数据到DLI表的作业时，如果遇到Parquet/Orc格式的OBS表对应的文件压缩率较高，超过了5倍的压缩率，您可以通过调整配置来优化作业的性能。具体方法：在submit-job请求体conf字段中配置“dli.sql.files.maxPartitionBytes=33554432”。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
Hudi Clustering操作说明 - 数据湖探索 DLI

Hudi Clustering操作说明什么是Clustering 即数据布局，该服务可重新组织数据以提高查询性能，也不会影响摄取速度。 Clustering架构 Hudi通过其写入客户端API提供了不同的操作，如insert/upsert/bulk_insert来将数据写入Hu

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
使用HetuEngine on Hudi - 数据湖探索 DLI

使用HetuEngine on Hudi HetuEngine是高性能的交互式SQL分析及数据虚拟化引擎，它与大数据生态无缝融合，实现海量数据秒级交互式查询，并支持跨源跨域统一访问，使能数据湖内、湖间、湖仓一站式SQL融合分析。 HetuEngine对Hudi仅支持select操

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
Hbase结果表 - 数据湖探索 DLI
Hbase结果表 - 数据湖探索 DLI

Hbase结果表功能描述 DLI将作业的输出数据输出到HBase中。HBase是一个稳定可靠，性能卓越、可伸缩、面向列的分布式云存储系统，适用于海量数据存储以及分布式计算的场景，用户可以利用HBase搭建起TB至PB级数据规模的存储系统，对数据轻松进行过滤分析，毫秒级得到响应，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
Hbase源表 - 数据湖探索 DLI
Hbase源表 - 数据湖探索 DLI

Hbase源表功能描述创建source流从HBase中获取数据，作为作业的输入数据。HBase是一个稳定可靠，性能卓越、可伸缩、面向列的分布式云存储系统，适用于海量数据存储以及分布式计算的场景，用户可以利用HBase搭建起TB至PB级数据规模的存储系统，对数据轻松进行过滤分析

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
Hbase结果表 - 数据湖探索 DLI
Hbase结果表 - 数据湖探索 DLI

每次写入请求缓存行的最大值。它能提升写入HBase数据库的性能，但是也可能增加延迟。设置为 "0" 关闭此选项。 sink.buffer-flush.max-rows 否 1000 Integer 每次写入请求缓存的最大行数。它能提升写入HBase数据库的性能，但是也可能增加延迟。设置为 "0"

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Hbase源表 - 数据湖探索 DLI
Hbase源表 - 数据湖探索 DLI

Hbase源表功能描述创建source流从HBase中获取数据，作为作业的输入数据。HBase是一个稳定可靠，性能卓越、可伸缩、面向列的分布式云存储系统，适用于海量数据存储以及分布式计算的场景，用户可以利用HBase搭建起TB至PB级数据规模的存储系统，对数据轻松进行过滤分析

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hbase

总条数： 136

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

（推荐）DLI SDK V3 - 数据湖探索 DLI

CREATE FUNCTION语句 - 数据湖探索 DLI

REFRESH TABLE刷新表元数据 - 数据湖探索 DLI

OPTIMIZE - 数据湖探索 DLI

产品优势 - 数据湖探索 DLI

BlackHole结果表 - 数据湖探索 DLI

BlackHole - 数据湖探索 DLI

CREATE FUNCTION语句 - 数据湖探索 DLI

Hudi Archive操作说明 - 数据湖探索 DLI

调用说明 - 数据湖探索 DLI

Spark 3.3.1版本说明 - 数据湖探索 DLI

CONVERT TO DELTA - 数据湖探索 DLI

DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

OBS表压缩率较高怎么办？ - 数据湖探索 DLI

Hudi Clustering操作说明 - 数据湖探索 DLI

使用HetuEngine on Hudi - 数据湖探索 DLI

Hbase结果表 - 数据湖探索 DLI

Hbase源表 - 数据湖探索 DLI

Hbase结果表 - 数据湖探索 DLI

Hbase源表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线