搜索_华为云

查询Spark作业日志 - 数据湖探索 DLI

System）是对象存储服务（Object Storage Service，OBS）提供的一种经过优化的高性能文件系统，提供毫秒级别访问时延，以及TB/s级别带宽和百万级别的IOPS，能够快速处理高性能计算（HPC）工作负载。并行文件系统的详细介绍和使用说明，请参见《并行文件系统特性指南》。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
版本支持公告 - 数据湖探索 DLI

3.3.1版本说明 Spark 3.1.1版本说明 Spark 2.4.5版本说明 Spark 2.4.x与Spark 3.3.x版本差异对比

 帮助中心 > 数据湖探索 DLI > 服务公告
CREATE FUNCTION语句 - 数据湖探索 DLI

JAVA|SCALA Language tag 用于指定 Flink runtime 如何执行这个函数。目前，只支持 JAVA, SCALA，且函数的默认语言为 JAVA。示例创建一个名为STRINGBACK的函数。 create function STRINGBACK as 'com.dli

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > SQL语法约束与定义 > DDL语法定义
创建DLI表关联RDS - 数据湖探索 DLI

fetchsize 读取数据时，每一批次获取数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 batchsize 写入数据时，每一批次写入数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 truncate

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接RDS表
DLI SDK功能矩阵 - 数据湖探索 DLI

SDK开发指南指导您如何安装和配置开发环境、如何通过调用DLI SDK提供的接口函数进行二次开发。 Java、Python SDK功能矩阵请参见表1 表1 SDK功能矩阵语言功能内容 Java OBS授权介绍将OBS桶的操作权限授权给DLI的Java SDK使用说明。队列相关介绍创建队列、获取默认队列、查询所有队列、删除队列的Java

帮助中心 > 数据湖探索 DLI > SDK参考 > DLI SDK
查询Flink作业日志 - 数据湖探索 DLI

System）是对象存储服务（Object Storage Service，OBS）提供的一种经过优化的高性能文件系统，提供毫秒级别访问时延，以及TB/s级别带宽和百万级别的IOPS，能够快速处理高性能计算（HPC）工作负载。并行文件系统的详细介绍和使用说明，请参见《并行文件系统特性指南》。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
概述 - 数据湖探索 DLI
概述 - 数据湖探索 DLI

管理控制台界面具体操作请参考《数据湖探索用户指南》。使用Spark作业跨源访问数据源支持使用scala，pyspark和java三种语言进行开发。表格存储服务CloudTable相关介绍请参考《表格存储服务产品介绍》。云搜索服务CSS相关介绍请参考《云搜索服务产品介绍》。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源
Hudi源表 - 数据湖探索 DLI
Hudi源表 - 数据湖探索 DLI

tion是否正常。因为当长时间不做Compaction时list性能会变差。流读Hudi MOR表时，建议开启log index特性提升Flink流读性能 Hudi的Mor表可以通过log index提升读写性能， Sink和Source表添加属性 'hoodie.log.index

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
变更普通队列规格 - 数据湖探索 DLI

扩容属于耗时操作，在DLI“规格变更”页面执行扩容操作后，需要等待大约10分钟，具体时长和扩容的CU值有关，等待一段时间后，可以通过刷新“队列管理”页面，对比“规格”和“实际CUs”大小是否一致来判断是否扩容成功。或者在“作业管理”页面，查看“SCALE_QUEUE”类型SQL作业的状态，如果作

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
固定精度型 - 数据湖探索 DLI
固定精度型 - 数据湖探索 DLI

固定精度型名称描述存储空间取值范围字面量 DECIMAL 固定精度的十进制数。精度最高支持到38位，但精度小于18位能保障性能最好。 Decimal有两个输入参数： precision：总位数，默认38 scale：小数部分的位数，默认0 说明：如果小数位为零，即十进制（38

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 数据类型
DWS Connector概述 - 数据湖探索 DLI

15版本支持两种DWS Connector方式用于接入GaussDB数据：（推荐使用）DWS服务自研的DWS Connector：更关注于直接与DWS的性能与交互，用户能够更加灵活便捷的与DWS进行数据的读写操作。您可以通过自定义函数（UDF）的方式使用DWS自研的DWS Connector。自定义函数操作请参考自定义函数。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
Spark SQL常用配置项说明 - 数据湖探索 DLI

ng.enabled true 该配置项用于启用或禁用动态分区修剪。在执行SQL查询时，动态分区修剪可以帮助减少需要扫描的数据量，提高查询性能。配置为true时，代表启用动态分区修剪，SQL会在查询中自动检测并删除那些不满足WHERE子句条件的分区，适用于在处理具有大量分区的表时。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

数据转换为Parquet数据。方案优势提升查询性能如果您在HDFS上拥有基于文本的数据文件或者表，而且正在使用Spark SQL对数据执行查询操作，那么推荐将文本数据文件转换为Parquet数据文件，转换需要时间，但查询性能的提升在某些情况下可能达到约30倍或更高。节省存储空间

 帮助中心 > 数据湖探索 DLI > 最佳实践
普通队列弹性扩缩容 - 数据湖探索 DLI

扩容属于耗时操作，在DLI“弹性扩缩容”页面执行扩容操作后，需要等待大约10分钟，具体时长和扩容的CU值有关，等待一段时间后，可以通过刷新“队列管理”页面，对比“规格”和“实际CUs”大小是否一致来判断是否扩容成功。或者在“作业管理”页面，查看“SCALE_QUEUE”类型SQL作业的状态，如果作

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
数据保护技术 - 数据湖探索 DLI

在Flink作业可以通过配置表2中的参数来开启SSL传输。打开Task Manager之间data传输通道的SSL，会对性能会有较大影响，建议结合安全和性能综合考虑是否开启。证书文件还需要在作业配置页面的“其他依赖文件”中完成配置。 OBS路径/opt/flink/usrli

帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
离线Compaction配置 - 数据湖探索 DLI

// 执行archivelog合并清理元数据文件关于清理、归档参数的值不宜设置过大，会影响Hudi表的性能，通常建议： hoodie.cleaner.commits.retained = compaction所需要的commit数的2倍 hoodie

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
Doris Connector概述 - 数据湖探索 DLI

Doris Connector概述 Flink Doris Connector 可以支持通过 Flink 操作（读取、插入、修改、删除） Doris 中存储的数据。只能对Unique Key模型的表进行修改和删除操作。表1 支持类别类别详情支持表类型源表、维表、结果表

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Doris
责任共担 - 数据湖探索 DLI
责任共担 - 数据湖探索 DLI

身的安全，涵盖华为云数据中心的物理环境设施和运行其上的基础服务、平台服务、应用服务等。这不仅包括华为云基础设施和各项云服务技术的安全功能和性能本身，也包括运维运营安全，以及更广义的安全合规遵从。租户：负责云服务内部的安全，安全地使用云。华为云租户的安全责任在于对使用的IaaS、

帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
CREATE TABLE AS SELECT - 数据湖探索 DLI

partitioned by (datestr) as select * from parquet_mngd; 注意事项为了更好的加载数据性能，CTAS使用bulk insert作为写入方式。权限需求由DLI提供的元数据服务 SQL权限： database table CREATE_TABLE

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
数据湖探索简介 - 数据湖探索 DLI

Spark是用于大规模数据处理的统一分析引擎，聚焦于查询计算分析。DLI在开源Spark基础上进行了大量的性能优化与服务化改造，不仅兼容Apache Spark生态和接口，性能较开源提升了2.5倍，在小时级即可实现EB级数据查询分析。 Flink是一款分布式的计算引擎，可以用来做批

 帮助中心 > 数据湖探索 DLI > 产品介绍

总条数： 136

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查询Spark作业日志 - 数据湖探索 DLI

版本支持公告 - 数据湖探索 DLI

CREATE FUNCTION语句 - 数据湖探索 DLI

创建DLI表关联RDS - 数据湖探索 DLI

DLI SDK功能矩阵 - 数据湖探索 DLI

查询Flink作业日志 - 数据湖探索 DLI

概述 - 数据湖探索 DLI

Hudi源表 - 数据湖探索 DLI

变更普通队列规格 - 数据湖探索 DLI

固定精度型 - 数据湖探索 DLI

DWS Connector概述 - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

普通队列弹性扩缩容 - 数据湖探索 DLI

数据保护技术 - 数据湖探索 DLI

离线Compaction配置 - 数据湖探索 DLI

Doris Connector概述 - 数据湖探索 DLI

责任共担 - 数据湖探索 DLI

CREATE TABLE AS SELECT - 数据湖探索 DLI

数据湖探索简介 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线