搜索_华为云

Hudi表分区设计规范 - 数据湖探索 DLI

Hudi表分区设计规范规则分区键不可以被更新： Hudi具有主键唯一性机制，但在分区表的场景下通常只能保证分区内主键唯一，因此如果分区键的值发生变更后，会导致相同主键的行记录出现多条的情况。在以日期分区的场景，可采用数据的创建时间为分区字段，切记不要采用数据更新时间做分区。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

使用JDBC连接DLI并提交SQL作业操作场景在Linux或Windows环境下您可以使用JDBC应用程序连接DLI服务端提交作业。使用JDBC连接DLI提交的作业运行在Spark引擎上。 JDBC版本2.X版本功能重构后，仅支持从DLI作业桶读取查询结果，如需使用该特性需具备以下条件：

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI > 使用JDBC提交SQL作业
ClickHouse结果表 - 数据湖探索 DLI

ClickHouse结果表功能描述 DLI支持将Flink作业数据输出到ClickHouse数据库中。ClickHouse是面向联机分析处理的列式数据库，支持SQL查询，且查询性能好，特别是基于大宽表的聚合分析查询性能非常优异，比其他分析型数据库速度快一个数量级。详细请参考ClickHouse组件操作。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
功能总览 - 数据湖探索 DLI
功能总览 - 数据湖探索 DLI

功能总览功能总览全部数据湖探索权限管理弹性资源池 DLI元数据 DLI SQL作业 DLI Spark作业 DLI Flink作业跨源连接 DLI自定义委托自定义镜像 OBS 2.0支持数据湖探索数据湖探索（Data Lake Insight，以下简称DLI）是完全兼容Apache

帮助中心 > 数据湖探索 DLI > 功能总览
分组聚合 - 数据湖探索 DLI
分组聚合 - 数据湖探索 DLI

分组聚合聚合函数把多行输入数据计算为一行结果。例如，有一些聚合函数可以计算一组行的 “COUNT”、“SUM”、“AVG”（平均）、“MAX”（最大）和 “MIN”（最小）。对于流式查询，用于计算查询结果的状态可能无限膨胀。状态的大小大多数情况下取决于去重行的数量和分组持续的时间，持续时间较短的

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
创建DLI表关联CSS - 数据湖探索 DLI

创建DLI表关联CSS 功能描述使用CREATE TABLE命令创建DLI表并关联CSS上已有的表。 Spark跨源开发场景中直接配置跨源认证信息存在密码泄露的风险，优先推荐您使用DLI提供的跨源认证方式。跨源认证简介及操作方法请参考跨源认证简介。前提条件创建DLI表关联

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接CSS表
Spark SQL常用配置项说明 - 数据湖探索 DLI

Spark SQL常用配置项说明本章节为您介绍DLI 批作业SQL语法的常用配置项。表1 常用配置项名称默认值描述 spark.sql.files.maxRecordsPerFile 0 要写入单个文件的最大记录数。如果该值为零或为负，则没有限制。 spark.sql.shuffle

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
MySQL CDC源表 - 数据湖探索 DLI
MySQL CDC源表 - 数据湖探索 DLI

MySQL CDC源表功能描述 MySQL的CDC源表，即MySQL的流式源表，会先读取数据库的历史全量数据，并平滑切换到Binlog读取上，保证数据的完整读取。前提条件 MySQL CDC要求MySQL版本为5.7或8.0.x。该场景作业需要DLI与MySQL建立增强型跨

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
成长地图 - 数据湖探索 DLI
成长地图 - 数据湖探索 DLI

云容器引擎-成长地图 | 华为云数据湖探索数据湖探索（Data Lake Insight，简称DLI）是完全兼容Apache Spark、Apache Flink、HetuEngine生态，提供一站式的流处理、批处理、交互式分析的Serverless融合处理分析服务。用户不需

 帮助中心 > 数据湖探索 DLI > 成长地图
使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据应用场景 Parquet是面向分析型业务的列式存储格式，这种格式可以加快查询速度，查询Parquet格式数据时，只检查所需要的列并对它们的值执行计算，也就是说，只读取一个数据文件或表的一小部分数据。Parquet还支持灵活的压缩选项

 帮助中心 > 数据湖探索 DLI > 最佳实践
SQL作业运行慢如何定位 - 数据湖探索 DLI

SQL作业运行慢如何定位作业运行慢可以通过以下步骤进行排查处理。可能原因1：FullGC原因导致作业运行慢判断当前作业运行慢是否是FullGC导致：登录DLI控制台，单击“作业管理 > SQL作业”。在SQL作业页面，在对应作业的“操作”列，单击“更多 > 归档日志”。

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
计费概述 - 数据湖探索 DLI
计费概述 - 数据湖探索 DLI

计费概述数据湖探索DLI的计费由不同的计费项组成，不同的计费项有不同的计费模式，如图1所示。图1 DLI的计费组成计费项 DLI的计费项包括计算计费、存储计费、扫描量计费。DLI的计费详情请参见DLI产品价格详情。您可以通过DLI提供的价格计算器，快速计算出购买资源的参考价格。

帮助中心 > 数据湖探索 DLI > 计费说明
数据保护技术 - 数据湖探索 DLI

数据保护技术数据存储安全为了确保您的个人敏感数据（例如用户名、密码、手机号码等）不被未经过认证、授权的实体或者个人获取，DLI对用户数据的存储和传输进行加密保护，以防止个人数据泄露，保证您的个人数据安全。数据销毁机制用户删除DLI队列后，存储在集群上的用户个人敏感数据会随之删除。

帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
扫描量计费 - 数据湖探索 DLI
扫描量计费 - 数据湖探索 DLI

扫描量计费按扫描量计费按扫描量计费即：按运行查询作业扫描的数据量付费，如果扫描字节数量少于10M，按10M计算。且数据定义语言（DDL）语句（如 CREATE、ALTER、DROP TABLE等语句）、管理分区语句、失败的查询语句无需付费。对于取消的查询，按取消查询时扫描的总数据量计费。

帮助中心 > 数据湖探索 DLI > 计费说明
Elasticsearch结果表 - 数据湖探索 DLI

Elasticsearch结果表功能描述 DLI将Flink作业的输出数据输出到云搜索服务CSS的Elasticsearch中。Elasticsearch是基于Lucene的当前流行的企业级搜索服务器，具备分布式多用户的能力。其主要功能包括全文检索、结构化搜索、分析、聚合、高亮

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
调整弹性资源池中队列的扩缩容策略 - 数据湖探索 DLI

调整弹性资源池中队列的扩缩容策略弹性资源池上可以添加多个不同队列用于作业运行，具体添加弹性资源池添加队列的操作可以参考创建弹性资源池并添加队列。添加完队列后，可以根据不同队列计算资源使用量的波峰和波谷和优先级来配置要扩缩容的CU数，从而来保障作业的稳定运行。注意事项建议对流

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
更新Flink Jar作业 - 数据湖探索 DLI

更新Flink Jar作业功能介绍该API用于更新用户自定义作业，目前仅支持Jar格式，运行在独享队列中。调试您可以在API Explorer中调试该接口。 URI URI格式 PUT /v1.0/{project_id}/streaming/flink-jobs/{job_id}

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
Kafka源表 - 数据湖探索 DLI
Kafka源表 - 数据湖探索 DLI

Kafka源表功能描述创建source流从Kafka获取数据，作为作业的输入数据。 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。前提条件确保已创建Kafka集群。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
数学函数概览 - 数据湖探索 DLI

数学函数概览 DLI所支持的数学函数如数学函数所示。表1 数学函数函数命令格式返回值功能简介 abs abs(DOUBLE a) DOUBLE或INT 取绝对值。 acos acos(DOUBLE a) DOUBLE 返回给定角度a的反余弦值。 asin asin(DOUBLE

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 数学函数
更新SQL作业 - 数据湖探索 DLI
更新SQL作业 - 数据湖探索 DLI

更新SQL作业功能介绍该API用于修改Flink SQL作业。调试您可以在API Explorer中调试该接口。 URI URI格式 PUT /v1.0/{project_id}/streaming/sql-jobs/{job_id} 参数说明表1 URI参数说明参数名称

 帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API

总条数： 267

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi表分区设计规范 - 数据湖探索 DLI

使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

ClickHouse结果表 - 数据湖探索 DLI

功能总览 - 数据湖探索 DLI

分组聚合 - 数据湖探索 DLI

创建DLI表关联CSS - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

MySQL CDC源表 - 数据湖探索 DLI

成长地图 - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

SQL作业运行慢如何定位 - 数据湖探索 DLI

计费概述 - 数据湖探索 DLI

数据保护技术 - 数据湖探索 DLI

扫描量计费 - 数据湖探索 DLI

Elasticsearch结果表 - 数据湖探索 DLI

调整弹性资源池中队列的扩缩容策略 - 数据湖探索 DLI

更新Flink Jar作业 - 数据湖探索 DLI

Kafka源表 - 数据湖探索 DLI

数学函数概览 - 数据湖探索 DLI

更新SQL作业 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线