搜索_华为云

DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

界和工业界普遍用来评价决策支持技术方面应用的性能。这种商业测试可以全方位评测系统的整体商业计算综合能力，对厂商的要求更高，同时也具有普遍的商业实用意义，目前在银行信贷分析和信用卡分析、电信运营分析、税收分析、烟草行业决策分析中都有广泛的应用。 TPC-H 基准测试是由 TPC-D（由

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
DLI计算引擎版本生命周期 - 数据湖探索 DLI

DLI计算引擎版本生命周期版本号说明 DLI计算引擎版本号：格式为计算引擎名称 x.y.z，其中计算引擎分为Flink和Spark，版本号具体含义如图1所示。图1 DLI计算引擎版本号版本支持情况 Flink计算引擎推荐版本：Flink 1.15。 Spark计算引擎推荐版本：

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
CREATE TABLE语句 - 数据湖探索 DLI

因此计算列可用于获得事件时间列。例如，原始字段的类型不是 TIMESTAMP(3) 或嵌套在 JSON 字符串中。注意：定义在一个数据源表（ source table ）上的计算列会在从数据源读取数据后被计算，它们可以在 SELECT 查询语句中使用。计算列不可以作为 INSERT

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > SQL语法约束与定义 > DDL语法定义
CREATE TABLE语句 - 数据湖探索 DLI

因此计算列可用于获得事件时间列。例如，原始字段的类型不是 TIMESTAMP(3) 或嵌套在 JSON 字符串中。注意：定义在一个数据源表（ source table ）上的计算列会在从数据源读取数据后被计算，它们可以在 SELECT 查询语句中使用。计算列不可以作为 INSERT

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > SQL语法约束与定义 > 语法定义 > DDL语法定义
CREATE TABLE语句 - 数据湖探索 DLI

因此计算列可用于获得事件时间列。例如，原始字段的类型不是 TIMESTAMP(3) 或嵌套在 JSON 字符串中。注意：定义在一个数据源表（ source table ）上的计算列会在从数据源读取数据后被计算，它们可以在 SELECT 查询语句中使用。计算列不可以作为 INSERT

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > SQL语法约束与定义 > 语法定义 > DDL语法定义
DLI弹性资源池与队列简介 - 数据湖探索 DLI

DLI弹性资源池与队列简介 DLI的计算资源是执行作业的基础，本节内容介绍DLI计算资源的模式和队列类型。什么是弹性资源池和队列？在了解DLI计算资源模式前首先了解弹性资源池和队列的基本概念。弹性资源池是DLI计算资源的一种池化管理模式，可以看做DLI计算资源的集合。DLI支持在弹性

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
怎样查看弹性资源池和作业的资源使用情况？ - 数据湖探索 DLI

怎样查看弹性资源池和作业的资源使用情况？在大数据分析的日常工作中，合理分配和管理计算资源，可以提供良好的作业执行环境。您可以根据作业的计算需求和数据规模分配资源、调整任务执行顺序，调度不同的弹性资源池或队列资源以适应不同的工作负载。待提交作业所需的CUs需小于等于弹性资源池的

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI弹性资源池和队列类
怎样升级DLI作业的引擎版本 - 数据湖探索 DLI

怎样升级DLI作业的引擎版本 DLI提供了Spark和Flink计算引擎，为用户提供了一站式的流处理、批处理、交互式分析的Serverless融合处理分析服务，当前，Flink计算引擎推荐版本：Flink 1.15，Spark计算引擎推荐版本： Spark 3.3.1。本节操作介绍如何升级作业的引擎版本。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
应用场景 - 数据湖探索 DLI
应用场景 - 数据湖探索 DLI

大数据ETL：具备TB~EB级运营商数据治理能力，能快速将海量运营商数据做ETL处理，为分布式批处理计算提供分布式数据集。高吞吐低时延：采用Apache Flink的Dataflow模型，高性能计算资源，从用户自建的Kafka、MRS-Kafka、DMS-Kafka消费数据，单CU每秒吞吐1千~2万条消息。

帮助中心 > 数据湖探索 DLI > 产品介绍
创建弹性资源池并添加队列 - 数据湖探索 DLI

弹性资源池为DLI作业运行提供所需的计算资源（CPU和内存），用于灵活应对业务对计算资源变化的需求。创建弹性资源池后，您可以在弹性资源池中创建多个队列，队列关联到具体的作业和数据处理任务，是资源池中资源被实际使用和分配的基本单元，即队列是执行作业所需的具体的计算资源。同一弹性资源池中，队列之间的计算资源支持共享。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
分组聚合 - 数据湖探索 DLI
分组聚合 - 数据湖探索 DLI

分组聚合聚合函数把多行输入数据计算为一行结果。例如，有一些聚合函数可以计算一组行的 “COUNT”、“SUM”、“AVG”（平均）、“MAX”（最大）和 “MIN”（最小）。对于流式查询，用于计算查询结果的状态可能无限膨胀。状态的大小大多数情况下取决于去重行的数量和分组持续的时间，持续时间较短的

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
故障恢复 - 数据湖探索 DLI
故障恢复 - 数据湖探索 DLI

故障恢复系统级故障恢复 DLI系统采用存算分离的架构，计算集群基于K8s资源调度和故障切换机制，在系统故障时，支持自动故障恢复。作业级故障恢复 Flink、Spark作业支持配置自动重启恢复机制，在开启自动重启功能后，当作业出现异常时将自动重启恢复作业。父主题：安全

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
开启Flink作业动态扩缩容 - 数据湖探索 DLI

在实际作业运行中，由于作业的数据流量变化，导致所需计算资源不同，造成流量较小时计算资源浪费，流量较大时计算资源不足以满足计算所需。 DLI提供的动态扩缩容功能可以根据当前作业的负载情况，例如：数据输入输出量、数据输入输出速率、反压等情况，动态的调整当前作业所用的计算资源，提升资源利用率。开启Fl

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
Spark 2.4.5版本说明 - 数据湖探索 DLI

Spark 2.4.5版本说明数据湖探索（DLI）遵循开源Spark计算引擎的发布一致性。本文介绍Spark 2.4.5版本所做的变更说明。更多Spark 2.4.5版本说明请参考Spark Release Notes。 Spark 2.4.5版本发布时间版本名称发布时间

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
弹性资源池计费 - 数据湖探索 DLI

配置费用示例根据所选配置包括弹性资源池CU范围，购买时长计算配置费用。包年/包月：根据所选配置，弹性资源池CU范围和购买时长计算配置费用。按需计费：根据所选配置，弹性资源池CU范围计算配置费用。计费示例价格仅供参考，实际计算请以DLI产品价格详情中的价格为准。样例1：包年/包月弹性资源池场景

 帮助中心 > 数据湖探索 DLI > 计费说明
Spark 3.3.1版本说明 - 数据湖探索 DLI

Spark 3.3.1版本说明数据湖探索（DLI）遵循开源Spark计算引擎的发布一致性。本文介绍Spark 3.3.1版本所做的变更说明。更多Spark 3.3.1版本说明请参考Spark Release Notes。 Spark 3.3.1版本发布时间版本名称发布时间

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
avg - 数据湖探索 DLI
avg - 数据湖探索 DLI

如果col值为NULL时，该列不参与计算。示例代码计算所有仓库的平均商品数（items）。命令示例如下： select avg(items) from warehouse; 返回结果如下： _c0 100.0 与group by配合使用，计算每个仓库中所有商品的平均库存。命令示例如下：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
Flink作业推荐配置指导 - 数据湖探索 DLI

6，则计算单元为8CU。如果不手动配置TaskManager资源，则单TM所占CU数默认为1，单TM slot数显示值为0，但实际上，单TM slot数值依据上述公式计算结果为2。如果手动配置TaskManager资源，请依据上述公式计算配置，建议作业最大并行数为计算单元2倍为宜。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
产品规格 - 数据湖探索 DLI
产品规格 - 数据湖探索 DLI

弹性资源池为DLI作业运行提供所需的计算资源（CPU和内存）。弹性资源池的单位为CU，1CU包含1CPU和4GB内存。您可以在弹性资源池中创建多个队列，队列之间的计算资源支持共享。通过合理设置队列的计算资源池分配策略，提高计算资源利用率。 DLI提供以下规格的计算资源，如表1所示。表1

帮助中心 > 数据湖探索 DLI > 产品介绍
Hudi表索引设计规范 - 数据湖探索 DLI

Bucket索引：在写入数据过程中，通过主键进行Hash计算，将数据进行分桶写入；该索引写入速度最快，但是需要合理配置分桶数目；Flink、Spark均支持该索引写入。状态索引：Flink引擎独有索引，是将行记录的存储位置记录到状态后端的一种索引形式，在作业冷启动过程中会遍历所有数据存储文件生成索引信息。用Fli

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范

总条数： 642

上一页
1
2
3
4
5
...
33
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

DLI计算引擎版本生命周期 - 数据湖探索 DLI

CREATE TABLE语句 - 数据湖探索 DLI

CREATE TABLE语句 - 数据湖探索 DLI

CREATE TABLE语句 - 数据湖探索 DLI

DLI弹性资源池与队列简介 - 数据湖探索 DLI

怎样查看弹性资源池和作业的资源使用情况？ - 数据湖探索 DLI

怎样升级DLI作业的引擎版本 - 数据湖探索 DLI

应用场景 - 数据湖探索 DLI

创建弹性资源池并添加队列 - 数据湖探索 DLI

分组聚合 - 数据湖探索 DLI

故障恢复 - 数据湖探索 DLI

开启Flink作业动态扩缩容 - 数据湖探索 DLI

Spark 2.4.5版本说明 - 数据湖探索 DLI

弹性资源池计费 - 数据湖探索 DLI

Spark 3.3.1版本说明 - 数据湖探索 DLI

avg - 数据湖探索 DLI

Flink作业推荐配置指导 - 数据湖探索 DLI

产品规格 - 数据湖探索 DLI

Hudi表索引设计规范 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线