搜索_华为云

终端节点 - 数据湖探索 DLI
终端节点 - 数据湖探索 DLI

终端节点终端节点（Endpoint）即调用API的请求地址，不同服务不同区域的终端节点不同，您可以从地区和终端节点中查询所有服务的终端节点。数据湖探索的终端节点如下表所示，请您根据业务需要选择对应区域的终端节点。表1 数据湖探索的终端节点区域名称区域终端节点（Endpoint）

帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读
DLI计算引擎版本生命周期 - 数据湖探索 DLI

DLI计算引擎版本生命周期版本号说明 DLI计算引擎版本号：格式为计算引擎名称 x.y.z，其中计算引擎分为Flink和Spark，版本号具体含义如图1所示。图1 DLI计算引擎版本号版本支持情况 Flink计算引擎推荐版本：Flink 1.15。 Spark计算引擎推荐版本：

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
计费概述 - 数据湖探索 DLI
计费概述 - 数据湖探索 DLI

DLI的计费项包括计算计费、存储计费、扫描量计费。DLI的计费详情请参见DLI产品价格详情。您可以通过DLI提供的价格计算器，快速计算出购买资源的参考价格。表1 DLI计费项计费项说明计算计费支持三种计费模式：按照包年/包月的订购周期计费根据计算资源使用量（CU时）按需计费。

帮助中心 > 数据湖探索 DLI > 计费说明
计费样例 - 数据湖探索 DLI
计费样例 - 数据湖探索 DLI

此案例中的单价仅为示例，且计算出的费用为估算值。单价的变动和实际场景中计算出来的费用可能会有偏差。请以华为云官网发布的数据为准。计费模式计算规则付费周期费用计算按需计费（专属）计算费用：计算费用=单价*CU数*小时数 1个月计算费用：0.4（弹性资源池计算单价：元/时） x

帮助中心 > 数据湖探索 DLI > 计费说明
执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？什么是数据倾斜？数据倾斜是在SQL作业执行中常见的问题，当数据分布不均匀的情况下，一部分计算节点处理的数据量远大于其他节点，从而影响整个计算过程的处理效率。例如观察到SQL执行时间较长，进入SparkUI查看对应SQL的执行状态，如图1所示，查看到一个

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
DLI弹性资源池与队列简介 - 数据湖探索 DLI

DLI计算资源模式 DLI提供了三种计算资源的管理模式，每一种模式都有独特的优势和适用场景。图1 DLI计算资源模式弹性资源池模式：计算资源的池化管理模式，提供计算资源的动态扩缩容能力，同一弹性资源池中的队列共享计算资源。通过合理设置队列的计算资源分配策略，可以提高计算资源利用率，应对业务高峰期的资源需求。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
怎样查看弹性资源池和作业的资源使用情况？ - 数据湖探索 DLI

怎样查看弹性资源池和作业的资源使用情况？在大数据分析的日常工作中，合理分配和管理计算资源，可以提供良好的作业执行环境。您可以根据作业的计算需求和数据规模分配资源、调整任务执行顺序，调度不同的弹性资源池或队列资源以适应不同的工作负载。待提交作业所需的CUs需小于等于弹性资源池的

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI弹性资源池和队列类
创建弹性资源池并添加队列 - 数据湖探索 DLI

弹性资源池为DLI作业运行提供所需的计算资源（CPU和内存），用于灵活应对业务对计算资源变化的需求。创建弹性资源池后，您可以在弹性资源池中创建多个队列，队列关联到具体的作业和数据处理任务，是资源池中资源被实际使用和分配的基本单元，即队列是执行作业所需的具体的计算资源。同一弹性资源池中，队列之间的计算资源支持共享。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
产品规格 - 数据湖探索 DLI
产品规格 - 数据湖探索 DLI

弹性资源池产品规格弹性资源池为DLI作业运行提供所需的计算资源（CPU和内存）。弹性资源池的单位为CU，1CU包含1CPU和4GB内存。您可以在弹性资源池中创建多个队列，队列之间的计算资源支持共享。通过合理设置队列的计算资源池分配策略，提高计算资源利用率。 DLI弹性资源池之间为物理集

 帮助中心 > 数据湖探索 DLI > 产品介绍
故障恢复 - 数据湖探索 DLI
故障恢复 - 数据湖探索 DLI

故障恢复系统级故障恢复 DLI系统采用存算分离的架构，计算集群基于K8s资源调度和故障切换机制，在系统故障时，支持自动故障恢复。作业级故障恢复 Flink、Spark作业支持配置自动重启恢复机制，在开启自动重启功能后，当作业出现异常时将自动重启恢复作业。父主题：安全

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
开启Flink作业动态扩缩容 - 数据湖探索 DLI

在实际作业运行中，由于作业的数据流量变化，导致所需计算资源不同，造成流量较小时计算资源浪费，流量较大时计算资源不足以满足计算所需。 DLI提供的动态扩缩容功能可以根据当前作业的负载情况，例如：数据输入输出量、数据输入输出速率、反压等情况，动态的调整当前作业所用的计算资源，提升资源利用率。开启Fl

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
聚合函数 - 数据湖探索 DLI
聚合函数 - 数据湖探索 DLI

聚合函数聚合函数是从一组输入值计算一个结果。例如使用COUNT函数计算SQL查询语句返回的记录行数。聚合函数如表1所示。表1 聚合函数表函数返回值类型描述 COUNT([ ALL ] expression | DISTINCT expression1 [, expression2]*)

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数 > 内置函数
聚合函数 - 数据湖探索 DLI
聚合函数 - 数据湖探索 DLI

聚合函数聚合函数是从一组输入值计算一个结果。例如使用COUNT函数计算SQL查询语句返回的记录行数。聚合函数如表1所示。表1 聚合函数表函数返回值类型描述 COUNT([ ALL ] expression | DISTINCT expression1 [, expression2]*)

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数 > 内置函数
怎样升级DLI作业的引擎版本 - 数据湖探索 DLI

怎样升级DLI作业的引擎版本 DLI提供了Spark和Flink计算引擎，为用户提供了一站式的流处理、批处理、交互式分析的Serverless融合处理分析服务，当前，Flink计算引擎推荐版本：Flink 1.15，Spark计算引擎推荐版本： Spark 3.3.1。本节操作介绍如何升级作业的引擎版本。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
产品优势 - 数据湖探索 DLI
产品优势 - 数据湖探索 DLI

可视化智能调优界面。学习成本高，需要了解上百个调优参数。支持数据源云上：OBS、RDS、DWS、CSS、MongoDB、Redis。云下：自建数据库、MongoDB、Redis。云上：OBS。云下：HDFS。生态兼容 DLV、永洪BI、帆软。大数据生态工具。自定义镜像

 帮助中心 > 数据湖探索 DLI > 产品介绍
分组聚合 - 数据湖探索 DLI
分组聚合 - 数据湖探索 DLI

分组聚合聚合函数把多行输入数据计算为一行结果。例如，有一些聚合函数可以计算一组行的 “COUNT”、“SUM”、“AVG”（平均）、“MAX”（最大）和 “MIN”（最小）。对于流式查询，用于计算查询结果的状态可能无限膨胀。状态的大小大多数情况下取决于去重行的数量和分组持续的时间，持续时间较短的

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
avg - 数据湖探索 DLI
avg - 数据湖探索 DLI

如果col值为NULL时，该列不参与计算。示例代码计算所有仓库的平均商品数（items）。命令示例如下： select avg(items) from warehouse; 返回结果如下： _c0 100.0 与group by配合使用，计算每个仓库中所有商品的平均库存。命令示例如下：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
e - 数据湖探索 DLI
e - 数据湖探索 DLI

e e函数用于计算返回e的值。命令格式 e() 返回值说明返回DOUBLE类型的值。示例代码返回2.718281828459045。 select e(); 父主题：数学函数

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 数学函数
sum - 数据湖探索 DLI
sum - 数据湖探索 DLI

如果输入为STRING类型，会隐式转换为DOUBLE类型后参与运算。返回值说明返回DOUBLE类型的值。如果col值为NULL时，该行不参与计算。示例代码计算所有仓库的商品（items）总和。命令示例如下： select sum(items) from warehouse; 返回结果如下：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
count - 数据湖探索 DLI
count - 数据湖探索 DLI

表示在计数时是否去除重复记录，默认为all，即计算全部记录。如果指定distinct，则只计算唯一值数量。 colname 是列值可以为任意类型。 colname可以为*，即count(*)，返回所有行数。返回值说明返回BIGINT类型。 colname值为NULL时，该行不参与计算。示例代码计算所有仓库表中的记录数。命令示例如下：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数

总条数： 708

上一页
1
2
3
4
5
...
36
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

终端节点 - 数据湖探索 DLI

DLI计算引擎版本生命周期 - 数据湖探索 DLI

计费概述 - 数据湖探索 DLI

计费样例 - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

DLI弹性资源池与队列简介 - 数据湖探索 DLI

怎样查看弹性资源池和作业的资源使用情况？ - 数据湖探索 DLI

创建弹性资源池并添加队列 - 数据湖探索 DLI

产品规格 - 数据湖探索 DLI

故障恢复 - 数据湖探索 DLI

开启Flink作业动态扩缩容 - 数据湖探索 DLI

聚合函数 - 数据湖探索 DLI

聚合函数 - 数据湖探索 DLI

怎样升级DLI作业的引擎版本 - 数据湖探索 DLI

产品优势 - 数据湖探索 DLI

分组聚合 - 数据湖探索 DLI

avg - 数据湖探索 DLI

e - 数据湖探索 DLI

sum - 数据湖探索 DLI

count - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线