搜索_华为云

已购买套餐包，为什么仍然产生按需计费？ - 数据湖探索 DLI

说明适用场景重置规则扫描数据量套餐包按照用户每个作业的数据扫描量（单位为“GB”）收取计算费用。仅适用于default 队列。扫描数据量套餐的额度按订购周期会重置。弹性资源池CU时套餐包按照“CU时”收取计算费用，用户在弹性资源池添加的队列上运行作业时按照弹性资源池CU时计费。

帮助中心 > 数据湖探索 DLI > 计费说明 > 计费相关问题
窗口Top-N - 数据湖探索 DLI
窗口Top-N - 数据湖探索 DLI

与普通Top-N不同，窗口Top-N只在窗口最后返回汇总的Top-N数据，不会产生中间结果。窗口 Top-N 会在窗口结束后清除不需要的中间状态。窗口 Top-N 适用于用户不需要每条数据都更新Top-N结果的场景，相对普通Top-N来说性能更好。通常，窗口 Top-N 直接用于窗口表值函数（Windowing

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
查看Delta表历史操作记录 - 数据湖探索 DLI

指标名称指标含义 version 对表操作的版本号 timestamp 当前版本操作的时间戳 userId 当前版本操作的用户id userName 当前版本操作的用户名 operation 操作名称（WRITE|CREATE TABLE|UPDATE|DELETE|MERGE|RESTORE等）

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta Time Travel
上传pyfile类型分组资源（废弃） - 数据湖探索 DLI

module_name 否 String 资源模块名 module_type 否 String 资源模块类型。 jar：用户jar文件; pyFile：用户python文件; file：用户文件。表4 details参数说明参数名称是否必选参数类型说明 create_time 否 Long

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
创建并提交Spark作业 - 数据湖探索 DLI

创建并提交Spark作业场景描述本章节指导用户通过API创建并提交Spark作业。约束限制新队列第一次运行作业时，需要一定的时间，通常为6~10分钟。涉及接口创建弹性资源池：创建弹性资源池。创建队列：在弹性资源池中添加队列。上传分组资源：上传Spark作业所需的资源包。

帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
创建并提交Flink作业 - 数据湖探索 DLI

创建并提交Flink作业场景描述本章节指导用户通过API创建并运行Flink自定义作业。约束限制新队列第一次运行作业时，需要一定的时间，通常为6~10分钟。涉及接口创建弹性资源池：创建弹性资源池。创建队列：在弹性资源池中添加队列。上传分组资源：上传Flink自定义作业所需的资源包。

帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
计费样例 - 数据湖探索 DLI
计费样例 - 数据湖探索 DLI

计费样例计费场景某公司用户A申请了256CUs的弹性资源池，并将1TB数据存放在DLI表中。该公司想要了解采用哪种计费模式才是性价比最优的方式。数据湖探索服务目前支持三种作业：SQL作业，Flink作业和Spark作业。SQL作业的计费包括存储计费和计算计费，Flink作业和Spark作业的计费只有计算计费。

帮助中心 > 数据湖探索 DLI > 计费说明
显示所有函数 - 数据湖探索 DLI

注意事项显示与给定正则表达式或函数名匹配的函数。如果未提供正则表达式或名称，则显示所有函数。如果声明了USER或SYSTEM，那么将分别显示用户定义的Spark SQL函数和系统定义的Spark SQL函数。示例查看当前的所有函数。 1 SHOW FUNCTIONS; 父主题：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 自定义函数
上传分组资源（废弃） - 数据湖探索 DLI

Array of Strings 用户OBS对象路径列表，OBS对象路径为OBS对象URL。 kind 是 String 分组资源文件的类型。 jar：用户jar文件。 pyFile：用户python文件。 file：用户文件。 modelFile：用户AI模型文件。说明：上传的

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
包年/包月计费模式的DLI资源可以和按需计费模式相互转换吗？ - 数据湖探索 DLI

优惠。自建队列购买方式如下：购买队列请参考创建队列。弹性资源池购买方式如下：具体弹性资源池的购买和添加队列操作可以参考《数据湖探索用户指南》中的“创建弹性资源池”和“弹性资源池添加队列”相关章节。父主题：计费相关问题

 帮助中心 > 数据湖探索 DLI > 计费说明 > 计费相关问题
字符码不一致导致数据乱码怎么办？ - 数据湖探索 DLI

在DLI执行作业时，为了避免因字符编码不一致导致的乱码问题，建议您统一数据源的编码格式。 DLI服务只支持UTF-8文本格式，因此在执行创建表和导入操作时，用户的数据需要以UTF-8编码。在将数据导入DLI之前，确保源数据文件（如CSV、JSON等）是以UTF-8编码保存的。如果数据源不是UTF

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
窗口去重 - 数据湖探索 DLI
窗口去重 - 数据湖探索 DLI

据。对于流式查询，与普通去重不同，窗口去重只在窗口的最后返回结果数据，不会产生中间结果。它会清除不需要的中间状态。因此，窗口去重查询在用户不需要更新结果时，性能较好。通常，窗口去重直接用于窗口表值函数上。另外，它可以用于基于窗口表值函数的操作。比如窗口聚合，窗口TopN和窗口关联。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
查询队列详情 - 数据湖探索 DLI

开通了企业管理服务的用户可设置该参数绑定指定的项目。 resource_type 否 String 资源类型。 vm：ecf集群 container：容器化集群（k8s） cu_spec 否 Integer 队列的规格大小。对于包周期队列，表示包周期部分的CU值；对于按需队列，表示用户购买队列时的初始值。

帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
Avro Format - 数据湖探索 DLI
Avro Format - 数据湖探索 DLI

"user_name":"Alice","area_id":"330106"} 按照如下方式查看taskmanager.out文件中的数据结果：登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
聚合函数 - 数据湖探索 DLI
聚合函数 - 数据湖探索 DLI

LAST_VALUE(expression) 返回一组有序值中的最后一个值。 LISTAGG(expression [, separator]) 连接字符串表达式的值并在它们之间放置分隔符值。字符串末尾不添加分隔符时则分隔符的默认值为“,”。父主题：内置函数

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
CSV Format - 数据湖探索 DLI
CSV Format - 数据湖探索 DLI

2021-03-24 16:10:06,0001,Alice,330106 按照如下方式查看taskmanager.out文件中的数据结果：登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
为什么Spark jar 作业一直处于“提交中”？ - 数据湖探索 DLI

数据探索湖 > 队列监控 > 队列CU使用量” 。计算剩余CU量。队列剩余CU量=队列CU量 - 队列CU使用量。当队列剩余CU量小于用户提交的CU量，则需要等待资源，才能提交成功。父主题： Spark作业开发类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
parse - 数据湖探索 DLI
parse - 数据湖探索 DLI

keyToExtract]) 参数说明表1 参数说明参数是否必选参数类型说明 urlString 是 STRING URL链接。无效URL链接会返回报错。 partToExtract 是 STRING 取值包含：HOST、PATH、QUERY、REF、PROTOCOL、A

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
查询所有全局变量 - 数据湖探索 DLI

String 全局变量值。 project_id 否 String 项目ID。 user_id 否 String 用户ID。 user_name 否 String 用户名。 is_sensitive 否 Boolean 是否设置为敏感变量。 create_time 否 Long 创建时间。

帮助中心 > 数据湖探索 DLI > API参考 > 全局变量相关API
查询所有队列 - 数据湖探索 DLI

enterprise_project_id 否 String 企业项目ID。0”表示default，即默认的企业项目。关于如何设置企业项目请参考《企业管理用户指南》。说明：开通了企业管理服务的用户可设置该参数绑定指定的项目。 cidr_in_vpc 否 String 队列的虚拟私有云（VPC）的网段。例如：10.0

帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）

总条数： 1024

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

已购买套餐包，为什么仍然产生按需计费？ - 数据湖探索 DLI

窗口Top-N - 数据湖探索 DLI

查看Delta表历史操作记录 - 数据湖探索 DLI

上传pyfile类型分组资源（废弃） - 数据湖探索 DLI

创建并提交Spark作业 - 数据湖探索 DLI

创建并提交Flink作业 - 数据湖探索 DLI

计费样例 - 数据湖探索 DLI

显示所有函数 - 数据湖探索 DLI

上传分组资源（废弃） - 数据湖探索 DLI

包年/包月计费模式的DLI资源可以和按需计费模式相互转换吗？ - 数据湖探索 DLI

字符码不一致导致数据乱码怎么办？ - 数据湖探索 DLI

窗口去重 - 数据湖探索 DLI

查询队列详情 - 数据湖探索 DLI

Avro Format - 数据湖探索 DLI

聚合函数 - 数据湖探索 DLI

CSV Format - 数据湖探索 DLI

为什么Spark jar 作业一直处于“提交中”？ - 数据湖探索 DLI

parse - 数据湖探索 DLI

查询所有全局变量 - 数据湖探索 DLI

查询所有队列 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线