搜索_华为云

Python SDK概述 - 数据湖探索 DLI
Python SDK概述 - 数据湖探索 DLI

SDK让您无需关心请求细节即可快速使用数据湖探索服务。本节操作介绍如何在Python环境获取并使用SDK。使用须知要使用DLI Python SDK访问指定服务的 API ，您需要确认已在DLI管理控制台开通当前服务并完成服务授权。 Python版本建议使用2.7.10和3.4.0以上版本，需要配置Visual

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
first - 数据湖探索 DLI
first - 数据湖探索 DLI

first_value函数用于取当前行所对应窗口的第一条数据的值。使用限制窗口函数的使用限制如下：窗口函数只能出现在select语句中。窗口函数中不能嵌套使用窗口函数和聚合函数。窗口函数不能和同级别的聚合函数一起使用。命令格式 first_value(<expr>[, <ignore_nulls>])

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
lead - 数据湖探索 DLI
lead - 数据湖探索 DLI

lead lead函数用于用于统计窗口内往下第n行值。使用限制窗口函数的使用限制如下：窗口函数只能出现在select语句中。窗口函数中不能嵌套使用窗口函数和聚合函数。窗口函数不能和同级别的聚合函数一起使用。命令格式 lead(<expr>[, bigint <offset>[

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
last - 数据湖探索 DLI
last - 数据湖探索 DLI

last_value函数用于取当前行所对应窗口的最后一条数据的值。使用限制窗口函数的使用限制如下：窗口函数只能出现在select语句中。窗口函数中不能嵌套使用窗口函数和聚合函数。窗口函数不能和同级别的聚合函数一起使用。命令格式 last_value(<expr>[, <ignore_nulls>])

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
关联OBS桶中嵌套的JSON格式数据如何创建表 - 数据湖探索 DLI

如果需要关联OBS桶中嵌套的JSON格式数据，可以使用异步模式创建表。以下是一个示例的建表语句，展示了如何使用 JSON 格式选项来指定 OBS 中的路径： create table tb1 using json options(path 'obs://....') using json：指定使用 JSON 格式。

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
停止计费 - 数据湖探索 DLI
停止计费 - 数据湖探索 DLI

的弹性资源池、包年/包月的队列等，用户在购买时会一次性付费，服务将在到期后自动停止使用。如果在计费周期内不再使用包年/包月资源，您可以执行退订操作，系统将根据资源是否属于五天无理由退订、是否使用代金券和折扣券等条件返还一定金额到您的账户。详细的退订规则请参见云服务退订规则概览。

帮助中心 > 数据湖探索 DLI > 计费说明
lag - 数据湖探索 DLI
lag - 数据湖探索 DLI

lag lag函数用于用于统计窗口内往上第n行值。使用限制窗口函数的使用限制如下：窗口函数只能出现在select语句中。窗口函数中不能嵌套使用窗口函数和聚合函数。窗口函数不能和同级别的聚合函数一起使用。命令格式 lag(<expr>[, bigint <offset>[

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
Spark 2.4.5版本说明 - 数据湖探索 DLI

更多版本新特性请参考Release Notes - Spark 2.4.5。表1 Spark 2.4.5版本优势特性说明支持配置小文件合并使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。参考如何合并小文件完成合并小文件。

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
分组聚合 - 数据湖探索 DLI
分组聚合 - 数据湖探索 DLI

窗口不会产生状态过大的问题。可以提供一个合适的状态 time-to-live (TTL) 配置来防止状态过大。注意：这可能会影响查询结果的正确性。更多介绍和使用请参考开源社区文档：分组聚合。 DISTINCT 聚合 DISTINCT 聚合在聚合函数前去掉重复的数据。下面的示例计算 Orders 表中不同

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
创建函数 - 数据湖探索 DLI
创建函数 - 数据湖探索 DLI

创建函数功能描述 DLI支持创建使用UDF和UDTF等自定义函数应用于Spark作业开发当中。具体使用自定义函数端到端的开发指导可以参考：Spark SQL作业使用UDF和Spark SQL作业使用UDTF。语法格式 1 2 3 4 5 CREATE FUNCTION [db_name

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 自定义函数
窗口函数 - 数据湖探索 DLI
窗口函数 - 数据湖探索 DLI

function, 缩写TVF）把表的数据划分到窗口中：滚动窗口滑动窗口累积窗口逻辑上，每个元素可以应用于一个或多个窗口，这取决于所使用的窗口表值函数的类型。例如：滑动窗口可以把单个元素分配给多个窗口。窗口表值函数是 Flink 定义的多态表函数（Polymorphic

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
cume - 数据湖探索 DLI
cume - 数据湖探索 DLI

当于求分区中大于等于或小于等于当前行的数据在分区中的占比。使用限制窗口函数的使用限制如下：窗口函数只能出现在select语句中。窗口函数中不能嵌套使用窗口函数和聚合函数。窗口函数不能和同级别的聚合函数一起使用。命令格式 cume_dist() over([partition_clause]

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
max - 数据湖探索 DLI
max - 数据湖探索 DLI

max(items) from warehouse; 返回结果如下： _c0 900 与group by配合使用，求每个仓库的最高库存。命令示例如下： select warehourseId, max(items) from warehouse group

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
窗口函数 - 数据湖探索 DLI
窗口函数 - 数据湖探索 DLI

窗口函数窗口函数跨查询结果的行执行计算。它们在HAVING子句之后但在ORDER BY子句之前运行。调用窗口函数需要使用OVER子句来指定窗口的特殊语法。窗口具有三个组成部分：分区规范，它将输入行分为不同的分区。这类似于GROUP BY子句如何将行分为聚合函数的不同组。排序

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
如何在一个Flink作业中将数据写入到不同的Elasticsearch集群中？ - 数据湖探索 DLI

如何在一个Flink作业中将数据写入到不同的Elasticsearch集群中？在Flink 作业中，可以使用CREATE语句来定义Source表和Sink表，并指定它们的连接器类型以及相关的属性。如果需要将数据写入到不同的Elasticsearch集群，您需要为每个集群配置不

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
类型转换函数 - 数据湖探索 DLI

cast(content as date) FROM T1; 结果： "2018-01-01" Flink作业不支持使用CAST将“BIGINT”转换为“TIMESTAMP”，可以使用to_timestamp进行转换。详细样例代码 /** source **/ CREATE TABLE car_infos

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数 > 内置函数
删除数据库 - 数据湖探索 DLI
删除数据库 - 数据湖探索 DLI

[RESTRICT|CASCADE]; 关键字 IF EXISTS：所需删除的数据库不存在时使用，可避免系统报错。注意事项 DATABASE与SCHEMA两者没有区别，可替换使用，建议使用DATABASE。 RESTRICT表示如果该database不为空（有表存在），DROP操

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据库相关
min - 数据湖探索 DLI
min - 数据湖探索 DLI

min(items) from warehouse; 返回结果如下： _c0 600 与group by配合使用，求每个仓库的最低库存。命令示例如下： select warehourseId, min(items) from warehouse group

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
Python开发环境配置 - 数据湖探索 DLI

Python开发环境配置操作场景在安装和使用Python SDK前，确保您已经完成开发环境的基本配置。 Python版本建议使用2.7.10和3.4.0以上版本，需要配置Visual C++编译环境Visual C++ build tools 或者 Visual Studio。

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
Spark 3.3.1版本说明 - 数据湖探索 DLI

动态Executor shuffle数据优化提升资源扩缩容的稳定性，当shuffle文件不需要时清理Executor。支持配置小文件合并使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。参考如何合并小文件完成合并小文件。

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告

总条数： 1067

上一页
1
...
12
13
14
...
54
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Python SDK概述 - 数据湖探索 DLI

first - 数据湖探索 DLI

lead - 数据湖探索 DLI

last - 数据湖探索 DLI

关联OBS桶中嵌套的JSON格式数据如何创建表 - 数据湖探索 DLI

停止计费 - 数据湖探索 DLI

lag - 数据湖探索 DLI

Spark 2.4.5版本说明 - 数据湖探索 DLI

分组聚合 - 数据湖探索 DLI

创建函数 - 数据湖探索 DLI

窗口函数 - 数据湖探索 DLI

cume - 数据湖探索 DLI

max - 数据湖探索 DLI

窗口函数 - 数据湖探索 DLI

如何在一个Flink作业中将数据写入到不同的Elasticsearch集群中？ - 数据湖探索 DLI

类型转换函数 - 数据湖探索 DLI

删除数据库 - 数据湖探索 DLI

min - 数据湖探索 DLI

Python开发环境配置 - 数据湖探索 DLI

Spark 3.3.1版本说明 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线