搜索_华为云

rank - 数据湖探索 DLI
rank - 数据湖探索 DLI

名序列中留出空位。使用限制窗口函数的使用限制如下：窗口函数只能出现在select语句中。窗口函数中不能嵌套使用窗口函数和聚合函数。窗口函数不能和同级别的聚合函数一起使用。命令格式 rank() over ([partition_clause] [orderby_clause])

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
创建函数 - 数据湖探索 DLI
创建函数 - 数据湖探索 DLI

创建函数功能描述 DLI支持创建使用UDF和UDTF等自定义函数应用于Spark作业开发当中。具体使用自定义函数端到端的开发指导可以参考：Spark SQL作业使用UDF和Spark SQL作业使用UDTF。语法格式 1 2 3 4 5 CREATE FUNCTION [db_name

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 自定义函数
删除分区 - 数据湖探索 DLI
删除分区 - 数据湖探索 DLI

删除分区功能描述本节操作介绍删除分区表的一个或多个分区。分区表分为两种，OBS表和DLI表。在删除分区时，DLI表和OBS表都支持利用指定条件删除分区表的一个或多个分区。OBS表还支持按指定筛选条件删除分区。注意事项所要删除分区的表必须是已经存在的表，否则会出错。所要

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
使用DataSource语法创建OBS表 - 数据湖探索 DLI

db_name 否 Database名称。由字母、数字和下划线（_）组成。不能是纯数字，且不能以数字和下划线开头。 table_name 是 Database中的待创建的表名。由字母、数字和下划线（_）组成。不能是纯数字，且不能以数字和下划线开头。匹配规则为：^(?!_)(?![0-

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
Spark作业使用咨询 - 数据湖探索 DLI

SQL语法创建表时是否支持定义主键 Spark SQL语法不支持定义主键。 DLI Spark jar作业是否能访问DWS跨源表？可以访问。详细操作请参考访问DWS和访问SQL库表。如何查看Spark内置依赖包的版本？ DLI内置依赖包是平台默认提供的依赖包，用户打包Spark或Flink jar作业j

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
parse - 数据湖探索 DLI
parse - 数据湖探索 DLI

部分，partToExtract的有效值包括HOST，PATH， QUERY， REF， PROTOCOL， AUTHORITY，FILE和USERINFO。例如：parse_url('http://facebook.com/path1/p.php?k1=v1&k2=v2#Ref1'

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

后续章节操作都需要在testdb数据库下进行操作。 DataSource和Hive两种语法创建OBS表的区别 DataSource语法和Hive语法主要区别在于支持的表数据存储格式范围、支持的分区数等有差异。两种语法创建OBS表主要差异点参见表1。表1 DataSource语法和Hive语法创建OBS表的差异点语法

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
Python SDK概述 - 数据湖探索 DLI
Python SDK概述 - 数据湖探索 DLI

Python SDK访问指定服务的 API ，您需要确认已在DLI管理控制台开通当前服务并完成服务授权。 Python版本建议使用2.7.10和3.4.0以上版本，需要配置Visual C++编译环境Visual C++ build tools 或者 Visual Studio。关

 帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
Hudi Clustering操作说明 - 数据湖探索 DLI

Hudi通过其写入客户端API提供了不同的操作，如insert/upsert/bulk_insert来将数据写入Hudi表。为了能够在文件大小和入湖速度之间进行权衡，Hudi提供了一个hoodie.parquet.small.file.limit配置来设置最小文件大小。用户可以将该配

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
JOINS - 数据湖探索 DLI
JOINS - 数据湖探索 DLI

JOIN、INNER JOIN、OUTER JOIN（LEFT JOIN、RIGHT JOIN、FULL JOIN）、SEMIN JOIN和ANTI JOIN。 CROSS JOIN CROSS JOIN返回两个关系的笛卡尔积。可以使用CROSS JOIN语法指定，也可以在FROM子句中指定多个relation。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
使用DLI提交Flink OpenSource SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

0/16，单击“确定”完成安全组规则添加。创建DLI队列连接RDS的增强型跨源连接。如果RDS和Kafka在同一VPC和子网，则无需重复执行此步骤，在步骤2中创建的增强型跨源连接已将网络打通。如果Kafka和RDS实例分别在两个VPC和子网下，则要执行以下步骤创建DLI队列连接RDS的增强型跨源连接。

帮助中心 > 数据湖探索 DLI > 快速入门
Upsert Kafka结果表 - 数据湖探索 DLI

Kafka中。 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。前提条件 Kafka是线下集群，需要通过增强型跨源连接功能将Flink作业与Kafka进行对接

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
Kafka结果表 - 数据湖探索 DLI
Kafka结果表 - 数据湖探索 DLI

DLI将Flink作业的输出数据输出到Kafka中。 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。前提条件 Kafka是线下集群，需要通过增强型跨源连接功能将Flink作业与Kafka进行对接

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
创建SQL作业模板 - 数据湖探索 DLI

创建SQL作业模板创建模板的操作入口有两个，分别在“作业模板”和“SQL编辑器”页面。在“作业模板”页面创建模板。在管理控制台左侧，单击“作业模板”>“SQL模板”。在“SQL模板”页面，单击右上角“创建模板”。输入模板名称、语句和描述信息，详细参数介绍请参见表1。图1 创建模板表1

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
数学运算函数 - 数据湖探索 DLI

常用的逻辑操作符有AND、OR和NOT，优先级顺序为：NOT>AND>OR。运算规则请参见表2，表中的A和B代表逻辑表达式。表2 逻辑运算符运算符返回类型描述 A OR B BOOLEAN 若A或B为TRUE，则返回TRUE，且支持三值逻辑。 A AND B BOOLEAN 若A和B为TRUE，则返回TRUE，且支持三值逻辑。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数 > 内置函数
数学运算函数 - 数据湖探索 DLI

常用的逻辑操作符有AND、OR和NOT，优先级顺序为：NOT>AND>OR。运算规则请参见表2，表中的A和B代表逻辑表达式。表2 逻辑运算符运算符返回类型描述 A OR B BOOLEAN 若A或B为TRUE，则返回TRUE，且支持三值逻辑。 A AND B BOOLEAN 若A和B为TRUE，则返回TRUE，且支持三值逻辑。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数 > 内置函数
增强型跨源连接绑定弹性资源池 - 数据湖探索 DLI

可以在增强型跨源连接页面绑定弹性资源池。本节的操作指导介绍增强型跨源连接绑定弹性资源池的操作指导。约束限制增强型跨源仅支持包年包月队列和按需专属的弹性资源池/队列。绑定跨源的DLI队列网段和数据源网段不能重合。不支持绑定系统预置的default队列。操作步骤登录DLI管理控制台。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
DLI自定义策略 - 数据湖探索 DLI

服务名为产品名称，例如dli、evs和vpc等，服务名仅支持小写。资源类型和操作没有大小写，要求支持通配符号*，无需罗列全部授权项。资源类型可以参考表4中的资源类型。操作：操作以IAM服务中已经注册的action为准。 Condition 限制条件：使策略生效的特定条件，包括条件键和运算符。条件键表示策略语句的

 帮助中心 > 数据湖探索 DLI > 用户指南 > 权限管理
pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码开发说明支持对接CloudTable的HBase和MRS的HBase。前提条件在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码开发说明支持对接CloudTable的OpenTSDB和MRS的OpenTSDB。前提条件在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接OpenTSDB

总条数： 109

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

rank - 数据湖探索 DLI

创建函数 - 数据湖探索 DLI

删除分区 - 数据湖探索 DLI

使用DataSource语法创建OBS表 - 数据湖探索 DLI

Spark作业使用咨询 - 数据湖探索 DLI

parse - 数据湖探索 DLI

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

Python SDK概述 - 数据湖探索 DLI

Hudi Clustering操作说明 - 数据湖探索 DLI

JOINS - 数据湖探索 DLI

使用DLI提交Flink OpenSource SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

Upsert Kafka结果表 - 数据湖探索 DLI

Kafka结果表 - 数据湖探索 DLI

创建SQL作业模板 - 数据湖探索 DLI

数学运算函数 - 数据湖探索 DLI

数学运算函数 - 数据湖探索 DLI

增强型跨源连接绑定弹性资源池 - 数据湖探索 DLI

DLI自定义策略 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线