搜索_华为云

Spark 3.1.1版本说明 - 数据湖探索 DLI

【SPARK-21492】：修复排序合并加入中的内存泄漏。【SPARK-27812】：K8S客户端版本提升到4.6.1。 DLI从Spark 3.x版本开始不支持内置地理空间查询函数。父主题：版本支持公告

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
lag - 数据湖探索 DLI
lag - 数据湖探索 DLI

<default>]]) over([partition_clause] orderby_clause) 参数说明表1 参数说明参数是否必选说明 expr 是待计算返回结果的表达式。 offset 否偏移量，BIGINT类型常量，取值大于等于0。值为0时表示当前行，为

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
Hudi表索引设计规范 - 数据湖探索 DLI

Flink在写Hudi的MOR表只会生成log文件，后续通过compaction操作，将log文件转为parquet文件。Spark在更新Hudi表时严重依赖parquet文件是否存在，如果当前Hudi表写的是log文件，采用Spark写入就会导致重复数据的产生。在批量初始化阶段，先采用Spark批量写入Hudi表

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
SHOW TABLES - 数据湖探索 DLI
SHOW TABLES - 数据湖探索 DLI

Table ------------- show_table1 show_table2 (2 rows) --同时满足多个条件，查询default中'show_'开头或者'in'开头的表 show tables in default like 'show$_%|in%'

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
字符类型 - 数据湖探索 DLI
字符类型 - 数据湖探索 DLI

binary_tb(col1 BINARY); -- 插入数据 INSERT INTO binary_tb values (X'63683F'); --查询数据 select * from binary_tb ; -- 63 68 3f 在做CHAR 数值比较的时候，在对两个仅尾部空格数不

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 数据类型
使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

properties文件中localFilePath配置的本地路面中。 -s,--skip-upload-resources <all | app | deps> 是否跳过，将jar包、Python程序文件、配置文件上传到OBS和加载到DLI服务端资源列表。当相关资源文件已经加载到DLI服务资源列表中，可以使用该参数跳过该步骤。

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
SDK的获取与安装 - 数据湖探索 DLI

<url>https://repo.huaweicloud.com/repository/maven/</url> </mirror> 增加activeProfiles标签激活配置： <activeProfiles> <activeProfile>MyProfile</activeProfile> </activeProfiles>

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
SparkSQL建表参数规范 - 数据湖探索 DLI

hive_sync.enable指定为false。指定为false将导致新写入的分区无法同步到Hive Metastore中。由于缺失新写入的分区信息，查询引擎读取该时会丢数。禁止指定Hudi的索引类型为INMEMORY类型。该索引仅是为了测试使用。生产环境上使用该索引将导致数据重复。建表示例

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
导入数据 - 数据湖探索 DLI
导入数据 - 数据湖探索 DLI

该行将被视为注释，并且不会被导入。默认值为＃。配置项为OPTIONS('COMMENTCHAR'='#') HEADER：用来表示源文件是否有表头。取值范围为“true”和“false”。“true”表示有表头，“false”表示无表头。默认值为“false”。如果没有表头，可

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
窗口聚合 - 数据湖探索 DLI
窗口聚合 - 数据湖探索 DLI

GROUP BY 子句必须包含 window_start 和 window_end 列，但 ROLLUP 子句中不能包含这两个字段。例如：下面这个查询和上个例子中的效果是一样的。 SELECT window_start, window_end, supplier_id, SUM(price)

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
DLI弹性资源池与队列简介 - 数据湖探索 DLI

任务。购买弹性资源池并在弹性资源池中添加队列的具体操作步骤请参考创建弹性资源池并添加队列。全局共享模式：全局共享模式是一种根据SQL查询中实际扫描的数据量来分配计算资源的模式，不支持指定或预留计算资源。 DLI服务预置的“default”队列即为全局共享模式的计算资源，资源

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
数学运算函数 - 数据湖探索 DLI

(sub-query) BOOLEAN 若子查询至少返回一条数据，则返回TRUE。 value IN (sub-query) BOOLEAN 若值等于子查询返回的某个值，则返回TRUE。 value NOT IN (sub-query) BOOLEAN 若值不等于子查询返回的每个值，则返回TRUE。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数 > 内置函数
数学运算函数 - 数据湖探索 DLI

(sub-query) BOOLEAN 若子查询至少返回一条数据，则返回TRUE。 value IN (sub-query) BOOLEAN 若值等于子查询返回的某个值，则返回TRUE。 value NOT IN (sub-query) BOOLEAN 若值不等于子查询返回的每个值，则返回TRUE。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数 > 内置函数
身份认证与访问控制 - 数据湖探索 DLI

于策略的授权是一种更加灵活的授权方式，能够满足企业对权限最小化的安全管控要求。例如：不允许某用户组删除集群，仅允许DLI基本操作（如创建、查询作业等）。 DLI支持的授权项请参见权限管理概述。如表3-1所示，包括了DLI的所有系统权限。系统角色/策略名称描述类别授权方式

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
时间函数 - 数据湖探索 DLI
时间函数 - 数据湖探索 DLI

条记录进行取值。但在批处理模式下，它在查询开始时计算一次，并对每一行使用相同的结果。 LOCALTIME TIME 返回本地时区的当前 SQL 时间，返回类型为 TIME(0)。在流模式下为每条记录进行取值。但在批处理模式下，它在查询开始时计算一次，并对每一行使用相同的结果。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
使用DLI分析账单消费数据 - 数据湖探索 DLI

'obs://xxx/Spendings(ByTransaction)_20200501_20200531.csv', header true) 查询该时间内消费最高的resource_id, resource_name。通过以下语句，可以发现sql和flink队列使用的费用均为184

帮助中心 > 数据湖探索 DLI > 最佳实践
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

sparkSession.sql("insert into dli_to_dws values(3,'Liu'),(4,'Xie')"); 查询数据 1 sparkSession.sql("select * from dli_to_dws").show(); 插入数据后：提交Spark作业

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
字符串函数概览 - 数据湖探索 DLI

将str按照charset格式进行编码。 find_in_set find_in_set(string <str1>, string <str2>) BIGINT 查找字符串str1在以逗号（,）分隔的字符串str2中的位置，从1开始计数。 get_json_object get_json_object(string

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
获取Spark作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

仅支持获取AK、SK、SecurityToken。获取到AK、SK、SecurityToken后，请参考如何使用凭据管理服务替换硬编码的数据库账号密码查询凭据。约束限制仅支持Spark3.3.1版本（Spark通用队列场景）使用委托授权访问临时凭证：在创建作业时，请配置作业使用Spark3

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

opentsdb_new_test values('Penglai', 'abc', '2021-06-30 18:00:00', 30.0)"); 查询数据 1 sparkSession.sql("select * from opentsdb_new_test").show(); 插入数据后：

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接OpenTSDB

总条数： 1069

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark 3.1.1版本说明 - 数据湖探索 DLI

lag - 数据湖探索 DLI

Hudi表索引设计规范 - 数据湖探索 DLI

SHOW TABLES - 数据湖探索 DLI

字符类型 - 数据湖探索 DLI

使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

SDK的获取与安装 - 数据湖探索 DLI

SparkSQL建表参数规范 - 数据湖探索 DLI

导入数据 - 数据湖探索 DLI

窗口聚合 - 数据湖探索 DLI

DLI弹性资源池与队列简介 - 数据湖探索 DLI

数学运算函数 - 数据湖探索 DLI

数学运算函数 - 数据湖探索 DLI

身份认证与访问控制 - 数据湖探索 DLI

时间函数 - 数据湖探索 DLI

使用DLI分析账单消费数据 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

字符串函数概览 - 数据湖探索 DLI

获取Spark作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线