搜索_华为云

Spark 3.1.1版本说明 - 数据湖探索 DLI

【SPARK-21492】：修复排序合并加入中的内存泄漏。【SPARK-27812】：K8S客户端版本提升到4.6.1。 DLI从Spark 3.x版本开始不支持内置地理空间查询函数。父主题：版本支持公告

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
string_split - 数据湖探索 DLI
string_split - 数据湖探索 DLI

disSource, lateral table(string_split(target, separator)) as T(item); 查看测试结果表3 disSink结果表数据 target（STRING） item（STRING） test-flink test test-flink

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数 > 内置函数 > 表值函数
SHOW TABLES - 数据湖探索 DLI
SHOW TABLES - 数据湖探索 DLI

Table ------------- show_table1 show_table2 (2 rows) --同时满足多个条件，查询default中'show_'开头或者'in'开头的表 show tables in default like 'show$_%|in%'

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
Hive维表 - 数据湖探索 DLI
Hive维表 - 数据湖探索 DLI

SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.15”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。数据类型的使用，请参考Format章节。 Hive 方言支持的 DDL 语句，Flink 1.15 当前仅支持使用Hive语法创建OBS表和使用hive语法的DLI

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
字符类型 - 数据湖探索 DLI
字符类型 - 数据湖探索 DLI

binary_tb(col1 BINARY); -- 插入数据 INSERT INTO binary_tb values (X'63683F'); --查询数据 select * from binary_tb ; -- 63 68 3f 在做CHAR 数值比较的时候，在对两个仅尾部空格数不

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 数据类型
创建DWS维表 - 数据湖探索 DLI
创建DWS维表 - 数据湖探索 DLI

是否必选说明 connector.type 是 connector类型，需配置为'gaussdb' connector.url 是 jdbc连接地址，格式为：jdbc:postgresql://${ip}:${port}/${dbName} 。 connector.table 是读取数据库中的数据所在的表名

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建维表
创建数据库 - 数据湖探索 DLI
创建数据库 - 数据湖探索 DLI

创建数据库功能描述创建数据库。语法格式 1 2 3 CREATE [DATABASE | SCHEMA] [IF NOT EXISTS] db_name [COMMENT db_comment] [WITH DBPROPERTIES (property_name=property_value

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据库相关
本文样例表数据准备 - 数据湖探索 DLI

--插入一条Map类型数据 insert into map_tb values(MAP(ARRAY['foo','bar'],ARRAY[1,2])); --查询数据 select * from map_tb; -- {bar=2, foo=1} --创建ROW表 create table row_tb

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > 附录
SparkSQL建表参数规范 - 数据湖探索 DLI

hive_sync.enable指定为false。指定为false将导致新写入的分区无法同步到Hive Metastore中。由于缺失新写入的分区信息，查询引擎读取该时会丢数。禁止指定Hudi的索引类型为INMEMORY类型。该索引仅是为了测试使用。生产环境上使用该索引将导致数据重复。建表示例

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
Python SDK环境配置 - 数据湖探索 DLI

Python SDK环境配置操作场景在进行二次开发时，要准备的开发环境如表1所示。表1 开发环境准备项说明操作系统 Windows系统，推荐Windows 7及以上版本。安装Python Python版本建议使用2.7.10和3.4.0以上版本，需要配置Visual

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
批量运行作业 - 数据湖探索 DLI

请求参数说明参数名称是否必选参数类型说明 job_ids 是 Array of Long 批量作业ID。作业ID可以通过创建作业接口或者查询作业接口获取。 resume_savepoint 否 Boolean 是否将作业从最近创建的保存点恢复。当“resume_savepoi

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
regexp_replace1 - 数据湖探索 DLI
regexp_replace1 - 数据湖探索 DLI

相似函数：regexp_replace，regexp_replace函数针对不同的Spark版本，功能略有差异，请参考regexp_replace查看详细的功能说明。命令格式 regexp_replace1(string <source>, string <pattern>, string

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
JSON Format - 数据湖探索 DLI
JSON Format - 数据湖探索 DLI

根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性。若能连通，则表示跨源已经绑定成功；否则表示未成功创建flink opensource sql作业，并选择flink版本为1

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
窗口聚合 - 数据湖探索 DLI
窗口聚合 - 数据湖探索 DLI

GROUP BY 子句必须包含 window_start 和 window_end 列，但 ROLLUP 子句中不能包含这两个字段。例如：下面这个查询和上个例子中的效果是一样的。 SELECT window_start, window_end, supplier_id, SUM(price)

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
Kafka源表 - 数据湖探索 DLI
Kafka源表 - 数据湖探索 DLI

'(topic-a|topic-b|topic-[0-9]*)' connector.properties.bootstrap.servers 是 kafka brokers地址，以逗号分隔。 connector.properties.group.id 否消费组名称 connector.startup-mode 否

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
DLI弹性资源池与队列简介 - 数据湖探索 DLI

任务。购买弹性资源池并在弹性资源池中添加队列的具体操作步骤请参考创建弹性资源池并添加队列。全局共享模式：全局共享模式是一种根据SQL查询中实际扫描的数据量来分配计算资源的模式，不支持指定或预留计算资源。 DLI服务预置的“default”队列即为全局共享模式的计算资源，资源

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
Flink Opensource SQL使用DEW管理访问凭据 - 数据湖探索 DLI

已创建DLI访问DEW的委托并完成委托授权。该委托需具备以下权限： DEW中的查询凭据的版本与凭据值ShowSecretVersion接口权限，csms:secretVersion:get。 DEW中的查询凭据的版本列表ListSecretVersions接口权限，csms:secretVersion:list。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink作业委托场景开发指导
Hudi结果表 - 数据湖探索 DLI
Hudi结果表 - 数据湖探索 DLI

SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.15”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。 Spark离线完成Compaction计划的执行，以及Clean和Archive操作，详见Hudi数据表Compaction规范。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
数学运算函数 - 数据湖探索 DLI

(sub-query) BOOLEAN 若子查询至少返回一条数据，则返回TRUE。 value IN (sub-query) BOOLEAN 若值等于子查询返回的某个值，则返回TRUE。 value NOT IN (sub-query) BOOLEAN 若值不等于子查询返回的每个值，则返回TRUE。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数 > 内置函数
更新Flink Jar作业 - 数据湖探索 DLI

-1或大于0。默认值为“-1”，表示无限次数。 checkpoint_path 否 String 用户Jar中checkpoint的储存地址，不同作业路径需要保持不同。 runtime_config 否 String Flink作业运行时自定义优化参数。 job_type 否 String

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API

总条数： 795

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark 3.1.1版本说明 - 数据湖探索 DLI

string_split - 数据湖探索 DLI

SHOW TABLES - 数据湖探索 DLI

Hive维表 - 数据湖探索 DLI

字符类型 - 数据湖探索 DLI

创建DWS维表 - 数据湖探索 DLI

创建数据库 - 数据湖探索 DLI

本文样例表数据准备 - 数据湖探索 DLI

SparkSQL建表参数规范 - 数据湖探索 DLI

Python SDK环境配置 - 数据湖探索 DLI

批量运行作业 - 数据湖探索 DLI

regexp_replace1 - 数据湖探索 DLI

JSON Format - 数据湖探索 DLI

窗口聚合 - 数据湖探索 DLI

Kafka源表 - 数据湖探索 DLI

DLI弹性资源池与队列简介 - 数据湖探索 DLI

Flink Opensource SQL使用DEW管理访问凭据 - 数据湖探索 DLI

Hudi结果表 - 数据湖探索 DLI

数学运算函数 - 数据湖探索 DLI

更新Flink Jar作业 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线