搜索_华为云

string_split - 数据湖探索 DLI
string_split - 数据湖探索 DLI

行作业。注意：创建作业时，在作业编辑界面的“运行参数”处，“Flink版本”选择“1.12”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。如下脚本中的加粗参数请根据实际环境修改。 CREATE TABLE kafkaSource ( target

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数 > 内置函数 > 表值函数
插入数据 - 数据湖探索 DLI
插入数据 - 数据湖探索 DLI

源表上的SELECT查询（支持DLI表、OBS表）。 values_row 想要插入到表中的值，列与列之间用逗号分隔。注意事项表必须已经存在。如果动态分区不需要指定分区，则将“part_spec”作为普通字段放置SELECT语句中。被插入的OBS表在建表时只能指定文件夹路径。源

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
概述 - 数据湖探索 DLI
概述 - 数据湖探索 DLI

SQL，支持多种接入方式，并兼容主流数据格式。数据无需复杂的抽取、转换、加载，使用SQL或程序就可以对云上CloudTable、RDS、DWS、CSS、OBS、ECS自建数据库以及线下数据库的异构数据进行探索。您可以使用本文档提供API对数据湖探索进行相关操作，包括队列、SQL作业、Flink

帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读
Parquet Format - 数据湖探索 DLI
Parquet Format - 数据湖探索 DLI

( 'connector' = 'filesystem', 'format' = 'parquet', 'path' = 'obs://xx' ); insert into sink select * from kafkaSource; 向kafka的作为source的topic中插入下列数据：

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

计算配置，建议作业最大并行数为计算单元2倍为宜。勾选“保存作业日志”，选择一个OBS桶。如果该桶未授权，需要单击“立即授权”进行授权。配置该参数，可以在作业异常失败后，将作业日志保存到用户的OBS桶下，方便用户定位故障原因。图3 保存作业日志勾选“作业异常告警”，选择1中创

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
查看Flink作业详情 - 数据湖探索 DLI

作业配置的每个TaskManager所占CU数量。单TM Slot数作业配置的每个TaskManager Slot数量。 OBS桶作业配置了OBS桶显示。当勾选“开启Checkpoint”和“保存作业日志”参数后，用于保存Checkpoint和作业运行日志。保存作业日志开启或关闭。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
Flink作业常用操作 - 数据湖探索 DLI

单击右上角“导出作业”，打开“导出作业”对话框。图2 导出作业选择保存作业的OBS桶。单击“下一步”。选择待导出的作业。默认导出所有作业，也可以勾选“自定义导出”选择需要导出的作业。单击“确认导出”，完成导出作业。导入作业用户可以将保存在OBS桶中的Flink作业配置文件导入至DLI的Flink作业管理中。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
Print - 数据湖探索 DLI
Print - 数据湖探索 DLI

OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.15”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。语法格式 1 2 3 4 5 6 7 8 9 create table printSink ( attr_name

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
CLUSTERING - 数据湖探索 DLI
CLUSTERING - 数据湖探索 DLI

1008L) or ts >= 1009L', order => 'ts'); call run_clustering(path => 'obs://bucket/path/hudi_test2', predicate => "dt = '2021-08-28'", order =>

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
DESCRIBE - 数据湖探索 DLI
DESCRIBE - 数据湖探索 DLI

Location: obs://bucket/user/hive/warehouse/fruit Table Type:

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 辅助命令语法
CLEAN_FILE - 数据湖探索 DLI
CLEAN_FILE - 数据湖探索 DLI

mode=>'query'); call clean_file(table => 'h1', mode=>'undo', backup_path=>'obs://bucket/hudi/h1/.hoodie/.cleanbackup/hoodie_repair_backup_20230527');

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
SHOW_FS_PATH_DETAIL - 数据湖探索 DLI

默认true，true表示根据storage_size排序结果，false表示根据文件数量排序结果否示例 call show_fs_path_detail(path=>'obs://bucket/path/hudi_mor/dt=2021-08-28', is_sub=>false, sort=>true); 返回结果

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
计费概述 - 数据湖探索 DLI
计费概述 - 数据湖探索 DLI

在估算存储费用时，请特别注意，DLI采用压缩存储，通常能压缩到原文件大小的 1/5 。DLI存储按照压缩后的大小计费。如果数据存储在OBS服务中，则DLI服务不收取存储费用，对应的费用由OBS服务收取。扫描量计费按照用户每个作业的数据扫描量（单位为“GB”）收取计算费用。当前仅适用于在默认def

帮助中心 > 数据湖探索 DLI > 计费说明
提交SQL作业（推荐） - 数据湖探索 DLI

步操作。调试您可以在API Explorer中调试该接口。 URI URI格式： POST /v1.0/{project_id}/jobs/submit-job 参数说明表1 URI参数参数名称是否必选参数类型说明 project_id 是 String 项目编号，

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
字符串函数 - 数据湖探索 DLI
字符串函数 - 数据湖探索 DLI

json_string STRING 需要解析的JSON对象，使用字符串表示。 json_path STRING 解析JSON的路径表达式，使用字符串表示。目前path支持如下表达式参考下表表3。表3 json_path参数支持的表达式表达式说明 $ 根对象 [] 数组下标 * 数组通配符 .

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数 > 内置函数
查询作业结果-方式一（废弃） - 数据湖探索 DLI

详细请参见导出查询结果。 URI URI格式： GET/v1.0/{project_id}/queues/{queue_name}/jobs/{job_id}?page-size=size&current-page=page_number 参数说明表1 URI 参数名称是否必选

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

<scope>provided</scope> </dependency> 使用方式将写好的自定义函数打成JAR包，并上传到OBS上。在DLI管理控制台的左侧导航栏中，单击数据管理>“程序包管理”，然后单击创建，并使用OBS中的jar包创建相应的程序包。在DLI管理控制台的左侧导航栏中，单击作业管理>“Flin

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数
DWS结果表（不推荐使用） - 数据湖探索 DLI

OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.15”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。请务必确保您的账户下已在数据仓库服务（DWS）里创建了DWS集群。如何创建DWS集群，请参考《数据仓库服务管理指南》中“创建集群”章节。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

如何呢？其实PySpark本身就已经考虑到这一点了，那就是基于PyFiles来指定依赖，在DLI Spark作业页面中可以直接选取存放在OBS上的Python第三方程序库（支持zip、egg等）。图1 Spark作业编辑页面对于依赖的这个Python第三方库的压缩包有一定的结

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
Kafka - 数据湖探索 DLI
Kafka - 数据湖探索 DLI

并下载SSL证书，将下载的证书client.jks上传到OBS桶中。其中，properties.sasl.jaas.config字段包含账号密码，使用DEW进行加密。 CREATE TABLE ordersSource ( order_id string, order_channel

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表

总条数： 491

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

string_split - 数据湖探索 DLI

插入数据 - 数据湖探索 DLI

概述 - 数据湖探索 DLI

Parquet Format - 数据湖探索 DLI

Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

查看Flink作业详情 - 数据湖探索 DLI

Flink作业常用操作 - 数据湖探索 DLI

Print - 数据湖探索 DLI

CLUSTERING - 数据湖探索 DLI

DESCRIBE - 数据湖探索 DLI

CLEAN_FILE - 数据湖探索 DLI

SHOW_FS_PATH_DETAIL - 数据湖探索 DLI

计费概述 - 数据湖探索 DLI

提交SQL作业（推荐） - 数据湖探索 DLI

字符串函数 - 数据湖探索 DLI

查询作业结果-方式一（废弃） - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

DWS结果表（不推荐使用） - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

Kafka - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线