搜索_华为云

创建并提交Spark作业 - 数据湖探索 DLI

创建并提交Spark作业场景描述本章节指导用户通过API创建并提交Spark作业。约束限制新队列第一次运行作业时，需要一定的时间，通常为6~10分钟。涉及接口创建弹性资源池：创建弹性资源池。创建队列：在弹性资源池中添加队列。上传分组资源：上传Spark作业所需的资源包。

帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
创建队列 - 数据湖探索 DLI
创建队列 - 数据湖探索 DLI

说明 queue_name 是 String 新建的队列名称，名称只能包含数字、英文字母和下划线，但不能是纯数字，且不能以下划线开头。长度限制：1~128个字符。说明：队列名称不区分大小写，系统会自动转换为小写。 queue_type 否 String 队列的类型,。有如下类型：

帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
从Kafka读取数据写入到RDS - 数据湖探索 DLI

计费模式：选择“包年/包月”或“按需计费”。本例选择“按需计费”。区域和项目：保持默认值即可。名称：填写具体的队列名称。新建的队列名称，名称只能包含数字、英文字母和下划线，但不能是纯数字，且不能以下划线开头。长度限制：1~128个字符。队列名称不区分大小写，系统会自动转换为小写。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
弹性资源池扩缩容历史记录 - 数据湖探索 DLI

项目编号，用于资源隔离。获取方式请参考获取项目ID。 elastic_resource_pool_name 是 String 弹性资源池名称。长度限制：1~128个字符。表2 Query参数参数是否必选参数类型描述 start_time 否 Long start_time用于查

 帮助中心 > 数据湖探索 DLI > API参考 > 弹性资源池相关API
查询OpenTSDB表 - 数据湖探索 DLI
查询OpenTSDB表 - 数据湖探索 DLI

enabled=true 语法格式 1 SELECT * FROM table_name LIMIT number; 关键字 LIMIT：对查询结果进行限制，number参数仅支持INT类型。注意事项所查询的表必须是已经存在的表，否则会出错。示例查询表opentsdb_table中的数据。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接OpenTSDB表
Raw Format - 数据湖探索 DLI
Raw Format - 数据湖探索 DLI

允许读写原始（基于字节）值作为单个列。 Raw Format将 null 值编码成 byte[] 类型的 null。这样在 upsert-kafka 中使用时可能会有限制，因为 upsert-kafka 将 null 值视为墓碑消息（在键上删除）。因此，如果该字段可能具有 null 值，我们建议避免使用 upsert-kafka

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Raw Format - 数据湖探索 DLI
Raw Format - 数据湖探索 DLI

允许读写原始（基于字节）值作为单个列。注意: 这种格式将 null 值编码成 byte[] 类型的 null。这样在 upsert-kafka 中使用时可能会有限制，因为 upsert-kafka 将 null 值视为墓碑消息（在键上删除）。因此，如果该字段可能具有 null 值，我们建议避免使用 upsert-kafka

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
创建SQL作业模板 - 数据湖探索 DLI

作业编辑窗口中自动输入对应的SQL语句。在SQL作业编辑窗口右上方，单击“执行”运行SQL语句，执行结束后，可以在SQL作业编辑窗口下方区域中查看执行结果。查找SQL作业模板在“SQL模板”页面，可在右上方搜索框中输入模板名称关键字，查找与之匹配的模板。修改SQL作业模板

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
使用DLI分析电商BI报表 - 数据湖探索 DLI

步骤请参考《对象存储服务工具指南》。通过OBS Browser+上传数据。在OBS Browser+页面单击“创建桶”，按照要求选择“区域”和填写“桶名”（例如：DLI-demo），创建桶成功后，返回桶列表，单击桶DLI-demo。OBS Browser+提供强大的拖拽上传功

 帮助中心 > 数据湖探索 DLI > 最佳实践
创建Bucket索引表调优 - 数据湖探索 DLI

创建Bucket索引表调优创建Bucket索引表调优 Bucket索引常用设置参数： Spark： hoodie.index.type=BUCKET hoodie.bucket.index.num.buckets=5 Flink index.type=BUCKET hoodie

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
Doris源表 - 数据湖探索 DLI
Doris源表 - 数据湖探索 DLI

向Doris发送请求的读取超时时间。 doris.request.query.timeout.s 3600 否查询Doris的超时时间，默认值为1小时，-1表示无超时限制。 doris.request.tablet.size Integer. MAX_VALUE 否一个 Partition 对应的Doris

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Doris
获取Spark作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

仅支持获取AK、SK、SecurityToken。获取到AK、SK、SecurityToken后，请参考如何使用凭据管理服务替换硬编码的数据库账号密码查询凭据。约束限制仅支持Spark3.3.1版本（Spark通用队列场景）使用委托授权访问临时凭证：在创建作业时，请配置作业使用Spark3.3.1版本

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
Over聚合 - 数据湖探索 DLI
Over聚合 - 数据湖探索 DLI

ORDER BY 必须指定于单个的时间属性。可以在一个 SELECT 子句中定义多个 OVER 窗口聚合。然而，对于流式查询，由于目前的限制，所有聚合的 OVER 窗口必须是相同的。 OVER 窗口需要数据是有序的。因为表没有固定的排序，所以 ORDER BY 子句是强制的。对于流式查询，Flink

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

dli-jdbc-1.x dli-jdbc-2.x regionname authenticationmode=aksk时必须配置 - 区域名称，具体区域请参考地区和终端节点。 dli-jdbc-1.x dli-jdbc-2.x token authenticationmode=token时必须配置

 帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI > 使用JDBC提交SQL作业
常见场景的委托权限策略 - 数据湖探索 DLI

n_agency。请在设置委托的授权范围时分别对OBS权限和DLI权限授权范围： OBS权限请选择“全局服务资源” DLI权限选择“指定区域项目资源” { "Version": "1.1", "Statement": [ {

帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI访问其他云服务的委托权限
trans - 数据湖探索 DLI
trans - 数据湖探索 DLI

trans_array trans_array函数用于将一行数据转为多行的UDTF，将列中存储的以固定分隔符格式分隔的数组转为多行。使用限制所有作为key的列必须位于在前面，而要转置的列必须放在后面。在一个select中只能有一个UDTF，不可以再出现其他的列。不可以与group

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 其他函数
配置SQL防御规则 - 数据湖探索 DLI

alter）涉及的分区数超限制。 dynamic spark 提示拦截取值范围：1-500000 默认值：5000 是 select * from 分区表 running_0002 Memory used(MB) SQL的占用内存峰值超绝对值限制。 running spark

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
查询作业列表 - 数据湖探索 DLI

是否必选参数类型说明 job_id 否 Long 作业ID。 name 否 String 作业名称。长度限制：0-57个字符。 desc 否 String 作业描述。长度限制：0-512个字符。 user_name 否 String 用户名，当“show_detail”为“false”时独有。

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
跨源认证概述 - 数据湖探索 DLI

12版本的跨源访问场景，使用DLI提供的“跨源认证”管理数据源的访问凭证。本节操作为您介绍DLI提供的跨源认证的使用方法。约束与限制表1 跨源认证约束限制限制项说明适用场景约束限制仅Spark SQL、和Flink OpenSource SQL 1.12版本的作业支持使用跨源认证。仅在

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
查询作业详情 - 数据湖探索 DLI

是否必选参数类型说明 job_id 否 Long 作业ID。 name 否 String 作业名称。长度限制：0-57个字符。 desc 否 String 作业描述。长度限制：0-512个字符。 job_type 否 String 作业类型。 flink_sql_job：flink

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API

总条数： 276

上一页
1
...
8
9
10
...
14
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建并提交Spark作业 - 数据湖探索 DLI

创建队列 - 数据湖探索 DLI

从Kafka读取数据写入到RDS - 数据湖探索 DLI

弹性资源池扩缩容历史记录 - 数据湖探索 DLI

查询OpenTSDB表 - 数据湖探索 DLI

Raw Format - 数据湖探索 DLI

Raw Format - 数据湖探索 DLI

创建SQL作业模板 - 数据湖探索 DLI

使用DLI分析电商BI报表 - 数据湖探索 DLI

创建Bucket索引表调优 - 数据湖探索 DLI

Doris源表 - 数据湖探索 DLI

获取Spark作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

Over聚合 - 数据湖探索 DLI

使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

常见场景的委托权限策略 - 数据湖探索 DLI

trans - 数据湖探索 DLI

配置SQL防御规则 - 数据湖探索 DLI

查询作业列表 - 数据湖探索 DLI

跨源认证概述 - 数据湖探索 DLI

查询作业详情 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线