搜索_华为云

Spark SQL常用配置项说明 - 数据湖探索 DLI

并删除那些不满足WHERE子句条件的分区，适用于在处理具有大量分区的表时。如果SQL查询中包含大量的嵌套left join操作，并且表有大量的动态分区时，这可能会导致在数据解析时消耗大量的内存资源，导致Driver节点的内存不足，并触发频繁的Full GC。在这种情况下，可以

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
为什么Spark jar 作业一直处于“提交中”？ - 数据湖探索 DLI

一直处于“提交中”可能是队列剩余的CU量不足导致作业无法提交。查看队列的的剩余步骤如下：查看队列CU使用量。点击“云监控服务 > 云服务监控 > 数据探索湖 > 队列监控 > 队列CU使用量” 。计算剩余CU量。队列剩余CU量=队列CU量 - 队列CU使用量。当队列剩余CU量小于用户提交的CU量，则需要等待资源，才能提交成功。

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
查询批处理作业详情 - 数据湖探索 DLI

Long 批处理作业的创建时间。是单位为“毫秒”的时间戳。 update_time 否 Long 批处理作业的更新时间。是单位为“毫秒”的时间戳。 feature 否 String 作业特性。表示用户作业使用的Spark镜像类型。 basic：表示使用DLI提供的基础Spark镜像。

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
扫描量计费 - 数据湖探索 DLI
扫描量计费 - 数据湖探索 DLI

扫描数据量套餐包的规格额度，超过扫描数据量套餐包额度的按照按需计费。扫描数据量套餐的额度每个月会重置。更多套餐包计费信息请参考套餐包计费。本文将介绍按需计费的DLI数据扫描量计费的计费规则。适用场景 DLI服务预置了名为default的队列供用户体验。用户在不确定所需队列容

 帮助中心 > 数据湖探索 DLI > 计费说明
parse - 数据湖探索 DLI
parse - 数据湖探索 DLI

parse_url parse_url函数用于返回给定URL的指定部分，partToExtract的有效值包括HOST，PATH， QUERY， REF， PROTOCOL， AUTHORITY，FILE和USERINFO。例如：parse_url('http://facebook

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
查询作业详情 - 数据湖探索 DLI

entrypoint 否 String 用户已上传到DLI资源管理系统的程序包名，用户自定义作业主类所在的jar包。 dependency_jars 否 Array of Strings 用户已上传到DLI资源管理系统的程序包名，用户自定义作业的其他依赖包。 dependency_files

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
创建集群（废弃） - 数据湖探索 DLI

cluster_name 是 String 新建的集群名称，名称只能包含数字、英文字母和下划线，但不能是纯数字，且不能以下划线开头。 description 否 String 集群的描述信息。 cu_count 是 Integer 与集群绑定的计算单元个数，同时是计费的单元。可选择16CU，64C

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 集群相关API（废弃）
查看所有SQL模板 - 数据湖探索 DLI

查看所有SQL模板功能介绍该接口用于查看用户保存的所有SQL模板。调试您可以在API Explorer中调试该接口。 URI URI格式： GET /v1.0/{project_id}/sqls 参数说明表1 URI参数说明参数是否必选参数类型描述 project_id

帮助中心 > 数据湖探索 DLI > API参考 > SQL模板相关API
LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

while trying to read 143805 bytes 问题原因上述报错可能原因是当前导入的文件数据量较大，同时因为spark.sql.shuffle.partitions参数设置的并行度过大，导致缓存区大小不够而导入数据报错。解决方案建议可以尝试调小spark.sql.shuffle

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
查询批处理作业列表 - 数据湖探索 DLI

批处理作业的id。 state 否 String 批处理作业的状态。 appId 否 String 批处理作业的后台app id。 log 否 Array of Strings 显示当前批处理作业的最后10条记录。 sc_type 否 String 计算资源类型。用户自定义时返回CUSTOMIZED。

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
Hudi Clustering操作说明 - 数据湖探索 DLI

调度Clustering：使用可插拔的Clustering策略创建Clustering计划。识别符合Clustering条件的文件：根据所选的Clustering策略，调度逻辑将识别符合Clustering条件的文件。根据特定条件对符合Clustering条件的文件进行分组。每个组的数据大小应为t

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
创建数据库 - 数据湖探索 DLI
创建数据库 - 数据湖探索 DLI

“default”的数据库。示例完整的SQL作业提交流程您可以参考《快速入门》中的《提交SQL作业》等章节描述。队列是使用DLI服务的基础，执行SQL前需要先创建队列。具体可以参考《用户指南》中的“创建队列”章节。在DLI管理控制台，单击左侧导航栏中的“SQL编辑器”，可进入SQL作业“SQL编辑器”页面。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据库相关
字符串函数 - 数据湖探索 DLI
字符串函数 - 数据湖探索 DLI

INITCAP(string) 返回新形式的 STRING，其中每个单词的第一个字符转换为大写，其余字符转换为小写。这里的单词表示字母数字的字符序列。 CONCAT(string1, string2, ...) 返回连接 string1，string2， … 的字符串。如果有任一参数为 NULL，则返回

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
更新管理 - 数据湖探索 DLI
更新管理 - 数据湖探索 DLI

Log4j2 远程代码执行漏洞（CVE-2021-44228）、Fastjson存在反序列化漏洞（CNVD-2022-40233）等。一旦发现服务模块涉及漏洞影响，会迅速通过官方解决方案升级现网更新漏洞。更新配置 DLI云服务通过版本更新升级更新配置，确保服务的安全性和稳定性。

帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
数据湖探索 DLI - 数据湖探索 DLI

None 服务介绍数据湖探索 DLI 介绍什么是数据湖探索 02:47 数据湖探索DLI产品介绍功能介绍数据湖探索 DLI 熟悉数据湖探索控制台 03:10 数据湖探索控制台介绍操作指导数据湖探索 DLI 介绍怎样创建提交SQL作业 07:36 数据湖探索SQL作业入门指导

 帮助中心 > 数据湖探索 DLI > 视频帮助
CREATE TABLE - 数据湖探索 DLI
CREATE TABLE - 数据湖探索 DLI

table_name Database中的表名，由字母、数字和下划线（_）组成。 columnTypeList 以逗号分隔的带数据类型的列表。列名由字母、数字和下划线（_）组成。 using 参数hudi，定义和创建Hudi table。 table_comment 表的描述信息。 location_path

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DDL语法说明
产品优势 - 数据湖探索 DLI
产品优势 - 数据湖探索 DLI

提供了更实时高效的多样性算力，可支撑更丰富的大数据处理需求。产品内核及架构深度优化，综合性能是传统MapReduce模型的百倍以上，SLA保障99.95%可用性。图1 DLI Serverless架构与传统自建Hadoop集群相比，Serverless架构的DLI还具有以下优势：

帮助中心 > 数据湖探索 DLI > 产品介绍
查询分组资源列表（废弃） - 数据湖探索 DLI

是否必选参数类型说明 kind 否 String 指定文件类型。包括以下文件类型： jar：用户jar文件。 pyFile：用户python文件。 file：用户文件。 modelFile：用户AI模型文件。 tags 否 String 指定标签过滤。请求消息无请求参数。响应消息

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
数据权限列表 - 数据湖探索 DLI

ROLE db的DROP_ROLE权限 - SHOW ROLES db的SHOW_ROLES权限 - GRANT ROLES db的GRANT_ROLE权限 - REVOKE ROLES db的REVOKE_ROLE权限 - GRANT PRIVILEGE db或table的GRANT_PRIVILEGE权限

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据权限相关
上传pyfile类型分组资源（废弃） - 数据湖探索 DLI

String 资源模块类型。 jar：用户jar文件; pyFile：用户python文件; file：用户文件。表4 details参数说明参数名称是否必选参数类型说明 create_time 否 Long 资源包上传的unix时间。是单位为“毫秒”的时间戳。 update_time

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）

总条数： 959

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark SQL常用配置项说明 - 数据湖探索 DLI

为什么Spark jar 作业一直处于“提交中”？ - 数据湖探索 DLI

查询批处理作业详情 - 数据湖探索 DLI

扫描量计费 - 数据湖探索 DLI

parse - 数据湖探索 DLI

查询作业详情 - 数据湖探索 DLI

创建集群（废弃） - 数据湖探索 DLI

查看所有SQL模板 - 数据湖探索 DLI

LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

查询批处理作业列表 - 数据湖探索 DLI

Hudi Clustering操作说明 - 数据湖探索 DLI

创建数据库 - 数据湖探索 DLI

字符串函数 - 数据湖探索 DLI

更新管理 - 数据湖探索 DLI

数据湖探索 DLI - 数据湖探索 DLI

CREATE TABLE - 数据湖探索 DLI

产品优势 - 数据湖探索 DLI

查询分组资源列表（废弃） - 数据湖探索 DLI

数据权限列表 - 数据湖探索 DLI

上传pyfile类型分组资源（废弃） - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线