搜索_华为云

创建批处理作业 - 数据湖探索 DLI

用户已上传到DLI资源管理系统的类型为jar的程序包名。也支持指定OBS路径，例如：obs://桶名/包名。 pyFiles 否 Array of Strings 用户已上传到DLI资源管理系统的类型为pyFile的资源包名。也支持指定OBS路径，例如：obs://桶名/包名。 files

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
生成Flink SQL作业的静态流图 - 数据湖探索 DLI

SQL作业的静态流图功能介绍该API用于生成Flink SQL作业的静态流图。 Flink 1.15版本不支持生成静态流图。调试您可以在API Explorer中调试该接口。 URI URI格式 POST /v3/{project_id}/streaming/jobs/{job_id}/gen-graph

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
应用场景 - 数据湖探索 DLI
应用场景 - 数据湖探索 DLI

图2 车企数字化服务转型大数据ETL处理运营商大数据分析运营商数据体量在PB~EB级，其数据种类多，有结构化的基站信息数据，非结构化的消息通信数据，同时对数据的时效性有很高的要求，DLI服务提供批处理、流处理等多模引擎，打破数据孤岛进行统一的数据分析。优势大数据ETL：具备

 帮助中心 > 数据湖探索 DLI > 产品介绍
LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

read 143805 bytes 问题原因上述报错可能原因是当前导入的文件数据量较大，同时因为spark.sql.shuffle.partitions参数设置的并行度过大，导致缓存区大小不够而导入数据报错。解决方案建议可以尝试调小spark.sql.shuffle.partit

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

SQL作业分析OBS数据 DLI支持将数据存储到OBS上，后续再通过创建OBS表即可对OBS上的数据进行分析和处理。本指导中的操作内容包括：创建OBS表、导入OBS表数据、插入和查询OBS表数据等内容来帮助您更好的在DLI上对OBS表数据进行处理。前提条件已创建OBS的桶。具体O

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
DLI如何访问OBS桶中的数据 - 数据湖探索 DLI

DLI如何访问OBS桶中的数据创建OBS表。具体语法请参考《数据湖探索SQL语法参考》。添加分区。具体语法请参考《数据湖探索SQL语法参考》。往分区导入OBS桶中的数据。具体语法请参考《数据湖探索SQL语法参考》。查询数据。具体语法请参考《数据湖探索SQL语法参考》。

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
成长地图 - 数据湖探索 DLI
成长地图 - 数据湖探索 DLI

详细介绍 07 API&SDK 通过DLI开放的API和调用示例，您可以使用并管理队列，SQL作业，Spark作业和跨源作业等。您还可以直接调用DLI SDK提供的接口函数实现业务。常用API API概览队列相关API Spark作业相关API 增强型跨源相关API 流作业相关API

帮助中心 > 数据湖探索 DLI > 成长地图
手动停止了Flink作业，再次启动时怎样从指定Checkpoint恢复？ - 数据湖探索 DLI

t保存的OBS桶。手工停止Flink作业后，再次启动该Flink作业怎样从指定Checkpoint恢复。解决方案由于Flink Checkpoint和Savepoint生成机制及格式一致，因此可以通过Flink作业列表“操作”列中的“更多 > 导入保存点”，导入OBS中最新成功的Checkpoint，并从中恢复。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业咨询类
常见场景的委托权限策略 - 数据湖探索 DLI

} ] } 访问和使用OBS的权限策略适用场景：DLI Flink作业下载OBS对象、OBS/DWS数据源（外表）、日志转储、使用savepoint、开启checkpoint，DLI Spark作业下载OBS对象、读写OBS外表。 { "Version":

帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI访问其他云服务的委托权限
提交SQL作业（废弃） - 数据湖探索 DLI

实现方式不同。另外，用户可使用其他API来对作业进行查询和管理。具体操作有：查询作业状态查询作业详细信息查询作业结果-方式一（废弃）导出查询结果查询所有作业取消作业（废弃）该API当响应消息中“job_type”为“DCL”时，为同步操作。本章节介绍的API已过

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）
DLI SDK与API的对应关系 - 数据湖探索 DLI

DLI SDK与API的对应关系 OBS授权表1 OBS授权相关API&SDK的对应关系表 Class Method Java Method Python Method API Authorize OBS授权 authorizeBucket - POST /v1.0/{proj

帮助中心 > 数据湖探索 DLI > SDK参考 > DLI SDK
使用Spark作业访问sftp中的文件，作业运行失败，日志显示访问目录异常 - 数据湖探索 DLI

使用Spark作业访问sftp中的文件，作业运行失败，日志显示访问目录异常 Spark作业不支持访问sftp，建议将文件数据上传到OBS，再通过Spark作业进行读取和分析。上传数据到OBS桶：通过OBS管理控制台或者使用命令行工具将存储在sftp中的文件数据上传到OBS桶中。 Sp

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
SQL作业运行报错：DLI.0002 FileNotFoundException - 数据湖探索 DLI

0002: FileNotFoundException: getFileStatus on obs://xxx: status [404] 解决方案请排查在同一时间点是否还有另外作业对当前报错作业操作的表信息有删除操作。 DLI不允许同时有多个作业在同一时间点对相同表进行读写操作，否则会造成作业冲突，导致作业运行失败。

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
DLI Flink与MRS Flink有什么区别？ - 数据湖探索 DLI

Flink与MRS Flink有什么区别？ DLI Flink是天然的云原生基础架构。在内核引擎上DLI Flink进行了多处核心功能的优化，并且提供了企业级的一站式开发平台，自带开发和运维功能，免除自建集群运维的麻烦；在connector方面除了支持开源connector之外，还

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
基本概念 - 数据湖探索 DLI
基本概念 - 数据湖探索 DLI

在DLI中，表和数据库是定义底层数据的元数据容器。表中的元数据让DLI知道数据所在的位置，并指定了数据的结构，例如列名称、数据类型和表名称。数据库是表的逻辑分组。 OBS表、DLI表、CloudTable表不同表类型表示不同的数据存储位置。 OBS表表示数据存储在OBS服务的桶中。 DLI表表示数据存储在本服务内部的表中。

帮助中心 > 数据湖探索 DLI > 产品介绍
Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

x版本在SQL队列的差异对比 DLI整理了Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异，便于您了解Spark版本升级后SQL队列上运行的作业在适配新版本引擎时的影响。 histogram_numeric函数的返回值的类型不同说明： Spark SQL中的histo

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
怎样升级DLI作业的引擎版本 - 数据湖探索 DLI

怎样升级DLI作业的引擎版本 DLI提供了Spark和Flink计算引擎，为用户提供了一站式的流处理、批处理、交互式分析的Serverless融合处理分析服务，当前，Flink计算引擎推荐版本：Flink 1.15，Spark计算引擎推荐版本： Spark 3.3.1。本节操作介绍如何升级作业的引擎版本。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
构造请求 - 数据湖探索 DLI
构造请求 - 数据湖探索 DLI

构造请求本章节介绍REST API请求的组成，并以调用IAM服务的获取用户Token来说明如何调用API，该API获取用户的Token，Token可以用于调用其他API时鉴权。您还可以通过这个视频教程了解如何构造请求调用API：https://bbs.huaweicloud.com/videos/102987

帮助中心 > 数据湖探索 DLI > API参考 > 如何调用API
在Spark SQL作业中使用UDTF - 数据湖探索 DLI

上传Jar包到OBS OBS控制台将生成的UDTF函数Jar包文件上传到OBS目录下。 5 创建DLI的UDTF函数 DLI控制台在DLI控制台的SQL作业管理界面创建使用的UDTF函数。 6 验证和使用DLI的UDTF函数 DLI控制台在DLI作业中使用创建的UDTF函数。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
入门实践 - 数据湖探索 DLI
入门实践 - 数据湖探索 DLI

我们整理了从队列网络连通、不同类型的作业分析、数据迁移场景的常用开发指南和最佳实践内容，帮助您更好的使用DLI进行大数据分析和处理。表1 DLI常用开发指南与最佳实践场景操作指导描述 Spark SQL作业开发使用Spark SQL作业分析OBS数据介绍使用Spark

帮助中心 > 数据湖探索 DLI > 快速入门

总条数： 1091

上一页
1
2
3
4
5
...
55
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建批处理作业 - 数据湖探索 DLI

生成Flink SQL作业的静态流图 - 数据湖探索 DLI

应用场景 - 数据湖探索 DLI

LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

DLI如何访问OBS桶中的数据 - 数据湖探索 DLI

成长地图 - 数据湖探索 DLI

手动停止了Flink作业，再次启动时怎样从指定Checkpoint恢复？ - 数据湖探索 DLI

常见场景的委托权限策略 - 数据湖探索 DLI

提交SQL作业（废弃） - 数据湖探索 DLI

DLI SDK与API的对应关系 - 数据湖探索 DLI

使用Spark作业访问sftp中的文件，作业运行失败，日志显示访问目录异常 - 数据湖探索 DLI

SQL作业运行报错：DLI.0002 FileNotFoundException - 数据湖探索 DLI

DLI Flink与MRS Flink有什么区别？ - 数据湖探索 DLI

基本概念 - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

怎样升级DLI作业的引擎版本 - 数据湖探索 DLI

构造请求 - 数据湖探索 DLI

在Spark SQL作业中使用UDTF - 数据湖探索 DLI

入门实践 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线