搜索_华为云

在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

jar作业的场景需要手动配置由LakeFormation提供元数据服务的Hudi锁实现类，请参照 Hudi锁配置说明。登录DLI管理控制台，选择“作业管理 > Spark作业”，进入到Spark作业的界面。提交Hudi相关的Spark jar作业需要选择Spark版本为3.3.1，且使用的通用队列需要支持Hudi。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
DLI的数据可存储在哪些地方 - 数据湖探索 DLI

DLI表与OBS表有什么区别？ DLI表表示数据存储在本服务内部，用户不感知数据存储路径。 OBS表表示数据存储在用户自己账户的OBS桶中，源数据文件由用户自己管理。 DLI表相较于OBS表提供了更多权限控制和缓存加速的功能，性能相较于外表性能更好，但是会收取存储费用。父主题： DLI产品咨询类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

E_DEFAULT_PARTITION__”，当前Spark判断分区为空时，则会直接返回null，不返回具体的数据。解决方案登录DLI管理控制台，在“SQL编辑器”中，单击“设置”。在参数设置中，添加参数“spark.sql.forcePartitionPredicatesOnPartitionedTable

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
典型场景示例：配置弹性资源池队列扩缩容策略 - 数据湖探索 DLI

登录DLI控制台，参考创建弹性资源池并添加队列创建一个最小CU数为128CU和最大CU数为256CU的弹性资源池。单击“资源管理 > 弹性资源池”，在已创建的弹性资源池所在行的“操作”列单击“队列管理”。参考创建弹性资源池并添加队列添加队列test_a，在添加队列扩缩容配置步骤里面添加扩缩容策略。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
查询所有队列 - 数据湖探索 DLI

enterprise_project_id 否 String 企业项目ID。0”表示default，即默认的企业项目。关于如何设置企业项目请参考《企业管理用户指南》。说明：开通了企业管理服务的用户可设置该参数绑定指定的项目。 cidr_in_vpc 否 String 队列的虚拟私有云（VPC）的网段。例如：10

帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
查询作业列表 - 数据湖探索 DLI

“0”：忽略。 entrypoint 否 String 用户已上传到DLI资源管理系统的程序包名，用户自定义作业主类所在的jar包。 dependency_jars 否 Array of Strings 用户已上传到DLI资源管理系统的程序包名，用户自定义作业的其他依赖包。 dependency_files

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
DLI Delta表概述 - 数据湖探索 DLI

partition(part='part1') select * from table2; ALTER TABLE ADD/DROP PARTITION管理分区 alter table test_delta_parts1 add partition('2024-10-28'); CONVERT

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考
创建批处理作业 - 数据湖探索 DLI

Array of Strings 用户已上传到DLI资源管理系统的类型为jar的程序包名。也支持指定OBS路径，例如：obs://桶名/包名。 pyFiles 否 Array of Strings 用户已上传到DLI资源管理系统的类型为pyFile的资源包名。也支持指定OBS路径，例如：obs://桶名/包名。

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
查询所有数据库（废弃） - 数据湖探索 DLI

enterprise_project_id 是 String 企业项目ID，“0”表示default，即默认的企业项目。关于如何设置企业项目请参考《企业管理用户指南》。说明：开通了企业管理服务的用户可设置该参数绑定指定的项目。 resource_id 是 String 资源ID。请求示例无响应示例 {

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 资源相关API（废弃） > 数据库相关API（废弃）
DLI跨源连接报错找不到子网怎么办？ - 数据湖探索 DLI

C（虚拟私有云）的VPC Administrator权限。客户未给VPC服务授权导致DLI跨源连接报错找不到子网。处理步骤登录DLI管理控制台，选择“全局配置 > 服务授权”。在委托设置页面，按需选择所需的委托权限。其中“DLI Datasource Connections

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
创建并提交SQL作业 - 数据湖探索 DLI

池并添加队列。 SQL作业只能在队列类型为“SQL队列”下执行。数据目录数据目录（Catalog）是元数据管理对象，它可以包含多个数据库。您可以在DLI中创建并管理多个Catalog，用于不同的元数据隔离。数据库下拉选择需要使用的数据库。如果没有可用数据库，此处显示“d

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
DLI支持的Prometheus基础监控指标 - 数据湖探索 DLI

保证JobManager的JVM可用的堆内存量 flink_jobmanager_Status_JVM_Memory_Heap_Max JobManager中可用于内存管理的最大堆内存量 flink_jobmanager_Status_JVM_Memory_NonHeap_Used JobManager的堆外内存使用量

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用AOM监控DLI服务
概述 - 数据湖探索 DLI
概述 - 数据湖探索 DLI

DDS，数据仓库服务GaussDB（DWS），MapReduce服务MRS，云数据库RDS等。使用DLI的跨源能力，需要先创建跨源连接。管理控制台界面具体操作请参考《数据湖探索用户指南》。使用Spark作业跨源访问数据源支持使用scala，pyspark和java三种语言进行开发。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源
DWS源表 - 数据湖探索 DLI
DWS源表 - 数据湖探索 DLI

为用户提供海量数据挖掘和分析服务。DWS的更多信息，请参见《数据仓库服务管理指南》。前提条件请务必确保您的账户下已在数据仓库服务（DWS）里创建了DWS集群。如何创建DWS集群，请参考《数据仓库服务管理指南》中“创建集群”章节。请确保已创建DWS数据库表。该场景作业需要

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
查询作业详情 - 数据湖探索 DLI

“0”：忽略。 entrypoint 否 String 用户已上传到DLI资源管理系统的程序包名，用户自定义作业主类所在的jar包。 dependency_jars 否 Array of Strings 用户已上传到DLI资源管理系统的程序包名，用户自定义作业的其他依赖包。 dependency_files

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
Raw Format - 数据湖探索 DLI
Raw Format - 数据湖探索 DLI

119 Safari/537.36" "2.75" 按照如下方式查看taskmanager.out文件中的数据结果：登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
创建数据库 - 数据湖探索 DLI
创建数据库 - 数据湖探索 DLI

SQL作业》等章节描述。队列是使用DLI服务的基础，执行SQL前需要先创建队列。具体可以参考《用户指南》中的“创建队列”章节。在DLI管理控制台，单击左侧导航栏中的“SQL编辑器”，可进入SQL作业“SQL编辑器”页面。在“SQL编辑器”页面右侧的编辑窗口中，输入如下创建数

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据库相关
Avro Format - 数据湖探索 DLI
Avro Format - 数据湖探索 DLI

"user_name":"Alice","area_id":"330106"} 按照如下方式查看taskmanager.out文件中的数据结果：登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Hbase源表 - 数据湖探索 DLI
Hbase源表 - 数据湖探索 DLI

认证用的username和password等硬编码到代码中或者明文存储都有很大的安全风险，建议使用DEW管理凭证。配置文件或者环境变量中密文存放，使用时解密，确保安全。Flink Opensource SQL使用DEW管理访问凭据创建HBase源表的列簇必须定义为ROW类型，字段名对应列簇名（column

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hbase
DWS Connector概述 - 数据湖探索 DLI

持空间信息服务、多版本并发控制（MVCC）、高并发，适用场景包括位置应用、金融保险、互联网电商等。 DWS的更多信息，请参见《数据仓库服务管理指南》。 DLI Flink 1.15版本支持两种DWS Connector方式用于接入GaussDB数据：（推荐使用）DWS服务自研的DWS

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS

总条数： 497

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

DLI的数据可存储在哪些地方 - 数据湖探索 DLI

DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

典型场景示例：配置弹性资源池队列扩缩容策略 - 数据湖探索 DLI

查询所有队列 - 数据湖探索 DLI

查询作业列表 - 数据湖探索 DLI

DLI Delta表概述 - 数据湖探索 DLI

创建批处理作业 - 数据湖探索 DLI

查询所有数据库（废弃） - 数据湖探索 DLI

DLI跨源连接报错找不到子网怎么办？ - 数据湖探索 DLI

创建并提交SQL作业 - 数据湖探索 DLI

DLI支持的Prometheus基础监控指标 - 数据湖探索 DLI

概述 - 数据湖探索 DLI

DWS源表 - 数据湖探索 DLI

查询作业详情 - 数据湖探索 DLI

Raw Format - 数据湖探索 DLI

创建数据库 - 数据湖探索 DLI

Avro Format - 数据湖探索 DLI

Hbase源表 - 数据湖探索 DLI

DWS Connector概述 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线