搜索_华为云

string_split - 数据湖探索 DLI
string_split - 数据湖探索 DLI

（VARCHAR） test-flink - flink - one-two-ww-three - 查看输出结果。方法一：登录DLI管理控制台，选择“作业管理 > Flink作业”。在对应Flink作业所在行的“操作”列，选择“更多 > FlinkUI”。在FlinkUI界面，选择“Task

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数 > 表值函数
SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

要去掉该标识。设置spark.sql.autoBroadcastJoinThreshold=-1，具体操作如下：登录DLI管理控制台，单击“作业管理 > SQL作业”，在对应报错作业的“操作”列，单击“编辑”进入到SQL编辑器页面。单击“设置”，在参数设置中选择“spark

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
设置Spark作业优先级 - 数据湖探索 DLI

Spark作业操作步骤在“Spark参数”中配置如下参数，其中x为优先级取值。 spark.dli.job.priority=x 登录DLI管理控制台。单击“作业管理 > Spark作业”。选择待配置的作业，单击操作列下的编辑。在“Spark参数”中配置spark.dli.job.priority参数。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
DLI Hudi开发规范 - 数据湖探索 DLI

DLI Hudi开发规范 Hudi开发规范概述 Hudi数据表设计规范 Hudi数据表管理操作规范 Spark on Hudi开发规范 Bucket调优示例

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
查询指定资源实例的标签信息 - 数据湖探索 DLI

增强型跨源连接ID：在DLI管理控制台的“增强型跨源连接”列表页获取“连接ID”即为增强型跨源连接ID。数据库ID：添加标签时候传入的数据库ID即数据库名。您可以在DLI控制台的“库表管理”页面查看数据库名称。 Flink作业ID：在DLI管理控制台的“Flink作业”列表页

 帮助中心 > 数据湖探索 DLI > API参考 > 资源标签相关API
最新动态 - 数据湖探索 DLI
最新动态 - 数据湖探索 DLI

相关文档 1 计算队列支持跨AZ双活 DLI跨AZ队列能够为用户提供跨区域容灾的能力，提高计算的可靠性。商用队列管理概述 2 支持Spark作业开发者模式用户可以在DLI管理控制台采用API接口模式设置参数及参数值。商用创建批处理作业API 2020年5月序号功能名称功能描述

 帮助中心 > 数据湖探索 DLI > 最新动态
DLI Spark 2.3.2版本停止服务（EOS）公告 - 数据湖探索 DLI

版本无关。如何升级到DLI Spark 2.4.5版本？在DLI管理控制台，购买弹性资源池和队列资源，用于提供执行作业所需的计算资源。单击“作业管理 > Spark作业”，新建Spark作业。在作业管理页面，单击作业操作列的“编辑”，进入作业运行参数编辑页面。配置Spa

帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

Jar作业可靠性配置与SQL作业相同，不再另行说明。根据如下公式，配置作业的“CU数量”、“管理单元”与“最大并行数”： CU数量 = 管理单元 + (算子总并行数 / 单TM Slot数) * 单TM所占CU数例如：CU数量为9CU，管理单元为1CU，最大并行数为16，则计算单元为8CU。如果不手动配

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
Flink作业输出流写入数据到OBS，通过该OBS文件路径创建的DLI表查询无数据 - 数据湖探索 DLI

果未开启则需要开启Checkpoint参数，重新运行作业生成OBS数据文件。开启Checkpoint步骤如下。到DLI管理控制台，左侧导航栏选择“作业管理 > Flink作业”，在对应的Flink作业所在行，操作列下单击“编辑”。在“运行参数”下，查看“开启Checkpoint”参数是否开启。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
Flink作业咨询类 - 数据湖探索 DLI

Flink作业咨询类如何给子用户授权查看Flink作业？ Flink作业怎样设置“异常自动重启”？ Flink作业如何保存作业日志？ Flink作业管理界面对用户进行授权时提示用户不存在怎么办？手动停止了Flink作业，再次启动时怎样从指定Checkpoint恢复？ DLI使用SMN主题，提示SMN主题不存在，怎么处理？

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类
创建集群（废弃） - 数据湖探索 DLI

同时是计费的单元。可选择16CU，64CU和256CU三种规格，如果需要更大配额，请联系DLI服务管理员。 cidr_in_vpc 否 String vpc的网段。 cidr_in_mgntsubnet 否 String 管理子网的网段。 cidr_in_subnet 否 String 特殊子网网段。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 集群相关API（废弃）
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

他的程序呢？ DLI服务在其计算资源中已经内置了一些常用的机器学习的算法库（具体可以参考”数据湖探索 DLI > 用户指南> 数据管理> 程序包管理> 内置依赖包”），这些常用算法库满足了大部分用户的使用场景。对于用户的PySpark程序依赖了内置算法库未提供的程序库该如何呢？其

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

jar作业的场景需要手动配置由LakeFormation提供元数据服务的Hudi锁实现类，请参照 Hudi锁配置说明。登录DLI管理控制台，选择“作业管理 > Spark作业”，进入到Spark作业的界面。提交Hudi相关的Spark jar作业需要选择Spark版本为3.3.1，且使用的通用队列需要支持Hudi。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
使用Flink Jar读写DIS开发指南 - 数据湖探索 DLI

创建所需要的DIS通道，具体流程可参开通DIS通道。在DIS控制台，打开“App管理 > 创建App”，填写App名称，App名称对应的是代码中的groupId。图1 创建App 创建Flink Jar对应的程序包。在DLI控制台，打开“数据管理 > 程序包管理”，单击“创建程序包”，创建Flink Jar对

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
DLI的数据可存储在哪些地方 - 数据湖探索 DLI

DLI表与OBS表有什么区别？ DLI表表示数据存储在本服务内部，用户不感知数据存储路径。 OBS表表示数据存储在用户自己账户的OBS桶中，源数据文件由用户自己管理。 DLI表相较于OBS表提供了更多权限控制和缓存加速的功能，性能相较于外表性能更好，但是会收取存储费用。父主题： DLI产品咨询类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

E_DEFAULT_PARTITION__”，当前Spark判断分区为空时，则会直接返回null，不返回具体的数据。解决方案登录DLI管理控制台，在“SQL编辑器”中，单击“设置”。在参数设置中，添加参数“spark.sql.forcePartitionPredicatesOnPartitionedTable

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
查询所有数据库（废弃） - 数据湖探索 DLI

enterprise_project_id 是 String 企业项目ID，“0”表示default，即默认的企业项目。关于如何设置企业项目请参考《企业管理用户指南》。说明：开通了企业管理服务的用户可设置该参数绑定指定的项目。 resource_id 是 String 资源ID。请求示例无响应示例 {

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 资源相关API（废弃） > 数据库相关API（废弃）
DLI跨源连接报错找不到子网怎么办？ - 数据湖探索 DLI

C（虚拟私有云）的VPC Administrator权限。客户未给VPC服务授权导致DLI跨源连接报错找不到子网。处理步骤登录DLI管理控制台，选择“全局配置 > 服务授权”。在委托设置页面，按需选择所需的委托权限。其中“DLI Datasource Connections

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
创建并提交SQL作业 - 数据湖探索 DLI

池并添加队列。 SQL作业只能在队列类型为“SQL队列”下执行。数据目录数据目录（Catalog）是元数据管理对象，它可以包含多个数据库。您可以在DLI中创建并管理多个Catalog，用于不同的元数据隔离。数据库下拉选择需要使用的数据库。如果没有可用数据库，此处显示“d

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
DLI支持的Prometheus基础监控指标 - 数据湖探索 DLI

保证JobManager的JVM可用的堆内存量 flink_jobmanager_Status_JVM_Memory_Heap_Max JobManager中可用于内存管理的最大堆内存量 flink_jobmanager_Status_JVM_Memory_NonHeap_Used JobManager的堆外内存使用量

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用AOM监控DLI服务

总条数： 1166

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

string_split - 数据湖探索 DLI

SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

设置Spark作业优先级 - 数据湖探索 DLI

DLI Hudi开发规范 - 数据湖探索 DLI

查询指定资源实例的标签信息 - 数据湖探索 DLI

最新动态 - 数据湖探索 DLI

DLI Spark 2.3.2版本停止服务（EOS）公告 - 数据湖探索 DLI

Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

Flink作业输出流写入数据到OBS，通过该OBS文件路径创建的DLI表查询无数据 - 数据湖探索 DLI

Flink作业咨询类 - 数据湖探索 DLI

创建集群（废弃） - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

使用Flink Jar读写DIS开发指南 - 数据湖探索 DLI

DLI的数据可存储在哪些地方 - 数据湖探索 DLI

DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

查询所有数据库（废弃） - 数据湖探索 DLI

DLI跨源连接报错找不到子网怎么办？ - 数据湖探索 DLI

创建并提交SQL作业 - 数据湖探索 DLI

DLI支持的Prometheus基础监控指标 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线