搜索_华为云

监控安全风险 - 数据湖探索 DLI

云监控服务为用户的云上资源提供了立体化监控平台。通过云监控您可以全面了解云上的资源使用情况、业务的运行状况，并及时收到异常告警做出反应，保证业务顺畅运行。 DLI服务提供基于云监控服务CES的资源监控能力 DLI已对接云监控服务，提供基于云监控服务的资源监控能力，帮助用户监控账号下的DLI

帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

S表即可对OBS上的数据进行分析和处理。本指导中的操作内容包括：创建OBS表、导入OBS表数据、插入和查询OBS表数据等内容来帮助您更好的在DLI上对OBS表数据进行处理。前提条件已创建OBS的桶。具体OBS操作可以参考《对象存储服务用户指南》。本指导中的OBS桶名都为“dli-test-021”。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

配置”应用程序”，路径指向上一步上传至OBS的Spark jar包。配置委托。选择提交DLI作业所需的委托。自定义委托请参考创建DLI自定义委托。配置”主类（--class）”，为上一步中所写的，包含需要执行的main函数的类的全名。在”Spark参数（--conf）“处

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
典型场景示例：配置弹性资源池队列扩缩容策略 - 数据湖探索 DLI

有队列的最小CU数。剩余的CU（弹性资源池最大CU-所有队列的最小CU数之和）则根据配置的优先级顺序分配：如果队列的优先级不同，根据配置的优先级顺序分配，直到剩余的CU数分配完成。如果队列的优先级相同，资源会被随机分配到某一队列，如果分配后资源还有剩余会随机分配到剩下的某一队列中，直到剩余的CU数分配完成。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？问题现象 DLI分区内表导入了CSV文件数据，导入的文件数据没有包含对应分区列的字段数据。分区表查询时需要指定分区字段，导致查询不到表数据。问题根因 DLI分区内表在导入数据时，如果文件数据没

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
DLI Delta表概述 - 数据湖探索 DLI

大规模增量处理。 DLI中Delta的使用限制仅Spark 3.3.1（3.0.0）及以上版本支持Delta。 DLI支持的Delta版本是Delta 2.3.0。 Spark 3.3.1（3.0.0）版本的SQL仍有部分不支持Delta表的相关开源语法，具体内容请参考表1。表1

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考
DLI支持的Prometheus基础监控指标 - 数据湖探索 DLI

正在进行的checkpoint的数量 flink_jobmanager_job_numberOfCompletedCheckpoints 成功完成的checkpoint的数量 flink_jobmanager_job_numberOfFailedCheckpoints 失败的checkpoint的数量

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用AOM监控DLI服务
创建并提交SQL作业 - 数据湖探索 DLI

柱状图和折线图的X轴可为任意一列，Y轴仅支持数值类型的列，扇形图对应图例和指标。 SQL编辑器功能概览 SQL作业参数设置单击SQL编辑器页面右上方的“设置”按钮。可以设置SQL作业运行参数和作业标签。参数设置：以“key/value”的形式设置提交SQL作业的配置项。详细

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
Raw Format - 数据湖探索 DLI
Raw Format - 数据湖探索 DLI

TypeSerializer 序列化的字节序列。示例使用kafka发送数据，输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列 > 找到作业的所属队列 >

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

ink Jar，并指定主类。主要参数的填写说明：所属队列：选择Flink Jar作业运行的队列。应用程序：自定义的程序包主类：指定类名：输入类名并确定类参数列表（参数间用空格分隔）。其他依赖文件：自定义的依赖文件。选择2和4导入的jks和properties文件。 Flink版本：1

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

TE BY 1”，可以将多个task生成的多个文件汇总为一个文件。操作步骤在管理控制台检查对应SQL作业详情中的“结果条数”是否正确。检查发现读取的数据量是正确的。图1 检查读取的数据量确认客户验证数据量的方式是否正确。客户验证的方式如下：通过OBS下载数据文件。通

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
弹性资源池CU设置 - 数据湖探索 DLI

注意事项在全天的任意一个时间段内，弹性资源池中所有队列的最小CU数之和需要小于等于弹性资源池的最小CU数。在全天的任意一个时间段内，弹性资源池中任意一个队列的最大CU必须小于等于弹性资源池的最大CU。弹性资源池创建后，调整最小CU时，最小CU需小于等于弹性资源池当前的CU值，否则会修改失败。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
Avro Format - 数据湖探索 DLI
Avro Format - 数据湖探索 DLI

读取kafka中的数据，以avro格式反序列化，并输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Hudi数据表Archive规范 - 数据湖探索 DLI

Archive（归档）是为了减轻Hudi读写元数据的压力，所有的元数据都存放在这个路径：Hudi表根目录/.hoodie目录，如果.hoodie目录下的文件数量超过10000就会发现Hudi表有非常明显的读写时延。规则 Hudi表必须执行Archive。对于Hudi的MOR类型和COW类型的表，都需要开启Archive。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
创建数据库 - 数据湖探索 DLI
创建数据库 - 数据湖探索 DLI

“default”的数据库。示例完整的SQL作业提交流程您可以参考《快速入门》中的《提交SQL作业》等章节描述。队列是使用DLI服务的基础，执行SQL前需要先创建队列。具体可以参考《用户指南》中的“创建队列”章节。在DLI管理控制台，单击左侧导航栏中的“SQL编辑器”，可进入SQL作业“SQL编辑器”页面。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据库相关
概述 - 数据湖探索 DLI
概述 - 数据湖探索 DLI

概述 DLI支持原生Spark的DataSource能力，并在其基础上进行了扩展，能够通过SQL语句或者Spark作业访问其他数据存储服务并导入、查询、分析处理其中的数据，目前支持的DLI跨源访问服务有：表格存储服务CloudTable，云搜索服务CSS，分布式缓存服务DCS，文

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源
CSV Format - 数据湖探索 DLI
CSV Format - 数据湖探索 DLI

根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多 > 测试地址连通性 > 输入kafka的地址 > 测试）。如果能

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
DWS Connector概述 - 数据湖探索 DLI

数据的读写操作。您可以通过自定义函数（UDF）的方式使用DWS自研的DWS Connector。自定义函数操作请参考自定义函数。 DWS-Connector的使用方法请参考dws-connector-flink。（废弃，不推荐使用）DLI服务的DWS Connector：支持

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
获取项目ID - 数据湖探索 DLI
获取项目ID - 数据湖探索 DLI

获取项目ID 操作场景在调用接口的时候，部分URL中需要填入项目ID，所以需要获取到项目ID。有如下两种获取方式：调用API获取项目ID 从控制台获取项目ID 调用API获取项目ID 项目ID可以通过调用查询指定条件下的项目信息API获取。获取项目ID的接口为“GET https:

帮助中心 > 数据湖探索 DLI > API参考 > 公共参数
JSON Format - 数据湖探索 DLI
JSON Format - 数据湖探索 DLI

该示例是从kafka的一个topic中读取数据，并使用kafka sink将数据写入到kafka的另一个topic中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format

总条数： 562

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

监控安全风险 - 数据湖探索 DLI

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

典型场景示例：配置弹性资源池队列扩缩容策略 - 数据湖探索 DLI

DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

DLI Delta表概述 - 数据湖探索 DLI

DLI支持的Prometheus基础监控指标 - 数据湖探索 DLI

创建并提交SQL作业 - 数据湖探索 DLI

Raw Format - 数据湖探索 DLI

使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

弹性资源池CU设置 - 数据湖探索 DLI

Avro Format - 数据湖探索 DLI

Hudi数据表Archive规范 - 数据湖探索 DLI

创建数据库 - 数据湖探索 DLI

概述 - 数据湖探索 DLI

CSV Format - 数据湖探索 DLI

DWS Connector概述 - 数据湖探索 DLI

获取项目ID - 数据湖探索 DLI

JSON Format - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线