搜索_华为云

DLI委托概述 - 数据湖探索 DLI
DLI委托概述 - 数据湖探索 DLI

ency。引擎版本低于Flink1.15，执行作业时默认使用dli_admin_agency；引擎版本低于Spark 3.3.1，执行作业时使用用户认证信息（AKSK、SecurityToken）。即引擎版本低于Flink1.15和Spark 3.3.1版本的作业不受更新委托权限的影响，无需自定义委托。

帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI访问其他云服务的委托权限
DLI SDK简介 - 数据湖探索 DLI
DLI SDK简介 - 数据湖探索 DLI

V3和DLI服务自行开发的SDK。（推荐）DLI SDK V3：是根据定义API的YAML文件统一自动生成，其接口参数与服务的API一致。具体操作请参考SDK V3版本开发指南。 DLI SDK（服务自研）：是DLI服务自行开发的SDK，本手册介绍DLI 自研SDK的使用方法。相关开发包请从华为云DLI 开发工具包（SDK）获取。

帮助中心 > 数据湖探索 DLI > SDK参考
使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

说明操作系统 Windows系统，支持Windows7以上版本。安装JDK JDK使用1.8版本。安装和配置IntelliJ IDEA IntelliJ IDEA为进行应用开发的工具，版本要求使用2019.1或其他兼容版本。安装Maven 开发环境的基本配置。用于项目管理，贯穿软件开发生命周期。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
流生态作业开发指引 - 数据湖探索 DLI

流生态作业开发指引流生态系统基于Flink和Spark双引擎，完全兼容Flink/Storm/Spark开源社区版本接口，并且在此基础上做了特性增强和性能提升，为用户提供易用、低时延、高吞吐的数据湖探索。数据湖探索的流生态开发包括云服务生态、开源生态和自拓展生态：云服务生态

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
查看队列的基本信息 - 数据湖探索 DLI

关于队列引擎相关字段的含义：执行引擎：负责执行队列中任务的引擎类型。默认版本：执行引擎的默认配置版本，或者是在没有指定特定版本时系统将使用的版本。支持版本：执行引擎支持的所有版本列表。通过查看队列的支持版本，您可以了解哪些版本的执行引擎可以用于处理队列中的任务。图1 队列基本信息父主题：

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
产品优势 - 数据湖探索 DLI
产品优势 - 数据湖探索 DLI

产品优势纯SQL操作 DLI提供标准SQL接口，用户仅需使用SQL便可实现海量数据查询分析。SQL语法全兼容标准ANSI SQL 2003。存算分离 DLI解耦计算和存储负载，存算分离架构，存储资源和计算资源按需灵活配置，提高了资源利用率，降低了成本。企业级多租户支持计算

 帮助中心 > 数据湖探索 DLI > 产品介绍
获取Flink作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

请参考如何使用凭据管理服务替换硬编码的数据库账号密码查询凭据。约束限制仅支持Flink1.15版本使用委托授权访问临时凭证：在创建作业时，请配置作业使用Flink1.15版本已在作业中配置允许DLI访问DEW的委托信息。flink.dli.job.agency.name=自定义委托名称。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink作业委托场景开发指导
创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

选择Spark版本。在下拉列表中选择支持的Spark版本，推荐使用最新版本。不建议长期混用不同版本的Spark/Flink引擎。长期混用不同版本的Spark/Flink引擎会导致代码在新旧版本之间不兼容，影响作业的执行效率。当作业依赖于特定版本的库或组件，长期混用不同版本的Spa

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
配置SQL防御规则 - 数据湖探索 DLI

动作的Scan files number规则。不同的引擎版本支持的防御规则不同。如需查看队列的引擎版本，您可以在队列资源的资源列表页面，通过查看队列基本信息中的“默认版本”获取引擎的版本信息。图1 查看队列引擎版本表2 DLI支持的系统防御规则规则ID 规则名称说明类别

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
使用Hive语法创建OBS表 - 数据湖探索 DLI

开启数据多版本功能，用于表数据的备份与恢复。开启多版本功能后，在进行删除或修改表数据时（insert overwrite或者truncate操作），系统会自动备份历史表数据并保留一定时间，后续您可以对保留周期内的数据进行快速恢复，避免因误操作而丢失数据。多版本功能SQL语法请

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
设置Spark作业优先级 - 数据湖探索 DLI

DLI提供的设置作业优先级功能，可以对每个Spark作业设置作业优先级，当资源不充足时，可以优先满足优先级较高的作业的计算资源。 Spark 2.4.5及以上版本的作业支持设置作业优先级。使用须知对于每个作业都允许设置优先级，其取值为1-10，数值越大表示优先级越高。优先满足高优先级作业的计算资

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
CLEANING - 数据湖探索 DLI
CLEANING - 数据湖探索 DLI

参数描述参数描述是否必填 table 需要查询表的表名，支持database.tablename格式是 clean_policy 清理老版本数据文件的策略，默认KEEP_LATEST_COMMITS 否 retain_commits 仅对KEEP_LATEST_COMMITS策略有效

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
Elasticsearch结果表 - 数据湖探索 DLI

跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。注意事项当前只支持CSS集群7.X及以上版本，推荐使用7.6.2版本。如果不使用“connector.username”和“connector.password”参数时CSS集群请勿开启安全模式。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
DLI对接LakeFormation - 数据湖探索 DLI

Jar作业访问LakeFormation元数据参数说明配置示例 Spark版本 Spark 3.3.x及以上版本支持对接LakeFormation。 3.3.1 委托使用Spark 3.3.1及以上版本的引擎执行作业时，需要您先在IAM页面创建相关委托，并在此处添加新建的委托信

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 创建并使用LakeFormation元数据
查询批处理作业详情 - 数据湖探索 DLI

spark_version 否 String 作业使用spark组件的版本号，在“feature”为“basic”或“ai”时填写，若不填写，则使用默认的spark组件版本号2.3.2。 image 否 String 自定义镜像。格式为：组织名/镜像名:镜像版本。当用户设置“feature”为“cust

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
查询作业模板列表 - 数据湖探索 DLI

String 作业使用Spark组件的版本号。如果当前Spark组件版本为2.3.2，则不填写该参数。如果当前Spark组件版本为2.3.3，则在“feature”为“basic”或“ai”时填写。若不填写，则使用默认的Spark组件版本号2.3.2。 image String

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业模板相关API
Kafka源表 - 数据湖探索 DLI
Kafka源表 - 数据湖探索 DLI

connector类型，对于kafka，需配置为'kafka'。 connector.version 是 Kafka版本，支持：'0.10'、 '0.11'。0.10或0.11版本号对应kafka版本号2.11-2.4.0及其他历史版本。 format.type 是数据反序列化格式，支持：'csv', 'json'及'avro'等。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
DLI Flink作业提交运行后（已选择保存作业日志到OBS桶），提交运行失败的情形（例如：jar包冲突），有时日志不会写到OBS桶中 - 数据湖探索 DLI

运行失败且超过1分钟(日志转储周期1分钟)，会在application_xx下生成运行日志。另外，由于DLI服务端已经内置了Flink的依赖包，并且基于开源社区版本做了安全加固。为了避免依赖包兼容性问题或日志输出及转储问题，打包时请注意排除以下文件：系统内置的依赖包，或者在Maven或者Sbt构建工具中将scope设为provided

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

给自定义镜像打标签。 docker tag 6中的[自定义组织名称]/[自定义镜像名称]:[自定义镜像版本] [镜像仓库地址]/[组织名称]/[自定义镜像名称:自定义版本名称] 示例： docker tag mydli/spark:2.4 swr.xxx/testdli0617/spark:2

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
创建DLI表关联CSS - 数据湖探索 DLI

pe为table，但绝不等同）。说明： ES 6.X版本中，单个Index只支持唯一type，type名可以自定义。 ES 7.X版本中，单个Index将使用“_doc”作为type名，不再支持自定义。若访问ES 7.X版本时，该参数只需要填写index即可。 pushdown

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接CSS表

总条数： 308

上一页
1
...
6
7
8
...
16
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

DLI委托概述 - 数据湖探索 DLI

DLI SDK简介 - 数据湖探索 DLI

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

流生态作业开发指引 - 数据湖探索 DLI

查看队列的基本信息 - 数据湖探索 DLI

产品优势 - 数据湖探索 DLI

获取Flink作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

创建Spark作业 - 数据湖探索 DLI

配置SQL防御规则 - 数据湖探索 DLI

使用Hive语法创建OBS表 - 数据湖探索 DLI

设置Spark作业优先级 - 数据湖探索 DLI

CLEANING - 数据湖探索 DLI

Elasticsearch结果表 - 数据湖探索 DLI

DLI对接LakeFormation - 数据湖探索 DLI

查询批处理作业详情 - 数据湖探索 DLI

查询作业模板列表 - 数据湖探索 DLI

Kafka源表 - 数据湖探索 DLI

DLI Flink作业提交运行后（已选择保存作业日志到OBS桶），提交运行失败的情形（例如：jar包冲突），有时日志不会写到OBS桶中 - 数据湖探索 DLI

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

创建DLI表关联CSS - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线