搜索_华为云

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

开发流程说明序号阶段操作界面说明 1 创建DLI通用队列 DLI控制台创建作业运行的DLI队列。 2 上传数据到OBS桶 OBS控制台将测试数据上传到OBS桶下。 3 新建Maven工程，配置pom文件 IntelliJ IDEA 参考样例代码说明，编写程序代码读取OBS数据。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
使用Spark作业访问DLI元数据 - 数据湖探索 DLI

单击“确定”完成添加队列配置。步骤2：OBS桶文件配置如果需要创建OBS表，则需要先上传数据到OBS桶目录下。本次演示的样例代码创建了OBS表，测试数据内容参考如下示例，创建名为的testdata.csv文件。 12,Michael 27,Andy 30,Justin 进入OBS管理控

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
Flink SQL作业类 - 数据湖探索 DLI

null错误 Flink SQL作业消费Kafka后sink到es集群，作业执行成功，但未写入数据 Flink Opensource SQL如何解析复杂嵌套 JSON？ Flink Opensource SQL从RDS数据库读取的时间和RDS数据库存储的时间为什么会不一致？ Flink

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类
DLI资源配额类 - 数据湖探索 DLI

DLI资源配额类什么是用户配额？怎样查看我的配额如何申请扩大配额

 帮助中心 > 数据湖探索 DLI > 常见问题
审计与日志 - 数据湖探索 DLI
审计与日志 - 数据湖探索 DLI

CTS可记录的DLI操作列表详见云审计服务支持的DLI操作列表说明。用户开通云审计服务并创建和配置追踪器后，CTS开始记录操作事件用于审计。关于如何开通云审计服务以及如何查看追踪事件，请参考《云审计服务快速入门》中的相关章节。 CTS支持配置关键操作通知。用户可将与IAM相关的高危敏感操作，作为关

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
Spark作业使用咨询 - 数据湖探索 DLI

SQL语法不支持定义主键。 DLI Spark jar作业是否能访问DWS跨源表？可以访问。详细操作请参考访问DWS和访问SQL库表。如何查看Spark内置依赖包的版本？ DLI内置依赖包是平台默认提供的依赖包，用户打包Spark或Flink jar作业jar包时，不需要额外

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
Hive结果表 - 数据湖探索 DLI
Hive结果表 - 数据湖探索 DLI

交记录使其可见。用户控制何时/如何触发具有多个属性的提交。流式写入不支持插入覆盖。有关可用配置的完整列表，请参阅流式处理接收器。Streaming sink 前提条件该场景作业需要建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
创建IAM用户并授权使用DLI - 数据湖探索 DLI

果提示权限不足，表示“DLI ReadOnlyAccess”已生效。更多操作创建子用户请参考《如何创建子用户》。创建自定义策略请参考DLI自定义策略。修改用户策略请参考《如何修改用户策略》。父主题：准备工作

 帮助中心 > 数据湖探索 DLI > 用户指南 > 准备工作
Hbase - 数据湖探索 DLI
Hbase - 数据湖探索 DLI

Hbase HBase连接器支持读取和写入HBase集群。本文档介绍如何使用HBase连接器基于HBase进行SQL查询。 HBase连接器在upsert模式下运行，可以使用 DDL 中定义的主键与外部系统交换更新操作消息。但是主键只能基于HBase的rowkey字段定义。如果没

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
身份认证与访问控制 - 数据湖探索 DLI

授权方式 DLI FullAccess 数据湖探索所有权限。系统策略具体的授权方式请参考创建IAM用户并授权使用DLI以及《如何创建子用户》和《如何修改用户策略》。 DLI ReadOnlyAccess 数据湖探索只读权限。系统策略 Tenant Administrator

帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
Hbase结果表 - 数据湖探索 DLI
Hbase结果表 - 数据湖探索 DLI

S集群所有节点的主机ip信息。详细操作请参考《数据湖探索用户指南》中的“修改主机信息”章节描述。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。语法格式 create table hbaseSink

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
Hbase源表 - 数据湖探索 DLI
Hbase源表 - 数据湖探索 DLI

S集群所有节点的主机ip信息。详细操作请参考《数据湖探索用户指南》中的“修改主机信息”章节描述。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。语法格式 create table hbaseSource

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
Elasticsearch结果表 - 数据湖探索 DLI

该场景作业需要运行在DLI的独享队列上，因此要与云搜索服务建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。注意事项当前只支持CSS集群7.X及以上版本，推荐使用7

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
管理DLI资源配额 - 数据湖探索 DLI

图1 我的配额您可以在“服务配额”页面，查看各项资源的总配额及使用情况。如果当前配额不能满足业务要求，请参考后续操作，申请扩大配额。如何申请扩大配额？登录管理控制台。在页面右上角，选择“资源 > 我的配额”。系统进入“服务配额”页面。图2 我的配额单击“申请扩大配额”。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
配额管理 - 数据湖探索 DLI
配额管理 - 数据湖探索 DLI

图1 我的配额您可以在“服务配额”页面，查看各项资源的总配额及使用情况。如果当前配额不能满足业务要求，请参考后续操作，申请扩大配额。如何申请扩大配额？登录管理控制台。在页面右上角，选择“资源 > 我的配额”。系统进入“服务配额”页面。图2 我的配额单击“申请扩大配额”。

帮助中心 > 数据湖探索 DLI > 产品介绍
创建DLI自定义委托权限 - 数据湖探索 DLI

全局服务资源：全局服务部署时不区分区域，访问全局级服务，不需要切换区域，全局服务不支持基于区域项目授权。如对象存储服务（OBS）、内容分发网络（CDN）等。授权后，用户根据权限使用全局服务的资源。指定区域项目资源：授权后，IAM用户根据权限使用所选区域项目中的资源，未选择的区域项目中的资源，该IAM用户将无权访问。

帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI访问其他云服务的委托权限
获取Spark作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

BasicCredentials。仅支持获取AK、SK、SecurityToken。获取到AK、SK、SecurityToken后，请参考如何使用凭据管理服务替换硬编码的数据库账号密码查询凭据。约束限制仅支持Spark3.3.1版本（Spark通用队列场景）使用委托授权访问临时凭证：

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
DLI Spark 2.3.2版本停止服务（EOS）公告 - 数据湖探索 DLI

支持配置小文件合并使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。参考如何合并小文件完成合并小文件。支持修改非分区表或分区表的列注释修改非分区表或分区表的列注释。支持统计SQL作业的CPU消耗支持在控制台查看“CPU累计使用量”。

帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
DLI Spark 3.1.1版本停止服务（EOS）公告 - 数据湖探索 DLI

支持配置小文件合并使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。参考如何合并小文件完成合并小文件。支持修改非分区表或分区表的列注释修改非分区表或分区表的列注释。支持统计SQL作业的CPU消耗支持在控制台查看“CPU累计使用量”。

帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
Hudi Clean操作说明 - 数据湖探索 DLI

什么是Clean Cleaning用于清理Hudi表不再需要的老版本数据文件 (parquet文件或者log文件)，减轻存储压力，提升list操作效率。如何执行Clean 写完数据后clean Spark SQL（设置如下参数，随后执行任意写入SQL时，在满足条件时触发） hoodie.clean

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护

总条数： 320

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

使用Spark作业访问DLI元数据 - 数据湖探索 DLI

Flink SQL作业类 - 数据湖探索 DLI

DLI资源配额类 - 数据湖探索 DLI

审计与日志 - 数据湖探索 DLI

Spark作业使用咨询 - 数据湖探索 DLI

Hive结果表 - 数据湖探索 DLI

创建IAM用户并授权使用DLI - 数据湖探索 DLI

Hbase - 数据湖探索 DLI

身份认证与访问控制 - 数据湖探索 DLI

Hbase结果表 - 数据湖探索 DLI

Hbase源表 - 数据湖探索 DLI

Elasticsearch结果表 - 数据湖探索 DLI

管理DLI资源配额 - 数据湖探索 DLI

配额管理 - 数据湖探索 DLI

创建DLI自定义委托权限 - 数据湖探索 DLI

获取Spark作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

DLI Spark 2.3.2版本停止服务（EOS）公告 - 数据湖探索 DLI

DLI Spark 3.1.1版本停止服务（EOS）公告 - 数据湖探索 DLI

Hudi Clean操作说明 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线