搜索_华为云

开启Flink作业动态扩缩容 - 数据湖探索 DLI

oint的大小影响，如果保存点较大，可能恢复时间较慢。如果需要调整动态扩缩容的配置项，则需要停止作业进行编辑，并提交运行才能生效。操作步骤 Flink作业动态扩缩容适用于Flink Opensource SQL作业和Flink Jar作业。登录DLI管理控制台。单击“作业管理

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
DWS维表（不推荐使用） - 数据湖探索 DLI

维表配置，数据拉取最大重试次数。示例从Kafka源表中读取数据，将DWS表作为维表，并将二者生成的宽表信息写入Kafka结果表中，其具体步骤如下：参考增强型跨源连接，在DLI上根据DWS和Kafka所在的虚拟私有云和子网分别创建相应的增强型跨源连接，并绑定所要使用的Flink弹性资源池。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
配置DLI云服务委托权限 - 数据湖探索 DLI

勾选基础使用、跨源场景、运维场景的权限。图2 华北-北京四的项目A更新委托权限示意图单击“更新委托权限”。权限说明：华北-北京四的项目A按上述操作步骤更新委托权限后，由于IAM ReadOnlyAccess授权范围是全局服务资源，所以所有区域和项目均具备该权限。而跨源场景的权限“DLI

帮助中心 > 数据湖探索 DLI > 用户指南 > 准备工作
创建Kafka_SSL类型跨源认证 - 数据湖探索 DLI

源表、结果表 Kafka DMS Kafka开启SASL_SSL认证。 MRS Kafka开启SASL认证。 MRS Kafka开启SSL认证。操作步骤下载认证凭证。 DMS Kafka 登录DMS Kafka控制台，单击实例名称进入详情页面。在连接信息中，找到SSL证书，单击“下载”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
配置Flink作业权限 - 数据湖探索 DLI

Guest权限。关于Tenant Guest权限的介绍和开通方法，详细参见《权限策略》和《统一身份认证服务用户指南》中的创建用户组。 Flink作业权限相关操作步骤在DLI管理控制台的左侧，选择“作业管理”>“Flink作业”。选择待设置的作业，单击其“操作”列中的“更多”>“权限管理”。“用户权

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
典型场景示例：配置弹性资源池队列扩缩容策略 - 数据湖探索 DLI

弹性资源池”，在已创建的弹性资源池所在行的“操作”列单击“队列管理”。参考创建弹性资源池并添加队列添加队列test_a，在添加队列扩缩容配置步骤里面添加扩缩容策略。设置默认的时间段优先级为5，最小CU为16，最大CU为32。单击“新增”，添加一个优先级为20，时间段为：00--

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

方法创建的数据和read.format() 方法及read.jdbc() 方法查询的数据都为DataFrame对象，可以直接进行查询单条记录等操作（在“步骤4”中，提到将DataFrame数据注册为临时表）。 where where 方法中可传入包含and 和 or 的条件筛选表达式，返回过滤后的DataFrame对象，示例如下：

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
创建Kerberos跨源认证 - 数据湖探索 DLI

MRS安全集群已开启Kerberos认证。 Kafka MRS Kafka开启Kerberos认证。维表 HBase MRS安全集群已开启Kerberos认证。操作步骤下载数据源的认证凭证。登录MRS Manager界面。选择“系统 > 权限 > 用户”。单击“更多 > 下载认证凭据”，保存后解压得到用户的keytab文件与krb5

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
DLI datasourceV1表和datasourceV2表 - 数据湖探索 DLI

x通用队列支持V1表和V2表，但Spark3.3.x通用队列不支持V1表。因此如需将Spark版本从Spark 2.4.x升级至Spark 3.3.1需经过以下步骤：将Spark 2.4.x的V1表修改为V2表。升级Spark 2.4.x的V2表升级为Spark 3.3.1的V2表。同时还需考虑Spark

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
创建非弹性资源池队列（废弃，不推荐使用） - 数据湖探索 DLI

DLI队列不支持访问公网。队列扩缩容 16CUs队列不支持扩容和缩容。 64CUs队列不支持缩容。新创建的队列需要运行作业后才可进行扩缩容。创建队列步骤创建队列的操作入口有三个，分别在“总览”页面、“SQL编辑器”页面和“队列管理”页面。单击总览页面右上角“购买队列”进行创建队列。在“队列管理”页面创建队列。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
导出SQL作业结果 - 数据湖探索 DLI

果的组织和管理。控制台界面查询结果最多显示1000条数据，如果需要查看更多或者全量数据，则可以通过该功能将数据导出到OBS获取。具体操作步骤如下：导出查询结果的操作入口有两个，分别在“SQL作业”和“SQL编辑器”页面。在“作业管理”>“SQL作业”页面，可单击对应作业“操作”列“更多

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
作业相关 - 数据湖探索 DLI
作业相关 - 数据湖探索 DLI

dk-java-x.x.x.zip”压缩包中获取。“dli-sdk-java-x.x.x.zip”压缩包可以参考SDK的获取与安装中的操作步骤获取。父主题： SQL作业相关

 帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > SQL作业相关
SDK的获取与安装 - 数据湖探索 DLI

Maven安装完成后，可根据开发需要，直接引入依赖到已有的Maven工程或先用开发工具创建Maven工程。创建项目以idea开发工具为例(已有Maven 工程可跳过此步骤)：打开IntelliJ IDEA 开发工具。点击File - New - project... 在New Project弹窗点击-Maven-点击Next。

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
Spark Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

本章节JAVA样例代码演示将DataGen数据处理后写入到OBS，具体参数配置请根据实际环境修改。创建DLI访问DEW的委托并完成委托授权。详细步骤请参考自定义DLI委托权限。在DEW创建通用凭证。详细操作请参考创建通用凭据。登录DEW管理控制台选择“凭据管理”，进入“凭据管理”页面。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
Hbase结果表 - 数据湖探索 DLI
Hbase结果表 - 数据湖探索 DLI

不支持 MAP / MULTISET 不支持 ROW 不支持示例该示例是从Kafka数据源中读取数据，并写入到HBase结果表中，其具体步骤如下（该示例中hbase的版本为1.3.1和2.2.3）：参考增强型跨源连接，在DLI上根据HBase和Kafka所在的虚拟私有云和子网

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Flink Jar作业开发基础样例 - 数据湖探索 DLI

15版本的计算引擎时，需要用户自行配置委托，否则可能影响作业运行。详细操作请参考自定义DLI委托权限。使用方法创建并提交Flink jar作业，详细操作步骤请参见《数据湖探索用户指南》中创建Flink Jar作业章节。在DLI管理控制台的左侧导航栏中，单击“作业管理”>“Flink作业”，进入“Flink作业”页面。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
Hudi数据表Compaction规范 - 数据湖探索 DLI

jar作业异步执行compaction、clean和archive。Compaction计划的生成是轻量级的对Flink写入作业影响可以忽略。上述方案落地的具体步骤参考如下： Flink只负责写数据和生成Compaction计划 Flink流任务建表语句/SQL hints中添加如下参数，控制Flin

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

是否跳过，将jar包、Python程序文件、配置文件上传到OBS和加载到DLI服务端资源列表。当相关资源文件已经加载到DLI服务资源列表中，可以使用该参数跳过该步骤。不携带该参数时，默认会上传和加载命令中的所有资源文件到DLI服务中。 all：跳过所有资源文件的上传和加载 app：跳过Spark应用程序文件的上传和加载

 帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

图1 获取kafka source kafka sink可以在initializeState里引入。图2 获取kafka sink 操作步骤从Kafka实例的基本信息页面下载SSL证书，解压后将其中的clinet.jks文件上传到OBS。图3 下载SSL证书在DLI控制台，打开“数据管理

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
创建弹性资源池并添加队列 - 数据湖探索 DLI

同一弹性资源池中，队列之间的计算资源支持共享。通过合理设置队列的计算资源分配策略，可以提高计算资源利用率。本章节介绍创建弹性资源池并添加队列的操作步骤。 DLI弹性资源池之间为物理集群隔离，同一个弹性资源池中的队列之间为逻辑隔离。建议您对测试业务场景和生产业务场景分别创建弹性资源池，通

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列

总条数： 201

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

开启Flink作业动态扩缩容 - 数据湖探索 DLI

DWS维表（不推荐使用） - 数据湖探索 DLI

配置DLI云服务委托权限 - 数据湖探索 DLI

创建Kafka_SSL类型跨源认证 - 数据湖探索 DLI

配置Flink作业权限 - 数据湖探索 DLI

典型场景示例：配置弹性资源池队列扩缩容策略 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

创建Kerberos跨源认证 - 数据湖探索 DLI

DLI datasourceV1表和datasourceV2表 - 数据湖探索 DLI

创建非弹性资源池队列（废弃，不推荐使用） - 数据湖探索 DLI

导出SQL作业结果 - 数据湖探索 DLI

作业相关 - 数据湖探索 DLI

SDK的获取与安装 - 数据湖探索 DLI

Spark Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

Hbase结果表 - 数据湖探索 DLI

Flink Jar作业开发基础样例 - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

创建弹性资源池并添加队列 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线