搜索_华为云

配置Tableau通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

在安装和使用Kyuubi前，确保您的开发环境已安装JDK。 Java SDK要求使用JDK1.8或更高版本。考虑到后续版本的兼容性，推荐使用1.8版本。下载JDK。从Oracle官网下载并安装JDK1.8版本安装包。本例使用jdk-8u261-linux-x64.tar.gz。将jdk上传到linux服务器对

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
创建弹性资源池并添加队列 - 数据湖探索 DLI

弹性资源池名称不区分大小写，系统会自动转换为小写。类型基础版：提供16-64CUs规格的资源适用于对资源消耗不高、对资源高可靠性和高可用性要求不高的测试场景。不支持高可靠与高可用。不支持设置队列属性和作业优先级。不支持对接Notebook实例。标准版：提供64CUs及以上规格的资源具备强

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
配置Beeline通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

在安装和使用Kyuubi前，确保您的开发环境已安装JDK。 Java SDK要求使用JDK1.8或更高版本。考虑到后续版本的兼容性，推荐使用1.8版本。下载JDK。从Oracle官网下载并安装JDK1.8版本安装包。本例使用jdk-8u261-linux-x64.tar.gz。将jdk上传到linux服务器对

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
使用DLI提交Spark Jar作业 - 数据湖探索 DLI

每个区域默认对应一个项目，由系统预置。系统默认项目名称弹性资源池名称。 dli_resource_pool 规格选择弹性资源池规格。标准版 CU范围弹性资源池最大最小CU范围。 64-64 网段规划弹性资源池所属的网段。如需使用DLI增强型跨源，弹性资源池网段与数据源网段不

 帮助中心 > 数据湖探索 DLI > 快速入门
使用DLI分析电商实时业务数据 - 数据湖探索 DLI

了解VPC计费说明。 DMS Kafka Kafka提供的消息队列服务，向用户提供计算、存储和带宽资源独占式的Kafka专享实例。 Kafka版支持按需和包周期两种付费模式。Kafka计费项包括Kafka实例和Kafka的磁盘存储空间。了解Kafka计费说明。 RDS MySQL 数据库

 帮助中心 > 数据湖探索 DLI > 最佳实践
使用DLI提交Flink OpenSource SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

更多信息请参考《分布式消息服务Kafka用户指南》中的“准备实例依赖资源”章节。创建用于作业输入流的Kafka专享版实例登录分布式消息服务Kafka管理控制台。在管理控制台左上角选择区域。在“Kafka专享版”页面，单击右上角“购买Kafka实例”配置相关参数。实例信息如下：计费模式：按需付费区域：选择与DLI服务相同的区域

 帮助中心 > 数据湖探索 DLI > 快速入门
创建增强型跨源连接 - 数据湖探索 DLI

创建增强型跨源连接操作场景使用DLI访问其他数据源的数据前，首先要通过建立增强型跨源连接打通DLI和数据源之间的网络，DLI才能够访问、导入、查询、分析其他数据源的数据。例如：DLI连接MRS、RDS、CSS、Kafka、DWS时，需要打通DLI和对应数据源VPC之间的网络，才能实现数据互通。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
从MySQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

从MySQL CDC源表读取数据写入到DWS 本指导仅适用于Flink 1.12版本。场景描述 CDC是变更数据捕获（Change Data Capture）技术的缩写，它可以将源数据库的增量变动记录，同步到一个或多个数据目的中。CDC在数据同步过程中，还可以对数据进行一定的处理，例如分组（GROUP

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
典型场景示例：配置DLI与内网数据源的网络联通 - 数据湖探索 DLI

步骤1：获取外部数据源的内网IP、端口和安全组表2 各数据源信息获取数据源参数获取 DMS Kafka 在Kafka管理控制台，选择“Kafka专享版”，单击对应的Kafka名称，进入到Kafka的基本信息页面。在“连接信息”中获取该Kafka的“内网连接地址”，在“网络”中获取该实例的“虚拟私有云”和“子网”信息。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
使用Notebook实例提交DLI作业 - 数据湖探索 DLI

自定义镜像中注册的镜像。所属队列：选择步骤1：创建弹性资源池并添加通用队列中创建的队列。 Spark版本：推荐选择Spark 3.3.1版本。增强型跨源链接：选择步骤3：创建增强型跨源连接中创建的增强型跨源连接。图1 预置创建Notebook实例相关的DLI资源信息单击“

帮助中心 > 数据湖探索 DLI > 用户指南
DLI委托概述 - 数据湖探索 DLI
DLI委托概述 - 数据湖探索 DLI

3.3.1，执行作业时使用用户认证信息（AKSK、SecurityToken）。即引擎版本低于Flink1.15和Spark 3.3.1版本的作业不受更新委托权限的影响，无需自定义委托。为兼容存量的作业委托权限需求，dli_admin_agency仍为您保留在IAM委托中。

帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI访问其他云服务的委托权限
DLI弹性资源池与队列简介 - 数据湖探索 DLI

k Task重算，引起Spark作业和SQL作业内部自动重试，当作业重试超过限制会导致作业执行失败，需用户重新执行作业。 Spark2.3版本作业需要升级作业版本后才能支持运行中动态缩容功能。 Spark Steaming作业、Flink作业在运行过程中所在节点无法缩容，需要暂停

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
配置DLI云服务委托权限 - 数据湖探索 DLI

3.3.1，执行作业时使用用户认证信息（AKSK、SecurityToken）。即引擎版本低于Flink1.15和Spark 3.3.1版本的作业不受更新委托权限的影响，无需自定义委托。常见的需要自建委托的业务场景： DLI表生命周期清理数据及Lakehouse表数据清理所需

 帮助中心 > 数据湖探索 DLI > 用户指南 > 准备工作
设置普通队列的弹性扩缩容定时任务 - 数据湖探索 DLI

设置普通队列的弹性扩缩容定时任务弹性扩缩容定时任务使用场景通常，用户业务繁忙的场景是有周期性的，在某个周期内，用户需要更多的计算资源来处理业务，过了这个周期，则不需要那么多资源。如果用户购买的队列规格比较小，在业务繁忙时会存在资源不足的情况；而如果购买的队列规格比较大，又可能会存在资源浪费的情况。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
Hive源表 - 数据湖探索 DLI
Hive源表 - 数据湖探索 DLI

Hive源表简介 Apache Hive 已经成为了数据仓库生态系统中的核心。它不仅仅是一个用于大数据分析和ETL场景的SQL引擎，同样它也是一个数据管理平台，可用于发现，定义，和演化数据。 Flink与Hive的集成包含两个层面，一是利用了Hive的MetaStore作为持

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
Canal Format - 数据湖探索 DLI
Canal Format - 数据湖探索 DLI

-->测试）。若能连通，则表示跨源已经绑定成功；否则表示未成功。创建flink opensource sql作业，选择flink1.12版本，并提交运行，其代码如下： create table kafkaSource( id bigint, name string,

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
从PostgreSQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

从PostgreSQL CDC源表读取数据写入到DWS 本指导仅适用于Flink 1.12版本。场景描述 CDC是变更数据捕获（Change Data Capture）技术的缩写，它可以将源数据库的增量变动记录，同步到一个或多个数据目的中。CDC在数据同步过程中，还可以对数据进行一定的处理，例如分组（GROUP

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

每个区域默认对应一个项目，由系统预置。系统默认项目名称弹性资源池名称。 dli_resource_pool 规格选择弹性资源池规格。标准版 CU范围弹性资源池最大最小CU范围。 64-64 网段规划弹性资源池所属的网段。如需使用DLI增强型跨源，弹性资源池网段与数据源网段不

 帮助中心 > 数据湖探索 DLI > 快速入门
Ogg Format - 数据湖探索 DLI
Ogg Format - 数据湖探索 DLI

> 测试）。如果能连通，则表示跨源已经绑定成功；否则表示未成功。创建flink opensource sql作业，选择flink1.15版本，并提交运行，其代码如下： CREATE TABLE kafkaSource ( id bigint, name string,

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

若计算资源规格配置值设置得过高，超出了集群或项目的资源分配能力，作业可能会因资源申请失败导致运行错误。表6 计算资源规格取值范围参数说明标准版弹性资源池修改后限制基础版弹性资源池 Executor内存 450MB-64GB 450MB-16GB Executor CPU核数 0-16 0-4 Executor个数

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业

总条数： 63

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置Tableau通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

创建弹性资源池并添加队列 - 数据湖探索 DLI

配置Beeline通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

使用DLI提交Spark Jar作业 - 数据湖探索 DLI

使用DLI分析电商实时业务数据 - 数据湖探索 DLI

使用DLI提交Flink OpenSource SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

创建增强型跨源连接 - 数据湖探索 DLI

从MySQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

典型场景示例：配置DLI与内网数据源的网络联通 - 数据湖探索 DLI

使用Notebook实例提交DLI作业 - 数据湖探索 DLI

DLI委托概述 - 数据湖探索 DLI

DLI弹性资源池与队列简介 - 数据湖探索 DLI

配置DLI云服务委托权限 - 数据湖探索 DLI

设置普通队列的弹性扩缩容定时任务 - 数据湖探索 DLI

Hive源表 - 数据湖探索 DLI

Canal Format - 数据湖探索 DLI

从PostgreSQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

Ogg Format - 数据湖探索 DLI

创建Spark作业 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线