搜索_华为云

Flink Jar作业开发基础样例 - 数据湖探索 DLI

Flink Jar作业开发基础样例概述用户可以基于Flink的API进行二次开发，构建自己的应用Jar包，提交到DLI队列运行，实现与MRS Kafka、HBase、Hive、HDFS，DWS，DCS等数据源的交互。本章节以通过自定义作业与MRS进行交互为例进行说明。更多样例代码请通过DLI样例代码获取。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
配置YongHong BI连接DLI进行数据查询和分析 - 数据湖探索 DLI

<key1>=<val1>;<key2>=<val2>… 说明： endpoint指DLI的终端节点，具体请参考地区和终端节点。 projectId指项目编号，从华为云“基本信息>我的凭证”页面获取项目编号。 “？”后面接其他配置项，每个配置项以“key=value”的形式列出，配置项之间以“;”隔开，详见表3

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
创建队列 - 数据湖探索 DLI
创建队列 - 数据湖探索 DLI

否 String 队列计算资源的cpu架构。 x86_64 aarch64 默认值为x86_64。说明： aarch64架构计算资源使用华为鲲鹏系列服务器。 resource_mode 否 Integer 队列资源模式。支持以下两种类型： 0：共享资源模式 1：专属资源模式 labels

帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

Overwrite) .save() 表1 redis操作参数参数描述 host 需要连接的redis集群的IP。获取方式为：登录华为云官网，之后搜索redis，进入“分布式缓存服务”,接着选择“缓存管理”，根据主机名称需要的IP，可选择其中任意一个IP进行复制即可（其中也包含了port信息），请参考图1。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
入门实践 - 数据湖探索 DLI
入门实践 - 数据湖探索 DLI

入门实践我们整理了从队列网络连通、不同类型的作业分析、数据迁移场景的常用开发指南和最佳实践内容，帮助您更好的使用DLI进行大数据分析和处理。表1 DLI常用开发指南与最佳实践场景操作指导描述 Spark SQL作业开发使用Spark SQL作业分析OBS数据介绍使用Spark

帮助中心 > 数据湖探索 DLI > 快速入门
DLI常用跨源分析开发方式 - 数据湖探索 DLI

DLI常用跨源分析开发方式跨源分析当DLI有访问外部数据源的业务需求时，首先需要通过建立增强型跨源连接，打通DLI与数据源之间的网络，再开发不同的作业访问数据源以实现DLI跨源分析。本节操作介绍DLI支持的数据源对应的开发方式。使用须知 Flink作业访问DIS，OBS和

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
在DLI使用Delta提交Spark Jar作业 - 数据湖探索 DLI

在DLI使用Delta提交Spark Jar作业 1. 添加如下依赖 <dependency> <groupId>io.delta</groupId> <artifactId>delta-core_2.12</artifactId> <version>2.3

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > DLI中使用Delta开发作业
创建OBS表时怎样指定OBS路径 - 数据湖探索 DLI

创建OBS表时怎样指定OBS路径场景概述创建OBS表时，OBS路径须指定到数据库下的具体表层路径。路径格式为：obs://xxx/数据库名/表名。创建OBS表更多语法介绍请参考《数据湖探索Spark SQL语法参考》。正确示例 CREATE TABLE `di_selle

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中问题现象 SQL作业中存在join操作，作业提交后状态一直是运行中，没有结果返回。问题根因 Spark SQL作业存在join小表操作时，会触发自动广播所有executor，使得join快速完成。但同时该操

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
流生态作业开发指引 - 数据湖探索 DLI

流生态作业开发指引流生态系统基于Flink和Spark双引擎，完全兼容Flink/Storm/Spark开源社区版本接口，并且在此基础上做了特性增强和性能提升，为用户提供易用、低时延、高吞吐的数据湖探索。数据湖探索的流生态开发包括云服务生态、开源生态和自拓展生态：云服务生态

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
概述 - 数据湖探索 DLI
概述 - 数据湖探索 DLI

概述 DLI支持原生Spark的DataSource能力，并在其基础上进行了扩展，能够通过SQL语句或者Spark作业访问其他数据存储服务并导入、查询、分析处理其中的数据，目前支持的DLI跨源访问服务有：表格存储服务CloudTable，云搜索服务CSS，分布式缓存服务DCS，文

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源
上传分组资源（废弃） - 数据湖探索 DLI

上传分组资源（废弃）功能介绍该API用于上传分组资源到某个project下。该API对应控制台的创建程序包功能。当前接口已废弃，不推荐使用。调试您可以在API Explorer中调试该接口。 URI URI格式： POST /v2.0/{project_id}/resources

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

DayTimeIntervalType的映射类型变化为Duration 说明：在ArrowWriter和ArrowColumnVector开发者API中，从Spark 3.3.x版本开始，Spark SQL中的DayTimeIntervalType类型被映射到Apache Arrow的Duration类型。

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
Spark如何将数据写入到DLI表中 - 数据湖探索 DLI

Spark如何将数据写入到DLI表中使用Spark将数据写入到DLI表中，主要设置如下参数： fs.obs.access.key fs.obs.secret.key fs.obs.impl fs.obs.endpoint 示例如下： import logging from operator

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
Postgres CDC源表 - 数据湖探索 DLI

Postgres CDC源表功能描述 Postgres的CDC源表，即Postgres的流式源表，用于依次读取PostgreSQL数据库全量快照数据和变更数据，保证不多读一条也不少读一条数据。即使发生故障，也能采用Exactly Once方式处理。前提条件 PostgreSQL

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
MySQL CDC源表 - 数据湖探索 DLI
MySQL CDC源表 - 数据湖探索 DLI

MySQL CDC源表功能描述 MySQL的CDC源表，即MySQL的流式源表，会先读取数据库的历史全量数据，并平滑切换到Binlog读取上，保证数据的完整读取。前提条件 MySQL CDC要求MySQL版本为5.7或8.0.x。该场景作业需要DLI与MySQL建立增强型跨

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
管理DLI全局变量 - 数据湖探索 DLI

管理DLI全局变量什么是全局变量 DLI支持在管理控制台设置全局变量，将作业开发过程中频繁使用的变量设置为全局变量，可以避免在编辑作业过程中重复定义，减少开发与维护成本。通过使用全局变量可以替换长难复杂变量，简化复杂参数，提升SQL语句可读性。本节操作为您介绍如何创建全局变量。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
MySql CDC - 数据湖探索 DLI
MySql CDC - 数据湖探索 DLI

MySql CDC 功能描述 MySQL的CDC源表，即MySQL的流式源表，会先读取数据库的历史全量数据，并平滑切换到Binlog读取上，保证数据的完整读取。表1 支持类别类别详情支持表类型源表前提条件 MySQL CDC要求MySQL版本为5.6，5.7或8.0.x。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

使用Flink Jar写入数据到OBS开发指南概述 DLI提供了使用自定义Jar运行Flink作业并将数据写入到OBS的能力。本章节JAVA样例代码演示将kafka数据处理后写入到OBS，具体参数配置请根据实际环境修改。环境准备已安装和配置IntelliJ IDEA等开发工具以及安装JDK和Maven。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

使用Flink Jar连接开启SASL_SSL认证的Kafka 概述本节操作介绍使用Flink Jar连接开启SASL_SSL认证的Kafka的操作方法。如需使用Flink OpenSource SQL连接开启SASL_SSL认证的Kafka，请参考Flink SQL语法参考-Kafka源表。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南

总条数： 357

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Flink Jar作业开发基础样例 - 数据湖探索 DLI

配置YongHong BI连接DLI进行数据查询和分析 - 数据湖探索 DLI

创建队列 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

入门实践 - 数据湖探索 DLI

DLI常用跨源分析开发方式 - 数据湖探索 DLI

在DLI使用Delta提交Spark Jar作业 - 数据湖探索 DLI

创建OBS表时怎样指定OBS路径 - 数据湖探索 DLI

SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

流生态作业开发指引 - 数据湖探索 DLI

概述 - 数据湖探索 DLI

上传分组资源（废弃） - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

Spark如何将数据写入到DLI表中 - 数据湖探索 DLI

Postgres CDC源表 - 数据湖探索 DLI

MySQL CDC源表 - 数据湖探索 DLI

管理DLI全局变量 - 数据湖探索 DLI

MySql CDC - 数据湖探索 DLI

使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线