搜索_华为云

Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

“Checkpoint间隔”为两次触发Checkpoint的间隔，执行Checkpoint机制会影响实时计算性能，配置间隔时间需权衡对业务的性能影响及恢复时长，最好大于Checkpoint的完成时间，建议设置为5分钟。 Exactly Once模式保证每条数据只被消费一次，At Least

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
Spark 2.4.x与Spark 3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

x：PySpark支持python版本范围2.6+版本到3.7+版本。 Spark3.3.x：PySpark支持Python版本范围3.6及以上版本。升级引擎版本后是否对作业有影响：依赖版本变化，有影响，需要排查是否涉及。 PySpark-pandas支持版本变更说明： Spark2

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
CREATE TABLE - 数据湖探索 DLI
CREATE TABLE - 数据湖探索 DLI

rwriteNonDefaultsWithLatestAvroPayload、OverwriteWithLatestAvroPayload及EmptyHoodieRecordPayload。 useCache 是否在Spark中缓存表的relation，无需用户配置。为支持Spa

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DDL语法说明
配置DLI云服务委托权限 - 数据湖探索 DLI

体操作请参考创建DLI自定义委托权限和常见场景的委托权限策略。使用Flink 1.15和Spark 3.3.1(Spark通用队列场景)及以上版本的引擎执行作业时，需自行在IAM页面创建相关委托。引擎版本低于Flink1.15，执行作业时默认使用dli_admin_agency；引擎版本低于Spark

帮助中心 > 数据湖探索 DLI > 用户指南 > 准备工作
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 // 计算从规则启动到目前为止的计数及总和(in proctime) insert into temp SELECT name, count(amount) OVER (PARTITION

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 // 计算从规则启动到目前为止的计数及总和(in proctime) insert into temp SELECT name, count(amount) OVER (PARTITION

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
数学函数概览 - 数据湖探索 DLI

ln(DOUBLE a) DOUBLE 返回给定数值的自然对数。 log log(DOUBLE base, DOUBLE a) DOUBLE 返回给定底数及指数返回自然对数。 log10 log10(DOUBLE a) DOUBLE 返回给定数值的以10为底自然对数。 log2 log2(DOUBLE

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 数学函数
新建Flink Jar作业 - 数据湖探索 DLI

作业ID。 status_name 否 String 当前状态名称。 status_desc 否 String 当前状态描述。包含异常状态原因及建议。请求示例新建名为test的Flink Jar作业，并设置作业执行在testQueue上，设置作业运行所使用的CU数、开启作业日志。

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
SDK的获取与安装 - 数据湖探索 DLI

DK安装包。表1 目录结构名称说明 jars SDK及其依赖的jar包。 maven-install 安装至本地Maven仓库的脚本及对应jar包。 dli-sdk-java.version Java SDK版本说明。方法一：通过Maven安装DLI SDK依赖推荐您通过Maven安装依赖的方式使用华为云

 帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

用户使用自定义镜像功能需要具备Docker相关的基础知识。使用限制创建自定义镜像必须使用DLI提供的基础镜像。不能随意修改基础镜像中DLI相关组件及目录。仅支持Spark jar作业、Flink jar作业，即jar包作业。使用流程图1 自定义镜像使用流程获取DLI基础镜像。使

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

DLI客户端空间命名为“dli-clientkit-<version>-bin.tar.gz”，支持在Linux环境中使用，且依赖JDK 1.8及以上版本。配置DLI Spark-submit 使用spark-submit的机器安装JDK 1.8或以上版本并配置环境变量，当前仅在Li

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
创建弹性资源池并添加队列 - 数据湖探索 DLI

不支持高可靠与高可用。不支持设置队列属性和作业优先级。不支持对接Notebook实例。标准版：提供64CUs及以上规格的资源具备强大的计算能力、高可用性、及灵活的资源管理能力，适用于大规模计算任务场景和有长期资源规划需求的业务场景。 CU范围弹性资源池最大最小CU范围。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
构造请求 - 数据湖探索 DLI
构造请求 - 数据湖探索 DLI

接口就不需要消息体，消息体具体内容需要根据具体接口而定。例如，对于IAM获取用户Token接口，您可以从接口的请求部分看到所需的请求参数及参数说明。将消息体加入后的请求如下所示，加粗的斜体字段需要根据实际值填写，其中username为用户名，domainname为用户所属的账号

 帮助中心 > 数据湖探索 DLI > API参考 > 如何调用API
新建SQL作业 - 数据湖探索 DLI
新建SQL作业 - 数据湖探索 DLI

当前状态名称。参数说明可以参考查询作业详情中status作业状态字段说明。 status_desc 否 String 当前状态描述。包含异常状态原因及建议。请求示例使用ID为100000的模板创建名为myjob的Flink SQL作业，该作业执行在testQueue队列上以独享的模式运行。

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

进入DLI界面，在左侧菜单点击”作业管理”->”Spark作业”，随后在右侧界面的右上角点击”创建作业”。首先配置队列，Spark版本选择 3.3.1 及之后的版本。可以选择配置作业名称，便于识别和筛选。配置”应用程序”，路径指向上一步上传至OBS的Spark jar包。配置委托。选择提

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
使用Flink Jar读写DIS开发指南 - 数据湖探索 DLI

put(DisConsumerConfig.GROUP_ID_CONFIG, groupId); // 是否主动更新分片信息及更新时间间隔（毫秒），若有主动扩缩容需求，可以开启 disConfig.put(FlinkDisConsumer.KEY_P

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
提交SQL作业（推荐） - 数据湖探索 DLI

IMPORT EXPORT QUERY INSERT schema 否 Array of Map 当语句类型为DDL时，返回其结果的列名称及类型。 rows 否 Array of objects 当语句类型为DDL，且dli.sql.sqlasync.enabled=false时

 帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
JDBC结果表 - 数据湖探索 DLI
JDBC结果表 - 数据湖探索 DLI

南》中“安全组”章节。 Flink跨源开发场景中直接配置跨源认证信息存在密码泄露的风险，优先推荐您使用DLI提供的跨源认证。跨源认证简介及操作方法请参考跨源认证简介。注意事项创建Flink OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
JDBC源表 - 数据湖探索 DLI
JDBC源表 - 数据湖探索 DLI

南》中“安全组”章节。 Flink跨源开发场景中直接配置跨源认证信息存在密码泄露的风险，优先推荐您使用DLI提供的跨源认证。跨源认证简介及操作方法请参考跨源认证简介。注意事项创建Flink OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
Hudi 结果表 - 数据湖探索 DLI
Hudi 结果表 - 数据湖探索 DLI

OverwriteNonDefaultsWithLatestAvroPayload、OverwriteWithLatestAvroPayload及EmptyHoodieRecordPayload。 write.tasks 否 4 Integer 写hudi表task并行度，建议值为4 index

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi

总条数： 286

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

CREATE TABLE - 数据湖探索 DLI

配置DLI云服务委托权限 - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

数学函数概览 - 数据湖探索 DLI

新建Flink Jar作业 - 数据湖探索 DLI

SDK的获取与安装 - 数据湖探索 DLI

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

创建弹性资源池并添加队列 - 数据湖探索 DLI

构造请求 - 数据湖探索 DLI

新建SQL作业 - 数据湖探索 DLI

在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

使用Flink Jar读写DIS开发指南 - 数据湖探索 DLI

提交SQL作业（推荐） - 数据湖探索 DLI

JDBC结果表 - 数据湖探索 DLI

JDBC源表 - 数据湖探索 DLI

Hudi 结果表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线