搜索_华为云

Flink作业重启后，如何判断是否可以从checkpoint恢复 - 数据湖探索 DLI

从checkpoint恢复的原则通常当作业执行失败、资源异常重启等非人为触发的异常场景时，支持从checkpoint恢复。但是如果修改了作业的运算逻辑，作业的计算逻辑已发生更改，不支持从checkpoint恢复。应用场景本文列举了一些常见的从checkpoint恢复的场景供您参考，如表1所示。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
使用Livy提交Spark Jar作业 - 数据湖探索 DLI

Livy是基于开源的Apache Livy用于提交Spark作业到DLI的客户端工具。准备工作创建DLI队列。在“队列类型”中选择“通用队列”，即Spark作业的计算资源。具体请参考创建队列。准备一个linux弹性云服务器ECS，用于安装DLI Livy。 ECS需要放通30000至32767端口、8

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
instr1 - 数据湖探索 DLI
instr1 - 数据湖探索 DLI

instr1 instr1函数用于计算子串str2在字符串str1中的位置。相似函数：instr，instr函数用于返回substr在str中最早出现的下标。但是instr不支持指定起始搜索位置和匹配次数。命令格式 instr1(string <str1>, string <str2>[

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
区域和可用区 - 数据湖探索 DLI

的集合，有独立的风火水电，AZ内逻辑上再将计算、网络、存储等资源划分成多个集群。一个Region中的多个AZ间通过高速光纤相连，以满足用户跨AZ构建高可用性系统的需求。图1阐明了区域和可用区之间的关系。图1 区域和可用区目前，华为云已在全球多个地域开放云服务，您可以根据需求

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
窗口函数 - 数据湖探索 DLI
窗口函数 - 数据湖探索 DLI

分钟生成一个新的窗口。图1 滚动窗口示例图语法描述 TUMBLE 函数通过时间属性字段为每行数据分配一个窗口。在流计算模式，时间属性字段必须被指定为事件或处理时间属性。在批计算模式，窗口表函数的时间属性字段必须是 TIMESTAMP 或 TIMESTAMP_LTZ 的类型。 TUMBLE

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

1时，支持在Spark参数（--conf)配置计算资源规格参数，且conf的配置优先级高于高级配置指定的值。参数对应关系请参考表5。在Spark参数（--conf)配置计算资源规格参数时，可以配置单位 M/G/K，不配置时候默认单位为byte。表5 控制台计算资源规格参数与Spark参数（

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
Flink作业性能调优 - 数据湖探索 DLI

使用超高IO本地盘规格机型，加速磁盘操作 group agg单点及数据倾斜调优按天聚合计算或者group by key不均衡场景下，group聚合计算存在单点或者数据倾斜问题，此时，可以通过将聚合计算拆分成Local-Global进行优化。配置方式为设置调优参数: table.optimizer

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
row - 数据湖探索 DLI
row - 数据湖探索 DLI

row_number row_number函数用于计算行号。从1开始递增。使用限制窗口函数的使用限制如下：窗口函数只能出现在select语句中。窗口函数中不能嵌套使用窗口函数和聚合函数。窗口函数不能和同级别的聚合函数一起使用。命令格式 row_number() ove

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
为什么Spark jar 作业一直处于“提交中”？ - 数据湖探索 DLI

查看队列的的剩余步骤如下：查看队列CU使用量。点击“云监控服务 > 云服务监控 > 数据探索湖 > 队列监控 > 队列CU使用量” 。计算剩余CU量。队列剩余CU量=队列CU量 - 队列CU使用量。当队列剩余CU量小于用户提交的CU量，则需要等待资源，才能提交成功。父主题：

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
窗口聚合 - 数据湖探索 DLI
窗口聚合 - 数据湖探索 DLI

BY子句定义的，其特征是包含窗口表值函数产生的 “window_start” 和 “window_end” 列。和普通的 GROUP BY 子句一样，窗口聚合对于每个组会计算出一行数据。和其他连续表上的聚合不同，窗口聚合不产生中间结果，只在窗口结束产生一个总的聚合结果，另外，窗口聚合会清除不需要的中间状态。更

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
DLI对接LakeFormation - 数据湖探索 DLI

DLI对接LakeFormation 操作场景 LakeFormation是企业级一站式湖仓构建服务，提供元数据统一管理能力，支持无缝对接多种计算引擎及大数据云服务，便捷高效地构建数据湖和运营相关业务，加速释放业务数据价值。在DLI的Spark作业和SQL作业场景，支持对接Lake

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 创建并使用LakeFormation元数据
扫描量计费 - 数据湖探索 DLI
扫描量计费 - 数据湖探索 DLI

如果扫描字节数量少于10M，则按10M计算。数据定义语言（DDL）语句（如 CREATE、ALTER、DROP TABLE等语句）、管理分区语句、失败的查询语句无需付费。取消的查询，按取消查询时扫描的总数据量计费。若计算任务超时或失败，则当次计算不收取费用。数据的存储方式（包括

 帮助中心 > 数据湖探索 DLI > 计费说明
instr - 数据湖探索 DLI
instr - 数据湖探索 DLI

当参数中出现NULL时，返回NULL，当str中不存在substr时返回0，注意下标从1开始。相似函数：instr1，instr1函数用于计算子串str2在字符串str1中的位置，instr1函数支持指定起始搜索位置和匹配次数。命令格式 instr(string <str>, string

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
percentlie - 数据湖探索 DLI
percentlie - 数据湖探索 DLI

percentlie percentile函数用于计算精确百分位数，适用于小数据量。先对指定列升序排列，然后取第p位百分数的精确值。命令格式 percentile(colname,DOUBLE p) 参数说明表1 参数说明参数是否必选参数类型说明 colname 是 STRING类型

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 数学函数
percentlie - 数据湖探索 DLI
percentlie - 数据湖探索 DLI

percentlie_approx percentile_approx函数用于计算近似百分位数，适用于大数据量。先对指定列升序排列，然后取第p位百分数最靠近的值。命令格式 percentile_approx (colname,DOUBLE p) 参数说明表1 参数说明参数是否必选

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 数学函数
rank - 数据湖探索 DLI
rank - 数据湖探索 DLI

rank rank函数用于计算一个值在一组值中的排位。如果出现并列的情况，RANK函数会在排名序列中留出空位。使用限制窗口函数的使用限制如下：窗口函数只能出现在select语句中。窗口函数中不能嵌套使用窗口函数和聚合函数。窗口函数不能和同级别的聚合函数一起使用。命令格式

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
percent - 数据湖探索 DLI
percent - 数据湖探索 DLI

percent_rank percent_rank函数为窗口的ORDER BY子句所指定列中值的返回值，但以介于0和1之间的小数形式表示，计算方法为 (分组内当前行的RANK值-1)/(分组内总行数-1)。使用限制窗口函数的使用限制如下：窗口函数只能出现在select语句中。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
查询所有队列 - 数据湖探索 DLI

子网网段。 resource_mode 否 Integer 资源模式。 0：共享队列 1：专属队列 platform 否 String 队列计算资源的cpu架构。 x86_64 aarch64 is_restarting 否 Boolean 是否重启队列。默认值为“false”。 labels

帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
存储计费 - 数据湖探索 DLI
存储计费 - 数据湖探索 DLI

计费公式资源类型计费公式资源单价计算资源计算费用=单价*CU数*小时数请参见DLI产品价格详情。存储资源存储费用=单价*存储数据量（GB）*小时数。请参见DLI产品价格详情。表3 资源类型资源类型计费详情合计计算资源 0.4元/小时，实际CUs：64CUs，累计计费时长：2小时

 帮助中心 > 数据湖探索 DLI > 计费说明
创建Flink Jar作业 - 数据湖探索 DLI

57字节。说明：作业名称必须是唯一的。描述作业的相关描述，且长度为0～512字节。标签使用标签标识云资源。包括标签键和标签值。如果您需要使用同一标签标识多种云资源，即所有服务均可在标签输入框下拉选择同一标签，建议在标签管理服务（TMS）中创建预定义标签。如您的组织已

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业

总条数： 662

上一页
1
...
5
6
7
...
34
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Flink作业重启后，如何判断是否可以从checkpoint恢复 - 数据湖探索 DLI

使用Livy提交Spark Jar作业 - 数据湖探索 DLI

instr1 - 数据湖探索 DLI

区域和可用区 - 数据湖探索 DLI

窗口函数 - 数据湖探索 DLI

创建Spark作业 - 数据湖探索 DLI

Flink作业性能调优 - 数据湖探索 DLI

row - 数据湖探索 DLI

为什么Spark jar 作业一直处于“提交中”？ - 数据湖探索 DLI

窗口聚合 - 数据湖探索 DLI

DLI对接LakeFormation - 数据湖探索 DLI

扫描量计费 - 数据湖探索 DLI

instr - 数据湖探索 DLI

percentlie - 数据湖探索 DLI

percentlie - 数据湖探索 DLI

rank - 数据湖探索 DLI

percent - 数据湖探索 DLI

查询所有队列 - 数据湖探索 DLI

存储计费 - 数据湖探索 DLI

创建Flink Jar作业 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线