-
包年包月弹性资源池设置了定时扩缩容时,怎样计费? - 数据湖探索 DLI
假设您在2023/03/08 15:50:04购买了包年/包月弹性资源池(CU范围:64CUs),购买时长为一个月,在资源运行一段时间后发现使用过程中大部分时间CU数在128CU以上(假设每天累计12个小时实际CUs为128CUs,超出规格64CUs。)
-
异常检测 - 数据湖探索 DLI
4010 numClusters 否 分类数,默认包含异常和非异常两类。 2 dataViewMode 否 算法学习模式。 history:学习所有历史数据。 horizon:仅考虑最近一段时间历史数据,默认为4个窗口。
-
使用DataSource语法创建OBS表 - 数据湖探索 DLI
DataSource语法和Hive语法主要区别在于支持的表数据存储格式范围、支持的分区数等有差异,详细请参考语法格式和注意事项说明。 推荐使用OBS并行文件系统进行存储。
-
使用Hive语法创建OBS表 - 数据湖探索 DLI
DataSource语法和Hive语法主要区别在于支持的表数据存储格式范围、支持的分区数等有差异,详细请参考语法格式和注意事项说明。 推荐使用OBS并行文件系统进行存储。
-
cume - 数据湖探索 DLI
1000 0.3333333333333333 d1 user2 2000 0.6666666666666666 d1 user3 3000 1.0 d2 user4 4000 0.5 d2 user5 5000 1.0 按照sal降序排序后,结果就是统计 ⼤于等于 当前薪⽔的⼈数的
-
使用DataSource语法创建OBS表 - 数据湖探索 DLI
DataSource语法和Hive语法主要区别在于支持的表数据存储格式范围、支持的分区数等有差异,详细请参考语法格式和注意事项说明。 推荐使用OBS并行文件系统进行存储。
-
怎样查看弹性资源池和作业的资源使用情况? - 数据湖探索 DLI
选择“作业配置信息 > 资源配置” 查看作业的CU数量,即作业占用资源总CUs数。 该CUs数可以编辑作业页面进行配置,CUs数量 = 管理单元 + (算子总并行数 / 单TM Slot数) * 单TM所占CUs数。
-
弹性资源池CU设置 - 数据湖探索 DLI
注意事项 在全天的任意一个时间段内,弹性资源池中所有队列的最小CU数之和需要小于等于弹性资源池的最小CU数。 在全天的任意一个时间段内,弹性资源池中任意一个队列的最大CU必须小于等于弹性资源池的最大CU。
-
Flink作业高可靠推荐配置指导(异常自动重启) - 数据湖探索 DLI
根据如下公式,配置作业的“CU数量”、“管理单元”与“最大并行数”: CU数量 = 管理单元 + (算子总并行数 / 单TM Slot数) * 单TM所占CU数 例如:CU数量为9CU,管理单元为1CU,最大并行数为16,则计算单元为8CU。
-
HAVING - 数据湖探索 DLI
示例 对表student_info按字段name进行分组,计算每组中记录数,若其记录数等于子查询中表course_info的记录数,返回表student_info中字段name等于表course_info字段name的记录数。
-
Flink作业推荐配置指导 - 数据湖探索 DLI
根据如下公式,配置作业的“CU数量”、“管理单元”与“最大并行数”: CU数量 = 管理单元 + (算子总并行数 / 单TM Slot数) * 单TM所占CU数 例如:CU数量为9CU,管理单元为1CU,最大并行数为16,则计算单元为8CU。
-
HAVING子句嵌套子查询 - 数据湖探索 DLI
示例 对表student_info按字段name进行分组,计算每组中记录数,若其记录数等于子查询中表course_info的记录数,返回表student_info中字段name等于表course_info字段name的记录数。
-
数学函数概览 - 数据湖探索 DLI
rand rand(INT seed) DOUBLE 返回大于或等于0且小于1的平均分布随机数。如果指定种子seed,则会得到一个稳定的随机数序列。 round round(DOUBLE a) DOUBLE 四舍五入。
-
OVER - 数据湖探索 DLI
num PRECEDING:定义窗口的下限,即窗口从当前行向前数num行处开始。 UNBOUNDED PRECEDING:表示窗口没有下限。 num FOLLOWING:定义窗口的上限,即窗口从当前行向后数num行处结束。
-
队列属性设置 - 数据湖探索 DLI
当运行作业的spark driver任务数超过“单spark driver实例最大并发数”的值时,作业将会分配到预先启动的spark driver上面。
-
greatest - 数据湖探索 DLI
参数v1的格式包括浮点数格式、整数格式。 v2 是 DOUBLE、BIGINT、DECIMAL类型。 参数v2的格式包括浮点数格式、整数格式。 返回值说明 返回DOUBLE类型的值。 a为NULL,则返回NULL。 示例代码 返回4.0。
-
Flink作业重启后,如何判断是否可以从checkpoint恢复 - 数据湖探索 DLI
表1 从checkpoint恢复的常见场景 场景 是否支持恢复 说明 调整或者增加并行数 不支持 该操作修改了作业的并行数,即修改了作业的运行逻辑。 修改Flink SQL语句、Flink Jar作业等操作 不支持 该操作修改了作业对资源的算法逻辑。
-
OVER子句 - 数据湖探索 DLI
num PRECEDING:定义窗口的下限,即窗口从当前行向前数num行处开始。 UNBOUNDED PRECEDING:表示窗口没有下限。 num FOLLOWING:定义窗口的上限,即窗口从当前行向后数num行处结束。
-
开启Flink作业动态扩缩容 - 数据湖探索 DLI
flink.dli.job.cu.max 用户CU初始值 该配置表示当前作业在进行动态扩缩时允许使用的最大CU数,如果用户未配置则默认值为该作业的初始总CU数。 注意:该配置值不能小于用户配置的总CU数,且只有当用户开启动态扩缩时,该配置才有意义。
-
least - 数据湖探索 DLI
参数v1的格式包括浮点数格式、整数格式。 v2 是 DOUBLE、BIGINT、DECIMAL类型。 参数v2的格式包括浮点数格式、整数格式。 返回值说明 返回DOUBLE类型的值。 v1、v2...为String类型时,返回报错。 所有参数都为NULL时,返回NULL。