搜索_华为云

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

单击“新增”，可以添加不同优先级、时间段、“最小CU”和“最大CU”扩缩容策略。本例配置的扩缩容策略如图2所示。图2 添加队列时配置扩缩容策略表5 扩缩容策略参数说明参数名称参数说明配置样例优先级当前弹性资源池中的优先级数字越大表示优先级越高。本例设置一条扩缩容策略，默认优先级为1。 1

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
禁止或恢复表的生命周期 - 数据湖探索 DLI

周期后因使用之前的配置导致数据被误回收。 disable 否禁止表或指定分区的生命周期功能。禁止表本身及其所有分区被生命周期回收，优先级高于恢复表分区生命周期。即当使用禁止表或指定分区的生命周期功能时，设置待禁止或恢复生命周期的表的分区信息是无效的。禁止表的生命周期功能后，

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
DLI自定义策略 - 数据湖探索 DLI

键和运算符。条件键表示策略语句的 Condition 元素中的键值，分为全局级条件键和服务级条件键。全局级条件键（前缀为g:）适用于所有操作。详细请参考策略语法中的条件键说明。服务级条件键，仅适用于对应服务的操作。运算符与条件键一起使用，构成完整的条件判断语句。具体内容请参考表1。

帮助中心 > 数据湖探索 DLI > 用户指南 > 权限管理
Flink作业性能调优 - 数据湖探索 DLI

可以通过Flink UI或者作业任务列表查看，一般情况下反压和高时延成对出现：图2 反压状态和时延性能分析由于Flink的反压机制，流作业在存在性能问题的情况下，会导致数据源消费速率跟不上生产速率，从而引起Kafka消费组的积压。在这种情况下，可以通过算子的反压和时延，确定算子的性能瓶颈点。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
Hudi表分区设计规范 - 数据湖探索 DLI

各个分区的数据量是会有波动的，分区下桶的个数设计一般会按照最大分区数据量计算，这样会出现越细粒度的分区，桶的个数会冗余越多。例如：采用天级分区，平均的日增数据量是3GB，最多一天的日志是8GB，这个会采用Bucket桶数= 8GB/2GB = 4 来创建表；每天的更新数据占比较

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
典型场景示例：创建弹性资源池并运行作业 - 数据湖探索 DLI

添加作业运行的队列到弹性资源池。具体内容包括：设置弹性资源池队列的名称、队列类型等基本信息。配置当前队列的扩缩容策略，包括队列策略的优先级、时间段、最大最小CU范围等配置。创建弹性资源池并添加队列调整弹性资源池中队列的扩缩容策略（可选）步骤三：创建增强型跨源连接如果运行

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
数学运算函数 - 数据湖探索 DLI

UE。注意事项 double、real和float值存在一定的精度差。且我们不建议直接使用等号“=”对两个double类型数据进行比较。用户可以使用两个double类型相减，而后取绝对值的方式判断。当绝对值足够小时，认为两个double数值相等，例如: abs(0.9999999999

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数 > 内置函数
创建DLI表关联DCS - 数据湖探索 DLI

访问DCS时，不支持复杂类型数据（Array、Struct、Map等）。可以考虑以下几种方式进行复杂类型数据处理：字段扁平化处理，将下一级的字段展开放在同一层Schema字段中。使用二进制方式进行写入与读取，并通过自定义函数进行编解码。示例指定table 1 2 3 4 5

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DCS表
RDS表有自增主键时怎样在DLI插入数据？ - 数据湖探索 DLI

使用NULL值：如果您需要在插入数据时明确指定某些字段由数据库自动填充，可以在这些字段的位置填写NULL。这样，数据库会识别到这些字段应该由系统自动生成值，而不是由用户指定。父主题：增强型跨源连接类

 帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
使用Spark作业访问DLI元数据 - 数据湖探索 DLI

单击“新增”，可以添加不同优先级、时间段、“最小CU”和“最大CU”扩缩容策略。本例配置的扩缩容策略如图2所示。图2 添加队列时配置扩缩容策略表5 扩缩容策略参数说明参数名称参数说明配置样例优先级当前弹性资源池中的优先级数字越大表示优先级越高。本例设置一条扩缩容策略，默认优先级为1。 1

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
SELECT - 数据湖探索 DLI
SELECT - 数据湖探索 DLI

BY：指GROUP BY子句中不止一列，查询语句将按照GROUP BY的所有字段分组，所有字段都相同的记录将被放在同一组中。注意事项 GroupBy在流处理表中会产生更新结果示例根据score及name两个字段对表student进行分组，并返回分组结果。 1 2 insert into temp

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
SELECT - 数据湖探索 DLI
SELECT - 数据湖探索 DLI

BY：指GROUP BY子句中不止一列，查询语句将按照GROUP BY的所有字段分组，所有字段都相同的记录将被放在同一组中。注意事项 GroupBy在流处理表中会产生更新结果示例根据score及name两个字段对表student进行分组，并返回分组结果。 1 2 insert into temp

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
SELECT - 数据湖探索 DLI
SELECT - 数据湖探索 DLI

BY：指GROUP BY子句中不止一列，查询语句将按照GROUP BY的所有字段分组，所有字段都相同的记录将被放在同一组中。注意事项 GroupBy在流处理表中会产生更新结果示例根据score及name两个字段对表student进行分组，并返回分组结果。 1 2 insert into temp

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
修改表分区位置（只支持OBS表） - 数据湖探索 DLI

所指定的新的OBS路径必须是已经存在的绝对路径，否则将报错。若新增分区指定的路径包含子目录（或嵌套子目录），则子目录下面的所有文件类型及内容也将作为该分区的记录。用户需要保证该分区目录下所有文件类型和文件内容与表的字段一致，否则查询将报错。示例将student表的分区dt='2008-08-08',

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
创建Flink Jar作业 - 数据湖探索 DLI

t/作业ID开头的目录”。开启Checkpoint后，请勿在作业代码中设置Checkpoint参数，作业代码中配置的参数优先级高于界面配置的参数优先级。重复配置可能导致作业在异常重启时使用错误的Checkpoint路径恢复数据，导致恢复失败或数据不一致。开启Checkpoint后，如果同时勾选了“异常自动重启”

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
数据权限列表 - 数据湖探索 DLI

GRANT_PRIVILEGE（数据库的赋权） REVOKE_PRIVILEGE（数据库权限的回收） SHOW_PRIVILEGES（查看其他用户具备的数据库权限） ALTER_TABLE_ADD_PARTITION（在分区表中添加分区） ALTER_TABLE_DROP_PARTITION（删除分区表的分区）

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据权限相关
正则表达式函数 - 数据湖探索 DLI

{prop}），但有以下差异：名称中的所有下划线都必须删除。例如，使用OldItalic而不是Old_Italic 必须直接指定脚本，不能带Is，script =或sc =前缀。示例：\ p {Hiragana} 必须使用In前缀指定块。不支持block =和blk =前缀。示例：\p{Mongolian}

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
自定义函数参数传递 - 数据湖探索 DLI

e.global-job-parameters传入连接数据库需要的url、user、password等参数，获取udf_info表数据后和流数据拼接成json输出。表2 udf_info表 key value class class-4 SimpleJsonBuild.java

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数
自定义函数参数传递 - 数据湖探索 DLI

e.global-job-parameters传入连接数据库需要的url、user、password等参数，获取udf_info表数据后和流数据拼接成json输出。表2 udf_info表 key value class class-4 SimpleJsonBuild.java

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数
Hudi数据表Compaction规范 - 数据湖探索 DLI

级的对Flink写入作业影响可以忽略。上述方案落地的具体步骤参考如下： Flink只负责写数据和生成Compaction计划 Flink流任务建表语句/SQL hints中添加如下参数，控制Flink任务写Hudi时只会生成Compaction plan。 'compaction

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范

总条数： 501

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

禁止或恢复表的生命周期 - 数据湖探索 DLI

DLI自定义策略 - 数据湖探索 DLI

Flink作业性能调优 - 数据湖探索 DLI

Hudi表分区设计规范 - 数据湖探索 DLI

典型场景示例：创建弹性资源池并运行作业 - 数据湖探索 DLI

数学运算函数 - 数据湖探索 DLI

创建DLI表关联DCS - 数据湖探索 DLI

RDS表有自增主键时怎样在DLI插入数据？ - 数据湖探索 DLI

使用Spark作业访问DLI元数据 - 数据湖探索 DLI

SELECT - 数据湖探索 DLI

SELECT - 数据湖探索 DLI

SELECT - 数据湖探索 DLI

修改表分区位置（只支持OBS表） - 数据湖探索 DLI

创建Flink Jar作业 - 数据湖探索 DLI

数据权限列表 - 数据湖探索 DLI

正则表达式函数 - 数据湖探索 DLI

自定义函数参数传递 - 数据湖探索 DLI

自定义函数参数传递 - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线