搜索_华为云

创建Bucket索引表调优 - 数据湖探索 DLI

事实表通常整表数据规模较大，以新增数据为主，更新数据占比小，且更新数据大多落在近一段时间范围内（年或月或天），下游读取该表进行ETL计算时通常会使用时间范围进行裁剪（例如最近一天、一月、一年），这种表通常可以通过数据的创建时间来做分区以保证最佳读写性能。维度表数据量一般整表数据规模较小，以更新数据为主，新增

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
跨源认证相关API（废弃） - 数据湖探索 DLI

跨源认证相关API（废弃）创建跨源认证（废弃）获取跨源认证列表（废弃）更新跨源认证（废弃）删除跨源认证（废弃）父主题：历史API

帮助中心 > 数据湖探索 DLI > API参考 > 历史API
Flink作业相关 - 数据湖探索 DLI
Flink作业相关 - 数据湖探索 DLI

createFlinkJarJob(body); System.out.println(result); } 更新SQL作业 DLI提供更新Flink SQL作业接口。您可以使用该接口更新Flink SQL作业，示例代码如下： 1 2 3 4 5 6 private static void

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
配置Hudi数据列默认值 - 数据湖探索 DLI

时新增列返回默认值。使用约束新增列在设置默认值前，如果数据已经进行了重写，则查询历史数据不支持返回列的默认值，返回NULL。数据入库、更新、执行Compaction、Clustering都会导致部分或全部数据重写。列的默认值设置要与列的类型一致，如不一致会进行类型强转，导致默认值精度丢失或者默认值为NULL。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考
窗口去重 - 数据湖探索 DLI
窗口去重 - 数据湖探索 DLI

对于流式查询，与普通去重不同，窗口去重只在窗口的最后返回结果数据，不会产生中间结果。它会清除不需要的中间状态。因此，窗口去重查询在用户不需要更新结果时，性能较好。通常，窗口去重直接用于窗口表值函数上。另外，它可以用于基于窗口表值函数的操作。比如窗口聚合，窗口TopN和窗口关联。窗

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
创建DLI程序包 - 数据湖探索 DLI

创建DLI程序包 DLI支持用户通过批处理方式将程序包提交至通用队列中运行。如果用户需要更新程序包，可以使用相同的程序包或文件上传至DLI的同一个位置（同一个分组），直接覆盖原有的程序包或文件。前提条件所使用的程序包需提前上传至OBS服务中保存。创建程序包步骤在管理控制

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
创建弹性资源池并添加队列 - 数据湖探索 DLI

当队列的最小CUs小于16CUs时，在队列属性中设置的“最大spark driver实例数”和“最大预拉起spark driver实例数”不生效。了解队列属性设置。 HetuEngine类型的SQL队列最小CU不能小于96CUs。最大CU 当前扩缩容策略支持的最大CU数。在全天

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
使用DLI提交Flink OpenSource SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

全局配置 > 服务授权”。在委托设置页面，勾选基础使用、跨源场景、运维场景的委托权限后，单击“更新委托权限”。查看并了解更新委托的提示信息，单击“确定”。完成DLI委托权限的更新。图1 配置DLI委托访问授权完成配置后，在IAM控制台的委托列表中，可查看到dli_management_agency的委托信息。

帮助中心 > 数据湖探索 DLI > 快速入门
设置SQL作业优先级 - 数据湖探索 DLI

计算资源不足，则会减少低优先级作业的计算资源 SQL队列上运行的作业优先级默认为3。调整作业优先级需要停止作业后编辑，并重新提交运行才能生效。设置SQL作业优先级在“ 设置 > 参数配置”中配置如下参数，其中x为优先级取值。 spark.sql.dli.job.priority=x

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
DLI自定义策略 - 数据湖探索 DLI

部授权项。资源类型可以参考表4中的资源类型。操作：操作以IAM服务中已经注册的action为准。 Condition 限制条件：使策略生效的特定条件，包括条件键和运算符。条件键表示策略语句的 Condition 元素中的键值，分为全局级条件键和服务级条件键。全局级条件键（

帮助中心 > 数据湖探索 DLI > 用户指南 > 权限管理
配置SQL防御规则 - 数据湖探索 DLI

配置SQL防御规则什么是SQL防御大数据领域的SQL引擎层出不穷，在带给解决方案多样性的同时，也暴露出一定的问题，例如SQL输入语句质量良莠不齐、SQL问题难定位、大SQL语句消耗资源过多等。低质量的SQL会对数据分析平台系统带来不可预料的冲击，影响系统的性能或者平台稳定性。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
配置DLI程序包权限 - 数据湖探索 DLI

参数名称描述用户名被授权的IAM用户的名称。说明：该用户名称是已存在的IAM用户名称。权限设置使用组：使用该组的程序包。更新组：更新该组内程序包，包含创建组内程序包。查询组：查询组内程序包详情。删除组：删除该组的程序包。赋权：当前用户可将组的权限赋予其他用户。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
Flink SQL作业运行失败，日志中有connect to DIS failed java.lang.IllegalArgumentException: Access key cannot be null错误 - 数据湖探索 DLI

权限，比如“OBS OperateAccess”。如果没有OBS写入权限，则给对应的用户组进行授权。授权完成后，等待5到10分钟等待权限生效。再次运行失败的Flink SQL作业，查看作业运行状态。父主题： Flink SQL作业类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
Top-N - 数据湖探索 DLI
Top-N - 数据湖探索 DLI

AND 与 rownum <= N 结合使用。注意事项 TopN 查询的结果会带有更新。 Flink SQL 会根据排序键对输入的流进行排序。如果 top N 的记录发生了变化，变化的部分会以撤销、更新记录的形式发送到下游。如果 top N 记录需要存储到外部存储，则结果表需要拥有相同与

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
Top-N - 数据湖探索 DLI
Top-N - 数据湖探索 DLI

AND 与 rownum <= N 结合使用。注意事项 TopN 查询的结果会带有更新。 Flink SQL 会根据排序键对输入的流进行排序。如果 top N 的记录发生了变化，变化的部分会以撤销、更新记录的形式发送到下游。如果 top N 记录需要存储到外部存储，则结果表需要拥有相同与

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
Spark 2.4.5版本说明 - 数据湖探索 DLI

支持在控制台查看“CPU累计使用量”。支持容器集群Spark日志跳转查看需要在容器查看日志。支持动态加载UDF（公测）无需重启队列UDF即可生效。 Spark UI支持火焰图 Spark UI支持绘制火焰图。优化SQL作业NOT IN语句查询性能 NOT IN语句查询性能提升。

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
设置Spark作业优先级 - 数据湖探索 DLI

足，则会减少低优先级作业的计算资源通用队列上运行的Spark作业的优先级默认为3。调整作业优先级需要停止作业后编辑，并重新提交运行才能生效。 Spark作业操作步骤在“Spark参数”中配置如下参数，其中x为优先级取值。 spark.dli.job.priority=x 登录DLI管理控制台。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
Hbase - 数据湖探索 DLI
Hbase - 数据湖探索 DLI

使用HBase连接器基于HBase进行SQL查询。 HBase连接器在upsert模式下运行，可以使用 DDL 中定义的主键与外部系统交换更新操作消息。但是主键只能基于HBase的rowkey字段定义。如果没有声明主键，HBase连接器默认取rowkey作为主键。详情可参考HBase

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Top-N - 数据湖探索 DLI
Top-N - 数据湖探索 DLI

AND 与 rownum <= N 结合使用。注意事项 TopN 查询的结果会带有更新。 Flink SQL 会根据排序键对输入的流进行排序。如果 top N 的记录发生了变化，变化的部分会以撤销、更新记录的形式发送到下游。如果 top N 记录需要存储到外部存储，则结果表需要拥有相同与

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
跨源认证权限管理 - 数据湖探索 DLI

用户授权参数说明参数名称描述用户名被授权的IAM用户的名称。说明：该用户名称是已存在的IAM用户名称。权限设置使用：使用该跨源认证。更新：更新该跨源认证。删除：删除该跨源认证。赋权：当前用户可将跨源认证的权限赋予其他用户。回收：当前用户可回收其他用户具备的该跨源认证的权限，但不能回收该跨源认证所有者的权限。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证

总条数： 216

上一页
1
...
6
7
8
...
11
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建Bucket索引表调优 - 数据湖探索 DLI

跨源认证相关API（废弃） - 数据湖探索 DLI

Flink作业相关 - 数据湖探索 DLI

配置Hudi数据列默认值 - 数据湖探索 DLI

窗口去重 - 数据湖探索 DLI

创建DLI程序包 - 数据湖探索 DLI

创建弹性资源池并添加队列 - 数据湖探索 DLI

使用DLI提交Flink OpenSource SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

设置SQL作业优先级 - 数据湖探索 DLI

DLI自定义策略 - 数据湖探索 DLI

配置SQL防御规则 - 数据湖探索 DLI

配置DLI程序包权限 - 数据湖探索 DLI

Flink SQL作业运行失败，日志中有connect to DIS failed java.lang.IllegalArgumentException: Access key cannot be null错误 - 数据湖探索 DLI

Top-N - 数据湖探索 DLI

Top-N - 数据湖探索 DLI

Spark 2.4.5版本说明 - 数据湖探索 DLI

设置Spark作业优先级 - 数据湖探索 DLI

Hbase - 数据湖探索 DLI

Top-N - 数据湖探索 DLI

跨源认证权限管理 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线