搜索_华为云

如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 - 数据湖探索 DLI

如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度操作场景 Spark作业在执行shuffle类语句，包括group by、join等场景时，常常会出现数据倾斜的问题，导致作业任务执行缓慢。该问题可以通过设置spark.sql.shuffle

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
队列属性设置 - 数据湖探索 DLI

队列属性设置操作场景 DLI支持在队列创建完成后设置队列的属性。当前支持设置：队列的Spark driver的相关参数：通过设置队列的Spark driver，以提升队列资源的调度效率。作业结果保存策略：设置是否开启队列的作业查询结果保存至DLI作业桶。本节操作介绍在管理控制台设置队列属性的操作步骤。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
设置Flink作业优先级 - 数据湖探索 DLI

设置Flink作业优先级操作场景在实际作业运行中，由于作业的重要程度以及紧急程度不同，需要重点保障重要和紧急的作业正常运行，因此需要满足它们正常运行所需的计算资源。 DLI提供的设置作业优先级功能，可以对每个Flink作业设置作业优先级，当资源不充足时，可以优先满足优先级较高的作业的计算资源。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
Flink Jar作业设置backend为OBS，报错不支持OBS文件系统 - 数据湖探索 DLI

确认所用AKSK是否有权限。设置依赖关系provided防止Jar包冲突。确认客户esdk-obs-java-3.1.3.jar的版本。确认是集群存在问题。处理步骤设置依赖关系provided。重启clusteragent应用集群升级后的配置。去掉OBS依赖，否则checkpoint会写不进OBS。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
设置普通队列的弹性扩缩容定时任务 - 数据湖探索 DLI

设置普通队列的弹性扩缩容定时任务弹性扩缩容定时任务使用场景通常，用户业务繁忙的场景是有周期性的，在某个周期内，用户需要更多的计算资源来处理业务，过了这个周期，则不需要那么多资源。如果用户购买的队列规格比较小，在业务繁忙时会存在资源不足的情况；而如果购买的队列规格比较大，又可能会存在资源浪费的情况。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
设置SQL作业优先级 - 数据湖探索 DLI

设置SQL作业优先级操作场景在实际作业运行中，由于作业的重要程度以及紧急程度不同，需要重点保障重要和紧急的作业正常运行，因此需要满足它们正常运行所需的计算资源。 DLI提供的设置作业优先级功能，可以对每个SQL设置作业优先级，当资源不充足时，可以优先满足优先级较高的作业的计算资源。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
设置Spark作业优先级 - 数据湖探索 DLI

设置Spark作业优先级操作场景在实际作业运行中，由于作业的重要程度以及紧急程度不同，需要重点保障重要和紧急的作业正常运行，因此需要满足它们正常运行所需的计算资源。 DLI提供的设置作业优先级功能，可以对每个Spark作业设置作业优先级，当资源不充足时，可以优先满足优先级较高的作业的计算资源。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
Flink作业怎样设置“异常自动重启”？ - 数据湖探索 DLI

Flink作业怎样设置“异常自动重启”？场景概述 DLI Flink作业具有高可用保障能力，通过设置“异常自动重启”功能，可在周边服务短时故障恢复后自动重启。操作步骤登录DLI控制台，选择“作业管理”>“Flink作业”。在Flink作业编辑页面，勾选“异常自动重启”。例如，图1所示。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业咨询类
通用队列操作OBS表如何设置AK/SK - 数据湖探索 DLI

DLI提供了一个通用接口，可用于获取用户在启动Flink作业时设置的委托的临时凭证。该接口将获取到的该作业委托的临时凭证封装到com.huaweicloud.sdk.core.auth.BasicCredentials类中。本操作介绍获取Flink作业委托临时凭证的操作方法。 Spark作业场景 Spark

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
包年包月弹性资源池设置了定时扩缩容时，怎样计费？ - 数据湖探索 DLI

包年包月弹性资源池设置了定时扩缩容时，怎样计费？假设您在2023/03/08 15:50:04购买了包年/包月弹性资源池（CU范围：64CUs），购买时长为一个月，在资源运行一段时间后发现使用过程中大部分时间CU数在128CU以上（假设每天累计12个小时实际CUs为128CUs

帮助中心 > 数据湖探索 DLI > 计费说明 > 计费相关问题
弹性资源池CU设置 - 数据湖探索 DLI

当弹性资源池队列的最大CU的和大于弹性资源池的实际CUs时，会触发弹性资源池扩容，扩容后的实际CUs= min（队列的最大CU和，弹性资源池CU范围最大值）。通过“CU设置”调整CU范围：80CUs - 96CUs。调整队列的CU范围、弹性资源池规格变更、弹性资源池的CU设置，均在下一个整点生效。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
创建表时指定表的生命周期 - 数据湖探索 DLI

创建表时指定表的生命周期功能描述 DLI提供了表生命周期管理功能，在创建表时指定表的生命周期。DLI会根据每张表的最后修改时间和表的生命周期来判断是否要回收此表。通过设置表的生命周期，可以帮助您更好的管理数目众多的表，自动清理长期不再使用的数据表，简化数据表的回收流程。同时支持数据恢复设置，避免因误操作丢失数据。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
Spark作业运行大批量数据时上报作业运行超时异常错误 - 数据湖探索 DLI

Spark作业运行大批量数据时上报作业运行超时异常错误当Spark作业运行大批量数据时，如果出现作业运行超时异常错误，通常是由于作业的资源配置不足、数据倾斜、网络问题或任务过多导致的。解决方案：设置并发数：通过设置合适的并发数，可以启动多任务并行运行，从而提高作业的处理能力。例如访

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
Delta常见配置参数 - 数据湖探索 DLI

SQL作业时，在“SQL编辑器”界面右上角的“设置 > 参数设置”中配置Delta参数。表1 Delta常见配置项参数描述默认值 spark.databricks.delta.retentionDurationCheck.enabled vacuum清理不再引用的文件时是否进行保留期检查。

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考
设置多版本备份数据保留周期 - 数据湖探索 DLI

进行清理。在添加列或者修改分区表时，也可以设置表属性“dli.multi.version.retention.days”调整保留周期。开启和关闭多版本功能SQL语法请参考开启或关闭数据多版本。 DLI数据多版本功能当前仅支持通过Hive语法创建的OBS表，具体建表SQL语法可以参考使用Hive语法创建OBS表。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
Spark异步任务执行表compaction参数设置规范 - 数据湖探索 DLI

Spark异步任务执行表compaction参数设置规范写作业未停止情况下，禁止手动执行run schedule命令生成compaction计划。错误示例： run schedule on dsrTable 如果还有别的任务在写这张表，执行该操作会导致数据丢失。执行run compaction命令时，禁止将hoodie

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
Hudi常见配置参数 - 数据湖探索 DLI

须扫描比其所需的更多的文件；如果将其设置得非常高，将线性增加每个数据文件的大小（每50000个条目大约4KB）。 60000 hoodie.index.bloom.fpp 根据条目数允许的错误率。用于计算应为布隆过滤器分配多少位以及哈希函数的数量。通常将此值设置得很低（默认值：0

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
CREATE TABLE语句 - 数据湖探索 DLI

watermark ；表达式的返回类型必须是 TIMESTAMP(3)，表示了从 Epoch 以来的经过的时间。返回的 watermark 只有当其不为空且其值大于之前发出的本地 watermark 时才会被发出（以保证 watermark 递增）。每条记录的 watermark 生成表达式计算都会由框架完成。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > SQL语法约束与定义 > 语法定义 > DDL语法定义
Flink Opensource SQL从RDS数据库读取的时间和RDS数据库存储的时间为什么会不一致？ - 数据湖探索 DLI

SQL从RDS数据库读取的时间和RDS数据库存储的时间为什么会不一致？问题描述 Flink Opensource SQL从RDS数据库读取的时间和RDS数据库存储的时间为不一致根因分析该问题的根因是数据库设置的时区不合理，通常该问题出现时Flink读取的时间和RDS数据库的时间会相差13小时。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
Hudi表模型设计规范 - 数据湖探索 DLI

SparkSQL天然与Hive集成，无需考虑元数据问题。该条建议针对的是通过Spark Datasource API或者Flin写Hudi表的场景，通过这两种方式写Hudi时需要增加向Hive同步元数据的配置项；该配置的目的是将Hudi表的元数据统一托管到Hive元数据服务中，为后续的跨引擎操作数据以及数据管理提供便利。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范

总条数： 935

上一页
1
2
3
4
5
...
47
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 - 数据湖探索 DLI

队列属性设置 - 数据湖探索 DLI

设置Flink作业优先级 - 数据湖探索 DLI

Flink Jar作业设置backend为OBS，报错不支持OBS文件系统 - 数据湖探索 DLI

设置普通队列的弹性扩缩容定时任务 - 数据湖探索 DLI

设置SQL作业优先级 - 数据湖探索 DLI

设置Spark作业优先级 - 数据湖探索 DLI

Flink作业怎样设置“异常自动重启”？ - 数据湖探索 DLI

通用队列操作OBS表如何设置AK/SK - 数据湖探索 DLI

包年包月弹性资源池设置了定时扩缩容时，怎样计费？ - 数据湖探索 DLI

弹性资源池CU设置 - 数据湖探索 DLI

创建表时指定表的生命周期 - 数据湖探索 DLI

Spark作业运行大批量数据时上报作业运行超时异常错误 - 数据湖探索 DLI

Delta常见配置参数 - 数据湖探索 DLI

设置多版本备份数据保留周期 - 数据湖探索 DLI

Spark异步任务执行表compaction参数设置规范 - 数据湖探索 DLI

Hudi常见配置参数 - 数据湖探索 DLI

CREATE TABLE语句 - 数据湖探索 DLI

Flink Opensource SQL从RDS数据库读取的时间和RDS数据库存储的时间为什么会不一致？ - 数据湖探索 DLI

Hudi表模型设计规范 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线