搜索_华为云

Flink Jar作业访问DWS启动异常，提示客户端连接数太多错误 - 数据湖探索 DLI

在GaussDB(DWS) 控制台设置会话闲置超时时长session_timeout，在闲置会话超过所设定的时间后服务端将主动关闭连接。 session_timeout默认值为600秒，设置为0表示关闭超时限制，一般不建议设置为0。 session_timeout设置方法如下：登录GaussDB(DWS)

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
禁止或恢复表的生命周期 - 数据湖探索 DLI

disable 否禁止表或指定分区的生命周期功能。禁止表本身及其所有分区被生命周期回收，优先级高于恢复表分区生命周期。即当使用禁止表或指定分区的生命周期功能时，设置待禁止或恢复生命周期的表的分区信息是无效的。禁止表的生命周期功能后，表的生命周期配置及其分区的enable和disable标记会被保留。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
创建SQL作业模板 - 数据湖探索 DLI

创建SQL作业模板为了便捷快速的执行SQL操作，DLI支持定制模板或将正在使用的SQL语句保存为模板。保存模板后，不需编写SQL语句，可通过模板直接执行SQL操作。 SQL模板包括样例模板和自定义模板。当前系统默认的样例模板包括22条标准的TPC-H查询语句，可以满足用户大部分的TPC-H需求场

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
创建视图 - 数据湖探索 DLI
创建视图 - 数据湖探索 DLI

VIEW：基于给定的select语句创建视图，不会将select语句的结果写入磁盘。 OR REPLACE：指定该关键字后，若视图已经存在将不报错，并根据select语句更新视图的定义。注意事项所要创建的视图必须是当前数据库下不存在的，否则会报错。当视图存在时，可通过增加OR REPLACE关键字来避免报错。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 视图相关
Hive结果表 - 数据湖探索 DLI
Hive结果表 - 数据湖探索 DLI

本节介绍利用Flink写Hive的表。Hive结果表的定义，以及创建结果表时使用的参数和示例代码。详情可参考：Apache Flink Hive Read & Write Flink 支持在 BATCH 和 STREAMING 模式下从Hive写入数据。当作为BATCH应用程序运行时，Flink将写

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
管理Spark作业模板 - 数据湖探索 DLI

操作场景在创建Spark作业时，您可以在已有的Spark样例模板中进行修改，来实现实际的作业逻辑需求，节约编辑SQL语句的时间。当前云平台尚未提供预置的Spark模板，但支持用户自定义Spark作业模板，本节操作介绍在Spark管理页面创建Spark模板的操作方法。新建Spark作业模板

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
SQL作业运行慢如何定位 - 数据湖探索 DLI

致整体作业时间变长问题。参考图10可以看到数据倾斜时，单个任务的shuffle数据远大于其他Task的数据，导致该任务耗时时间变长。图10 数据倾斜示例图数据倾斜原因和解决： Shuffle的数据倾斜基本是由于join中的key值数量不均衡导致。对join连接条件进行group

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
Hive源表 - 数据湖探索 DLI
Hive源表 - 数据湖探索 DLI

已经成为了数据仓库生态系统中的核心。它不仅仅是一个用于大数据分析和ETL场景的SQL引擎，同样它也是一个数据管理平台，可用于发现，定义，和演化数据。 Flink与Hive的集成包含两个层面，一是利用了Hive的MetaStore作为持久化的Catalog，二是利用Flink来读写Hive的表。Overview

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
使用DLI分析电商BI报表 - 数据湖探索 DLI

某电商商城在保持高速发展的同时，沉淀了数亿的忠实用户，积累了海量的真实数据。如何利用BI工具从历史数据中找出商机，是大数据应用在精准营销中的关键问题，也是所有电商平台在做智能化升级时所需要的核心技术。本案例以某商城真实的用户、商品、评论数据（脱敏后）为基础，利用数据湖探索来分析用户和商品的各种数

 帮助中心 > 数据湖探索 DLI > 最佳实践
典型场景示例：配置弹性资源池队列扩缩容策略 - 数据湖探索 DLI

弹性资源池队列中的扩缩容策略时间段仅支持整点的时间段设置，并且包含设置的开启时间，不包含设置的结束时间，例如设置时间段00-09，则时间段范围为：[00:00，09:00)。默认的扩缩容策略不支持时间段配置修改。弹性资源池扩缩容策略生效规则为：在任意一个时间段周期内，优先满

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
在DLI使用Hudi提交Spark SQL作业 - 数据湖探索 DLI

首进入提交SQL作业的界面。提交SQL作业时需要选择支持Hudi的Spark SQL队列。创建一张Hudi表：将如下的建表语句粘贴至DLI SQL编辑器的输入区域，修改 LOCATION，执行引擎选择Spark，配置队列，数据目录，数据库，随后点击右上角的执行按钮，提交作业。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
Hudi Compaction操作说明 - 数据湖探索 DLI

n-Read表可减少数据摄入延迟，因而进行不阻塞摄入的异步Compaction很有意义。如何执行Compaction 仅执行Schedule Spark SQL（设置如下参数，写数据时触发） hoodie.compact.inline=true hoodie.schedule.compact

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
CSS安全集群配置 - 数据湖探索 DLI

"***") 此处设置keystore.jks文件的位置以及进入这个文件的密钥。在准备工作中生成的keystore.jks文件需要先放到OBS桶中，然后填入ak和sk以及jks文件的具体位置。最后在“es.net.ssl.keystore.pass”填入进入文件的密钥。 .option("es

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
SHOW TBLPROPERTIES TABLE|VIEW - 数据湖探索 DLI

table_name|view_name[(property_name)] 描述如果不指定属性的关键词，该语句将返回所有的表属性，否则返回给定关键词的属性值。示例 --查看show_table1的所有表属性 SHOW TBLPROPERTIES

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
创建函数 - 数据湖探索 DLI
创建函数 - 数据湖探索 DLI

REPLACE，或者替换所有作业中的函数F1为F2。需要重启Spark SQL队列后新创建的自定义函数F2生效需要重启Spark SQL队列，影响当前运行的作业。重启队列后，影响F1原有功能，F1的功能变为和F2一样。场景二在原有程序包类的基础上新增了类，新创建的函数指定为新增的类，包名不变。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 自定义函数
CREATE TABLE语句 - 数据湖探索 DLI

watermark ；表达式的返回类型必须是 TIMESTAMP(3)，表示了从 Epoch 以来的经过的时间。返回的 watermark 只有当其不为空且其值大于之前发出的本地 watermark 时才会被发出（以保证 watermark 递增）。每条记录的 watermark 生成表达式计算都会由框架完成。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > SQL语法约束与定义 > 语法定义 > DDL语法定义
Hudi Archive操作说明 - 数据湖探索 DLI

什么是Archive Archive用户清理Hudi表的元数据文件（位于.hoodie目录下，格式为 ${时间戳}.${操作类型}.${操作状态}，比如20240622143023546.deltacommit.request）。对Hudi表进行的每次操作都会产生元数据文件，而元数据文件过多

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
DIS源表 - 数据湖探索 DLI
DIS源表 - 数据湖探索 DLI

参数没有配置的时候默认读取所有partition。 partition-range = "[0:2]"时，表示读取的分区范围是1-3，包括分区1、分区2和分区3，范围设置要在dis相应通道的范围内。 connector.offset 否用户可以根据需求设置该参数的数值，读取数据

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
导出查询结果 - 数据湖探索 DLI

USING：指定所存储格式。 OPTIONS：导出时的属性列表，为可选项。参数表1 INSERT OVERWRITE DIRECTORY参数描述参数描述 path 要将查询结果写入的OBS路径。 file_format 写入的文件格式，支持按CSV、Parquet、ORC、JSON、Avro格式。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
最新动态 - 数据湖探索 DLI
最新动态 - 数据湖探索 DLI

在不同的时间或者周期内设置不同的队列大小，以满足自己的业务需求，节约成本。商用定时扩容/缩容 2020年6月序号功能名称功能描述阶段相关文档 1 计算队列支持跨AZ双活 DLI跨AZ队列能够为用户提供跨区域容灾的能力，提高计算的可靠性。商用队列管理概述 2 支持Spark作业开发者模式

 帮助中心 > 数据湖探索 DLI > 最新动态

总条数： 931

上一页
1
...
7
8
9
...
47
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Flink Jar作业访问DWS启动异常，提示客户端连接数太多错误 - 数据湖探索 DLI

禁止或恢复表的生命周期 - 数据湖探索 DLI

创建SQL作业模板 - 数据湖探索 DLI

创建视图 - 数据湖探索 DLI

Hive结果表 - 数据湖探索 DLI

管理Spark作业模板 - 数据湖探索 DLI

SQL作业运行慢如何定位 - 数据湖探索 DLI

Hive源表 - 数据湖探索 DLI

使用DLI分析电商BI报表 - 数据湖探索 DLI

典型场景示例：配置弹性资源池队列扩缩容策略 - 数据湖探索 DLI

在DLI使用Hudi提交Spark SQL作业 - 数据湖探索 DLI

Hudi Compaction操作说明 - 数据湖探索 DLI

CSS安全集群配置 - 数据湖探索 DLI

SHOW TBLPROPERTIES TABLE|VIEW - 数据湖探索 DLI

创建函数 - 数据湖探索 DLI

CREATE TABLE语句 - 数据湖探索 DLI

Hudi Archive操作说明 - 数据湖探索 DLI

DIS源表 - 数据湖探索 DLI

导出查询结果 - 数据湖探索 DLI

最新动态 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线