搜索_华为云

Spark 3.3.1版本说明 - 数据湖探索 DLI

动态Executor shuffle数据优化提升资源扩缩容的稳定性，当shuffle文件不需要时清理Executor。支持配置小文件合并使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。参考如何合并小文件完成合并小文件。

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
责任共担 - 数据湖探索 DLI
责任共担 - 数据湖探索 DLI

和各项云服务技术的安全功能和性能本身，也包括运维运营安全，以及更广义的安全合规遵从。租户：负责云服务内部的安全，安全地使用云。华为云租户的安全责任在于对使用的IaaS、PaaS和SaaS类云服务内部的安全以及对租户定制配置进行安全有效的管理，包括但不限于虚拟网络、虚拟主机和访客

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
Top-N - 数据湖探索 DLI
Top-N - 数据湖探索 DLI

根据当前分区内的各行的顺序从第一行开始，依次为每一行分配一个唯一且连续的号码。目前，我们只支持 ROW_NUMBER 在 over 窗口函数中使用。未来将会支持 RANK() 和 DENSE_RANK()函数。 PARTITION BY col1[, col2...]: 指定分区列，每个分区都将会有一个

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
Top-N - 数据湖探索 DLI
Top-N - 数据湖探索 DLI

根据当前分区内的各行的顺序从第一行开始，依次为每一行分配一个唯一且连续的号码。目前，我们只支持 ROW_NUMBER 在 over 窗口函数中使用。未来将会支持 RANK() 和 DENSE_RANK()函数。 PARTITION BY col1[, col2...]: 指定分区列，每个分区都将会有一个

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
GROUP BY - 数据湖探索 DLI
GROUP BY - 数据湖探索 DLI

复杂分组语法（GROUPING SETS、CUBE或ROLLUP）的查询只从基础数据源读取一次，而使用UNION ALL的查询将读取基础数据三次。这就是当数据源不具有确定性时，使用UNION ALL的查询可能会产生不一致的结果的原因。 --创建一个航运表 create table

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
计费样例 - 数据湖探索 DLI
计费样例 - 数据湖探索 DLI

计算费用：43520元/月存储费用：购买了存储量套餐包，按需使用过程中优先抵扣存储套餐包的规格额度，超过套餐包额度的按照按需计费。存储套餐的额度每个小时会重置。存储费用：100元/月合计总费用：43620 元/月由此可见，购买资源使用包年/包月的方式将为您节省大量成本，购买资源的时长越长优惠越多。

帮助中心 > 数据湖探索 DLI > 计费说明
ADD COLUMNS - 数据湖探索 DLI
ADD COLUMNS - 数据湖探索 DLI

ER origin_col新增列将会被加入到原始列origin_col之后，可以缺省。FIRST只能再嵌套列添加新的子列时使用，禁止top-level列使用FIRST，AFTER没有限制。示例 alter table h0 add columns(ext0 string); alter

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Schema演进语法说明
DROP VIEW - 数据湖探索 DLI
DROP VIEW - 数据湖探索 DLI

删除视图orders_by_date，如果视图不存在则会报错 DROP VIEW orders_by_date; 删除视图orders_by_date，使用参数IF EXISTS，如果视图存在则删除视图，如果视图不存在，也不会报错 DROP VIEW IF EXISTS orders_by_date;

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
Hudi表索引设计规范 - 数据湖探索 DLI

缺点：该索引为Flink特有索引。在表的总数据行数达到数亿级别，需要优化状态后端参数来保持写入的性能。使用该索引无法支持Flink和Spark交叉混写。对于数据总量持续上涨的表，采用Bucket索引时，须使用时间分区，分区键采用数据创建时间。参照Flink状态索引的特点，Hudi表超过一定数

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
Hudi Clustering操作说明 - 数据湖探索 DLI

将Clustering计划以avro元数据格式保存到时间线。执行Clustering：使用执行策略处理计划以创建新文件并替换旧文件。读取Clustering计划，并获得ClusteringGroups，其标记了需要进行Clustering的文件组。对于每个组使用strategyParams实例化适当的策略类（例

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
配置多版本过期数据回收站 - 数据湖探索 DLI

dir”即可开启回收站功能。开启和关闭多版本语法请参考开启或关闭数据多版本。 DLI数据多版本功能当前仅支持通过Hive语法创建的OBS表，具体建表SQL语法可以参考使用Hive语法创建OBS表。语法格式 1 2 ALTER TABLE [db_name.]table_name SET TBLPROPERTIES

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
配置Hudi数据列默认值 - 数据湖探索 DLI

配置Hudi数据列默认值该特性允许用户在给表新增列时，设置列的默认值。查询历史数据时新增列返回默认值。使用约束新增列在设置默认值前，如果数据已经进行了重写，则查询历史数据不支持返回列的默认值，返回NULL。数据入库、更新、执行Compaction、Clustering都会导致部分或全部数据重写。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考
Top-N - 数据湖探索 DLI
Top-N - 数据湖探索 DLI

根据当前分区内的各行的顺序从第一行开始，依次为每一行分配一个唯一且连续的号码。目前，我们只支持 ROW_NUMBER 在 over 窗口函数中使用。未来将会支持 RANK() 和 DENSE_RANK()函数。 PARTITION BY col1[, col2...]: 指定分区列，每个分区都将会有一个

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
FileSystem结果表 - 数据湖探索 DLI

lk Formats在每次创建Checkpoint时进行滚动，并且用户也可以添加基于大小或者时间等的其他条件。在STREAMING模式下使用FileSink需要开启Checkpoint功能。Part文件只在Checkpoint成功时生成。如果没有开启Checkpoint功能，文

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
提示OBS Bucket没有授权怎么办？ - 数据湖探索 DLI

授权DLI读写OBS的权限并不包含在的DLI委托dli_management_agency中。需要您创建自定义委托，并将委托配置在作业中（使用Flink 1.15和Spark 3.3及以上版本的引擎执行作业时需要配置）。了解dli_management_agency请参考DLI委托概述。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI权限管理类
Avro Format - 数据湖探索 DLI
Avro Format - 数据湖探索 DLI

读取kafka中的数据，以avro格式反序列化，并输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列-->找到作业的所属队列-->更多-->测试地址连通性

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
FileSytem结果表 - 数据湖探索 DLI

t恢复”。 checkpoint间隔设置需在输出文件实时性、文件大小和恢复时长之间进行权衡，比如10分钟。使用HDFS时需要绑定相应的跨源，并填写相应的主机信息。使用hdfs时，请配置主NameNode的所在节点信息。参数说明表1 参数说明参数是否必选说明 connector

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
Map函数和运算符 - 数据湖探索 DLI

4]);-- {1=2, 3=4} map_from_entries(array(row(K, V))) -> map(K, V) 描述：使用给定数组生成map。 SELECT map_from_entries(ARRAY[(1, 'x'), (2, 'y')]); -- {1=x

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

控制台搜索作业：如果在运行复杂DLI作业时遇到权限类报错，应该怎么办？使用DLI的过程中需要与其他云服务协同工作，因此需要您将部分服务的操作权限委托给DLI服务，确保DLI具备基本使用的权限，让DLI服务以您的身份使用其他云服务，代替您进行一些资源运维工作。了解更多：配置DLI云服务委托权限

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
stddev - 数据湖探索 DLI
stddev - 数据湖探索 DLI

_c0 | +------------+ | 1.342355 | +------------+ 与group by配合使用，对所有商品按照仓库（warehourseId）进行分组，并计算同组商品库存（items）的样本偏差。命令示例如下： select warehourseId

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数

总条数： 1040

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark 3.3.1版本说明 - 数据湖探索 DLI

责任共担 - 数据湖探索 DLI

Top-N - 数据湖探索 DLI

Top-N - 数据湖探索 DLI

GROUP BY - 数据湖探索 DLI

计费样例 - 数据湖探索 DLI

ADD COLUMNS - 数据湖探索 DLI

DROP VIEW - 数据湖探索 DLI

Hudi表索引设计规范 - 数据湖探索 DLI

Hudi Clustering操作说明 - 数据湖探索 DLI

配置多版本过期数据回收站 - 数据湖探索 DLI

配置Hudi数据列默认值 - 数据湖探索 DLI

Top-N - 数据湖探索 DLI

FileSystem结果表 - 数据湖探索 DLI

提示OBS Bucket没有授权怎么办？ - 数据湖探索 DLI

Avro Format - 数据湖探索 DLI

FileSytem结果表 - 数据湖探索 DLI

Map函数和运算符 - 数据湖探索 DLI

在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

stddev - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线