搜索_华为云

分析窗口函数概览 - 数据湖探索 DLI

为窗口的ORDER BY子句所指定列中值的返回秩，但以介于0和1之间的小数形式表示，计算方法为 (RANK - 1)/(- 1)。 rank rank() INT 计算一个值在一组值中的排位。如果出现并列的情况，RANK函数会在排名序列中留出空位。 row_number row_number()

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
使用DLI分析电商实时业务数据 - 数据湖探索 DLI

OBS的使用涉及以下几项费用：存储费用：静态网站文件存储在OBS中产生的存储费用。请求费用：用户访问OBS中存储的静态网站文件时产生的请求费用。流量费用：用户使用自定义域名通过公网访问OBS时产生的流量费用。实际产生的费用与存储的文件大小、用户访问所产生的请求次数和流量大小有关，请根据自己的业务进行预估。

帮助中心 > 数据湖探索 DLI > 最佳实践
DLI的计费模式有哪些？ - 数据湖探索 DLI

DLI的计费模式有哪些？ DLI在不同的计费项下有不同的计费模式，具体详见表1说明。表1 DLI计费模式计费项计费模式计费模式说明计算计费包年/包月按照弹性资源池包年/包月的固定费用计费。按需计费按需弹性资源池资源使用CU时进行计费。计算费用=单价*CU数*小时数

 帮助中心 > 数据湖探索 DLI > 计费说明 > 计费相关问题
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

使用方式将写好的自定义函数打成JAR包，并上传到OBS上。在DLI管理控制台的左侧导航栏中，单击数据管理>“程序包管理”，然后单击创建，并使用OBS中的jar包创建相应的程序包。在DLI管理控制台的左侧导航栏中，单击作业管理>“Flink作业”，在需要编辑作业对应的“操作”列中，单击“编辑”，进入作业编辑页面。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数
已购买套餐包，为什么仍然产生按需计费？ - 数据湖探索 DLI

B”）收取计算费用。仅适用于default 队列。扫描数据量套餐的额度按订购周期会重置。弹性资源池CU时套餐包按照“CU时”收取计算费用，用户在弹性资源池添加的队列上运行作业时按照弹性资源池CU时计费。适用于可预估队列使用量的场景、或测试项目等资源消耗不高的场景。弹性

 帮助中心 > 数据湖探索 DLI > 计费说明 > 计费相关问题
Hudi - 数据湖探索 DLI
Hudi - 数据湖探索 DLI

Hudi Hudi是一种数据湖的存储格式，在Hadoop文件系统之上提供了更新数据和删除数据的能力以及消费变化数据的能力。支持多种计算引擎，提供IUD接口，在HDFS的数据集上提供了插入更新和增量拉取的功能。表1 支持类别类别详情支持Flink表类型源表、结果表支持hudi表类型

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

使用方式将写好的自定义函数打成JAR包，并上传到OBS上。在DLI管理控制台的左侧导航栏中，单击数据管理>“程序包管理”，然后单击创建，并使用OBS中的jar包创建相应的程序包。在DLI管理控制台的左侧导航栏中，单击作业管理>“Flink作业”，在需要编辑作业对应的“操作”列中，单击“编辑”，进入作业编辑页面。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数
创建Bucket索引表调优 - 数据湖探索 DLI

方法三：数据老化，按照业务逻辑分析大的维度表是否可以通过数据老化清理无效的维度数据从而降低数据规模。数据量非常小的事实表这种可以在预估很长一段时间的数据增长量的前提下使用非分区表预留稍宽裕一些的桶数来提升读写性能。确认表内桶数 Hudi表的桶数设置，关系到表的性能，需要格外引起注意。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
Kafka - 数据湖探索 DLI
Kafka - 数据湖探索 DLI

json数据类型的数据，输出到日志文件中。参考增强型跨源连接，根据Kafka所在的虚拟私有云和子网创建相应的增强型跨源，并绑定所要使用的Flink弹性资源池。设置Kafka的安全组，添加入向规则使其对Flink的队列网段放通。参考测试地址连通性根据Kafka的地址测试队列连通

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Lambda 表达式 - 数据湖探索 DLI
Lambda 表达式 - 数据湖探索 DLI

x[3]); -- Once upon a time ... 在聚合函数中应用Lambda表达式。如使用reduce_agg()计算一个较为复杂的按列求元素和： SELECT reduce_agg(value, 0, (a, b) -> a + b, (a, b) -> a + b)

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
Connector概述 - 数据湖探索 DLI
Connector概述 - 数据湖探索 DLI

源表：源表是Flink作业的数据输入表，例如Kafka等实时流数据输入。维表：数据源表的辅助表，用于丰富和扩展源表的数据。在Flink作业中，因为数据采集端采集到的数据往往比较有限，在做数据分析之前，就要先将所需的维度信息补全，而维表就是代表存储数据维度信息的数据源。常见的用户维表有 MySQL，Redis等。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
file - 数据湖探索 DLI
file - 数据湖探索 DLI

目前包含以上6种格式。指定数据格式的方式有两种，一种是USING，可指定以上6种数据格式，另一种是STORED AS，只能指定ORC和PARQUET。 ORC对RCFile做了优化，可以提供一种高效的方法来存储Hive数据。 PARQUET是面向分析型业务的列式存储格式。父主题：标示符

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 标示符
OpenTSDB结果表 - 数据湖探索 DLI
OpenTSDB结果表 - 数据湖探索 DLI

OpenTSDB是基于HBase分布式的，可伸缩的时间序列数据库。OpenTSDB的设计目标是用来采集大规模集群中的监控类信息，并可实现数据的秒级查询，解决海量监控类数据在普通数据库中查询存储的局限性，可用于系统监控和测量、物联网数据、金融数据和科学实验结果数据的收集监控。 DLI可以通过增强型跨源连接功

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

将写好的自定义函数打成JAR包，并上传到OBS上。在DLI管理控制台的左侧导航栏中，单击数据管理>“程序包管理”，然后点击创建，并使用OBS中的jar包创建相应的程序包。在DLI管理控制台的左侧导航栏中，单击作业管理>“Flink作业”，在需要编辑作业对应的“操作”列中，单击“编辑”，进入作业编辑页面。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数
从PostgreSQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

步骤1：创建队列：创建DLI作业运行的队列。步骤2：创建RDS Postgres数据库：创建RDS Postgres的数据库和表。步骤3：创建DWS数据库和表：创建用于接收数据的DWS数据库和表。步骤4：创建增强型跨源连接：DLI上创建连接RDS和DWS的跨源连接，打通网络。步骤5

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
成长地图 - 数据湖探索 DLI
成长地图 - 数据湖探索 DLI

GO语言深入之道介绍几个Go语言及相关开源框架的插件机制跟唐老师学习云网络唐老师将自己对网络的理解分享给大家智能客服您好！我是有问必答知识渊博的的智能问答机器人，有问题欢迎随时求助哦！社区求助华为云社区是华为云用户的聚集地。这里有来自数据湖探索的技术牛人，为您解决技术难题。

帮助中心 > 数据湖探索 DLI > 成长地图
在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

弹性资源池为DLI作业运行提供所需的计算资源（CPU和内存），用于灵活应对业务对计算资源变化的需求。创建弹性资源池后，您可以在弹性资源池中创建多个队列，队列关联到具体的作业和数据处理任务，是资源池中资源被实际使用和分配的基本单元，即队列是执行作业所需的具体的计算资源。同一弹性资源池中，队列之间的计算资源支持共享。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
Kafka源表 - 数据湖探索 DLI
Kafka源表 - 数据湖探索 DLI

创建source流从Kafka获取数据，作为作业的输入数据。 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。前提条件 Kafka是线下集群，需要通过增强型跨源连接功能将Flink作

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
Kafka结果表 - 数据湖探索 DLI
Kafka结果表 - 数据湖探索 DLI

DLI将Flink作业的输出数据输出到Kafka中。 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。前提条件 Kafka是线下集群，需要通过增强型跨源连接功能将F

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
levenshtein - 数据湖探索 DLI
levenshtein - 数据湖探索 DLI

levenshtein函数用于返回两个字符串之间的Levenshtein距离，如levenshtein('kitten','sitting') =3。 Levenshtein距离，是编辑距离的一种。指两个字串之间，由一个转成另一个所需的最少编辑操作次数。命令格式 levenshtein(string

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数

总条数： 898

上一页
1
...
13
14
15
...
45
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

分析窗口函数概览 - 数据湖探索 DLI

使用DLI分析电商实时业务数据 - 数据湖探索 DLI

DLI的计费模式有哪些？ - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

已购买套餐包，为什么仍然产生按需计费？ - 数据湖探索 DLI

Hudi - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

创建Bucket索引表调优 - 数据湖探索 DLI

Kafka - 数据湖探索 DLI

Lambda 表达式 - 数据湖探索 DLI

Connector概述 - 数据湖探索 DLI

file - 数据湖探索 DLI

OpenTSDB结果表 - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

从PostgreSQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

成长地图 - 数据湖探索 DLI

在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

Kafka源表 - 数据湖探索 DLI

Kafka结果表 - 数据湖探索 DLI

levenshtein - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线