搜索_华为云

Ogg Format - 数据湖探索 DLI
Ogg Format - 数据湖探索 DLI

列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多 > 测试地址连通性 > 输入kafka的地址 > 测试）。如果能连通，则表示跨源已经绑定成功；否则表示未成功。创建flink opensource

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
ClickHouse - 数据湖探索 DLI
ClickHouse - 数据湖探索 DLI

设置ClickHouse和Kafka集群安全组的入向规则，使其对当前将要使用的Flink作业队列网段放通。参考测试地址连通性根据ClickHouse和Kafka的地址测试队列连通性。如果能连通，则表示跨源已经绑定成功，否则表示未成功。使用ClickHouse客户端连接到Clic

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
版本支持公告 - 数据湖探索 DLI

版本支持公告 DLI计算引擎版本生命周期 Flink 1.15版本说明 Flink 1.12版本说明 Spark 3.3.1版本说明 Spark 3.1.1版本说明 Spark 2.4.5版本说明 Spark 2.4.x与Spark 3.3.x版本差异对比

 帮助中心 > 数据湖探索 DLI > 服务公告
Hudi数据表Clean规范 - 数据湖探索 DLI

发阈值（对于Flink任务来说就是compaction.delta_commits的值）。 MOR表下游采用流式计算，历史版本保留小时级。如果MOR表的下游是流式计算，例如Flink流读，可以按照业务需要保留小时级的历史版本，这样的话近几个小时之内的增量数据可以通过log文件读

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
增强型跨源连接类 - 数据湖探索 DLI

增强型跨源连接类增强型跨源连接绑定队列失败怎么办？ DLI增强型跨源连接DWS失败怎么办？创建跨源成功但测试网络连通性失败怎么办？怎样配置DLI队列与数据源的网络连通？为什么DLI增强型跨源连接要创建对等连接？ DLI创建跨源连接，绑定队列一直在创建中怎么办？新建跨源连

 帮助中心 > 数据湖探索 DLI > 常见问题
典型场景示例：创建弹性资源池并运行作业 - 数据湖探索 DLI

队列管理”，选择操作的队列，如本示例的“general_test”，在操作列，单击“更多 > 测试地址连通性”。在“测试连通性”界面，根据5中获取的RDS连接信息，地址栏输入“RDS内网地址:RDS数据库端口”，单击“测试”测试到RDS网络是否可达。步骤四：运行作业本示例通过在弹性资源池队列上运行一个Flink

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
分析窗口函数概览 - 数据湖探索 DLI

DOUBLE 为窗口的ORDER BY子句所指定列中值的返回秩，但以介于0和1之间的小数形式表示，计算方法为 (RANK - 1)/(- 1)。 rank rank() INT 计算一个值在一组值中的排位。如果出现并列的情况，RANK函数会在排名序列中留出空位。 row_number

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
数学函数概览 - 数据湖探索 DLI

DOUBLE或DECIMAL 计算中位数。 negative negative(INT a) DECIMAL或INT 返回a的相反数，例如negative(2)，返回-2。 percentlie percentile(colname,DOUBLE p) DOUBLE或ARRAY 计算精确百分位数，

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 数学函数
Confluent Avro Format - 数据湖探索 DLI

安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka和ecs的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多 > 测试地址连通性 > 输入kafka或ecs的地址 > 测试）。如果能连通，则表示跨源已经绑定成功；否则表示未成功。购买ecs集群，并下载5

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Maxwell Format - 数据湖探索 DLI
Maxwell Format - 数据湖探索 DLI

列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多 > 测试地址连通性 > 输入kafka的地址 > 测试）。如果能连通，则表示跨源已经绑定成功；否则表示未成功。创建flink opensource

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

T(subValue, length) ON TRUE; UDAF UDAF函数需继承AggregateFunction函数。首先需要创建一个用来存储计算结果的Accumulator，如示例里的WeightedAvgAccum。编写代码示例 public class WeightedAvgAccum

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数
Upsert Kafka - 数据湖探索 DLI
Upsert Kafka - 数据湖探索 DLI

型跨源，并绑定所要使用的Flink弹性资源池。设置Kafka的安全组，添加入向规则使其对Flink的队列网段放通。参考测试地址连通性根据Kafka的地址测试队列连通性。如果能连通，则表示跨源已经绑定成功，否则表示未成功。参考创建Flink OpenSource作业，创建flink

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
创建Bucket索引表调优 - 数据湖探索 DLI

该表进行ETL计算时通常会使用时间范围进行裁剪（例如最近一天、一月、一年），这种表通常可以通过数据的创建时间来做分区以保证最佳读写性能。维度表数据量一般整表数据规模较小，以更新数据为主，新增较少，表数据量比较稳定，且读取时通常需要全量读取做join之类的ETL计算，因此通常使用非分区表性能更好。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
Connector概述 - 数据湖探索 DLI
Connector概述 - 数据湖探索 DLI

等数据库。示例： Flink 实时消费用户订单数据的 Kafka 源表，通过Redis维表将商品ID关联维表获取商品分类，并计算不同类别的商品销售金额，将计算结果写入 RDS（Relational Database Service，如 MySQL）结果表中。表信息如下：源表：

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

T(subValue, length) ON TRUE; UDAF UDAF函数需继承AggregateFunction函数。首先需要创建一个用来存储计算结果的Accumulator，如示例里的WeightedAvgAccum。编写代码示例 public class WeightedAvgAccum

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数
SparkSQL建表参数规范 - 数据湖探索 DLI

Metastore中。由于缺失新写入的分区信息，查询引擎读取该时会丢数。禁止指定Hudi的索引类型为INMEMORY类型。该索引仅是为了测试使用。生产环境上使用该索引将导致数据重复。建表示例 create table data_partition(id int, comb int

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
Hudi - 数据湖探索 DLI
Hudi - 数据湖探索 DLI

Hudi Hudi是一种数据湖的存储格式，在Hadoop文件系统之上提供了更新数据和删除数据的能力以及消费变化数据的能力。支持多种计算引擎，提供IUD接口，在HDFS的数据集上提供了插入更新和增量拉取的功能。表1 支持类别类别详情支持Flink表类型源表、结果表支持hudi表类型

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

T(subValue, length) ON TRUE; UDAF UDAF函数需继承AggregateFunction函数。首先需要创建一个用来存储计算结果的Accumulator，如示例里的WeightedAvgAccum。编写代码示例 public class WeightedAvgAccum

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数
levenshtein - 数据湖探索 DLI
levenshtein - 数据湖探索 DLI

levenshtein(string A, string B) 参数说明表1 参数说明参数是否必选参数类型说明 A、B 是 STRING 计算Levenshtein距离需要输入的字符串。返回值说明返回INT类型的值。示例代码返回3 SELECT levenshtein('kitten'

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

ip把Python库安装到执行机器上，对于DLI这样的Serverless化服务用户无需也感知不到底层的计算资源，那如何来保证用户可以更好的运行他的程序呢？ DLI服务在其计算资源中已经内置了一些常用的机器学习的算法库（具体可以参考”数据湖探索 DLI > 用户指南> 数据管理>

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类

总条数： 354

上一页
1
...
11
12
13
...
18
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Ogg Format - 数据湖探索 DLI

ClickHouse - 数据湖探索 DLI

版本支持公告 - 数据湖探索 DLI

Hudi数据表Clean规范 - 数据湖探索 DLI

增强型跨源连接类 - 数据湖探索 DLI

典型场景示例：创建弹性资源池并运行作业 - 数据湖探索 DLI

分析窗口函数概览 - 数据湖探索 DLI

数学函数概览 - 数据湖探索 DLI

Confluent Avro Format - 数据湖探索 DLI

Maxwell Format - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

Upsert Kafka - 数据湖探索 DLI

创建Bucket索引表调优 - 数据湖探索 DLI

Connector概述 - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

SparkSQL建表参数规范 - 数据湖探索 DLI

Hudi - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

levenshtein - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线