搜索_华为云

实时聚类 - 数据湖探索 DLI
实时聚类 - 数据湖探索 DLI

实时聚类聚类算法是非监督算法中非常典型的一类算法，经典的K-Means算法通过提前确定类别数目，计算数据点之间的距离来分类。对于离线静态数据集，我们可以依赖领域中知识来确定类别数目，运行K-Means算法可以取得比较好的聚类效果。但是对于在线实时流数据，数据是在不断变化和演进，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > 历史版本 > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > StreamingML
典型场景示例：迁移DWS数据至DLI - 数据湖探索 DLI

选择已创建的DLI数据源连接。资源队列选择已创建的DLI SQL类型的队列。数据库名称选择DLI下已创建的数据库。当前示例为在DLI上创建数据库和表创建的数据库名，即为“testdb”。表名选择DLI下已创建的表名。当前示例为在DLI上创建数据库和表创建的表名，即为“tabletest”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 迁移外部数据源数据至DLI
实时聚类 - 数据湖探索 DLI
实时聚类 - 数据湖探索 DLI

实时聚类聚类算法是非监督算法中非常典型的一类算法，经典的K-Means算法通过提前确定类别数目，计算数据点之间的距离来分类。对于离线静态数据集，我们可以依赖领域中知识来确定类别数目，运行K-Means算法可以取得比较好的聚类效果。但是对于在线实时流数据，数据是在不断变化和演进，

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > 历史版本（即将下线） > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > StreamingML
开源Kafka输出流 - 数据湖探索 DLI

功能描述 DLI将Flink作业的输出数据输出到Kafka中。 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。前提条件 Kafka服务端的端口如果监听在hostname上，则需要将Kafka

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > 历史版本 > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 创建输出流
设置普通队列的弹性扩缩容定时任务 - 数据湖探索 DLI

设置普通队列的弹性扩缩容定时任务弹性扩缩容定时任务使用场景通常，用户业务繁忙的场景是有周期性的，在某个周期内，用户需要更多的计算资源来处理业务，过了这个周期，则不需要那么多资源。如果用户购买的队列规格比较小，在业务繁忙时会存在资源不足的情况；而如果购买的队列规格比较大，又可能会存在资源浪费的情况。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
字符串函数概览 - 数据湖探索 DLI

次匹配pattern的子串，以及之后匹配pattern的子串，全都替换成指定字符串replace_string后，返回结果字符适用于Spark3.3.1：用于将source字符串中第occurrence次匹配pattern的子串，以及之后匹配pattern的子串，全都替换成指定

 帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线） > 内置函数 > 字符串函数
字符串函数概览 - 数据湖探索 DLI

次匹配pattern的子串，以及之后匹配pattern的子串，全都替换成指定字符串replace_string后，返回结果字符适用于Spark3.3.1：用于将source字符串中第occurrence次匹配pattern的子串，以及之后匹配pattern的子串，全都替换成指定

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
开源Kafka输出流 - 数据湖探索 DLI

功能描述 DLI将Flink作业的输出数据输出到Kafka中。 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。前提条件 Kafka服务端的端口如果监听在hostname上，则需要将Kafka

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > 历史版本（即将下线） > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 创建输出流
查询经典型跨源连接列表 - 数据湖探索 DLI

String 连接ID，用于标识跨源连接的UUID。 destination 否 String 创建连接时，用户填写的队列的访问地址。 state 否 String 连接状态，具体状态请参见表4。 process 否 Double 正在创建的跨源连接进度，显示0.0至1.0代表0%至100%。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 经典型跨源连接相关API（废弃）
查询经典型跨源连接 - 数据湖探索 DLI

String 连接ID，用于标识跨源连接的UUID。 destination 否 String 创建连接时，用户填写的队列的访问地址。 state 否 String 连接状态，具体状态请参见表4。 process 否 Double 正在创建的跨源连接进度，显示0.0至1.0代表0%至100%。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 经典型跨源连接相关API（废弃）
时间序列预测 - 数据湖探索 DLI

为序列均值加上q个之前值的白噪声的线性组合。利用线性组合的权值也可预测下一个值。 ARMA(p, q)：自回归移动平均模型，综合了AR和MA两个模型的优势，在ARMA模型中，自回归过程负责量化当前数据与前期数据之间的关系，移动平均过程负责解决随机变动项的求解问题，因此，该模型比AR/MA更为有效和常用。

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > 历史版本（即将下线） > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > StreamingML
普通队列弹性扩缩容 - 数据湖探索 DLI

容到设定的目标大小。队列资源缩容时，系统不保证将队列资源完全缩容到设定的目标大小。通常队列资源缩容时，系统会先检查资源使用情况，判断是否存在缩容空间，如果现有资源无法按照最小缩容步长执行缩容任务，则队列可能缩容不成功，或缩容一部分规格的情况。因资源规格不同可能有不同的缩容步长

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
查询批处理作业列表 - 数据湖探索 DLI

作业运行时长，单位毫秒。 id 否 String 批处理作业的id。 state 否 String 批处理作业的状态。 appId 否 String 批处理作业的后台app id。 log 否 Array of Strings 显示当前批处理作业的最后10条记录。 sc_type 否 String

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
DLI弹性资源池与队列简介 - 数据湖探索 DLI

性资源池中的资源。队列是DLI中被实际使用和分配的基本单元，即队列是执行作业所需的具体的计算资源。您可以为不同的作业或数据处理任务创建不同的队列，并按需对这些队列分配和调整资源。了解DLI的队列类型请参考DLI队列类型。 DLI计算资源模式 DLI提供了三种计算资源的管理模式，每一种模式都有独特的优势和适用场景。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
Flink作业标签管理 - 数据湖探索 DLI

个业务所使用的云资源创建相同的标签键值对以保持一致性。 DLI支持以下两类标签：资源标签：在DLI中创建的非全局的标签。预定义标签：在标签管理服务（简称TMS）中创建的预定义标签，属于全局标签。有关预定义标签的更多信息，请参见《标签管理服务用户指南》。如您的组织已经设定D

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
创建DLI表关联DWS - 数据湖探索 DLI

个连接里将"postgres"修改为对应的数据库名字。 dbtable 指定在DWS关联的表名，或者"模式名.表名"，例如：public.table_name。 user （已废弃）DWS的用户名。 password （已废弃）DWS集群的用户密码。 passwdauth 跨源密

 帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线） > 跨源连接DWS表
创建非弹性资源池队列（废弃，不推荐使用） - 数据湖探索 DLI

不支持队列类型切换，如需使用其他队列类型，请重新购买新的队列。不支持切换队列的计费模式。队列不支持切换区域。 16CUs队列不支持扩容和缩容。 64CUs队列不支持缩容。创建队列时，仅支持包年包月队列和按需专属队列选择跨AZ双活，且跨AZ的队列价格为单AZ模式下的2倍。新创建的队列需要运行作业后才可进行扩缩容。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
时间序列预测 - 数据湖探索 DLI

为序列均值加上q个之前值的白噪声的线性组合。利用线性组合的权值也可预测下一个值。 ARMA(p, q)：自回归移动平均模型，综合了AR和MA两个模型的优势，在ARMA模型中，自回归过程负责量化当前数据与前期数据之间的关系，移动平均过程负责解决随机变动项的求解问题，因此，该模型比AR/MA更为有效和常用。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > 历史版本 > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > StreamingML
创建DLI表关联DWS - 数据湖探索 DLI

个连接里将"postgres"修改为对应的数据库名字。 dbtable 指定在DWS关联的表名，或者"模式名.表名"，例如：public.table_name。 user （已废弃）DWS的用户名。 password （已废弃）DWS集群的用户密码。 passwdauth 跨源密

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DWS表
Print - 数据湖探索 DLI
Print - 数据湖探索 DLI

登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。进入对应日期的文件夹后，找到名字中包含“taskmanager”的文件夹进入，下载获取taskmanager.out文件查看结果日志。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表

总条数： 744

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

实时聚类 - 数据湖探索 DLI

典型场景示例：迁移DWS数据至DLI - 数据湖探索 DLI

实时聚类 - 数据湖探索 DLI

开源Kafka输出流 - 数据湖探索 DLI

设置普通队列的弹性扩缩容定时任务 - 数据湖探索 DLI

字符串函数概览 - 数据湖探索 DLI

字符串函数概览 - 数据湖探索 DLI

开源Kafka输出流 - 数据湖探索 DLI

查询经典型跨源连接列表 - 数据湖探索 DLI

查询经典型跨源连接 - 数据湖探索 DLI

时间序列预测 - 数据湖探索 DLI

普通队列弹性扩缩容 - 数据湖探索 DLI

查询批处理作业列表 - 数据湖探索 DLI

DLI弹性资源池与队列简介 - 数据湖探索 DLI

Flink作业标签管理 - 数据湖探索 DLI

创建DLI表关联DWS - 数据湖探索 DLI

创建非弹性资源池队列（废弃，不推荐使用） - 数据湖探索 DLI

时间序列预测 - 数据湖探索 DLI

创建DLI表关联DWS - 数据湖探索 DLI

Print - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线