搜索_华为云

实时聚类 - 数据湖探索 DLI
实时聚类 - 数据湖探索 DLI

实时聚类聚类算法是非监督算法中非常典型的一类算法，经典的K-Means算法通过提前确定类别数目，计算数据点之间的距离来分类。对于离线静态数据集，我们可以依赖领域中知识来确定类别数目，运行K-Means算法可以取得比较好的聚类效果。但是对于在线实时流数据，数据是在不断变化和演进，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > 历史版本 > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > StreamingML
产品优势 - 数据湖探索 DLI
产品优势 - 数据湖探索 DLI

提供了更实时高效的多样性算力，可支撑更丰富的大数据处理需求。产品内核及架构深度优化，综合性能是传统MapReduce模型的百倍以上，SLA保障99.95%可用性。图1 DLI Serverless架构与传统自建Hadoop集群相比，Serverless架构的DLI还具有以下优势：

帮助中心 > 数据湖探索 DLI > 产品介绍
上传jar类型分组资源（废弃） - 数据湖探索 DLI

of strings 该模块包含的资源包名列表。 details 否 Array of body 分组资源包的详细信息。具体请参考表4。 create_time 否 Long 模块上传的unix时间戳。 update_time 否 Long 模块更新的unix时间戳。 is_async

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
数据迁移概览 - 数据湖探索 DLI

本文为您介绍数据迁移的最佳实践，您可以通过云数据迁移服务CDM轻松的将其他云服务或者业务平台的数据迁移至DLI。 DLI提供一站式的流处理、批处理、交互式分析的Serverless融合处理分析服务，采用批流融合高扩展性框架，为TB~EB级数据提供了更实时高效的多样性算力，可支撑更丰富的大数据处理需求。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 数据迁移
查询弹性资源池下所有队列 - 数据湖探索 DLI

message 否 String 系统提示信息，执行成功时，信息可能为空。 queues 否 Array of objects 该弹性资源池下所有queue的资源权重信息。详细参数说明请参考表4。 count 否 Long 该资源池下关联的队列数量。表4 queues 参数是否必填参数类型

 帮助中心 > 数据湖探索 DLI > API参考 > 弹性资源池相关API
迁移数据场景概述 - 数据湖探索 DLI

为了将分散在不同系统中的数据迁移到DLI，确保数据可以在DLI集中分析和管理，你可以通过云数据迁移服务CDM等迁移工具迁移数据至DLI，再使用DLI提交作业分析数据。 CDM支持数据库、数据仓库、文件等多种类型的数据源，通过可视化界面对数据源迁移任务进行配置，提高数据迁移和集成的效率。图1

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
查询资源实例数量 - 数据湖探索 DLI

最多支持20个标签。每个资源中的键不能重复，同一个键中值不能重复。无tag过滤条件时返回全量数据。 matches 否 Array of objects 搜索字段。请参考matches。表3 tags 参数是否必选参数类型描述 key 是 String 键。标签的键的最大长度为12

帮助中心 > 数据湖探索 DLI > API参考 > 资源标签相关API
入门实践 - 数据湖探索 DLI
入门实践 - 数据湖探索 DLI

数据源之间的网络连通方法，如：DLI连接MRS、RDS、CSS、Kafka、DWS时，需要打通DLI和外部数据源之间的网络。配置DLI 队列与公网网络连通介绍DLI队列在公网访问场景下网络连通的方法。通过配置SNAT规则，添加到公网的路由信息，可以实现队列到和公网的网络打通。

帮助中心 > 数据湖探索 DLI > 快速入门
上传file类型分组资源（废弃） - 数据湖探索 DLI

of strings 该模块包含的资源包名列表。 details 否 Array of body 分组资源包的详细信息。具体请参考表4。 create_time 否 Long 模块上传的unix时间戳。 update_time 否 Long 模块更新的unix时间戳。 is_async

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
查询作业状态 - 数据湖探索 DLI

Insert作业执行过程中扫描到的错误记录数。 input_size Long 作业执行过程中扫描文件的大小，单位字节。 result_count Integer 当前作业返回的结果总条数或insert作业插入的总条数。 database_name String 记录其操作的表所在的数据库名称。类

 帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
Spark开源命令支持说明 - 数据湖探索 DLI

Spark开源命令支持说明本章节介绍了目前DLI对开源的Spark SQL语法的支持情况。详细的语法、参数说明，示例等信息请参考Spark官方文档。表1 DLI Spark开源命令支持说明功能描述语法示例 DLI Spark 2.4.5 DLI Spark 3.3.1 创建数据库

 帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线）
停止计费 - 数据湖探索 DLI
停止计费 - 数据湖探索 DLI

查看弹性资源池详细信息，根据计算资源的类型选择结束计费需要执行的操作。按需计费的弹性资源池如不再使用，可删除资源停止计费。按需计费资源删除后，可能还会存在账单信息，因为系统通常会在使用后1个小时内对上一个结算周期的费用进行扣款。例如在8:30删除按小时结算的资源，但是8:00~9:00期间产生的费用，通常会在10:00左右才进行扣费。

帮助中心 > 数据湖探索 DLI > 计费说明
Spark开源命令支持说明 - 数据湖探索 DLI

Spark开源命令支持说明本章节介绍了目前DLI对开源的Spark SQL语法的支持情况。详细的语法、参数说明，示例等信息请参考Spark官方文档。表1 DLI Spark开源命令支持说明功能描述语法示例 DLI Spark 2.4.5 DLI Spark 3.3.1 创建数据库

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
创建弹性资源池 - 数据湖探索 DLI

String 标签的键。说明：标签的键的最大长度为128个字符，标签的键可以包含任意语种字母、数字、空格和_ . : =+-@ ,但首尾不能含有空格，不能以_sys_开头。 value 是 String 标签的值。说明：标签值的最大长度为255个字符，标签的值可以包含任意语种字母、数字、空格和_

帮助中心 > 数据湖探索 DLI > API参考 > 弹性资源池相关API
时间函数 - 数据湖探索 DLI
时间函数 - 数据湖探索 DLI

指定日期减去目标天数后的日期，数据类型为STRING。 TIME string TIME 以“HH:mm:ss”的形式返回从字符串解析的 SQL 时间。 TIMESTAMP string TIMESTAMP 以“yyyy-MM-dd HH:mm:ss[.SSS]”的形式返回从字符串解析的 SQL

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
获取分区信息列表（废弃） - 数据湖探索 DLI

每页显示的返回信息的个数，默认值为100。 offset 否 Integer 偏移量。 filter 否 String 筛选条件，目前只支持“=”条件筛选，例如：name=name1，表示筛选出分区中name=name1的数据，name为分区列名称，name1为分区列的值。key和value不区分大小写。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 资源相关API（废弃） > 表相关API（废弃）
数据赋权（用户）（废弃） - 数据湖探索 DLI

功能介绍该API用于将数据库或数据表的数据权限赋给指定的其他用户。被赋权用户所在用户组的所属区域需具有Tenant Guest权限。关于Tenant Guest权限的介绍和开通方法，详细参见权限策略和《统一身份认证服务用户指南》中的创建用户组。当前接口已废弃，不推荐使用。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 权限相关API（废弃）
创建增强型跨源连接 - 数据湖探索 DLI

输入长度不能超过64个字符。 dest_vpc_id 是 String 对应服务的vpc的ID。具体请参考《虚拟私有云API参考》。 dest_network_id 是 String 对应服务的子网网络ID，即为需要建立连接的服务所在的子网。具体请参考《虚拟私有云API参考》。 elastic_resource_pools

帮助中心 > 数据湖探索 DLI > API参考 > 增强型跨源连接相关API
创建JDBC维表 - 数据湖探索 DLI
创建JDBC维表 - 数据湖探索 DLI

connector，必须为jdbc connector.url 是数据库的URL connector.table 是读取数据库中的数据所在的表名 connector.driver 否连接数据库所需要的驱动。若未配置，则会自动通过URL提取 connector.username

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建维表
first - 数据湖探索 DLI
first - 数据湖探索 DLI

expr 是待计算返回结果的表达式。 ignore_nulls 否 BOOLEAN类型，表示是否忽略NULL值。默认值为False。当参数的值为True时，返回窗口中第一条非NULL的值。 partition_clause 否指定分区。分区列的值相同的行被视为在同一个窗口内。 orderby_clause

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数

总条数： 1216

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

实时聚类 - 数据湖探索 DLI

产品优势 - 数据湖探索 DLI

上传jar类型分组资源（废弃） - 数据湖探索 DLI

数据迁移概览 - 数据湖探索 DLI

查询弹性资源池下所有队列 - 数据湖探索 DLI

迁移数据场景概述 - 数据湖探索 DLI

查询资源实例数量 - 数据湖探索 DLI

入门实践 - 数据湖探索 DLI

上传file类型分组资源（废弃） - 数据湖探索 DLI

查询作业状态 - 数据湖探索 DLI

Spark开源命令支持说明 - 数据湖探索 DLI

停止计费 - 数据湖探索 DLI

Spark开源命令支持说明 - 数据湖探索 DLI

创建弹性资源池 - 数据湖探索 DLI

时间函数 - 数据湖探索 DLI

获取分区信息列表（废弃） - 数据湖探索 DLI

数据赋权（用户）（废弃） - 数据湖探索 DLI

创建增强型跨源连接 - 数据湖探索 DLI

创建JDBC维表 - 数据湖探索 DLI

first - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线