搜索_华为云

ClickHouse结果表 - 数据湖探索 DLI

ClickHouse结果表功能描述 DLI将Flink作业数据输出到ClickHouse中。 ClickHouse是面向联机分析处理的列式数据库，支持SQL查询，且查询性能好，特别是基于大宽表的聚合分析查询性能非常优异，比其他分析型数据库速度快一个数量级。详细请参考ClickHouse组件操作。

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
MRS Kafka输入流 - 数据湖探索 DLI

式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。MRS基于Apache Kafka在平台部署并托管了Kafka集群。前提条件 Kafka服务端的端口如果监听在hostname上，则需要将Kafka Broker节点的host

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > 历史版本（即将下线） > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 创建输入流
DLI中的Spark组件与MRS中的Spark组件有什么区别？ - 数据湖探索 DLI

S服务所分配的虚机上，用户可以根据实际需求调整及优化Spark服务，支持各种接口调用。 MRS的这种模式提供了更高的自由度和定制性，适合有大数据处理经验的用户使用。具体请参考《MapReduce服务开发指南》。父主题： DLI产品咨询类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
MRS Kafka输入流 - 数据湖探索 DLI

式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。MRS基于Apache Kafka在平台部署并托管了Kafka集群。前提条件 Kafka服务端的端口如果监听在hostname上，则需要将Kafka Broker节点的host

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > 历史版本 > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 创建输入流
MRS Kafka输出流 - 数据湖探索 DLI

式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。MRS基于Apache Kafka在平台部署并托管了Kafka集群。前提条件 Kafka服务端的端口如果监听在hostname上，则需要将Kafka Broker节点的host

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > 历史版本（即将下线） > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 创建输出流
MRS Kafka输出流 - 数据湖探索 DLI

式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。MRS基于Apache Kafka在平台部署并托管了Kafka集群。前提条件 Kafka服务端的端口如果监听在hostname上，则需要将Kafka Broker节点的host

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > 历史版本 > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 创建输出流
DLI内置依赖包 - 数据湖探索 DLI

DLI内置依赖包 DLI内置依赖包是平台默认提供的依赖包，用户打包Spark或Flink jar作业jar包时，不需要额外上传这些依赖包，以免与平台内置依赖包冲突。 Spark 3.1.1 依赖包表1 Spark 3.1.1 依赖包依赖包名称 accessors-smart-1

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

使用Spark SQL作业分析OBS数据 DLI支持将数据存储到OBS上，后续再通过创建OBS表即可对OBS上的数据进行分析和处理。本指导中的操作内容包括：创建OBS表、导入OBS表数据、插入和查询OBS表数据等内容来帮助您更好的在DLI上对OBS表数据进行处理。前提条件已

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
DLI Flink与MRS Flink有什么区别？ - 数据湖探索 DLI

Flink有什么区别？ DLI Flink是天然的云原生基础架构。在内核引擎上DLI Flink进行了多处核心功能的优化，并且提供了企业级的一站式开发平台，自带开发和运维功能，免除自建集群运维的麻烦；在connector方面除了支持开源connector之外，还可以对接云上Mysql、GaussDB、MRS

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
EdgeHub输入流（EOS） - 数据湖探索 DLI

处理，增加数据处理计算的速度和效率。同时将数据在边缘预处理，可以有效减少无效的数据上云，减少资源消耗，提升分析效率。边缘作业依赖于智能边缘平台(Intelligent EdgeFabric, IEF)，IEF通过纳管用户的边缘节点，提供将云上应用延伸到边缘的能力，联动边缘和云端的

 帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > 历史版本（即将下线） > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 创建输入流
数学函数概览 - 数据湖探索 DLI

percentlie_approx percentile_approx (colname,DOUBLE p) DOUBLE或ARRAY 计算近似百分位数，适用于大数据量。先对指定列升序排列，然后取第p位百分数对应的值。 pi pi() DOUBLE 返回pi的值。 pmod pmod(INT a, INT

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 数学函数
DWS源表 - 数据湖探索 DLI
DWS源表 - 数据湖探索 DLI

用场景包括位置应用、金融保险、互联网电商等。数据仓库服务（Data Warehouse Service，简称DWS）是一种基于基础架构和平台的在线数据处理数据库，为用户提供海量数据挖掘和分析服务。DWS的更多信息，请参见《数据仓库服务管理指南》。前提条件请务必确保您的账户下

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
了解数据目录、数据库和表 - 数据湖探索 DLI

数据库和表的约束与限制数据库 “default”为内置数据库，不能创建名为“default”的数据库。 DLI支持创建的数据库的最大数量为50个。数据表 DLI支持创建的表的最大数量为5000个。 DLI支持创建表类型： Managed：数据存储位置为DLI的表。 External：数据存储位置为OBS的表。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
资产识别与管理 - 数据湖探索 DLI

资产识别与管理 DLI 可以通过标签实现资源的标识与管理。使用场景通常您的业务系统可能使用了华为云的多种云服务，您可以为这些云服务下不同的资源实例分别设置标签，各服务的计费详单会体现这些资源实例设置的标签。如果您的业务系统是由多个不同的应用构成，为同一种应用拥有的资源实例设置

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
分析窗口函数概览 - 数据湖探索 DLI

分析窗口函数概览 DLI所支持的分析窗口函数如分析窗口函数介绍所示。表1 分析窗口函数介绍函数命令格式返回值功能简介 cume_dist cume_dist() DOUBLE 用于求累计分布，相当于求分区中大于等于或小于等于当前行的数据在分区中的占比。 first_value

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线） > 内置函数 > 分析窗口函数
Elasticsearch结果表 - 数据湖探索 DLI

max-actions 否批量写入时的每次最大写入记录数 connector.bulk-flush.max-size 否批量写入时的最大数据量，当前只支持MB，请带上单位 mb connector.bulk-flush.interval 否批量写入时的刷新的时间间隔，单位为milliseconds，无需带上单位

 帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
Elasticsearch结果表 - 数据湖探索 DLI

max-actions 否批量写入时的每次最大写入记录数 connector.bulk-flush.max-size 否批量写入时的最大数据量，当前只支持MB，请带上单位 mb connector.bulk-flush.interval 否批量写入时的刷新的时间间隔，单位为milliseconds，无需带上单位

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
Spark 3.3.1版本说明 - 数据湖探索 DLI

表1 Spark 3.3.1版本优势特性说明 Native性能加速 Spark查询语句性能提升。元数据访问性能提升提升Spark在处理大数据时的元数据访问性能，提高数据处理流程效率。提升OBS committer小文件写性能提升对象存储服务（OBS）在处理小文件写入时的性能，提高数据传输效率。

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
查询Spark作业日志 - 数据湖探索 DLI

转换对象的存储类别。 DLI的作业桶设置后请谨慎修改，否则可能会造成历史数据无法查找。前提条件配置前，请先购买OBS桶或并行文件系统。大数据场景推荐使用并行文件系统，并行文件系统（Parallel File System）是对象存储服务（Object Storage Serv

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
查询SQL作业日志 - 数据湖探索 DLI

转换对象的存储类别。 DLI的作业桶设置后请谨慎修改，否则可能会造成历史数据无法查找。前提条件配置前，请先购买OBS桶或并行文件系统。大数据场景推荐使用并行文件系统，并行文件系统（Parallel File System）是对象存储服务（Object Storage Serv

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业

总条数： 212

上一页
1
2
3
4
5
...
11
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ClickHouse结果表 - 数据湖探索 DLI

MRS Kafka输入流 - 数据湖探索 DLI

DLI中的Spark组件与MRS中的Spark组件有什么区别？ - 数据湖探索 DLI

MRS Kafka输入流 - 数据湖探索 DLI

MRS Kafka输出流 - 数据湖探索 DLI

MRS Kafka输出流 - 数据湖探索 DLI

DLI内置依赖包 - 数据湖探索 DLI

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

DLI Flink与MRS Flink有什么区别？ - 数据湖探索 DLI

EdgeHub输入流（EOS） - 数据湖探索 DLI

数学函数概览 - 数据湖探索 DLI

DWS源表 - 数据湖探索 DLI

了解数据目录、数据库和表 - 数据湖探索 DLI

资产识别与管理 - 数据湖探索 DLI

分析窗口函数概览 - 数据湖探索 DLI

Elasticsearch结果表 - 数据湖探索 DLI

Elasticsearch结果表 - 数据湖探索 DLI

Spark 3.3.1版本说明 - 数据湖探索 DLI

查询Spark作业日志 - 数据湖探索 DLI

查询SQL作业日志 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线