搜索_华为云

应用场景 - 数据湖探索 DLI
应用场景 - 数据湖探索 DLI

dTable 图2 车企数字化服务转型大数据ETL处理运营商大数据分析运营商数据体量在PB~EB级，其数据种类多，有结构化的基站信息数据，非结构化的消息通信数据，同时对数据的时效性有很高的要求，DLI服务提供批处理、流处理等多模引擎，打破数据孤岛进行统一的数据分析。优势

 帮助中心 > 数据湖探索 DLI > 产品介绍
基本概念 - 数据湖探索 DLI
基本概念 - 数据湖探索 DLI

的API，快速与其他数据系统的集成。 Flink Jar作业：允许用户提交编译为Jar包的Flink作业，提供了更大的灵活性和自定义能力。适合需要自定义函数、UDF（用户定义函数）或特定库集成的复杂数据处理场景。可以利用Flink的生态系统，实现高级流处理逻辑和状态管理。 Spark作业

 帮助中心 > 数据湖探索 DLI > 产品介绍
Upsert Kafka - 数据湖探索 DLI
Upsert Kafka - 数据湖探索 DLI

Kafka 功能描述 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。Upsert Kafka 连接器支持以upsert方式从Kafka topic中读取数据并将数据写入Kafka

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Flink作业推荐配置指导 - 数据湖探索 DLI

选择“运行队列”。提交并运行作业。登录云监控服务CES控制台，在“云服务监控”列表中找到“数据湖探索”服务。在Flink作业中找到目标作业，单击“创建告警规则”。图6 云服务监控图7 创建告警规则 DLI 为Flink作业提供了丰富的监控指标，用户可以依据自身需求使用不同的监控指标定义告警规则，实现更细粒度的作业监控。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

TPC-H 基准测试的度量单位是每小时执行的查询数( QphH@size)，其中“H”表示每小时系统执行复杂查询的平均次数，“size”表示数据库规模的大小，能够反映出系统在处理查询时的能力。TPC-H 是根据真实的生产运行环境来建模的,这使得它可以评估一些其他测试所不能评估的

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
Hive源表 - 数据湖探索 DLI
Hive源表 - 数据湖探索 DLI

AMING读取将持续监控表，并在新数据可用时以增量方式获取新数据。默认情况下，Flink会读取有界的表。 STREAMING读取支持同时使用分区表和非分区表。对于分区表，Flink将监控新分区的生成，并在可用时增量读取它们。对于未分区的表，Flink 会监控文件夹中新文件的生成情况，并增量读取新文件。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
Upsert Kafka结果表 - 数据湖探索 DLI

Kafka结果表功能描述 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。DLI将Flink作业的输出数据以upsert的模式输出到Kafka中。 Upsert Kafka

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
查看Flink作业详情 - 数据湖探索 DLI

图1 作业监控 Flink 作业包含如下监控指标。表3 Flink作业监控指标指标名称说明 Flink作业数据输入速率展示用户Flink作业的数据输入速率，供监控和调试使用。单位：条/秒。 Flink作业数据输出速率展示用户Flink作业的数据输出速率，供监控和调试使用。单位：条/秒。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
查看SQL执行计划 - 数据湖探索 DLI

查看SQL执行计划 SQL执行计划是数据库查询的逻辑流程图，它展示了数据库管理系统如何执行一个特定的SQL查询。执行计划详细列出了执行查询所需的各个步骤，例如表扫描、索引查找、连接操作（如内连接、外连接）、排序和聚合等。执行计划可以帮助分析查询的性能，识别可能的性能瓶颈，通过了解

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
SMN结果表 - 数据湖探索 DLI
SMN结果表 - 数据湖探索 DLI

中。消息通知服务（Simple Message Notification，简称SMN）为DLI提供可靠的、可扩展的、海量的消息处理服务，它大大简化系统耦合，能够根据用户的需求，向订阅终端主动推送消息。可用于连接云服务、向多个协议推送消息以及集成在产生或使用通知的任何其他应用程序

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
创建Hive Catalog - 数据湖探索 DLI

创建Hive Catalog 简介 Catalog提供了元数据信息，例如数据库、表、分区、视图以及数据库或其他外部系统中存储的函数和信息。数据处理最关键的方面之一是管理元数据。元数据可以是临时的，例如临时表、或者通过TableEnvironment注册的UDF。元数据也可以是持久化的，例如Hive

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
Upsert Kafka结果表 - 数据湖探索 DLI

输出到Kafka中。 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。前提条件 Kafka是线下集群，需要通过增强型跨源连接功能将Flink作业与Kafka进

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
Upsert Kafka源表 - 数据湖探索 DLI

Kafka源表功能描述 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。作为 source，upsert-kafka 连接器生产changelog流，其中每条数

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
Kafka结果表 - 数据湖探索 DLI
Kafka结果表 - 数据湖探索 DLI

输出到Kafka中。 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。前提条件确保已创建kafka集群。该场景作业需要运行在DLI的独享队列上，因此要与K

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Kafka - 数据湖探索 DLI
Kafka - 数据湖探索 DLI

中消费和写入数据的能力。 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。表1 支持类别类别详情支持表类型源表、结果表支持数据格式 CSV JSON Apache

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
API概览 - 数据湖探索 DLI
API概览 - 数据湖探索 DLI

Flink作业模板相关API 包括新建模板、更新模板、删除模板和查询模板列表。 Spark作业相关API 包括创建批处理作业、取消批处理作业、查询批处理作业列表、查询批处理作业详情、查询批处理作业状态和查询批处理作业日志。 Spark作业模板相关API 包括保存SQL模板、创建作业模板等模板相关API。

帮助中心 > 数据湖探索 DLI > API参考
Kafka源表 - 数据湖探索 DLI
Kafka源表 - 数据湖探索 DLI

作为作业的输入数据。 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。前提条件确保已创建Kafka集群。该场景作业需要运行在DLI的独享队列上，因此要与k

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
Kafka源表 - 数据湖探索 DLI
Kafka源表 - 数据湖探索 DLI

作为作业的输入数据。 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。前提条件 Kafka是线下集群，需要通过增强型跨源连接功能将Flink作业与Kafka进

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
Kafka结果表 - 数据湖探索 DLI
Kafka结果表 - 数据湖探索 DLI

DLI将Flink作业的输出数据输出到Kafka中。 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。前提条件 Kafka是线下集群，需要通过增强型跨源连接功能将Flink作业与Kafka进

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
数据湖探索简介 - 数据湖探索 DLI

以用来做流处理，即实时地处理一些实时数据流，实时地产生数据的结果。DLI在开源Flink基础上进行了特性增强和安全增强，提供了数据处理所必须的Stream SQL特性。 HetuEngine是提供交互式查询分析能力的开源分布式SQL查询引擎，具备高性能、低延迟的查询处理能力，支持在大规模数据存储中进行数据查询和分析。

帮助中心 > 数据湖探索 DLI > 产品介绍

总条数： 593

上一页
1
2
3
4
5
...
30
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

0/200

提交反馈取消

应用场景 - 数据湖探索 DLI

基本概念 - 数据湖探索 DLI

Upsert Kafka - 数据湖探索 DLI

Flink作业推荐配置指导 - 数据湖探索 DLI

DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

Hive源表 - 数据湖探索 DLI

Upsert Kafka结果表 - 数据湖探索 DLI

查看Flink作业详情 - 数据湖探索 DLI

查看SQL执行计划 - 数据湖探索 DLI

SMN结果表 - 数据湖探索 DLI

创建Hive Catalog - 数据湖探索 DLI

Upsert Kafka结果表 - 数据湖探索 DLI

Upsert Kafka源表 - 数据湖探索 DLI

Kafka结果表 - 数据湖探索 DLI

Kafka - 数据湖探索 DLI

API概览 - 数据湖探索 DLI

Kafka源表 - 数据湖探索 DLI

Kafka源表 - 数据湖探索 DLI

Kafka结果表 - 数据湖探索 DLI

数据湖探索简介 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线