搜索_华为云

对象存储OBS源表 - 数据湖探索 DLI

monitor-interval 无 Duration 设置新文件的监控时间间隔，并且必须设置 > 0 的值。每个文件都有其路径唯一标识，一旦发现新文件，就会处理一次。已处理的文件在 source 的整个生命周期内存储在 state 中，因此，source 的 state 在 checkpoint 和

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > 对象存储OBS
应用场景 - 数据湖探索 DLI
应用场景 - 数据湖探索 DLI

大数据ETL处理运营商大数据分析运营商数据体量在PB~EB级，其数据种类多，有结构化的基站信息数据，非结构化的消息通信数据，同时对数据的时效性有很高的要求，DLI服务提供批处理、流处理等多模引擎，打破数据孤岛进行统一的数据分析。优势大数据ETL：具备TB~EB级运营商数据治理能力，能快速

 帮助中心 > 数据湖探索 DLI > 产品介绍
Delta常见配置参数 - 数据湖探索 DLI

deletedFileRetentionDuration Delta不再引用的文件的保留期。当spark.databricks.delta.retentionDurationCheck.enabled为true时，清空未超过保留期的文件将会抛出异常。 168小时（1周） spark.databricks

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考
如何在一个Flink作业中将数据写入到不同的Elasticsearch集群中？ - 数据湖探索 DLI

如何在一个Flink作业中将数据写入到不同的Elasticsearch集群中？在Flink 作业中，可以使用CREATE语句来定义Source表和Sink表，并指定它们的连接器类型以及相关的属性。如果需要将数据写入到不同的Elasticsearch集群，您需要为每个集群配置不同的连接参数，并确保Fl

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
在DLI使用Hudi提交Spark SQL作业 - 数据湖探索 DLI

首进入提交SQL作业的界面。提交SQL作业时需要选择支持Hudi的Spark SQL队列。创建一张Hudi表：将如下的建表语句粘贴至DLI SQL编辑器的输入区域，修改 LOCATION，执行引擎选择Spark，配置队列，数据目录，数据库，随后点击右上角的执行按钮，提交作业。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
在DLI控制台预览表数据 - 数据湖探索 DLI

“预览页面”将显示对应表的前10条数据。预览数据步骤预览数据的入口有两个，分别在“数据管理”和“SQL编辑器”页面。在“数据管理”页面预览数据。在管理控制台左侧，单击“数据管理”>“库表管理”。单击需导出数据对应数据库名称，进入该数据库“表管理”页面。单击目标表“操作”栏中的“更多”，选择“表属性”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
Format概述 - 数据湖探索 DLI
Format概述 - 数据湖探索 DLI

Flink 提供了一套与表连接器（table connector）一起使用的表格式（table format）。表格式是一种存储格式，定义了如何把二进制数据映射到表的列上。表1 Flink支持格式 Formats 支持的Connectors CSV Kafka, Upsert Kafka

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Hudi常见配置参数 - 数据湖探索 DLI

有小文件的更新来解决小文件的问题。此处的大小是被视为“小文件大小”的最小文件大小。 104857600 byte hoodie.copyonwrite.insert.split.size 插入写入并行度。为单个分区的总共插入次数。写出100MB的文件，至少1KB大小的记录，意味着

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
使用DLI分析电商BI报表 - 数据湖探索 DLI

某电商商城在保持高速发展的同时，沉淀了数亿的忠实用户，积累了海量的真实数据。如何利用BI工具从历史数据中找出商机，是大数据应用在精准营销中的关键问题，也是所有电商平台在做智能化升级时所需要的核心技术。本案例以某商城真实的用户、商品、评论数据（脱敏后）为基础，利用数据湖探索来分析用户和商品的各种数

 帮助中心 > 数据湖探索 DLI > 最佳实践
数据湖探索简介 - 数据湖探索 DLI

时，队列2不能使用队列1中的资源，只能单独对队列1进行扩容。添加到同一个弹性资源池的多个队列，CU资源可以共享，达到资源的合理利用。配置跨源时，必须为每个队列分配不重合的网段，占用大量VPC网段。多队列通过弹性资源池统一进行网段划分，减少跨源配置的复杂度。资源调配多个队

 帮助中心 > 数据湖探索 DLI > 产品介绍
手动在OBS表的分区目录下添加了数据，但是无法查询到数据怎么办？ - 数据湖探索 DLI

手动在OBS表的分区目录下添加了数据，但是无法查询到数据怎么办？问题现象手动在OBS表的分区目录下上传了分区数据，但是在SQL编辑器中查询该表新增的分区数据时却查询不到。解决方案手动添加分区数据后，需要刷新OBS表的元数据信息。具体操作如下： MSCK REPAIR TABLE

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
Upsert Kafka结果表 - 数据湖探索 DLI

流。它会将INSERT/UPDATE_AFTER数据作为正常的Kafka消息写入，并将DELETE数据以value为空的Kafka消息写入（表示对应 key 的消息被删除）。Flink将根据主键列的值对数据进行分区，从而保证主键上的消息有序，因此同一主键上的更新/删除消息将落在同一分区中。前提条件

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Upsert Kafka - 数据湖探索 DLI
Upsert Kafka - 数据湖探索 DLI

EXCEPT_KEY：记录的value部分包含schema的所有内容，定义为主键的字段除外。 properties.* 否无 String 该选项可以传递任意的Kafka参数。 “properties.”后的后缀名必须匹配定义在 kafka参数文档中的参数名。 Flink会自动移除选项名中的 "properties

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
概述 - 数据湖探索 DLI
概述 - 数据湖探索 DLI

Flink、trino生态，提供一站式的流处理、批处理、交互式分析的Serverless融合处理分析服务。用户不需要管理任何服务器，即开即用。支持标准SQL/Spark SQL/Flink SQL，支持多种接入方式，并兼容主流数据格式。数据无需复杂的抽取、转换、加载，使用SQL或程序

 帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读
Elasticsearch - 数据湖探索 DLI
Elasticsearch - 数据湖探索 DLI

DLI将Flink作业的输出数据输出到云搜索服务CSS的Elasticsearch 引擎的索引中。 Elasticsearch是基于Lucene的当前流行的企业级搜索服务器，具备分布式多用户的能力。其主要功能包括全文检索、结构化搜索、分析、聚合、高亮显示等。能为用户提供实时搜索、稳定可靠的服务。适用于日志分析、站内搜索等场景。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Elasticsearch结果表 - 数据湖探索 DLI

Kafka所在的虚拟私有云和子网分别创建相应的增强型跨源连接，并绑定所要使用的Flink弹性资源池。设置Elasticsearch和Kafka的安全组，添加入向规则使其对Flink的队列网段放通。参考测试地址连通性分别根据Elasticsearch和Kafka的地址测试队列连通

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Kafka - 数据湖探索 DLI
Kafka - 数据湖探索 DLI

json数据类型的数据，输出到日志文件中。参考增强型跨源连接，根据Kafka所在的虚拟私有云和子网创建相应的增强型跨源，并绑定所要使用的Flink弹性资源池。设置Kafka的安全组，添加入向规则使其对Flink的队列网段放通。参考测试地址连通性根据Kafka的地址测试队列连通

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
配置PowerBI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

Power BI提供了数据集成、数据仓库、报告和数据可视化等功能，能够将复杂的数据转换为易于理解和交互的可视化图表和仪表板，从而帮助企业做出基于数据的决策。 Kyuubi是一个分布式SQL查询引擎，它允许用户通过标准的SQL接口来访问和分析数据。将Power BI与Kyuubi对接，通

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
使用Livy提交Spark Jar作业 - 数据湖探索 DLI

Livy工具配置文件上传指定的DLI Livy工具jar资源包到OBS桶路径下。登录OBS控制台，在指定的OBS桶下创建一个存放Livy工具jar包的资源目录。例如：“obs://bucket/livy/jars/”。进入3.a中DLI Livy工具所在ECS服务器的安装目录，获取以下jar包，将获取的jar包上传到1

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
配置Tableau通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

在开始页面的“连接”窗格中，选择你想要连接的数据源类型。本例选择Hive类型的数据连接。配置数据连接信息。连接：Hive 服务器：Kyuubi主机的IP地址。端口：连接Kyuubi的端口，Hive Thrift协议对接，默认端口10009。身份验证：本例选择用户名的认证方式。用户名：Kyuubi用户名。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据

总条数： 228

上一页
1
2
3
4
5
...
12
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

对象存储OBS源表 - 数据湖探索 DLI

应用场景 - 数据湖探索 DLI

Delta常见配置参数 - 数据湖探索 DLI

如何在一个Flink作业中将数据写入到不同的Elasticsearch集群中？ - 数据湖探索 DLI

在DLI使用Hudi提交Spark SQL作业 - 数据湖探索 DLI

在DLI控制台预览表数据 - 数据湖探索 DLI

Format概述 - 数据湖探索 DLI

Hudi常见配置参数 - 数据湖探索 DLI

使用DLI分析电商BI报表 - 数据湖探索 DLI

数据湖探索简介 - 数据湖探索 DLI

手动在OBS表的分区目录下添加了数据，但是无法查询到数据怎么办？ - 数据湖探索 DLI

Upsert Kafka结果表 - 数据湖探索 DLI

Upsert Kafka - 数据湖探索 DLI

概述 - 数据湖探索 DLI

Elasticsearch - 数据湖探索 DLI

Elasticsearch结果表 - 数据湖探索 DLI

Kafka - 数据湖探索 DLI

配置PowerBI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

使用Livy提交Spark Jar作业 - 数据湖探索 DLI

配置Tableau通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线