搜索_华为云

最新动态 - 数据湖探索 DLI
最新动态 - 数据湖探索 DLI

最新动态本文介绍了数据湖探索DLI各特性版本的功能发布和对应的文档动态，新特性将在各个区域（Region）陆续发布，欢迎体验。 2020年8月序号功能名称功能描述阶段相关文档 1 集成TPC-H测试套件用户可以通过DLI内置的TPC-H测试套件进行简单高效的交互式查询

 帮助中心 > 数据湖探索 DLI > 最新动态
Flink SQL作业Kafka分区数增加或减少，怎样不停止Flink作业实现动态感知？ - 数据湖探索 DLI

Flink SQL作业Kafka分区数增加或减少，怎样不停止Flink作业实现动态感知？问题描述用户执行Flink Opensource SQL, 采用Flink 1.10版本。初期Flink作业规划的Kafka的分区数partition设置过小或过大，后期需要更改Kafka区分数

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
开启Flink作业动态扩缩容 - 数据湖探索 DLI

开启Flink作业动态扩缩容操作场景在实际作业运行中，由于作业的数据流量变化，导致所需计算资源不同，造成流量较小时计算资源浪费，流量较大时计算资源不足以满足计算所需。 DLI提供的动态扩缩容功能可以根据当前作业的负载情况，例如：数据输入输出量、数据输入输出速率、反压等情况，动态的调整当前作业所用的计算资源

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
Spark SQL常用配置项说明 - 数据湖探索 DLI

Spark SQL常用配置项说明本章节为您介绍DLI 批作业SQL语法的常用配置项。表1 常用配置项名称默认值描述 spark.sql.files.maxRecordsPerFile 0 要写入单个文件的最大记录数。如果该值为零或为负，则没有限制。 spark.sql.shuffle.partitions

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
导入数据（废弃） - 数据湖探索 DLI

导入数据（废弃）功能介绍该API用于将数据从文件导入DLI或OBS表，目前仅支持将OBS上的数据导入DLI或OBS中。当前接口已废弃，不推荐使用。该API为异步操作。导入数据时，可选择已存在的OBS桶路径或新建OBS桶路径，但只能指定一个OBS桶路径。若需新建OBS桶，

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）
创建跨源成功但测试网络连通性失败怎么办？ - 数据湖探索 DLI

创建跨源成功但测试网络连通性失败怎么办？问题描述创建跨源并绑定新创建的DLI队列，测试跨源的网络连通性时失败，有如下报错信息： failed to connect to specified address 排查思路以下排查思路根据原因的出现概率进行排序，建议您从高频率原因往低频率原因排查

 帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
测试地址连通性 - 数据湖探索 DLI

测试地址连通性 DLI提供的“测试地址连通性”用于验证DLI队列与目标地址之间的网络连通性。常用于读写外部数据源场景，在配置了跨源连接后，检验DLI队列与绑定的跨源对端地址之间的通信能力。测试队列与数据源地址连通性登录DLI管理控制台，选择“资源管理 > 队列管理”。在“队列管理

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
插入数据 - 数据湖探索 DLI
插入数据 - 数据湖探索 DLI

插入数据功能描述将SELECT查询结果或某条数据插入到表中。约束限制 insert overwrite语法不适用于“自读自写”场景，该场景因涉及数据的连续处理和更新，如果使用insert overwrite语法可能存在数据丢失风险。 "自读自写"是指在处理数据时能够读取数据，

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
Spark 3.3.1版本说明 - 数据湖探索 DLI

Spark 3.3.1版本说明数据湖探索（DLI）遵循开源Spark计算引擎的发布一致性。本文介绍Spark 3.3.1版本所做的变更说明。更多Spark 3.3.1版本说明请参考Spark Release Notes。 Spark 3.3.1版本发布时间版本名称发布时间

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
了解数据目录、数据库和表 - 数据湖探索 DLI

了解数据目录、数据库和表数据库和表是SQL作业、Spark作业场景开发的基础，在执行作业前您需要根据业务场景定义数据库和表。 Flink支持动态数据类型，可以在运行时定义数据结构，不需要事先定义元数据。数据目录数据目录（Catalog）是元数据管理对象，它可以包含多个数据库。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
为什么insert overwrite覆盖分区表数据的时候，覆盖了全量数据？ - 数据湖探索 DLI

为什么insert overwrite覆盖分区表数据的时候，覆盖了全量数据？当您使用insert overwrite语句覆盖分区表的数据时，如果发现它覆盖了全量数据而不是预期的分区数据，这可能是因为动态分区覆盖功能没有被启用。如果需要动态覆盖DataSource表指定的分区数据

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
设置Flink作业优先级 - 数据湖探索 DLI

设置Flink作业优先级操作场景在实际作业运行中，由于作业的重要程度以及紧急程度不同，需要重点保障重要和紧急的作业正常运行，因此需要满足它们正常运行所需的计算资源。 DLI提供的设置作业优先级功能，可以对每个Flink作业设置作业优先级，当资源不充足时，可以优先满足优先级较高的作业的计算资源

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
修改弹性资源池的主机信息 - 数据湖探索 DLI

修改弹性资源池的主机信息操作场景主机信息用于配置主机的IP与域名的映射关系，在作业配置时只需使用配置的域名即可访问对应的主机。在跨源连接创建完成后，支持修改主机信息。常见的访问MRS的HBase集群时需要配置实例的主机名（即域名）与主机对应的IP地址。约束限制已获取MRS

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
DLI弹性资源池与队列简介 - 数据湖探索 DLI

DLI弹性资源池与队列简介 DLI的计算资源是执行作业的基础，本节内容介绍DLI计算资源的模式和队列类型。什么是弹性资源池和队列？在了解DLI计算资源模式前首先了解弹性资源池和队列的基本概念。弹性资源池是DLI计算资源的一种池化管理模式，可以看做DLI计算资源的集合。DLI支持在弹性资源池中创建多个队列

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
创建增强型跨源连接 - 数据湖探索 DLI

创建增强型跨源连接操作场景使用DLI访问其他数据源的数据前，首先要通过建立增强型跨源连接打通DLI和数据源之间的网络，DLI才能够访问、导入、查询、分析其他数据源的数据。例如：DLI连接MRS、RDS、CSS、Kafka、DWS时，需要打通DLI和对应数据源VPC之间的网络，

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
管理Flink作业 - 数据湖探索 DLI
管理Flink作业 - 数据湖探索 DLI

管理Flink作业查看Flink作业详情设置Flink作业优先级开启Flink作业动态扩缩容查询Flink作业日志 Flink作业常用操作父主题：使用DLI提交Flink作业

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
提交SQL作业（推荐） - 数据湖探索 DLI

提交SQL作业（推荐）功能介绍该API用于通过执行SQL语句的方式向队列提交作业。作业包含以下类型：DDL、DCL、IMPORT、QUERY和INSERT。其中，IMPORT与导入数据（废弃）的功能一致，区别仅在于实现方式不同。另外，用户可使用其他API来对作业进行查询和管理

 帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
增强型跨源连接概述 - 数据湖探索 DLI

增强型跨源连接概述为什么要创建增强型跨源连接？ DLI跨源分析场景连接外部数据源时，由于数据源的VPC与DLI VPC不同，网络无法连通，导致DLI无法读取数据源数据。DLI提供的增强型跨源连接功能可以实现DLI与数据源的网络连通。本节操作为您介绍跨VPC的数据源网络连通方案：

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
Elasticsearch - 数据湖探索 DLI
Elasticsearch - 数据湖探索 DLI

Elasticsearch 功能描述 DLI将Flink作业的输出数据输出到云搜索服务CSS的Elasticsearch 引擎的索引中。 Elasticsearch是基于Lucene的当前流行的企业级搜索服务器，具备分布式多用户的能力。其主要功能包括全文检索、结构化搜索、分析、聚合

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
跨源访问MRS HBase，连接超时，日志未打印错误怎么办？ - 数据湖探索 DLI

跨源访问MRS HBase，连接超时，日志未打印错误怎么办？用户在跨源连接中没有添加集群主机信息，导致KRB认证失败，故连接超时，日志也未打印错误。建议您重新配置主机信息后再重试访问MRS HBase。在“增强型跨源”页面，单击该连接“操作”列中的“修改主机信息”，在弹出的对话框中

 帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类

总条数： 79

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

最新动态 - 数据湖探索 DLI

Flink SQL作业Kafka分区数增加或减少，怎样不停止Flink作业实现动态感知？ - 数据湖探索 DLI

开启Flink作业动态扩缩容 - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

导入数据（废弃） - 数据湖探索 DLI

创建跨源成功但测试网络连通性失败怎么办？ - 数据湖探索 DLI

测试地址连通性 - 数据湖探索 DLI

插入数据 - 数据湖探索 DLI

Spark 3.3.1版本说明 - 数据湖探索 DLI

了解数据目录、数据库和表 - 数据湖探索 DLI

为什么insert overwrite覆盖分区表数据的时候，覆盖了全量数据？ - 数据湖探索 DLI

设置Flink作业优先级 - 数据湖探索 DLI

修改弹性资源池的主机信息 - 数据湖探索 DLI

DLI弹性资源池与队列简介 - 数据湖探索 DLI

创建增强型跨源连接 - 数据湖探索 DLI

管理Flink作业 - 数据湖探索 DLI

提交SQL作业（推荐） - 数据湖探索 DLI

增强型跨源连接概述 - 数据湖探索 DLI

Elasticsearch - 数据湖探索 DLI

跨源访问MRS HBase，连接超时，日志未打印错误怎么办？ - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线