搜索_华为云

创建增强型跨源连接 - 数据湖探索 DLI

创建增强型跨源连接操作场景使用DLI访问其他数据源的数据前，首先要通过建立增强型跨源连接打通DLI和数据源之间的网络，DLI才能够访问、导入、查询、分析其他数据源的数据。例如：DLI连接MRS、RDS、CSS、Kafka、DWS时，需要打通DLI和对应数据源VPC之间的网络，才能实现数据互通。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
Ogg Format - 数据湖探索 DLI
Ogg Format - 数据湖探索 DLI

Ogg Format 功能描述 Oracle GoldenGate (a.k.a ogg) 是一个实现异构 IT 环境间数据实时数据集成和复制的综合软件包。该产品集支持高可用性解决方案、实时数据集成、事务更改数据捕获、运营和分析企业系统之间的数据复制、转换和验证。Ogg 为变更日志提供了统一的格式结构，并支持使用

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
增强型跨源连接概述 - 数据湖探索 DLI

增强型跨源连接概述为什么要创建增强型跨源连接？ DLI跨源分析场景连接外部数据源时，由于数据源的VPC与DLI VPC不同，网络无法连通，导致DLI无法读取数据源数据。DLI提供的增强型跨源连接功能可以实现DLI与数据源的网络连通。本节操作为您介绍跨VPC的数据源网络连通方案：

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
为什么DLI增强型跨源连接要创建对等连接？ - 数据湖探索 DLI

为什么DLI增强型跨源连接要创建对等连接？ DLI增强型跨源连接创建对等连接的主要原因是为了实现DLI与不同VPC中的数据源之间的网络连通。当DLI需要访问外部数据源，而这些数据源位于不同的VPC中时，由于网络隔离，DLI默认无法直接读取这些数据源的数据。通过创建增强型跨源连接

 帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
file - 数据湖探索 DLI
file - 数据湖探索 DLI

file_format 格式 | AVRO | CSV | JSON | ORC | PARQUET 说明目前包含以上6种格式。指定数据格式的方式有两种，一种是USING，可指定以上6种数据格式，另一种是STORED AS，只能指定ORC和PARQUET。 ORC对RCFil

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 标示符
从Kafka读取数据写入到RDS - 数据湖探索 DLI

从Kafka读取数据写入到RDS 本指导仅适用于Flink 1.12版本。场景描述该场景为根据商品的实时点击量，获取每小时内点击量最高的3个商品及其相关信息。商品的实时点击量数据为输入源发送到Kafka中，再将Kafka数据的分析结果输出到RDS中。例如，输入如下样例数据：

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

使用Spark Jar作业读取和查询OBS数据操作场景 DLI完全兼容开源的Apache Spark，支持用户开发应用程序代码来进行作业数据的导入、查询以及分析处理。本示例从编写Spark程序代码读取和查询OBS数据、编译打包到提交Spark Jar作业等完整的操作步骤说明来帮助您在DLI上进行作业开发。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
Hudi数据表Compaction规范 - 数据湖探索 DLI

'false' // 关闭Archive操作 Spark离线完成Compaction计划的执行，以及Clean和Archive操作在调度平台（可以使用华为的DataArts）运行一个定时调度的离线任务来让Spark完成Hudi表的Compaction计划执行以及Clean和Archive操作。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
DWS源表（不推荐使用） - 数据湖探索 DLI

用场景包括位置应用、金融保险、互联网电商等。数据仓库服务（Data Warehouse Service，简称DWS）是一种基于基础架构和平台的在线数据处理数据库，为用户提供海量数据挖掘和分析服务。DWS的更多信息，请参见《数据仓库服务管理指南》。推荐使用DWS服务自研的DWS

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
DWS结果表 - 数据湖探索 DLI
DWS结果表 - 数据湖探索 DLI

用场景包括位置应用、金融保险、互联网电商等。数据仓库服务（Data Warehouse Service，简称DWS）是一种基于基础架构和平台的在线数据处理数据库，为用户提供海量数据挖掘和分析服务。DWS的更多信息，请参见《数据仓库服务管理指南》。前提条件创建Flink OpenSource

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
导出SQL作业结果 - 数据湖探索 DLI

导出SQL作业结果导出作业结果是将SQL作业分析后的数据结果按指定格式存储到指定位置。 DLI默认将SQL作业结果存储在DLI作业桶中。同时也支持下载作业结果到本地或导出作业结果到指定的OBS桶。导出作业结果到DLI作业桶 DLI在指定了一个默认的OBS桶作为作业结果的存储位置，请在DLI管理控制台的“全局配置

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
下载并安装JDBC驱动包 - 数据湖探索 DLI

x”即可下载对应版本的JDBC驱动包。 JDBC驱动包命名为“huaweicloud-dli-jdbc-<version>.zip”，支持在所有平台（Linux、Windows等）所有版本中使用，且依赖JDK 1.7及以上版本。下载的JDBC驱动包中包含了.bat（Windows）或

 帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI > 使用JDBC提交SQL作业
DWS结果表（不推荐使用） - 数据湖探索 DLI

用场景包括位置应用、金融保险、互联网电商等。数据仓库服务（Data Warehouse Service，简称DWS）是一种基于基础架构和平台的在线数据处理数据库，为用户提供海量数据挖掘和分析服务。DWS的更多信息，请参见《数据仓库服务管理指南》。推荐使用DWS服务自研的DWS

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
DLI Delta常见问题 - 数据湖探索 DLI

DLI Delta常见问题执行insert into/overwrite table_name partition(part_key='part_value') select ...报错DLI.0005: DeltaAnalysisException: Partition column

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考
DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

DLI预置的SQL模板中TPC-H样例数据说明 TPC-H样例数据简介 TPC-H（商业智能计算测试）是交易处理效能委员会（TPC,Transaction Processing Performance Council) 组织制定的用来模拟决策支持类应用的一个测试集。目前，在学术

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
配置DLI与数据源网络连通（增强型跨源连接） - 数据湖探索 DLI

配置DLI与数据源网络连通（增强型跨源连接）增强型跨源连接概述创建增强型跨源连接建立DLI与共享VPC中资源的网络连接 DLI常用跨源分析开发方式父主题：配置DLI读写外部数据源数据

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
SQL作业开发指南 - 数据湖探索 DLI

SQL作业开发指南使用Spark SQL作业分析OBS数据在DataArts Studio开发DLI SQL作业在Spark SQL作业中使用UDF 在Spark SQL作业中使用UDTF 在Spark SQL作业中使用UDAF

帮助中心 > 数据湖探索 DLI > 开发指南
基本概念 - 数据湖探索 DLI
基本概念 - 数据湖探索 DLI

基本概念弹性资源池专属的计算资源，不同弹性资源上的计算资源完全隔离，弹性资源池内的不同队列资源可以共享，并可以根据队列资源负载配置策略进行分时弹性扩缩容，满足不同的业务需求。 DLI存储资源 DLI存储资源是DLI服务内部存储的资源，用于存储数据库和DLI表，是向DLI导入数

 帮助中心 > 数据湖探索 DLI > 产品介绍
为什么Spark3.x的作业日志中打印找不到global_temp数据库 - 数据湖探索 DLI

为什么Spark3.x的作业日志中打印找不到global_temp数据库问题描述 Spark3.x的作业日志中提示找不到global_temp数据库。根因分析 global_temp数据库是Spark3.x默认内置的数据库，是Spark的全局临时视图。通常在Spark作业执

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
通过跨源表向CloudTable Hbase表导入数据，executor报错：RegionTooBusyException - 数据湖探索 DLI

通过跨源表向CloudTable Hbase表导入数据，executor报错：RegionTooBusyException 问题现象客户通过DLI跨源表向CloudTable Hbase导入数据，原始数据：HBASE表，一个列簇，一个rowkey运行一个亿的模拟数据，数据量为9

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类

总条数： 163

上一页
1
...
5
6
7
8
9
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建增强型跨源连接 - 数据湖探索 DLI

Ogg Format - 数据湖探索 DLI

增强型跨源连接概述 - 数据湖探索 DLI

为什么DLI增强型跨源连接要创建对等连接？ - 数据湖探索 DLI

file - 数据湖探索 DLI

从Kafka读取数据写入到RDS - 数据湖探索 DLI

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

DWS源表（不推荐使用） - 数据湖探索 DLI

DWS结果表 - 数据湖探索 DLI

导出SQL作业结果 - 数据湖探索 DLI

下载并安装JDBC驱动包 - 数据湖探索 DLI

DWS结果表（不推荐使用） - 数据湖探索 DLI

DLI Delta常见问题 - 数据湖探索 DLI

DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

配置DLI与数据源网络连通（增强型跨源连接） - 数据湖探索 DLI

SQL作业开发指南 - 数据湖探索 DLI

基本概念 - 数据湖探索 DLI

为什么Spark3.x的作业日志中打印找不到global_temp数据库 - 数据湖探索 DLI

通过跨源表向CloudTable Hbase表导入数据，executor报错：RegionTooBusyException - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线