搜索_华为云

OBS表压缩率较高怎么办？ - 数据湖探索 DLI

OBS表压缩率较高怎么办？当您在提交导入数据到DLI表的作业时，如果遇到Parquet/Orc格式的OBS表对应的文件压缩率较高，超过了5倍的压缩率，您可以通过调整配置来优化作业的性能。具体方法：在submit-job请求体conf字段中配置“dli.sql.files.ma

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
概述 - 数据湖探索 DLI
概述 - 数据湖探索 DLI

概述 DLI支持原生Spark的DataSource能力，并在其基础上进行了扩展，能够通过SQL语句或者Spark作业访问其他数据存储服务并导入、查询、分析处理其中的数据，目前支持的DLI跨源访问服务有：表格存储服务CloudTable，云搜索服务CSS，分布式缓存服务DCS，文档

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源
提交SQL作业（废弃） - 数据湖探索 DLI

当前接口已废弃，不推荐使用。作业包含以下类型：DDL、DCL、IMPORT、EXPORT、QUERY和INSERT。其中，IMPORT和EXPORT分别与导入数据（废弃）和与导出数据（废弃）的功能一致，区别仅在于实现方式不同。另外，用户可使用其他API来对作业进行查询和管理。具体操作有：查询作业状态

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）
提交SQL作业（推荐） - 数据湖探索 DLI

该API用于通过执行SQL语句的方式向队列提交作业。作业包含以下类型：DDL、DCL、IMPORT、QUERY和INSERT。其中，IMPORT与导入数据（废弃）的功能一致，区别仅在于实现方式不同。另外，用户可使用其他API来对作业进行查询和管理。具体操作有：查询作业状态查询作业详细信息

 帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
DIS源表 - 数据湖探索 DLI
DIS源表 - 数据湖探索 DLI

S的通道读取数据，作为作业的输入数据。Flink作业可通过DIS的source源将数据从生产者快速移出，进行持续处理，适用于将云服务外数据导入云服务后进行过滤、实时分析、监控报告和转储等场景。数据接入服务（Data Ingestion Service，简称DIS）为处理或分析流

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
DLI如何访问OBS桶中的数据 - 数据湖探索 DLI

DLI如何访问OBS桶中的数据创建OBS表。具体语法请参考《数据湖探索SQL语法参考》。添加分区。具体语法请参考《数据湖探索SQL语法参考》。往分区导入OBS桶中的数据。具体语法请参考《数据湖探索SQL语法参考》。查询数据。具体语法请参考《数据湖探索SQL语法参考》。父主题： SQL作业开发类

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
怎样将一个区域中的DLI表数据同步到另一个区域中？ - 数据湖探索 DLI

BS桶中。具体请参考《数据湖探索用户指南》。通过OBS跨区域复制功能将数据复制至区域二的OBS桶中。具体请参考跨区域复制。根据需要导入或使用对应的数据。父主题： SQL作业开发类

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。操作前准备导入依赖涉及到的mvn依赖库 1 2 3 4 5 <dependency> <groupId>org.apache.spark</groupId>

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
创建CSS类型跨源认证 - 数据湖探索 DLI

创建CSS类型跨源认证操作场景通过在DLI控制台创建的CSS类型的跨源认证，将CSS安全集群的认证信息存储到DLI，无需在SQL作业中配置账号密码，安全访问CSS安全集群。本节操作介绍在DLI控制台创建CSS安全集群的跨源认证的操作步骤。操作须知已创建CSS安全集群，且集群满足以下条件：

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
查询作业详细信息 - 数据湖探索 DLI

with_column_header 否 Boolean 导入作业时，导入的数据是否包括列名。 delimiter 否 String 导入作业时，用户自定义数据分隔符。 quote_char 否 String 导入作业时，用户自定义引用字符。 escape_char 否 String 导入作业时，用户自定义转义字符。

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
复杂数据类型 - 数据湖探索 DLI

创建含有复杂数据类型字段的表时，该表存储格式不支持CSV（txt）。如果表中含有复杂数据类型字段时，该表不支持CSV（txt）格式的文件数据导入。 MAP数据类型建表必须指定schema，且不支持date、short、timestamp数据类型。对于JSON格式OBS表，MAP的键类型只支持STRING类型。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据类型
DIS结果表 - 数据湖探索 DLI
DIS结果表 - 数据湖探索 DLI

DIS结果表功能描述 DLI将Flink作业的输出数据写入数据接入服务（DIS）中。适用于将数据过滤后导入DIS通道，进行后续处理的场景。数据接入服务（Data Ingestion Service，简称DIS）为处理或分析流数据的自定义应用程序构建数据流管道，主要解决云服务外

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
Flink Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

job.agency.name=*** Flink Jar作业示例。环境准备已安装和配置IntelliJ IDEA等开发工具以及安装JDK和Maven。 pom文件配置中依赖包 <properties> <flink.version>1.15.0</flink

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink作业委托场景开发指导
Hudi表初始化 - 数据湖探索 DLI
Hudi表初始化 - 数据湖探索 DLI

Hudi表初始化初始化导入存量数据通常由Spark作业来完成，由于初始化数据量通常较大，因此推荐使用API方式给充足资源来完成。对于批量初始化后需要接Flink或Spark流作业实时写入的场景，一般建议通过对上有消息进行过滤，从一个指定的时间范围开始消费来控制数据的重复接入量

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

SQL作业分析OBS数据 DLI支持将数据存储到OBS上，后续再通过创建OBS表即可对OBS上的数据进行分析和处理。本指导中的操作内容包括：创建OBS表、导入OBS表数据、插入和查询OBS表数据等内容来帮助您更好的在DLI上对OBS表数据进行处理。前提条件已创建OBS的桶。具体OBS操作可以

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。操作前准备构造依赖信息，创建SparkSession 导入依赖涉及到的mvn依赖库 1 2 3 4 5 <dependency> <groupId>org.apache.spark</groupId>

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
创建增强型跨源连接 - 数据湖探索 DLI

创建增强型跨源连接操作场景使用DLI访问其他数据源的数据前，首先要通过建立增强型跨源连接打通DLI和数据源之间的网络，DLI才能够访问、导入、查询、分析其他数据源的数据。例如：DLI连接MRS、RDS、CSS、Kafka、DWS时，需要打通DLI和对应数据源VPC之间的网络，才能实现数据互通。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
CREATE FUNCTION语句 - 数据湖探索 DLI

function ，需要指定一个 identifier ，可指定 language tag 。若catalog 中，已经有同名的函数注册了，则无法注册。如果 language tag 是 JAVA 或者 SCALA ，则 identifier 是 UDF 实现类的全限定名。如果您

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > SQL语法约束与定义 > DDL语法定义
基本概念 - 数据湖探索 DLI
基本概念 - 数据湖探索 DLI

略进行分时弹性扩缩容，满足不同的业务需求。 DLI存储资源 DLI存储资源是DLI服务内部存储的资源，用于存储数据库和DLI表，是向DLI导入数据的必备条件，体现用户数据存储在DLI中的数据量。弹性资源池的实际CUs、已使用CUs、CU范围、规格（包周期CU）实际CUs：弹性资源池当前分配的可用CUs。

帮助中心 > 数据湖探索 DLI > 产品介绍
入门实践 - 数据湖探索 DLI
入门实践 - 数据湖探索 DLI

DLI常用开发指南与最佳实践场景操作指导描述 Spark SQL作业开发使用Spark SQL作业分析OBS数据介绍使用Spark SQL作业创建OBS表、导入OBS表数据、插入和查询OBS表数据等操作。 Flink OpenSource SQL作业开发从Kafka读取数据写入到RDS 介绍使用Flink

帮助中心 > 数据湖探索 DLI > 快速入门

总条数： 242

上一页
1
...
4
5
6
...
13
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

OBS表压缩率较高怎么办？ - 数据湖探索 DLI

概述 - 数据湖探索 DLI

提交SQL作业（废弃） - 数据湖探索 DLI

提交SQL作业（推荐） - 数据湖探索 DLI

DIS源表 - 数据湖探索 DLI

DLI如何访问OBS桶中的数据 - 数据湖探索 DLI

怎样将一个区域中的DLI表数据同步到另一个区域中？ - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

创建CSS类型跨源认证 - 数据湖探索 DLI

查询作业详细信息 - 数据湖探索 DLI

复杂数据类型 - 数据湖探索 DLI

DIS结果表 - 数据湖探索 DLI

Flink Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

Hudi表初始化 - 数据湖探索 DLI

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

创建增强型跨源连接 - 数据湖探索 DLI

CREATE FUNCTION语句 - 数据湖探索 DLI

基本概念 - 数据湖探索 DLI

入门实践 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线