搜索_华为云

使用Hive语法创建DLI表 - 数据湖探索 DLI

使用Hive语法创建DLI表功能描述使用Hive语法创建DLI表。DataSource语法和Hive语法主要区别在于支持的表数据存储格式范围、支持的分区数等有差异，详细请参考语法格式和注意事项说明。注意事项 CTAS建表语句不能指定表的属性。 Hive DLI表不支持在建表时指定多字符的分隔符。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建DLI表
创建IAM用户并授权使用DLI - 数据湖探索 DLI

本章节介绍创建IAM用户并授权使用DLI的方法，操作流程如图1所示。前提条件给用户组授权之前，请您先了解用户组可以添加的DLI权限，并结合实际需求进行选择。DLI支持的系统权限，请参见：DLI系统权限。示例流程图1 给用户授权DLI权限流程创建用户组并授权在IAM控制台创建用户

 帮助中心 > 数据湖探索 DLI > 用户指南 > 准备工作
导出查询结果 - 数据湖探索 DLI

导出查询结果功能描述 INSERT OVERWRITE DIRECTORY用于将查询结果直接写入到指定的目录，支持按CSV、Parquet、ORC、JSON、Avro格式进行存储。语法格式 1 2 3 4 INSERT OVERWRITE DIRECTORY path USING

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
DLI的数据可存储在哪些地方 - 数据湖探索 DLI

DLI的数据可存储在哪些地方 DLI支持存储哪些格式的数据？ DLI支持如下数据格式： Parquet CSV ORC Json Avro DLI服务的数据可以存储在哪些地方？ OBS：SQL作业，Spark作业，Flink作业使用的数据均可以存储在OBS服务中，降低存储成本。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
图解数据湖探索 - 数据湖探索 DLI

图解数据湖探索

 帮助中心 > 数据湖探索 DLI > 产品介绍
配置DLI读写外部数据源数据 - 数据湖探索 DLI

配置DLI读写外部数据源数据配置DLI读写外部数据源数据的操作流程配置DLI与数据源网络连通（增强型跨源连接）使用DEW管理数据源访问凭证使用DLI的跨源认证管理数据源访问凭证管理增强型跨源连接典型场景示例：配置DLI与内网数据源的网络联通典型场景示例：配置DLI 与公网网络连通

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输
file - 数据湖探索 DLI
file - 数据湖探索 DLI

file_format 格式 | AVRO | CSV | JSON | ORC | PARQUET 说明目前包含以上6种格式。指定数据格式的方式有两种，一种是USING，可指定以上6种数据格式，另一种是STORED AS，只能指定ORC和PARQUET。 ORC对RCFil

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 标示符
在Spark SQL作业中使用UDF - 数据湖探索 DLI

9.1或其他兼容版本。安装Maven 开发环境的基本配置。用于项目管理，贯穿软件开发生命周期。开发流程 DLI下UDF函数开发流程参考如下：图1 开发流程表2 开发流程说明序号阶段操作界面说明 1 新建Maven工程，配置pom文件 IntelliJ IDEA 参考操作步骤说明，编写UDF函数代码。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
将OBS数据导入至DLI - 数据湖探索 DLI

将OBS数据导入至DLI 本节操作介绍将OBS上的数据导入到DLI控制台的表中。注意事项导入数据时只能指定一个路径，路径中不能包含逗号。如果将CSV格式数据导入分区表，需在数据源中将分区列放在最后一列。不建议对同一张表并发导入数据，因为有一定概率发生并发冲突，导致导入失败。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
在Spark SQL作业中使用UDAF - 数据湖探索 DLI

安装Maven 开发环境的基本配置（下载并安装 Maven）。用于项目管理，贯穿软件开发生命周期。开发流程 DLI下UDAF函数开发流程参考如下：图1 UDAF开发流程表2 开发流程说明序号阶段操作界面说明 1 新建Maven工程，配置pom文件 IntelliJ IDEA

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
在Spark SQL作业中使用UDTF - 数据湖探索 DLI

1或其他兼容版本。安装Maven 开发环境的基本配置。用于项目管理，贯穿软件开发生命周期。开发流程 DLI下UDTF函数开发流程参考如下：图1 UDTF开发流程表2 开发流程说明序号阶段操作界面说明 1 新建Maven工程，配置pom文件 IntelliJ IDEA

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
增强型跨源连接概述 - 数据湖探索 DLI

范围：0~65535。例如example.com:8080。 DLI跨源分析流程使用DLI进行跨源分析，需要先建立跨源连接，打通DLI和数据源的网络，再开发不同的作业访问数据源。图1 跨源分析流程相关链接创建方式增强型跨源连接管理控制台操作创建增强型跨源连接 API接口

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
Hudi表初始化 - 数据湖探索 DLI
Hudi表初始化 - 数据湖探索 DLI

kafka消息进行过滤，则可以考虑先实时接入生成offset，再truncate table ，再历史导入，再开启实时。图1 初始化操作流程如果批量初始化前表里已经存在数据且没有truncate table，则会导致批量数据写成非常大的log文件，对后续compaction形成很大压力需要更多资源才能完成。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
使用前必读 - 数据湖探索 DLI
使用前必读 - 数据湖探索 DLI

级交互式查询。 DLI+HetuEngine能够快速处理大规模数据集的查询请求，迅速和高效从大数据中提取信息，极大地简化了数据的管理和分析流程，提升大数据环境下的索引和查询性能。 TB级数据秒级响应： HetuEngine通过自动优化资源与负载的配比，能够对TB级数据实现秒级响应，极大提升了数据查询的效率。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法
数据迁移与传输方式概述 - 数据湖探索 DLI

DLI提供的跨源访问能力，支持您在不迁移数据的情况下，连接数据源获取数据并进行数据分析。具体操作请参考配置DLI读写外部数据源数据的操作流程。父主题：数据迁移与数据传输

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输
MRS配置 - 数据湖探索 DLI
MRS配置 - 数据湖探索 DLI

b5.conf文件。创建MRS HBase表创建DLI表关联MRS HBase表之前确保HBase的表是存在的。以样例代码为例，具体的流程是：远程登录ECS，通过hbase shell命令查看表信息。其中，“hbtest”是要查询的表名。 describe 'hbtest'

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
创建数据库 - 数据湖探索 DLI
创建数据库 - 数据湖探索 DLI

替换使用，建议使用DATABASE。 “default”为内置数据库，不能创建名为“default”的数据库。示例完整的SQL作业提交流程您可以参考《快速入门》中的《提交SQL作业》等章节描述。队列是使用DLI服务的基础，执行SQL前需要先创建队列。具体可以参考《用户指南》中的“创建队列”章节。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据库相关
典型场景示例：配置DLI与内网数据源的网络联通 - 数据湖探索 DLI

本节操作介绍适用增强型跨源连接配置DLI与内网数据源的网络联通的操作指导。创建增强型跨源连接网络不通的问题，可以根据本指导的整体流程和步骤进行排查验证。整体流程图1 增强型跨源连接配置流程前提条件已创建DLI队列。创建队列详见创建DLI队列操作指导。队列的计费类型必须为：“包年/包月”，“

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
Spark 3.3.1版本说明 - 数据湖探索 DLI

特性说明 Native性能加速 Spark查询语句性能提升。元数据访问性能提升提升Spark在处理大数据时的元数据访问性能，提高数据处理流程效率。提升OBS committer小文件写性能提升对象存储服务（OBS）在处理小文件写入时的性能，提高数据传输效率。动态Executor

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
Debezium Format - 数据湖探索 DLI
Debezium Format - 数据湖探索 DLI

Debezium Format 功能描述 Debezium是一个 CDC（Changelog Data Capture，变更数据捕获）的工具，可以把来自 MySQL、PostgreSQL、Oracle、Microsoft SQL Server 和许多其他数据库的更改实时流式传输到

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format

总条数： 375

上一页
1
2
3
4
5
...
19
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Hive语法创建DLI表 - 数据湖探索 DLI

创建IAM用户并授权使用DLI - 数据湖探索 DLI

导出查询结果 - 数据湖探索 DLI

DLI的数据可存储在哪些地方 - 数据湖探索 DLI

图解数据湖探索 - 数据湖探索 DLI

配置DLI读写外部数据源数据 - 数据湖探索 DLI

file - 数据湖探索 DLI

在Spark SQL作业中使用UDF - 数据湖探索 DLI

将OBS数据导入至DLI - 数据湖探索 DLI

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

在Spark SQL作业中使用UDTF - 数据湖探索 DLI

增强型跨源连接概述 - 数据湖探索 DLI

Hudi表初始化 - 数据湖探索 DLI

使用前必读 - 数据湖探索 DLI

数据迁移与传输方式概述 - 数据湖探索 DLI

MRS配置 - 数据湖探索 DLI

创建数据库 - 数据湖探索 DLI

典型场景示例：配置DLI与内网数据源的网络联通 - 数据湖探索 DLI

Spark 3.3.1版本说明 - 数据湖探索 DLI

Debezium Format - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线