搜索_华为云

pyspark样例代码 - 数据湖探索 DLI

在DLI管理控制台上已完成创建增强跨源连接，并绑定包年/包月队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。通过DataFrame API 访问 import相关依赖

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
概述 - 数据湖探索 DLI
概述 - 数据湖探索 DLI

概述欢迎使用数据湖探索。数据湖探索（Data Lake Insight，简称DLI）是完全兼容Apache Spark、Apache Flink、trino生态，提供一站式的流处理、批处理、交互式分析的Serverless融合处理分析服务。用户不需要管理任何服务器，即开即用。支持标准SQL/Spark

帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读
怎样升级DLI作业的引擎版本 - 数据湖探索 DLI

怎样升级DLI作业的引擎版本 DLI提供了Spark和Flink计算引擎，为用户提供了一站式的流处理、批处理、交互式分析的Serverless融合处理分析服务，当前，Flink计算引擎推荐版本：Flink 1.15，Spark计算引擎推荐版本： Spark 3.3.1。本节操作介绍如何升级作业的引擎版本。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
建立DLI与共享VPC中资源的网络连接 - 数据湖探索 DLI

VPC”相关内容。 DLI使用场景企业IT管理账号创建VPC和子网，并将该VPC和子网共享给其他企业业务账号，便于企业集中配置VPC安全策略，有利于资源有序集中管理。企业业务账号使用共享的VPC和子网创建资源，并想要使用DLI提交作业访问共享VPC中的资源。此时需要建立DLI与共享VPC中资源的网络连接。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
时间和日期类型 - 数据湖探索 DLI

时间和日期类型限制时间和日期类型目前精确到毫秒。表1 时间和日期类型名称描述存储空间 DATE 日期和时间。仅支持ISO 8601格式：'2020-01-01' 32位 TIME 不带时区的时间（时、分、秒、毫秒）例如：TIME '01:02:03.456' 64位

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 数据类型
费用账单 - 数据湖探索 DLI
费用账单 - 数据湖探索 DLI

水与明细账单。查看数据存储的资源账单 DLI控制台并未展示数据存储的相关信息，您可以在费用中心查询DLI数据存储的资源账单。在控制台顶部菜单栏中选择“费用与成本 > 费用账单”。选择“流水和明细账单 > 明细账单”，在产品的筛选条件中选择“DLI存储空间”，单击图标即可搜索DLI数据存储的资源账单。

帮助中心 > 数据湖探索 DLI > 计费说明
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

前提条件在DLI管理控制台上已完成创建跨源连接并绑定队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。代码实现导入依赖涉及到的mvn依赖库 1 2 3 4

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
配置DLI程序包权限 - 数据湖探索 DLI

限时，管理员用户所在用户组的所属区域需具有Tenant Guest权限。关于Tenant Guest权限的介绍和开通方法，详细参见《权限策略》和《统一身份认证服务用户指南》中的创建用户组。配置程序包组或程序包权限在“程序包管理”页面，选择要授权的程序包组或程序包，单击“操作”列中的“权限管理”。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
基本概念 - 数据湖探索 DLI
基本概念 - 数据湖探索 DLI

调用API的鉴权过程中，您需要用到账号、用户和密码等信息。区域从地理位置和网络时延维度划分，同一个Region内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。Region分为通用Region和专属Region，通用Region指面向公共租户提供通用

 帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读
创建并提交SQL作业 - 数据湖探索 DLI

首次进入SQL编辑器，页面会提示设置DLI作业桶。该桶用于存储使用DLI服务产生的临时数据，例如：作业日志等。如果不创建该桶，将无法查看作业日志。桶名称为系统默认。在OBS管理控制台页面通过配置桶的生命周期规则，可以实现定时删除OBS桶中的对象或者定时转换对象的存储类别。具体操作请参考通过配置生命周期规则。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
Hudi Compaction操作说明 - 数据湖探索 DLI

tion Plan一个一个去执行，一直到全部都执行完。对于Merge-On-Read表，数据使用列式Parquet文件和行式Avro文件存储，更新被记录到增量文件，然后进行同步/异步compaction生成新版本的列式文件。Merge-On-Read表可减少数据摄入延迟，因而进

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
DLI中的Spark组件与MRS中的Spark组件有什么区别？ - 数据湖探索 DLI

DLI中的Spark组件与MRS中的Spark组件有什么区别？ DLI和MRS都支持Spark组件，但在服务模式、接口方式、应用场景和性能特性上存在一些差异。 DLI服务的Spark组件是全托管式服务，用户对Spark组件不感知，仅仅可以使用该服务，且接口为封装式接口。 DLI的

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
Flink Opensource SQL使用DEW管理访问凭据 - 数据湖探索 DLI

rsion:list。 DEW解密凭据的权限，kms:dek:decrypt。委托权限示例请参考自定义DLI委托权限和常见场景的委托权限策略。仅支持Flink1.15版本使用DEW管理访问凭据，在创建作业时，请配置作业使用Flink1.15版本、且已在作业中配置允许DLI访问DEW的委托信息。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink作业委托场景开发指导
Spark Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

rsion:list。 DEW解密凭据的权限，kms:dek:decrypt。委托权限示例请参考自定义DLI委托权限和常见场景的委托权限策略。仅支持Spark3.3.1（Spark通用队列场景）及以上版本使用DEW管理访问凭据，在创建作业时，请配置作业使用Spark3.3.1

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
Hudi表概述 - 数据湖探索 DLI
Hudi表概述 - 数据湖探索 DLI

Hudi表概述 Hudi表使用约束 Hudi查询类型 Hudi存储结构

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
Connector列表 - 数据湖探索 DLI
Connector列表 - 数据湖探索 DLI

Connector列表 Connector概述 BlackHole ClickHouse DataGen Doris DWS Elasticsearch 对象存储OBS Hbase Hive Hudi JDBC Kafka MySql CDC Print Redis Upsert Kafka 父主题：

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考
CREATE TABLE AS SELECT - 数据湖探索 DLI

obs桶名称。 tbl_path Delta表在obs桶中的存储位置。 using 参数delta，定义和创建Delta table table_comment 表的描述信息。 location_path Delta表的存储位置，当前版本通过表名创建Delta表时必须指定，且只支持obs路径，指定该路径Delta

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
Top-N - 数据湖探索 DLI
Top-N - 数据湖探索 DLI

会根据排序键对输入的流进行排序。如果 top N 的记录发生了变化，变化的部分会以撤销、更新记录的形式发送到下游。如果 top N 记录需要存储到外部存储，则结果表需要拥有相同与 Top-N 查询相同的唯一键。示例查询每个分类实时销量最大的五个产品 SELECT * FROM (

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
Hudi - 数据湖探索 DLI
Hudi - 数据湖探索 DLI

Hudi Hudi是一种数据湖的存储格式，在Hadoop文件系统之上提供了更新数据和删除数据的能力以及消费变化数据的能力。支持多种计算引擎，提供IUD接口，在HDFS的数据集上提供了插入更新和增量拉取的功能。表1 支持类别类别详情支持Flink表类型源表、结果表支持hudi表类型

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
开启或关闭数据多版本 - 数据湖探索 DLI

version.enable"); 开启多版本功能后，在执行insert overwrite或者truncate操作时会自动在OBS存储路径下存储多版本数据。关闭多版本功能后，需要通过如下命令把多版本数据目录回收。 RESTORE TABLE [db_name.]table_name

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 修改表

总条数： 457

上一页
1
...
13
14
15
...
23
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

pyspark样例代码 - 数据湖探索 DLI

概述 - 数据湖探索 DLI

怎样升级DLI作业的引擎版本 - 数据湖探索 DLI

建立DLI与共享VPC中资源的网络连接 - 数据湖探索 DLI

时间和日期类型 - 数据湖探索 DLI

费用账单 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

配置DLI程序包权限 - 数据湖探索 DLI

基本概念 - 数据湖探索 DLI

创建并提交SQL作业 - 数据湖探索 DLI

Hudi Compaction操作说明 - 数据湖探索 DLI

DLI中的Spark组件与MRS中的Spark组件有什么区别？ - 数据湖探索 DLI

Flink Opensource SQL使用DEW管理访问凭据 - 数据湖探索 DLI

Spark Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

Hudi表概述 - 数据湖探索 DLI

Connector列表 - 数据湖探索 DLI

CREATE TABLE AS SELECT - 数据湖探索 DLI

Top-N - 数据湖探索 DLI

Hudi - 数据湖探索 DLI

开启或关闭数据多版本 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线