搜索_华为云

获取Spark作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

获取Spark作业委托临时凭证用于访问其他云服务功能描述 DLI提供了一个通用接口，可用于获取用户在启动Spark作业时设置的委托的临时凭证。该接口将获取到的该作业委托的临时凭证封装到com.huaweicloud.sdk.core.auth.BasicCredentials类中。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
CREATE TABLE - 数据湖探索 DLI
CREATE TABLE - 数据湖探索 DLI

细粒度权限：dli:database:createTable LakeFormation提供的元数据服务，权限配置详见LakeFormation文档。示例通过表名创建非分区表 create table if not exists delta_table0 ( id int, name

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DDL语法说明
创建DLI表关联HBase - 数据湖探索 DLI

ZK_IP2:ZK_PORT2"。说明：访问MRS集群，只支持创建增强型跨源连接并且需要配置主机信息，管理控制台操作请参考增强型跨源连接，相关API信息请参考创建增强型跨源连接。 TableName 指定在HBase集群中已创建的表名。 RowKey 指定作为rowkey的dli关联表

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接HBase表
Hudi数据表Compaction规范 - 数据湖探索 DLI

// 关闭Archive操作 Spark离线完成Compaction计划的执行，以及Clean和Archive操作在调度平台（可以使用华为的DataArts）运行一个定时调度的离线任务来让Spark完成Hudi表的Compaction计划执行以及Clean和Archive操作。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
窗口去重 - 数据湖探索 DLI
窗口去重 - 数据湖探索 DLI

移除重复数据，就像窗口TopN一样。理论上，窗口是一种特殊的窗口 Top-N：N是1并且是根据处理时间或事件时间排序的。更多介绍和使用请参考开源社区文档：窗口去重。语法格式 SELECT [column_list] FROM ( SELECT [column_list],

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
CREATE TABLE - 数据湖探索 DLI
CREATE TABLE - 数据湖探索 DLI

细粒度权限：dli:database:createTable LakeFormation提供的元数据服务，权限配置详见LakeFormation文档。系统响应 Table创建成功，创建的Hudi表可以进入DLI控制台，在左侧菜单栏选择”数据管理”->”库表管理”，随后筛选数据库并点击名称，进入表列表查询。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DDL语法说明
DLI SDK功能矩阵 - 数据湖探索 DLI

DLI SDK功能矩阵 SDK开发指南指导您如何安装和配置开发环境、如何通过调用DLI SDK提供的接口函数进行二次开发。 Java、Python SDK功能矩阵请参见表1 表1 SDK功能矩阵语言功能内容 Java OBS授权介绍将OBS桶的操作权限授权给DLI的Java

帮助中心 > 数据湖探索 DLI > SDK参考 > DLI SDK
Raw Format - 数据湖探索 DLI
Raw Format - 数据湖探索 DLI

upsert-kafka 连接器和 raw format 作为 value.format。 Raw format 连接器是内置的。更多具体使用可参考开源社区文档：Raw Format。支持的Connector Kafka Upsert Kafka Filesystem 参数说明表1 参数是否必选

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
分组聚合 - 数据湖探索 DLI
分组聚合 - 数据湖探索 DLI

窗口不会产生状态过大的问题。可以提供一个合适的状态 time-to-live (TTL) 配置来防止状态过大。注意：这可能会影响查询结果的正确性。更多介绍和使用请参考开源社区文档：分组聚合。 DISTINCT 聚合 DISTINCT 聚合在聚合函数前去掉重复的数据。下面的示例计算 Orders 表中不同 order_ids

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
Hive结果表 - 数据湖探索 DLI
Hive结果表 - 数据湖探索 DLI

[[ENABLE|DISABLE] [VALIDATE|NOVALIDATE] [RELY|NORELY]] 参数说明请参考使用Hive语法创建OBS表，和Hive 文档了解每个DDL语句的语义。有关可用配置的完整列表，请参阅流式处理接收器。Streaming sink 示例以下示例演示如何使用 Datagen

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
窗口Top-N - 数据湖探索 DLI
窗口Top-N - 数据湖探索 DLI

子句包含窗口表值函数或窗口聚合产生的 window_start 和 window_end。否则优化器无法翻译。更多介绍和使用请参考开源社区文档：窗口Top-N。语法格式 SELECT [column_list] FROM ( SELECT [column_list],

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
MERGE INTO - 数据湖探索 DLI
MERGE INTO - 数据湖探索 DLI

dli:table:insertIntoTable, dli:table:delete。由LakeFormation提供的元数据服务，权限配置详见LakeFormation文档。示例部分字段更新 create table h0(id int, comb int, name string, price int)

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
Debezium Format - 数据湖探索 DLI
Debezium Format - 数据湖探索 DLI

UPDATE_BEFORE 和 UPDATE_AFTER 分别编码为 DELETE 和 INSERT 类型的 Debezium 消息。更多具体使用可参考开源社区文档：Debezium Format。支持的Connector Kafka Filesystem 注意事项重复的变更事件在正常的操作环境下，Debezium

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
OBS授权 - 数据湖探索 DLI
OBS授权 - 数据湖探索 DLI

SDK概述配置Java SDK环境。已参考初始化DLI客户端完成客户端DLIClient的初始化。样例代码用户可以使用OBS授权操作的接口，将OBS桶的操作权限授权给DLI, 用于保存用户作业的数据和作业的运行日志等。示例代码如下： 1 2 3 4 5 6 7 private

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
Upsert Kafka - 数据湖探索 DLI
Upsert Kafka - 数据湖探索 DLI

properties.* 否无 String 该选项可以传递任意的Kafka参数。 “properties.”后的后缀名必须匹配定义在 kafka参数文档中的参数名。 Flink会自动移除选项名中的 "properties." 前缀，并将转换后的键名以及值传入KafkaClient。例如：您可以通过

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
功能总览 - 数据湖探索 DLI
功能总览 - 数据湖探索 DLI

OBS 2.0支持 DLI Spark作业 DLI在开源Spark基础上进行了大量的性能优化与服务化改造，兼容Apache Spark生态和接口，执行批处理任务。 DLI还支持使用Spark作业访问DLI元数据，具体请参考《数据湖探索开发指南》。发布区域：全部使用DLI提交Spark

帮助中心 > 数据湖探索 DLI > 功能总览
资源相关 - 数据湖探索 DLI
资源相关 - 数据湖探索 DLI

myhuaweicloud.com/jarname.jar" group_name：资源包所属分组名称。查询所有资源包 DLI提供查询资源列表接口，您可以使用该接口并选择相应的资源来执行作业。示例代码如下： 1 2 3 4 5 6 7 8 9 10 11 12 def lis

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
产品优势 - 数据湖探索 DLI
产品优势 - 数据湖探索 DLI

产品优势纯SQL操作 DLI提供标准SQL接口，用户仅需使用SQL便可实现海量数据查询分析。SQL语法全兼容标准ANSI SQL 2003。存算分离 DLI解耦计算和存储负载，存算分离架构，存储资源和计算资源按需灵活配置，提高了资源利用率，降低了成本。企业级多租户支持计算

 帮助中心 > 数据湖探索 DLI > 产品介绍
资源相关 - 数据湖探索 DLI
资源相关 - 数据湖探索 DLI

{obs域名}/{jarPath}/{jarName}。 description：资源包描述信息。查询所有资源包 DLI提供查询资源列表接口，您可以使用该接口并选择相应的资源来执行作业。示例代码如下： 1 2 3 4 5 6 7 8 9 10 11 private static

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
流生态作业开发指引 - 数据湖探索 DLI

流生态作业开发指引流生态系统基于Flink和Spark双引擎，完全兼容Flink/Storm/Spark开源社区版本接口，并且在此基础上做了特性增强和性能提升，为用户提供易用、低时延、高吞吐的数据湖探索。数据湖探索的流生态开发包括云服务生态、开源生态和自拓展生态：云服务生态

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南

总条数： 649

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

获取Spark作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

CREATE TABLE - 数据湖探索 DLI

创建DLI表关联HBase - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

窗口去重 - 数据湖探索 DLI

CREATE TABLE - 数据湖探索 DLI

DLI SDK功能矩阵 - 数据湖探索 DLI

Raw Format - 数据湖探索 DLI

分组聚合 - 数据湖探索 DLI

Hive结果表 - 数据湖探索 DLI

窗口Top-N - 数据湖探索 DLI

MERGE INTO - 数据湖探索 DLI

Debezium Format - 数据湖探索 DLI

OBS授权 - 数据湖探索 DLI

Upsert Kafka - 数据湖探索 DLI

功能总览 - 数据湖探索 DLI

资源相关 - 数据湖探索 DLI

产品优势 - 数据湖探索 DLI

资源相关 - 数据湖探索 DLI

流生态作业开发指引 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线