搜索_华为云

Python SDK概述 - 数据湖探索 DLI
Python SDK概述 - 数据湖探索 DLI

Python SDK访问指定服务的 API ，您需要确认已在DLI管理控制台开通当前服务并完成服务授权。 Python版本建议使用2.7.10和3.4.0以上版本，需要配置Visual C++编译环境Visual C++ build tools 或者 Visual Studio。

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
BlackHole结果表 - 数据湖探索 DLI

H参数是否正确。前提条件无注意事项创建Flink OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.12”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。语法格式 create table blackhole_table

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

在Linux或Windows环境下您可以使用JDBC应用程序连接DLI服务端提交作业。使用JDBC连接DLI提交的作业运行在Spark引擎上。 JDBC版本2.X版本功能重构后，仅支持从DLI作业桶读取查询结果，如需使用该特性需具备以下条件：在DLI管理控制台“全局配置 > 工程配置”中完成作业桶的配置。

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI > 使用JDBC提交SQL作业
创建CSS类型跨源认证 - 数据湖探索 DLI

本节操作介绍在DLI控制台创建CSS安全集群的跨源认证的操作步骤。操作须知已创建CSS安全集群，且集群满足以下条件： CSS集群版本选择“6.5.4”或“6.5.4”以上版本。 CSS集群已开启“安全模式”。创建CSS安全集群请参考创建Elasticsearch类型集群（安全模式）。操作步骤

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
创建Flink OpenSource SQL作业 - 数据湖探索 DLI

Flink1.15及以上版本在创建作业时仅支持配置OBS中的程序包，不支持读取DLI程序包。 Flink版本 Flink版本是选择作业运行时所使用的Flink的版本。不同版本的Flink支持不同的特性。了解更多Flink版本的信息请参考DLI Flink版本说明。选择使用Flink1

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
（推荐）DLI SDK V3 - 数据湖探索 DLI

（推荐）DLI SDK V3 写作说明本文介绍了DLI服务提供的V3版本的SDK，列举了最新版本SDK的获取地址。 SDK列表表1提供了DLI云服务支持的SDK列表，您可以在GitHub仓库查看SDK更新历史、获取安装包以及查看指导文档。表1 SDK列表编程语言 Github地址

 帮助中心 > 数据湖探索 DLI > SDK参考
创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

选择Spark版本。在下拉列表中选择支持的Spark版本，推荐使用最新版本。不建议长期混用不同版本的Spark/Flink引擎。长期混用不同版本的Spark/Flink引擎会导致代码在新旧版本之间不兼容，影响作业的执行效率。当作业依赖于特定版本的库或组件，长期混用不同版本的Spa

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
还原Delta表到早期状态 - 数据湖探索 DLI

还原Delta表到某一历史版本的状态： RESTORE [TABLE] [database_name.]table_name|DELTA.`obs_path` [TO] VERSION AS OF version_code 参数描述表1 还原Delta表版本参数说明参数描述 database_name

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta Time Travel
Kafka Sink配置发送失败重试机制 - 数据湖探索 DLI

Kafka Sink配置发送失败重试机制问题描述用户执行Flink Opensource SQL, 采用Flink 1.10版本。Flink Sink写Kafka报错后作业失败： Caused by: org.apache.kafka.common.errors.NetworkException:

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
Flink SQL作业Kafka分区数增加或减少，怎样不停止Flink作业实现动态感知？ - 数据湖探索 DLI

SQL作业Kafka分区数增加或减少，怎样不停止Flink作业实现动态感知？问题描述用户执行Flink Opensource SQL, 采用Flink 1.10版本。初期Flink作业规划的Kafka的分区数partition设置过小或过大，后期需要更改Kafka区分数。解决方案在SQL语句中添加如下参数：

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
Hudi Clean操作说明 - 数据湖探索 DLI

Hudi Clean操作说明什么是Clean Cleaning用于清理Hudi表不再需要的老版本数据文件 (parquet文件或者log文件)，减轻存储压力，提升list操作效率。如何执行Clean 写完数据后clean Spark SQL（设置如下参数，随后执行任意写入SQL时，在满足条件时触发）

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
RESTORE - 数据湖探索 DLI
RESTORE - 数据湖探索 DLI

RESTORE 命令功能 RESTORE命令用于将Delta表还原到早期状态，支持还原到较早的版本号或者时间戳。命令格式还原Delta表到历史某一时刻的状态： RESTORE [TABLE] [database_name.]table_name|DELTA.`obs_path`

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
CLEAN - 数据湖探索 DLI
CLEAN - 数据湖探索 DLI

CLEAN 命令功能用于根据配置对Timeline上的Instant进行clean，删除老旧的历史版本文件，以减少hudi表的数据存储及读写压力。命令格式 RUN CLEAN ON tableIdentifier; RUN CLEAN ON tablelocation; 参数描述

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
生成Flink SQL作业的静态流图 - 数据湖探索 DLI

生成Flink SQL作业的静态流图功能介绍该API用于生成Flink SQL作业的静态流图。 Flink 1.15版本不支持生成静态流图。调试您可以在API Explorer中调试该接口。 URI URI格式 POST /v3/{project_id}/streamin

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
Hive维表 - 数据湖探索 DLI
Hive维表 - 数据湖探索 DLI

Flink支持processing-time temporal join Hive Table，processing-time temporal join始终会加入最新版本的时态表。Flink支持分区表和 Hive非分区表的临时连接，对于分区表，Flink 支持自动跟踪Hive表的最新分区。详情可参考：Apache

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
regexp_replace1 - 数据湖探索 DLI
regexp_replace1 - 数据湖探索 DLI

回结果字符串。 regexp_replace1函数只适用于Spark 2.4.5及之前的版本。相似函数：regexp_replace，regexp_replace函数针对不同的Spark版本，功能略有差异，请参考regexp_replace查看详细的功能说明。命令格式 regexp_replace1(string

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

进入DLI界面，在左侧菜单点击”作业管理”->”Spark作业”，随后在右侧界面的右上角点击”创建作业”。首先配置队列，Spark版本选择 3.3.1 及之后的版本。可以选择配置作业名称，便于识别和筛选。配置”应用程序”，路径指向上一步上传至OBS的Spark jar包。配置委托。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
最新动态 - 数据湖探索 DLI
最新动态 - 数据湖探索 DLI

最新动态本文介绍了数据湖探索DLI各特性版本的功能发布和对应的文档动态，新特性将在各个区域（Region）陆续发布，欢迎体验。 2020年8月序号功能名称功能描述阶段相关文档 1 集成TPC-H测试套件用户可以通过DLI内置的TPC-H测试套件进行简单高效的交互式查

 帮助中心 > 数据湖探索 DLI > 最新动态
DLI Flink与MRS Flink有什么区别？ - 数据湖探索 DLI

仅支持Flink UI 多版本支持支持不同作业使用不同Flink版本单Flink集群仅支持单版本下的作业开发易用性即开即用，Serverless架构，跨AZ容灾能力。用户仅编写SQL代码，无需编译，只需关心业务代码。支持用户通过编写SQL连接各个数据源，如RDS、DWS

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
DataGen源表 - 数据湖探索 DLI
DataGen源表 - 数据湖探索 DLI

TABLE语句中的“COMPUTED COLUMN”来进行类似功能构造。创建Flink OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.12”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。语法格式 create table dataGenSource(

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表

总条数： 343

上一页
1
2
3
4
5
...
18
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Python SDK概述 - 数据湖探索 DLI

BlackHole结果表 - 数据湖探索 DLI

使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

创建CSS类型跨源认证 - 数据湖探索 DLI

创建Flink OpenSource SQL作业 - 数据湖探索 DLI

（推荐）DLI SDK V3 - 数据湖探索 DLI

创建Spark作业 - 数据湖探索 DLI

还原Delta表到早期状态 - 数据湖探索 DLI

Kafka Sink配置发送失败重试机制 - 数据湖探索 DLI

Flink SQL作业Kafka分区数增加或减少，怎样不停止Flink作业实现动态感知？ - 数据湖探索 DLI

Hudi Clean操作说明 - 数据湖探索 DLI

RESTORE - 数据湖探索 DLI

CLEAN - 数据湖探索 DLI

生成Flink SQL作业的静态流图 - 数据湖探索 DLI

Hive维表 - 数据湖探索 DLI

regexp_replace1 - 数据湖探索 DLI

在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

最新动态 - 数据湖探索 DLI

DLI Flink与MRS Flink有什么区别？ - 数据湖探索 DLI

DataGen源表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线