搜索_华为云

基本概念 - 数据湖探索 DLI
基本概念 - 数据湖探索 DLI

以子项目为单位进行授权，使得用户仅能访问特定子项目中资源，使得资源的权限控制更加精确。在我的凭证下，您可以查看项目ID。图1 项目隔离模型企业项目企业项目是项目的升级版，针对企业不同项目间资源的分组和管理，是逻辑隔离。企业项目中可以包含多个区域的资源，且项目中的资源可以迁入迁出。

帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读
资源相关 - 数据湖探索 DLI
资源相关 - 数据湖探索 DLI

kind：资源包类型，当前支持的包类型分别为： jar：用户jar文件 pyfile：用户Python文件 file：用户文件 modelfile：用户AI模型文件 obs_jar_paths：对应资源包的OBS路径，参数构成为：{bucketName}.{obs域名}/{jarPath}/{jarName}。

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
regexp - 数据湖探索 DLI
regexp - 数据湖探索 DLI

参数类型说明 source 是 STRING 待替换的字符。 pattern 是 STRING STRING类型常量或正则表达式。待匹配的模型。更多正则表达式编写规范，请参见正则表达式规范。pattern为空串时返回报错。 replace_string 是 STRING 将匹配pattern的字符串替换后的字符串。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
资源相关 - 数据湖探索 DLI
资源相关 - 数据湖探索 DLI

kind：资源包类型，当前支持包类型分别为： jar：用户jar文件 pyfile：用户Python文件 file：用户文件 modelfile：用户AI模型文件 paths：对应资源包的OBS路径，参数构成为：{bucketName}.{obs域名}/{jarPath}/{jarName}。

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
创建DLI程序包 - 数据湖探索 DLI

描述包类型支持的包类型如下： JAR：用户jar文件 PyFile：用户Python文件 File：用户文件 ModelFile：用户AI模型文件 OBS路径选择对应程序包的OBS路径。说明：程序包需提前上传至OBS服务中保存。只支持选择文件。分组设置可选择“已有分组”，“创建新分组”或“不分组”。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
查询分组资源列表（废弃） - 数据湖探索 DLI

指定文件类型。包括以下文件类型： jar：用户jar文件。 pyFile：用户python文件。 file：用户文件。 modelFile：用户AI模型文件。 tags 否 String 指定标签过滤。请求消息无请求参数。响应消息表3 响应参数说明参数名称是否必选参数类型说明

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
配置DBT连接DLI进行数据调度和分析 - 数据湖探索 DLI

yml文件中配置的profile 验证配置执行以下命令测试DBT配置是否正确： dbt debug 执行项目作业测试通过后执行以下命令来执行您的数据模型。 dbt run 父主题：使用BI工具连接DLI分析数据

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
上传分组资源（废弃） - 数据湖探索 DLI

String 分组资源文件的类型。 jar：用户jar文件。 pyFile：用户python文件。 file：用户文件。 modelFile：用户AI模型文件。说明：上传的同一组资源包含不同文件类型时，均选择“file”类型作为这次上传文件的类型。 group 是 String 将要创建的分组名。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
Doris结果表 - 数据湖探索 DLI
Doris结果表 - 数据湖探索 DLI

enable-delete TRUE 否是否启用删除。此选项需要 Doris 表开启批量删除功能(Doris0.15+版本默认开启)，只支持 Unique 模型。 sink.properties.* -- 否 Stream Load 的导入参数。例如: 'sink.properties.column_separator'

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Doris
对象存储OBS结果表 - 数据湖探索 DLI

对象存储OBS结果表功能描述 FileSystem sink用于将数据输出到分布式文件系统HDFS或者对象存储服务OBS等文件系统。适用于数据转储、大数据分析、备份或活跃归档、深度或冷归档等场景。考虑到输入流可以是无界的，每个桶中的数据被组织成有限大小的Part文件。完全可以

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > 对象存储OBS
使用Flink Jar读写DIS开发指南 - 数据湖探索 DLI

示例包类型支持的包类型如下： JAR：用户jar文件 PyFile：用户Python文件 File：用户文件 ModelFile：用户AI模型文件 JAR OBS路径选择对应程序包的OBS路径。说明：程序包需提前上传至OBS服务中保存。只支持选择文件。 Flink Jar所在的OBS路径

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
FileSystem结果表 - 数据湖探索 DLI

FileSystem结果表功能描述 FileSystem sink用于将数据输出到分布式文件系统HDFS或者对象存储服务OBS等文件系统。适用于数据转储、大数据分析、备份或活跃归档、深度或冷归档等场景。考虑到输入流可以是无界的，每个桶中的数据被组织成有限大小的Part文件。完

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
FileSytem结果表 - 数据湖探索 DLI

FileSytem结果表功能描述 FileSystem结果表用于将数据输出到分布式文件系统HDFS或者对象存储服务OBS等文件系统。数据生成后，可直接对生成的目录创建非DLI表，通过DLI SQL进行下一步处理分析，并且输出数据目录支持分区表结构。适用于数据转储、大数据分析、备份或活跃归档、深度或冷归档等场景。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

使用自定义镜像增强作业运行环境自定义镜像应用场景通过下载DLI提供的基础镜像再按需制作自定义镜像，将作业运行需要的依赖（文件、jar包或者软件）、私有能力等内置到自定义镜像中，以此改变Spark作业和Flink作业的容器运行环境，增强作业的功能、性能。例如，在自定义镜像中加

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
使用DLI提交Spark Jar作业 - 数据湖探索 DLI

使用DLI提交Spark Jar作业操作场景 DLI允许用户提交编译为Jar包的Spark作业，Jar包中包含了Jar作业执行所需的代码和依赖信息，用于在数据查询、数据分析、机器学习等特定的数据处理任务中使用。在提交Spark Jar作业前，将程序包上传至OBS，并将程序包与数据和作业参数一起提交以运行作业。

帮助中心 > 数据湖探索 DLI > 快速入门
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？数据湖探索（DLI）服务对于PySpark是原生支持的。对于数据分析来说Python是很自然的选择，而在大数据分析中PySpark无疑是不二选择。对于JVM语言系的程序，通常会把程序打成Jar包并依赖其他一些第三方的Jar，同样的Py

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
约束与限制 - 数据湖探索 DLI
约束与限制 - 数据湖探索 DLI

支持上传的程序包类型： JAR：用户jar文件。 PyFile：用户Python文件。 File：用户文件。 ModelFile：用户AI模型文件。增强型跨源连接约束限制更多增强型跨源连接约束限制请参考增强型跨源连接概述。表7 增强型跨源连接约束限制限制项说明适用场景约束限制

 帮助中心 > 数据湖探索 DLI > 产品介绍
DLI作业开发流程 - 数据湖探索 DLI

DLI作业开发流程本节内容为您介绍DLI作业开发流程。创建IAM用户并授权使用DLI 如果您是企业用户，并计划使用IAM对您所拥有的DLI资源进行精细的权限管理，请创建IAM用户并授权使用DLI。具体操作请参考创建IAM用户并授权使用DLI。首次使用DLI您需要根据控制台的

 帮助中心 > 数据湖探索 DLI > 用户指南
成长地图 - 数据湖探索 DLI
成长地图 - 数据湖探索 DLI

云容器引擎-成长地图 | 华为云数据湖探索数据湖探索（Data Lake Insight，简称DLI）是完全兼容Apache Spark、Apache Flink、HetuEngine生态，提供一站式的流处理、批处理、交互式分析的Serverless融合处理分析服务。用户不需

 帮助中心 > 数据湖探索 DLI > 成长地图
功能总览 - 数据湖探索 DLI
功能总览 - 数据湖探索 DLI

功能总览功能总览全部数据湖探索权限管理弹性资源池 DLI元数据 DLI SQL作业 DLI Spark作业 DLI Flink作业跨源连接 DLI自定义委托自定义镜像 OBS 2.0支持数据湖探索数据湖探索（Data Lake Insight，以下简称DLI）是完全兼容Apache

帮助中心 > 数据湖探索 DLI > 功能总览

总条数： 40

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

基本概念 - 数据湖探索 DLI

资源相关 - 数据湖探索 DLI

regexp - 数据湖探索 DLI

资源相关 - 数据湖探索 DLI

创建DLI程序包 - 数据湖探索 DLI

查询分组资源列表（废弃） - 数据湖探索 DLI

配置DBT连接DLI进行数据调度和分析 - 数据湖探索 DLI

上传分组资源（废弃） - 数据湖探索 DLI

Doris结果表 - 数据湖探索 DLI

对象存储OBS结果表 - 数据湖探索 DLI

使用Flink Jar读写DIS开发指南 - 数据湖探索 DLI

FileSystem结果表 - 数据湖探索 DLI

FileSytem结果表 - 数据湖探索 DLI

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

使用DLI提交Spark Jar作业 - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

约束与限制 - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

成长地图 - 数据湖探索 DLI

功能总览 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线