搜索_华为云

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

通过下载DLI提供的基础镜像再按需制作自定义镜像，将作业运行需要的依赖（文件、jar包或者软件）、私有能力等内置到自定义镜像中，以此改变Spark作业和Flink作业的容器运行环境，增强作业的功能、性能。例如，在自定义镜像中加入机器学习相关的Python包或者C库，可以通过这种方式帮助用户实现功能扩展。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
怎样监控DLI队列上的作业异常？ - 数据湖探索 DLI

单击左侧“队列管理”，进入队列管理页面。在队列管理页面，单击左上角“创建消息通知主题”进行配置。详细操作请参考《数据湖探索用户指南》。父主题： DLI弹性资源池和队列类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI弹性资源池和队列类
对象存储OBS结果表 - 数据湖探索 DLI

FileSystem sink用于将数据输出到分布式文件系统HDFS或者对象存储服务OBS等文件系统。适用于数据转储、大数据分析、备份或活跃归档、深度或冷归档等场景。考虑到输入流可以是无界的，每个桶中的数据被组织成有限大小的Part文件。完全可以配置为基于时间的方式往桶中写入数据，比如

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > 对象存储OBS
产品优势 - 数据湖探索 DLI
产品优势 - 数据湖探索 DLI

I SQL 2003。存算分离 DLI解耦计算和存储负载，存算分离架构，存储资源和计算资源按需灵活配置，提高了资源利用率，降低了成本。企业级多租户支持计算资源按租户隔离，数据权限控制到队列、作业，帮助企业实现部门间的数据共享和权限管理。 Serverless DLI DLI完全兼容Apache

帮助中心 > 数据湖探索 DLI > 产品介绍
使用Notebook实例提交DLI作业 - 数据湖探索 DLI

使用Notebook实例提交DLI作业 Notebook是基于开源JupyterLab进行了深度优化的交互式数据分析挖掘模块，提供在线的开发和调试能力，用于编写和调测模型训练代码。完成DLI对接Notebook实例后，您可以基于Notebook提供的Web交互的开发环境同时完成代

 帮助中心 > 数据湖探索 DLI > 用户指南
FileSytem结果表 - 数据湖探索 DLI

type 是输出数据编码格式，当前支持“parquet”格式和“csv”格式。当schema为obs时，输出数据编码格式仅支持“parquet”格式。当schema为hdfs时，输出数据编码格式支持“parquet”格式和“csv”格式。 format.field-delimiter

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

30倍或更高。节省存储空间 Parquet还支持灵活的压缩选项，因此可以显著减少磁盘上的存储。存储的节省可高达约75%。资源和成本规划表1 资源和成本规划资源资源说明成本说明 OBS 需要创建一个OBS桶将数据上传到对象存储服务OBS，为后面使用DLI完成数据分析做准备。

帮助中心 > 数据湖探索 DLI > 最佳实践
Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

机发送消息通知，方便客户及时感知异常。图4 作业异常告警勾选“开启Checkpoint”，依据自身业务情况调整Checkpoint间隔和模式。Flink Checkpoint机制可以保证Flink任务突然失败时，能够从最近的Checkpoint进行状态恢复重启。图5 checkpoint参数

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
DLI Flink与MRS Flink有什么区别？ - 数据湖探索 DLI

启。作业模板内置多个常见Flink SQL通用场景模板，帮助您快速了解和构建作业代码暂无企业安全访问控制与华为云IAM权限打通，支持多角色的访问控制暂无空间隔离支持租户级和项目级的资源和代码隔离，满足多团队协作需求暂无父主题： DLI产品咨询类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
FileSystem结果表 - 数据湖探索 DLI

FileSystem sink用于将数据输出到分布式文件系统HDFS或者对象存储服务OBS等文件系统。适用于数据转储、大数据分析、备份或活跃归档、深度或冷归档等场景。考虑到输入流可以是无界的，每个桶中的数据被组织成有限大小的Part文件。完全可以配置为基于时间的方式往桶中写入数据，比如

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Upsert Kafka结果表 - 数据湖探索 DLI

(none) String 用于对Kafka消息中key部分序列化和反序列化的格式。key字段由PRIMARY KEY语法指定。支持的格式如下： csv json avro 请参考Format页面以获取更多详细信息和格式参数。 key.fields-prefix 否 (none) String

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
DLI中的Spark组件与MRS中的Spark组件有什么区别？ - 数据湖探索 DLI

别？ DLI和MRS都支持Spark组件，但在服务模式、接口方式、应用场景和性能特性上存在一些差异。 DLI服务的Spark组件是全托管式服务，用户对Spark组件不感知，仅仅可以使用该服务，且接口为封装式接口。 DLI的这种模式减轻了运维负担，可以更专注于数据处理和分析任务本身。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

后续章节操作都需要在testdb数据库下进行操作。 DataSource和Hive两种语法创建OBS表的区别 DataSource语法和Hive语法主要区别在于支持的表数据存储格式范围、支持的分区数等有差异。两种语法创建OBS表主要差异点参见表1。表1 DataSource语法和Hive语法创建OBS表的差异点语法

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
流生态作业开发指引 - 数据湖探索 DLI

流生态作业开发指引流生态系统基于Flink和Spark双引擎，完全兼容Flink/Storm/Spark开源社区版本接口，并且在此基础上做了特性增强和性能提升，为用户提供易用、低时延、高吞吐的数据湖探索。数据湖探索的流生态开发包括云服务生态、开源生态和自拓展生态：云服务生态 DLI服务在Stream

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？数据湖探索（DLI）服务对于PySpark是原生支持的。对于数据分析来说Python是很自然的选择，而在大数据分析中PySpark无疑是不二选择。对于JVM语言系的程序，通常会把程序打成Jar包并依赖其他一些第三方的Jar，同样的Py

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
使用DLI提交Spark Jar作业 - 数据湖探索 DLI

DLI允许用户提交编译为Jar包的Spark作业，Jar包中包含了Jar作业执行所需的代码和依赖信息，用于在数据查询、数据分析、机器学习等特定的数据处理任务中使用。在提交Spark Jar作业前，将程序包上传至OBS，并将程序包与数据和作业参数一起提交以运行作业。本例介绍通过DLI控制台提交Jar作业

 帮助中心 > 数据湖探索 DLI > 快速入门
DLI弹性资源池与队列简介 - 数据湖探索 DLI

DLI弹性资源池与队列简介 DLI的计算资源是执行作业的基础，本节内容介绍DLI计算资源的模式和队列类型。什么是弹性资源池和队列？在了解DLI计算资源模式前首先了解弹性资源池和队列的基本概念。弹性资源池是DLI计算资源的一种池化管理模式，可以看做DLI计算资源的集合。DLI

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
Flink作业概述 - 数据湖探索 DLI
Flink作业概述 - 数据湖探索 DLI

r的支持，新增了Redis、DWS作为数据源类型。为用户提供了更多的数据源选择，使得数据集成更加灵活和方便。 Flink OpenSource SQL作业适合通过SQL语句来定义和执行流处理逻辑的场景，简化了流处理的复杂性，使得开发者可以更加专注于业务逻辑的实现。创建Flink

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
DROP SCHEMA - 数据湖探索 DLI
DROP SCHEMA - 数据湖探索 DLI

从Catalog中删除指定的数据库，如果数据库中包含表，则必须在执行DROP DATABASE之前删除这些表，或者使用CASCADE模式。 DATABASE和SCHEMA在概念上是等价可互换的。 [IF EXISTS] 如果目标数据库不存在，将抛出错误提示，但如果使用了IF EXISTS子句则不会抛出错误提示。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
创建DLI表关联OpenTSDB - 数据湖探索 DLI

”分隔，包括对应metric下所有tagk的值。注意事项创建DLI表时，不需要指定timestamp和value字段，系统会根据指定的tags自动构建字段，包含以下字段，其中TAG1和TAG2由tags指定。 TAG1 String TAG2 String timestamp Timestamp

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接OpenTSDB表

总条数： 216

上一页
1
2
3
4
5
...
11
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

怎样监控DLI队列上的作业异常？ - 数据湖探索 DLI

对象存储OBS结果表 - 数据湖探索 DLI

产品优势 - 数据湖探索 DLI

使用Notebook实例提交DLI作业 - 数据湖探索 DLI

FileSytem结果表 - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

DLI Flink与MRS Flink有什么区别？ - 数据湖探索 DLI

FileSystem结果表 - 数据湖探索 DLI

Upsert Kafka结果表 - 数据湖探索 DLI

DLI中的Spark组件与MRS中的Spark组件有什么区别？ - 数据湖探索 DLI

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

流生态作业开发指引 - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

使用DLI提交Spark Jar作业 - 数据湖探索 DLI

DLI弹性资源池与队列简介 - 数据湖探索 DLI

Flink作业概述 - 数据湖探索 DLI

DROP SCHEMA - 数据湖探索 DLI

创建DLI表关联OpenTSDB - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线