搜索_华为云

使用Notebook实例提交DLI作业 - 数据湖探索 DLI

Notebook是基于开源JupyterLab进行了深度优化的交互式数据分析挖掘模块，提供在线的开发和调试能力，用于编写和调测模型训练代码。完成DLI对接Notebook实例后，您可以基于Notebook提供的Web交互的开发环境同时完成代码的编写与作业的开发，使用Notebook灵活的进行数据分析与探索，本节操作介

 帮助中心 > 数据湖探索 DLI > 用户指南
使用DLI提交Spark Jar作业 - 数据湖探索 DLI

k作业，Jar包中包含了Jar作业执行所需的代码和依赖信息，用于在数据查询、数据分析、机器学习等特定的数据处理任务中使用。在提交Spark Jar作业前，将程序包上传至OBS，并将程序包与数据和作业参数一起提交以运行作业。本例介绍通过DLI控制台提交Jar作业程序包的基本流程。

帮助中心 > 数据湖探索 DLI > 快速入门
SDK获取与安装 - 数据湖探索 DLI

SDK获取与安装 Python SDK安装方式本节操作介绍安装Python SDK的操作指导。获取DLI SDK 在“DLI SDK DOWNLOAD”页面，单击选择所需的SDK链接，即可获取对应的SDK安装包。 “dli-sdk-python-x.x.x.zip”压缩包，解压后目录结构如下：

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
产品优势 - 数据湖探索 DLI
产品优势 - 数据湖探索 DLI

产品内核及架构深度优化，综合性能是传统MapReduce模型的百倍以上，SLA保障99.95%可用性。图1 DLI Serverless架构与传统自建Hadoop集群相比，Serverless架构的DLI还具有以下优势：表1 Serverless DLI与传统自建Hadoop集群对比的优势

 帮助中心 > 数据湖探索 DLI > 产品介绍
资产识别与管理 - 数据湖探索 DLI

资产识别与管理 DLI 可以通过标签实现资源的标识与管理。使用场景通常您的业务系统可能使用了华为云的多种云服务，您可以为这些云服务下不同的资源实例分别设置标签，各服务的计费详单会体现这些资源实例设置的标签。如果您的业务系统是由多个不同的应用构成，为同一种应用拥有的资源实例设置

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

的融合机器学习相关的大数据分析程序。传统上，通常是直接基于pip把Python库安装到执行机器上，对于DLI这样的Serverless化服务用户无需也感知不到底层的计算资源，那如何来保证用户可以更好的运行他的程序呢？ DLI服务在其计算资源中已经内置了一些常用的机器学习的算法库（具体可以参考”数据湖探索

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

、私有能力等内置到自定义镜像中，以此改变Spark作业和Flink作业的容器运行环境，增强作业的功能、性能。例如，在自定义镜像中加入机器学习相关的Python包或者C库，可以通过这种方式帮助用户实现功能扩展。用户使用自定义镜像功能需要具备Docker相关的基础知识。使用限制

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
FileSytem结果表 - 数据湖探索 DLI

成的目录创建非DLI表，通过DLI SQL进行下一步处理分析，并且输出数据目录支持分区表结构。适用于数据转储、大数据分析、备份或活跃归档、深度或冷归档等场景。语法格式 1 2 3 4 5 6 7 create table filesystemSink ( attr_name

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
对象存储OBS结果表 - 数据湖探索 DLI

FileSystem sink用于将数据输出到分布式文件系统HDFS或者对象存储服务OBS等文件系统。适用于数据转储、大数据分析、备份或活跃归档、深度或冷归档等场景。考虑到输入流可以是无界的，每个桶中的数据被组织成有限大小的Part文件。完全可以配置为基于时间的方式往桶中写入数据，比如

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > 对象存储OBS
DLI作业开发流程 - 数据湖探索 DLI

跨源访问可以减少数据的复制和延迟。跨源访问的必要条件包括“DLI与数据源网络连通”、“DLI可获取数据源的访问凭证”： DLI与数据源网络连通：您可以参考配置DLI与数据源网络连通（增强型跨源连接）配置DLI与数据源的网络连通。管理数据源的凭证：您可以使用DLI提供的跨源认证功能管理访问指定数据源的认证信息。

帮助中心 > 数据湖探索 DLI > 用户指南
成长地图 - 数据湖探索 DLI
成长地图 - 数据湖探索 DLI

SQL作业编辑器作业管理数据管理作业模板跨源连接常用语法 Spark SQL语法参考 Flink OpenSource SQL语法参考运维与监控查看审计日志查看监控指标 06 开发您可以使用客户端或第三方BI工具对接DLI，以及通过DLI跨源连接进行数据分析。客户端工具操作指导

 帮助中心 > 数据湖探索 DLI > 成长地图
身份认证与访问控制 - 数据湖探索 DLI

身份认证与访问控制身份认证用户访问DLI的方式主要有两种，包括DLI Console界面、DLI Open API等，其本质都是通过DLI提供的REST API接口进行请求。 DLI的接口均需要通过认证鉴权才能访问，控制台发送的请求与调用API接口的请求均支持Token认证鉴权。

帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
SQL语法约束与定义 - 数据湖探索 DLI

SQL语法约束与定义语法支持类型保留关键字 DDL语法定义 DML语法定义父主题： Flink Opensource SQL1.15语法参考

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考
SQL语法约束与定义 - 数据湖探索 DLI

SQL语法约束与定义语法支持类型语法定义父主题： Flink Opensource SQL1.10语法参考

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考
SQL语法约束与定义 - 数据湖探索 DLI

SQL语法约束与定义语法支持类型语法定义父主题： Flink Opensource SQL1.12语法参考

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考
Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

”。本例对重点参数加以说明，其他参数根据业务情况自行配置即可。 Flink Jar作业可靠性配置与SQL作业相同，不再另行说明。根据如下公式，配置作业的“CU数量”、“管理单元”与“最大并行数”： CU数量 = 管理单元 + (算子总并行数 / 单TM Slot数) * 单TM所占CU数

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
FileSystem结果表 - 数据湖探索 DLI

FileSystem sink用于将数据输出到分布式文件系统HDFS或者对象存储服务OBS等文件系统。适用于数据转储、大数据分析、备份或活跃归档、深度或冷归档等场景。考虑到输入流可以是无界的，每个桶中的数据被组织成有限大小的Part文件。完全可以配置为基于时间的方式往桶中写入数据，比如

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
约束与限制 - 数据湖探索 DLI
约束与限制 - 数据湖探索 DLI

约束与限制弹性资源池约束限制更多弹性资源池约束限制请参考弹性资源池使用约束限制。表1 弹性资源池约束限制限制项说明资源规格当前弹性资源池最大的计算资源 32000CUs。弹性资源池中可创建队列的最小CU：通用队列：4CUs SQL队列：Spark SQL队列：8CUs；HetuEngine

帮助中心 > 数据湖探索 DLI > 产品介绍
约束与限制 - 数据湖探索 DLI
约束与限制 - 数据湖探索 DLI

约束与限制您能创建的资源的数量与配额有关系，如果您想查看服务配额、扩大配额，具体请参见《如何申请扩大配额》。更详细的限制请参见具体API的说明。父主题： API使用前必读

 帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读
Upsert Kafka结果表 - 数据湖探索 DLI

parallelism 否 (none) Interger 定义upsert-kafka sink 算子的并行度。默认情况下，由框架确定并行度，与上游链接算子的并行度保持一致。 properties.* 否 (none) String 该选项可以传递任意的 Kafka 参数。选项的后缀名必须匹配定义在

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表

总条数： 478

上一页
1
2
3
4
5
...
24
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Notebook实例提交DLI作业 - 数据湖探索 DLI

使用DLI提交Spark Jar作业 - 数据湖探索 DLI

SDK获取与安装 - 数据湖探索 DLI

产品优势 - 数据湖探索 DLI

资产识别与管理 - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

FileSytem结果表 - 数据湖探索 DLI

对象存储OBS结果表 - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

成长地图 - 数据湖探索 DLI

身份认证与访问控制 - 数据湖探索 DLI

SQL语法约束与定义 - 数据湖探索 DLI

SQL语法约束与定义 - 数据湖探索 DLI

SQL语法约束与定义 - 数据湖探索 DLI

Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

FileSystem结果表 - 数据湖探索 DLI

约束与限制 - 数据湖探索 DLI

约束与限制 - 数据湖探索 DLI

Upsert Kafka结果表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线