搜索_华为云

产品优势 - 数据湖探索 DLI
产品优势 - 数据湖探索 DLI

线下应用可无缝平滑迁移上云，减少迁移工作量。采用批流融合高扩展性框架，为TB~EB级数据提供了更实时高效的多样性算力，可支撑更丰富的大数据处理需求。产品内核及架构深度优化，综合性能是传统MapReduce模型的百倍以上，SLA保障99.95%可用性。图1 DLI Serverless架构

 帮助中心 > 数据湖探索 DLI > 产品介绍
成长地图 - 数据湖探索 DLI
成长地图 - 数据湖探索 DLI

Native Lives Kubernetes系列课程，带你走进云原生技术的核心 GO语言深入之道介绍几个Go语言及相关开源框架的插件机制跟唐老师学习云网络唐老师将自己对网络的理解分享给大家智能客服您好！我是有问必答知识渊博的的智能问答机器人，有问题欢迎随时求助哦！社区求助华为

 帮助中心 > 数据湖探索 DLI > 成长地图
使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

、私有能力等内置到自定义镜像中，以此改变Spark作业和Flink作业的容器运行环境，增强作业的功能、性能。例如，在自定义镜像中加入机器学习相关的Python包或者C库，可以通过这种方式帮助用户实现功能扩展。用户使用自定义镜像功能需要具备Docker相关的基础知识。使用限制

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
使用DLI提交Spark Jar作业 - 数据湖探索 DLI

操作场景 DLI允许用户提交编译为Jar包的Spark作业，Jar包中包含了Jar作业执行所需的代码和依赖信息，用于在数据查询、数据分析、机器学习等特定的数据处理任务中使用。在提交Spark Jar作业前，将程序包上传至OBS，并将程序包与数据和作业参数一起提交以运行作业。本例介绍

 帮助中心 > 数据湖探索 DLI > 快速入门
使用Notebook实例提交DLI作业 - 数据湖探索 DLI

使用Notebook实例提交DLI作业 Notebook是基于开源JupyterLab进行了深度优化的交互式数据分析挖掘模块，提供在线的开发和调试能力，用于编写和调测模型训练代码。完成DLI对接Notebook实例后，您可以基于Notebook提供的Web交互的开发环境同时完成代

 帮助中心 > 数据湖探索 DLI > 用户指南
DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

Council) 组织制定的用来模拟决策支持类应用的一个测试集。目前，在学术界和工业界普遍用来评价决策支持技术方面应用的性能。这种商业测试可以全方位评测系统的整体商业计算综合能力，对厂商的要求更高，同时也具有普遍的商业实用意义，目前在银行信贷分析和信用卡分析、电信运营分析、税收分析、烟草行业决策分析中都有广泛的应用。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
对象存储OBS结果表 - 数据湖探索 DLI

FileSystem sink用于将数据输出到分布式文件系统HDFS或者对象存储服务OBS等文件系统。适用于数据转储、大数据分析、备份或活跃归档、深度或冷归档等场景。考虑到输入流可以是无界的，每个桶中的数据被组织成有限大小的Part文件。完全可以配置为基于时间的方式往桶中写入数据，比如

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > 对象存储OBS
新建SQL作业 - 数据湖探索 DLI
新建SQL作业 - 数据湖探索 DLI

Integer 用户设置的作业并行数目。默认值为“1”。并行数是指同时运行Flink SQL作业的最大任务数。适度增加并行数会提高作业整体算力，但也须考虑线程增多带来的切换开销。最大并行数不能大于计算单元（CU数量-管理单元）的4倍。管理单元参数设置详见：manager_cu_number。

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
DLI作业开发流程 - 数据湖探索 DLI

资源管理和作业调度。支持多种数据源和格式，提供了丰富的数据处理能力，包括但不限于SQL查询、机器学习等。详细操作请参考创建Spark作业。适用于大规模数据处理和分析，如机器学习训练、日志分析、大规模数据挖掘等场景。管理Jar作业的程序包 DLI允许用户提交编译为Jar包的F

帮助中心 > 数据湖探索 DLI > 用户指南
数据湖探索简介 - 数据湖探索 DLI

rch等。具体内容请参见《数据湖探索开发指南》。存算分离用户将数据存储到OBS后，DLI可以直接和OBS对接进行数据分析。存算分离的架构下，使得存储资源和计算资源可以分开申请和计费，降低了成本并提高了资源利用率。存算分离场景下，DLI支持OBS在创建桶时数据冗余策略选择单

 帮助中心 > 数据湖探索 DLI > 产品介绍
故障恢复 - 数据湖探索 DLI
故障恢复 - 数据湖探索 DLI

故障恢复系统级故障恢复 DLI系统采用存算分离的架构，计算集群基于K8s资源调度和故障切换机制，在系统故障时，支持自动故障恢复。作业级故障恢复 Flink、Spark作业支持配置自动重启恢复机制，在开启自动重启功能后，当作业出现异常时将自动重启恢复作业。父主题：安全

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
DLI弹性资源池与队列简介 - 数据湖探索 DLI

当弹性资源池中添加队列、删除队列时，会触发弹性资源扩缩容。而弹性资源池缩容可能会触发缩容含有shuffle数据的节点，会导致Spark Task重算，引起Spark作业和SQL作业内部自动重试，当作业重试超过限制会导致作业执行失败，需用户重新执行作业。 Spark2.3版本作业需要升级作业版本后才能支持运行中动态缩容功能。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
FileSytem结果表 - 数据湖探索 DLI

成的目录创建非DLI表，通过DLI SQL进行下一步处理分析，并且输出数据目录支持分区表结构。适用于数据转储、大数据分析、备份或活跃归档、深度或冷归档等场景。语法格式 1 2 3 4 5 6 7 create table filesystemSink ( attr_name

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

的融合机器学习相关的大数据分析程序。传统上，通常是直接基于pip把Python库安装到执行机器上，对于DLI这样的Serverless化服务用户无需也感知不到底层的计算资源，那如何来保证用户可以更好的运行他的程序呢？ DLI服务在其计算资源中已经内置了一些常用的机器学习的算法库（具体可以参考”数据湖探索

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
应用场景 - 数据湖探索 DLI
应用场景 - 数据湖探索 DLI

面临市场新的竞争压力及出行服务不断变革，车企通过构建车联云平台和车机OS，将互联网应用与用车场景打通，完成车企数字化服务转型，从而为车主提供更好的智联出行体验，增加车企竞争力，促进销量增长。例如：通过对车辆日常指标数据（电池、发动机，轮胎胎压、安全气囊等健康状态）的采集和分析，及时将维保建议回馈给车主。优势多

 帮助中心 > 数据湖探索 DLI > 产品介绍
生成Flink SQL作业的静态流图 - 数据湖探索 DLI

管理单元CU数。 parallel_number 否 Integer 最大并行度。并行数为作业每个算子的并行数，适度增加并行数会提高作业整体算力，但也须考虑线程增多带来的切换开销，上限是计算单元CU数的4倍，最佳实践为计算单元CU数的1-2倍。 tm_cus 否 Integer 单个taskManagerCU数量。

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
功能总览 - 数据湖探索 DLI
功能总览 - 数据湖探索 DLI

相关组件都运行在容器中，通过下载DLI提供的自定义镜像，可以改变Spark作业和Flink作业的容器运行环境。例如，在自定义镜像中加入机器学习相关的Python包或者C库，可以通过这种方式方便地帮助用户进行功能扩展。发布区域：全部创建自定义镜像

 帮助中心 > 数据湖探索 DLI > 功能总览
FileSystem结果表 - 数据湖探索 DLI

FileSystem sink用于将数据输出到分布式文件系统HDFS或者对象存储服务OBS等文件系统。适用于数据转储、大数据分析、备份或活跃归档、深度或冷归档等场景。考虑到输入流可以是无界的，每个桶中的数据被组织成有限大小的Part文件。完全可以配置为基于时间的方式往桶中写入数据，比如

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表

总条数： 18

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

产品优势 - 数据湖探索 DLI

成长地图 - 数据湖探索 DLI

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

使用DLI提交Spark Jar作业 - 数据湖探索 DLI

使用Notebook实例提交DLI作业 - 数据湖探索 DLI

DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

对象存储OBS结果表 - 数据湖探索 DLI

新建SQL作业 - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

数据湖探索简介 - 数据湖探索 DLI

故障恢复 - 数据湖探索 DLI

DLI弹性资源池与队列简介 - 数据湖探索 DLI

FileSytem结果表 - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

应用场景 - 数据湖探索 DLI

生成Flink SQL作业的静态流图 - 数据湖探索 DLI

功能总览 - 数据湖探索 DLI

FileSystem结果表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线