搜索_华为云

产品优势 - 数据湖探索 DLI
产品优势 - 数据湖探索 DLI

运维成本即开即用，Serverless架构。需要较强的技术能力进行搭建、配置、运维。高可用具有跨AZ容灾能力。无高易用学习成本学习成本低，包含10年、上千个项目经验固化的调优参数。同时提供可视化智能调优界面。学习成本高，需要了解上百个调优参数。支持数据源云上：O

帮助中心 > 数据湖探索 DLI > 产品介绍
使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

自定义镜像应用场景通过下载DLI提供的基础镜像再按需制作自定义镜像，将作业运行需要的依赖（文件、jar包或者软件）、私有能力等内置到自定义镜像中，以此改变Spark作业和Flink作业的容器运行环境，增强作业的功能、性能。例如，在自定义镜像中加入机器学习相关的Python包或者C库，可以通过这种方式帮助用户实现功能扩展。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

原生支持的。对于数据分析来说Python是很自然的选择，而在大数据分析中PySpark无疑是不二选择。对于JVM语言系的程序，通常会把程序打成Jar包并依赖其他一些第三方的Jar，同样的Python程序也有依赖一些第三方库，尤其是基于PySpark的融合机器学习相关的大数据分析

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
使用DLI提交Spark Jar作业 - 数据湖探索 DLI

单击“提交”完成弹性资源池的创建。在弹性资源池的列表页，选择要操作的弹性资源池，单击操作列的“添加队列”。配置队列的基础配置，具体参数信息如下。表3 弹性资源池添加队列基础配置参数名称参数说明配置样例名称弹性资源池添加的队列名称。 dli_queue_01 类型选择创建的队列类型。

帮助中心 > 数据湖探索 DLI > 快速入门
应用场景 - 数据湖探索 DLI
应用场景 - 数据湖探索 DLI

大数据ETL处理运营商大数据分析运营商数据体量在PB~EB级，其数据种类多，有结构化的基站信息数据，非结构化的消息通信数据，同时对数据的时效性有很高的要求，DLI服务提供批处理、流处理等多模引擎，打破数据孤岛进行统一的数据分析。优势大数据ETL：具备TB~EB级运营商数据治理能力，能快速

 帮助中心 > 数据湖探索 DLI > 产品介绍
DLI作业开发流程 - 数据湖探索 DLI

您还可以通过自定义镜像增强DLI的计算环境，通过下载DLI提供的基础镜像再按需制作自定义镜像，将作业运行需要的依赖（文件、jar包或者软件）、私有能力等内置到自定义镜像中，可以改变Spark作业和Flink作业的容器运行环境，增强作业的功能、性能。例如，在自定义镜像中加入机器学习相关的Python

帮助中心 > 数据湖探索 DLI > 用户指南
成长地图 - 数据湖探索 DLI
成长地图 - 数据湖探索 DLI

GO语言深入之道介绍几个Go语言及相关开源框架的插件机制跟唐老师学习云网络唐老师将自己对网络的理解分享给大家智能客服您好！我是有问必答知识渊博的的智能问答机器人，有问题欢迎随时求助哦！社区求助华为云社区是华为云用户的聚集地。这里有来自数据湖探索的技术牛人，为您解决技术难题。

帮助中心 > 数据湖探索 DLI > 成长地图
创建非弹性资源池队列（废弃，不推荐使用） - 数据湖探索 DLI

不支持队列类型切换，如需使用其他队列类型，请重新购买新的队列。管理队列不支持切换队列的计费模式。队列不支持切换区域。创建队列时（非弹性资源池模式的队列），仅支持包年包月队列和按需专属队列选择跨AZ双活，且跨AZ的队列价格为单AZ模式下的2倍。 DLI队列不支持访问公网。队列扩缩容

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
普通队列弹性扩缩容 - 数据湖探索 DLI

容到设定的目标大小。队列资源缩容时，系统不保证将队列资源完全缩容到设定的目标大小。通常队列资源缩容时，系统会先检查资源使用情况，判断是否存在缩容空间，如果现有资源无法按照最小缩容步长执行缩容任务，则队列可能缩容不成功，或缩容一部分规格的情况。因资源规格不同可能有不同的缩容步长

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
创建并提交SQL作业 - 数据湖探索 DLI

柱状图和折线图的X轴可为任意一列，Y轴仅支持数值类型的列，扇形图对应图例和指标。 SQL编辑器功能概览 SQL作业参数设置单击SQL编辑器页面右上方的“设置”按钮。可以设置SQL作业运行参数和作业标签。参数设置：以“key/value”的形式设置提交SQL作业的配置项。详细

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
Hudi表使用约束 - 数据湖探索 DLI

1.0 0.11.0 如何判断队列支持的计算引擎版本：首先进入DLI的控制台界面，点击左侧菜单栏的”资源管理”-> ”队列管理”。在队列管理的界面筛选并选中需要查询的队列，随后点击窗口底部的窗格，展开隐藏的队列详情页面，在支持版本即可查看可用的计算引擎版本。对于SQL队列，无法切换

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
功能总览 - 数据湖探索 DLI
功能总览 - 数据湖探索 DLI

队列，队列关联到具体的作业和数据处理任务，是资源池中资源被实际使用和分配的基本单元，即队列是执行作业所需的具体的计算资源。同一弹性资源池中，队列之间的计算资源支持共享。通过合理设置队列的计算资源分配策略，可以提高计算资源利用率。发布区域：以用户指南中的说明为准 DLI对接LakeFormation

帮助中心 > 数据湖探索 DLI > 功能总览
修改弹性资源池的主机信息 - 数据湖探索 DLI

修改弹性资源池的主机信息操作场景主机信息用于配置主机的IP与域名的映射关系，在作业配置时只需使用配置的域名即可访问对应的主机。在跨源连接创建完成后，支持修改主机信息。常见的访问MRS的HBase集群时需要配置实例的主机名（即域名）与主机对应的IP地址。约束限制已获取MR

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
DLI Flink与MRS Flink有什么区别？ - 数据湖探索 DLI

Flink与MRS Flink有什么区别？ DLI Flink是天然的云原生基础架构。在内核引擎上DLI Flink进行了多处核心功能的优化，并且提供了企业级的一站式开发平台，自带开发和运维功能，免除自建集群运维的麻烦；在connector方面除了支持开源connector之外，还

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
Hudi表索引设计规范 - 数据湖探索 DLI

基于简化使用的角度，针对大数据量的表，可以通过采用Bucket索引来避免状态后端的复杂调优。如果Bucket索引+分区表的模式无法平衡Bueckt桶过大的问题，还是可以继续采用Flink状态索引，按照规范去优化对应的配置参数即可。建议基于Flink的流式写入的表，在数据量超

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

队列管理”下，单击右上角“购买队列”，进入购买队列页面选择“通用队列”，即Spark作业的计算资源。如果创建队列的用户不是管理员用户，在创建队列后，需要管理员用户赋权后才可使用。关于赋权的具体操作请参考《数据湖探索用户指南》。操作步骤在使用JDBC的机器中安装JDK，JDK版本为1.7或以上版本，并配置环境变量。

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI > 使用JDBC提交SQL作业
Flink作业重启后，如何判断是否可以从checkpoint恢复 - 数据湖探索 DLI

该操作修改了作业对资源的算法逻辑。例如原有的算法的语句是执行加减运算，当前需要恢复的状态将算法的语句修改成为乘除取余的运算，是无法从checkpoint直接恢复的。修改“静态流图” 不支持该操作修改了作业对资源的算法逻辑。修改“单TM所占CU数”参数支持对计算资源的修改并没有影响到作业算法或算子的运行逻辑。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

projectId 是 - 用户访问的DLI服务使用的项目编号。 region 是 - 对接的DLI服务的Region。根据Spark应用程序的需要，修改“spark-defaults.conf”中的配置项，配置项兼容开源Spark配置项，参考开源Spark的配置项说明。使用Spark-submit提交Spark作业

 帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
Flink作业常用操作 - 数据湖探索 DLI

适用于当用户切换区域、项目或用户时，需要创建相同的作业，而作业比较多的情况。此时，不需要重新创建作业，只需要将原有的作业导出，再在新的区域、项目或者使用新的用户登录后，导入作业即可。如果需要导入自建的作业，建议使用创建作业的功能。具体请参考创建Flink OpenSource SQL作业，创建Flink

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
手动停止了Flink作业，再次启动时怎样从指定Checkpoint恢复？ - 数据湖探索 DLI

Checkpoint保存的OBS桶。手工停止Flink作业后，再次启动该Flink作业怎样从指定Checkpoint恢复。解决方案由于Flink Checkpoint和Savepoint生成机制及格式一致，因此可以通过Flink作业列表“操作”列中的“更多 > 导入保存点”，

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业咨询类

总条数： 244

上一页
1
2
3
4
5
...
13
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

产品优势 - 数据湖探索 DLI

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

使用DLI提交Spark Jar作业 - 数据湖探索 DLI

应用场景 - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

成长地图 - 数据湖探索 DLI

创建非弹性资源池队列（废弃，不推荐使用） - 数据湖探索 DLI

普通队列弹性扩缩容 - 数据湖探索 DLI

创建并提交SQL作业 - 数据湖探索 DLI

Hudi表使用约束 - 数据湖探索 DLI

功能总览 - 数据湖探索 DLI

修改弹性资源池的主机信息 - 数据湖探索 DLI

DLI Flink与MRS Flink有什么区别？ - 数据湖探索 DLI

Hudi表索引设计规范 - 数据湖探索 DLI

使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

Flink作业重启后，如何判断是否可以从checkpoint恢复 - 数据湖探索 DLI

使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

Flink作业常用操作 - 数据湖探索 DLI

手动停止了Flink作业，再次启动时怎样从指定Checkpoint恢复？ - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线