搜索_华为云

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？数据湖探索（DLI）服务对于PySpark是原生支持的。对于数据分析来说Python是很自然的选择，而在大数据分析中PySpark无疑是不二选择。对于JVM语言系的程序，通常会把程序打成Jar包并依赖其他一些第三方的Jar，同样的Python

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相关问题 > 作业开发
使用Flink Jar连接开启SASL - 数据湖探索 DLI

使用Flink Jar连接开启SASL_SSL认证的Kafka 概述本节操作介绍使用Flink Jar连接开启SASL_SSL认证的Kafka的操作方法。如需使用Flink OpenSource SQL连接开启SASL_SSL认证的Kafka，请参考Flink SQL语法参考-

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink Jar作业开发指南
Flink作业标签管理 - 数据湖探索 DLI

Flink作业标签管理标签是用户自定义的、用于标识云资源的键值对，它可以帮助用户对云资源进行分类和搜索。标签由标签“键”和标签“值”组成。 DLI支持对Flink作业添加标签。如果想对Flink作业添加如项目名称、业务类别、背景信息等相关信息的标识，用户可以通过添加标签来实现。如果用户在其他云服务中使用了标签

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
修改弹性资源池的主机信息 - 数据湖探索 DLI

修改弹性资源池的主机信息操作场景主机信息用于配置主机的IP与域名的映射关系，在作业配置时只需使用配置的域名即可访问对应的主机。在跨源连接创建完成后，支持修改主机信息。常见的访问MRS的HBase集群时需要配置实例的主机名（即域名）与主机对应的IP地址。约束限制已获取MRS

帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
在使用Spark2.3.x访问元数据时，DataSource语法创建avro类型的OBS表创建失败 - 数据湖探索 DLI

在使用Spark2.3.x访问元数据时，DataSource语法创建avro类型的OBS表创建失败问题描述使用Spark访问元数据时，DataSource语法创建avro类型的OBS表创建失败。图1 avro类型的OBS创建失败根因分析当前Spark2.3.x不支持创建avro

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相关问题 > 作业运维报错
调整弹性资源池中队列的扩缩容策略 - 数据湖探索 DLI

调整弹性资源池中队列的扩缩容策略弹性资源池上可以添加多个不同队列用于作业运行，具体添加弹性资源池添加队列的操作可以参考在弹性资源池中添加队列。添加完队列后，可以根据不同队列计算资源使用量的波峰和波谷和优先级来配置要扩缩容的CU数，从而来保障作业的稳定运行。注意事项在全天的任意一个时间段内

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
弹性资源池规格变更 - 数据湖探索 DLI

弹性资源池规格变更使用场景包年包月的弹性资源池CU数在规格的范围内使用包年包月计费，超过规格的部分则按弹性资源池CU时计费的方式计费，您可以根据实际CU的使用情况通过规格变更来使得计费更优惠。例如，当前弹性资源池的规格为64CU，实际使用过程中大部分时间CU数在128CU以上

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
删除队列 - 数据湖探索 DLI
删除队列 - 数据湖探索 DLI

删除队列根据实际使用情况，您可以通过删除操作释放队列。如果待删除的队列中有正在提交或正在运行的作业，将不支持删除操作。删除队列不会导致您数据库中的表数据丢失。删除队列步骤在DLI管理控制台左侧，选择“资源管理 > 队列管理”。选择待删除的队列，单击“操作”列的“删除”删除

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
查看Flink作业详情 - 数据湖探索 DLI

查看Flink作业详情创建作业后，您可以在DLI管理控制台查看Flink作业的基本信息、作业详情、任务列表、执行计划等信息。本节操作介绍怎样查看Flink作业相关信息。表1 查看Flink作业相关信息类型说明操作指导 Flink作业基本信息包括Flink作业的ID、作业类型

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
弹性资源池计费 - 数据湖探索 DLI

弹性资源池计费弹性资源池计费模式弹性资源池为DLI作业运行提供计算资源。弹性资源池支持三种计费模式：包年包月：是预付费模式，按订单的购买周期计费。拥有专属的计算资源，空闲（无作业运行）时不会释放，使用体验更佳，价格比按需计费模式更优惠。适用于可预估资源使用周期的场景，例如已完成开发进入生产阶段的项目

 帮助中心 > 数据湖探索 DLI > 计费说明
使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

使用DLI提交SQL作业查询RDS MySQL数据操作场景 DLI可以查询存储在RDS数据库中的数据，本节操作介绍使用DLI提交SQL作业查询RDS MySQL数据的操作步骤。本例创建RDS实例并新建数据库和表，创建DLI弹性资源池队列，通过增强型跨源连接打通DLI弹性资源池和

 帮助中心 > 数据湖探索 DLI > 快速入门
设置Flink作业优先级 - 数据湖探索 DLI

设置Flink作业优先级操作场景在实际作业运行中，由于作业的重要程度以及紧急程度不同，需要重点保障重要和紧急的作业正常运行，因此需要满足它们正常运行所需的计算资源。 DLI提供的设置作业优先级功能，可以对每个Flink作业设置作业优先级，当资源不充足时，可以优先满足优先级较高的作业的计算资源

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
Flink作业如何进行性能调优 - 数据湖探索 DLI

Flink作业如何进行性能调优概念说明及监控查看消费组积压消费组积压可通过topic最新数据offset减去该消费组已提交最大offset计算得出，说明的是该消费组当前待消费的数据总量。如果Flink作业对接的是kafka专享版，则可通过云监控服务(CES)进行查看。具体可选择

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业相关问题 > 性能调优
变更普通队列规格 - 数据湖探索 DLI

变更普通队列规格前提条件新创建的包年包月计费队列需要运行作业后才可进行规格变更。本节操作仅适用于普通队列，不适用于弹性资源池队列。注意事项目前只支持64CUs以上规格包年包月队列进行规格变更。如果在“规格变更”页面提示“Status of queue xxx is assigning

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
Spark SQL语法参考（即将下线） - 数据湖探索 DLI

Spark SQL语法参考（即将下线）批作业SQL常用配置项说明批作业SQL语法概览 Spark开源命令支持说明数据库创建OBS表创建DLI表删除表查看表修改表分区表相关导入数据插入数据清空数据导出查询结果多版本备份恢复数据表生命周期管理跨源连接HBase

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线）
查询作业列表 - 数据湖探索 DLI

查询作业列表功能介绍查询当前用户的作业列表，可以根据作业ID作为ID，查询大于ID或小于ID的限定条数的作业，默认查询全部状态的作业，也可以设定运行中或其他状态条件。调试您可以在API Explorer中调试该接口。 URI URI格式 GET /v1.0/{project_id

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
Flink Jar作业运行报错，报错信息为Authentication failed - 数据湖探索 DLI

Flink Jar作业运行报错，报错信息为Authentication failed 问题现象 Flink Jar作业运行异常，作业日志中有如下报错信息： org.apache.flink.shaded.curator.org.apache.curator.ConnectionState

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业相关问题 > Flink Jar作业相关问题
导出DLI表数据至OBS中 - 数据湖探索 DLI

导出DLI表数据至OBS中支持将数据从DLI表中导出到OBS服务中，导出操作将在OBS服务新建文件夹，或覆盖已有文件夹中的内容。注意事项支持导出json格式的文件，且文本格式仅支持UTF-8。只支持将DLI表（表类型为“Managed”）中的数据导出到OBS桶中，且导出的路径必须指定到文件夹级别

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建DLI元数据 > 在DLI控制台管理表资源
扫描量计费 - 数据湖探索 DLI
扫描量计费 - 数据湖探索 DLI

扫描量计费按扫描量计费按扫描量计费即：按运行查询作业扫描的数据量付费，如果扫描字节数量少于10M，按10M计算。且数据定义语言（DDL）语句（如 CREATE、ALTER、DROP TABLE等语句）、管理分区语句、失败的查询语句无需付费。对于取消的查询，按取消查询时扫描的总数据量计费

 帮助中心 > 数据湖探索 DLI > 计费说明
使用DLI进行账单分析与优化 - 数据湖探索 DLI

使用DLI进行账单分析与优化应用场景本文主要介绍如何使用华为云DLI上的实际消费数据（文中涉及账户的信息已脱敏），在DLI的大数据分析平台上进行分析，找出费用优化的空间，并给出使用DLI过程中降低成本的一些优化措施。流程介绍使用DLI进行账单分析与优化的操作过程主要包括以下步骤

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 数据分析

总条数： 300

上一页
1
...
8
9
10
...
15
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

使用Flink Jar连接开启SASL - 数据湖探索 DLI

Flink作业标签管理 - 数据湖探索 DLI

修改弹性资源池的主机信息 - 数据湖探索 DLI

在使用Spark2.3.x访问元数据时，DataSource语法创建avro类型的OBS表创建失败 - 数据湖探索 DLI

调整弹性资源池中队列的扩缩容策略 - 数据湖探索 DLI

弹性资源池规格变更 - 数据湖探索 DLI

删除队列 - 数据湖探索 DLI

查看Flink作业详情 - 数据湖探索 DLI

弹性资源池计费 - 数据湖探索 DLI

使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

设置Flink作业优先级 - 数据湖探索 DLI

Flink作业如何进行性能调优 - 数据湖探索 DLI

变更普通队列规格 - 数据湖探索 DLI

Spark SQL语法参考（即将下线） - 数据湖探索 DLI

查询作业列表 - 数据湖探索 DLI

Flink Jar作业运行报错，报错信息为Authentication failed - 数据湖探索 DLI

导出DLI表数据至OBS中 - 数据湖探索 DLI

扫描量计费 - 数据湖探索 DLI

使用DLI进行账单分析与优化 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线