搜索_华为云

库表管理标签管理 - 数据湖探索 DLI

库表管理标签管理标签管理标签是用户自定义的、用于标识云资源的键值对，它可以帮助用户对云资源进行分类和搜索。标签由标签“键”和标签“值”组成。如果用户在其他云服务中使用了标签，建议用户为同一个业务所使用的云资源创建相同的标签键值对以保持一致性。如您的组织已经设定DLI的相关标签策略

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理数据库资源
SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中问题现象 SQL作业中存在join操作，作业提交后状态一直是运行中，没有结果返回。问题根因 Spark SQL作业存在join小表操作时，会触发自动广播所有executor，使得join快速完成。但同时该操作会增加

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
设置SQL作业优先级 - 数据湖探索 DLI

设置SQL作业优先级操作场景在实际作业运行中，由于作业的重要程度以及紧急程度不同，需要重点保障重要和紧急的作业正常运行，因此需要满足它们正常运行所需的计算资源。 DLI提供的设置作业优先级功能，可以对每个SQL设置作业优先级，当资源不充足时，可以优先满足优先级较高的作业的计算资源

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？什么是数据倾斜？数据倾斜是在SQL作业执行中常见的问题，当数据分布不均匀的情况下，一部分计算节点处理的数据量远大于其他节点，从而影响整个计算过程的处理效率。例如观察到SQL执行时间较长，进入SparkUI查看对应SQL的执行状态，如图1所示

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
设置Spark作业优先级 - 数据湖探索 DLI

设置Spark作业优先级操作场景在实际作业运行中，由于作业的重要程度以及紧急程度不同，需要重点保障重要和紧急的作业正常运行，因此需要满足它们正常运行所需的计算资源。 DLI提供的设置作业优先级功能，可以对每个Spark作业设置作业优先级，当资源不充足时，可以优先满足优先级较高的作业的计算资源

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
在DLI控制台创建数据库和表 - 数据湖探索 DLI

在DLI控制台创建数据库和表数据库是按照数据结构来组织、存储和管理数据的建立在计算机存储设备上的仓库。表是数据库最重要的组成部分之一。表是由行与列组合成的。每一列被当作是一个字段。每个字段中的值代表一种类型的数据。数据库是一个框架，表是其实质内容。一个数据库包含一个或者多个表

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

从DLI导入数据到OBS，数据量不一致怎么办？问题现象使用DLI插入数据到OBS临时表文件，数据量有差异。根因分析出现该问题可能原因如下：作业执行过程中，读取数据量错误。验证数据量的方式不正确。通常在执行插入数据操作后，如需确认插入数据量是否正确，建议通过查询语句进行查询

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
Hive维表 - 数据湖探索 DLI
Hive维表 - 数据湖探索 DLI

Hive维表功能描述您可以将Hive表用作时态表，通过时态连接来关联Hive表。有关时态连接的详细信息，请参阅 temporal join。 Flink支持processing-time temporal join Hive Table，processing-time temporal

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
弹性资源池标签管理 - 数据湖探索 DLI

弹性资源池标签管理标签管理标签是用户自定义的、用于标识云资源的键值对，它可以帮助用户对云资源进行分类和搜索。标签由标签“键”和标签“值”组成。如果用户在其他云服务中使用了标签，建议用户为同一个业务所使用的云资源创建相同的标签键值对以保持一致性。 DLI支持以下两类标签：资源标签

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
导出DLI表数据至OBS中 - 数据湖探索 DLI

导出DLI表数据至OBS中支持将数据从DLI表中导出到OBS服务中，导出操作将在OBS服务新建文件夹，或覆盖已有文件夹中的内容。注意事项支持导出json格式的文件，且文本格式仅支持UTF-8。只支持将DLI表（表类型为“Managed”）中的数据导出到OBS桶中，且导出的路径必须指定到文件夹级别

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
队列标签管理 - 数据湖探索 DLI

队列标签管理标签管理标签是用户自定义的、用于标识云资源的键值对，它可以帮助用户对云资源进行分类和搜索。标签由标签“键”和标签“值”组成。如果用户在其他云服务中使用了标签，建议用户为同一个业务所使用的云资源创建相同的标签键值对以保持一致性。 DLI支持以下两类标签：资源标签：

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
创建DLI自定义委托权限 - 数据湖探索 DLI

创建DLI自定义委托权限使用Flink 1.15和Spark 3.3及以上版本的引擎执行作业时，当您所需的委托没有包含在DLI系统委托dli_management_agency时，您需要在IAM页面创建相关委托，并在作业配置中添加新建的委托信息。dli_management_agency

帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI访问其他云服务的委托权限
添加Flink作业标签 - 数据湖探索 DLI

添加Flink作业标签标签是用户自定义的、用于标识云资源的键值对，它可以帮助用户对云资源进行分类和搜索。标签由标签“键”和标签“值”组成。 DLI支持对Flink作业添加标签。如果想对Flink作业添加如项目名称、业务类别、背景信息等相关信息的标识，用户可以通过添加标签来实现。如果用户在其他云服务中使用了标签

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

DLI预置的SQL模板中TPC-H样例数据说明 TPC-H样例数据简介 TPC-H（商业智能计算测试）是交易处理效能委员会（TPC,Transaction Processing Performance Council) 组织制定的用来模拟决策支持类应用的一个测试集。目前，在学术界和工业界普遍用来评价决策支持技术方面应用的性能

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

使用自定义镜像增强作业运行环境自定义镜像应用场景通过下载DLI提供的基础镜像再按需制作自定义镜像，将作业运行需要的依赖（文件、jar包或者软件）、私有能力等内置到自定义镜像中，以此改变Spark作业和Flink作业的容器运行环境，增强作业的功能、性能。例如，在自定义镜像中加入机器学习相关的

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
怎样管理在DLI上运行的作业 - 数据湖探索 DLI

怎样管理在DLI上运行的作业管理大量的DLI作业时您可以采用以下方案：作业分组：将几万个作业根据不同的类型分组，不同类型的作业通过不同的队列运行。创建IAM子用户或者创建IAM子用户，将不同类型的作业通过不同的用户执行。具体请参考《数据湖探索用户指南》。此外DLI还提供了作业管理功能

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
Java SDK - 数据湖探索 DLI
Java SDK - 数据湖探索 DLI

Java SDK Java SDK概述 Java SDK环境配置 OBS授权队列相关资源相关 SQL作业相关 Flink作业相关 Spark作业相关 Flink作业模板相关

 帮助中心 > 数据湖探索 DLI > SDK参考
Python SDK环境配置 - 数据湖探索 DLI

Python SDK环境配置操作场景在进行二次开发时，要准备的开发环境如表1所示。表1 开发环境准备项说明操作系统 Windows系统，推荐Windows 7及以上版本。安装Python Python版本建议使用2.7.10和3.4.0以上版本，需要配置Visual

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
SQL作业相关 - 数据湖探索 DLI
SQL作业相关 - 数据湖探索 DLI

SQL作业相关数据库相关表相关作业相关父主题： Python SDK

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
Python SDK - 数据湖探索 DLI
Python SDK - 数据湖探索 DLI

Python SDK Python SDK概述 Python SDK环境配置队列相关资源相关 SQL作业相关 Spark作业相关

 帮助中心 > 数据湖探索 DLI > SDK参考

总条数： 473

上一页
1
2
3
4
5
...
24
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

库表管理标签管理 - 数据湖探索 DLI

SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

设置SQL作业优先级 - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

设置Spark作业优先级 - 数据湖探索 DLI

在DLI控制台创建数据库和表 - 数据湖探索 DLI

从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

Hive维表 - 数据湖探索 DLI

弹性资源池标签管理 - 数据湖探索 DLI

导出DLI表数据至OBS中 - 数据湖探索 DLI

队列标签管理 - 数据湖探索 DLI

创建DLI自定义委托权限 - 数据湖探索 DLI

添加Flink作业标签 - 数据湖探索 DLI

DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

怎样管理在DLI上运行的作业 - 数据湖探索 DLI

Java SDK - 数据湖探索 DLI

Python SDK环境配置 - 数据湖探索 DLI

SQL作业相关 - 数据湖探索 DLI

Python SDK - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线