搜索_华为云

使用DLI分析电商BI报表 - 数据湖探索 DLI

某电商商城在保持高速发展的同时，沉淀了数亿的忠实用户，积累了海量的真实数据。如何利用BI工具从历史数据中找出商机，是大数据应用在精准营销中的关键问题，也是所有电商平台在做智能化升级时所需要的核心技术。本案例以某商城真实的用户、商品、评论数据（脱敏后）为基础，利用数据湖探索来分析用户和商品的各种数

 帮助中心 > 数据湖探索 DLI > 最佳实践
查询弹性资源池下所有队列 - 数据湖探索 DLI

系统提示信息，执行成功时，信息可能为空。 queues 否 Array of objects 该弹性资源池下所有queue的资源权重信息。详细参数说明请参考表4。 count 否 Long 该资源池下关联的队列数量。表4 queues 参数是否必填参数类型描述 queue_name 否 String

帮助中心 > 数据湖探索 DLI > API参考 > 弹性资源池相关API
DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？问题现象 DLI分区内表导入了CSV文件数据，导入的文件数据没有包含对应分区列的字段数据。分区表查询时需要指定分区字段，导致查询不到表数据。问题根因 DLI分区内表在导入数据时，如果文件数据没

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
Spark 3.1.1版本说明 - 数据湖探索 DLI

Spark 3.1.1版本说明数据湖探索（DLI）遵循开源Spark计算引擎的发布一致性。本文介绍Spark 3.1.1版本所做的变更说明。更多Spark 3.1.1版本说明请参考Spark Release Notes。 Spark 3.1.1版本发布时间版本名称发布时间

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
创建并使用跨源链接 - 数据湖探索 DLI

本章节指导用户通过API创建增强型跨源连接。约束限制新队列第一次运行作业时，需要一定的时间，通常为6~10分钟。创建增强型跨源连接之前需要获取需要建立连接的服务对应VPC的ID和其所在子网的网络ID。获取VPC的ID接口，具体请参考《虚拟私有云API参考》。获取子网网络ID接口，具体请参考《虚拟私有云API参考》。

帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
设置Flink作业优先级 - 数据湖探索 DLI

在实际作业运行中，由于作业的重要程度以及紧急程度不同，需要重点保障重要和紧急的作业正常运行，因此需要满足它们正常运行所需的计算资源。 DLI提供的设置作业优先级功能，可以对每个Flink作业设置作业优先级，当资源不充足时，可以优先满足优先级较高的作业的计算资源。 Flink 1.

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
使用DLI提交Flink Jar作业 - 数据湖探索 DLI

单击“提交”完成弹性资源池的创建。在弹性资源池的列表页，选择要操作的弹性资源池，单击操作列的“添加队列”。配置队列的基础配置，具体参数信息如下。表3 弹性资源池添加队列基础配置参数名称参数说明配置样例名称弹性资源池添加的队列名称。 dli_queue_01 类型选择创建的队列类型。

帮助中心 > 数据湖探索 DLI > 快速入门
Spark 3.3.1版本说明 - 数据湖探索 DLI

提升对象存储服务（OBS）在处理小文件写入时的性能，提高数据传输效率。动态Executor shuffle数据优化提升资源扩缩容的稳定性，当shuffle文件不需要时清理Executor。支持配置小文件合并使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
对两个表进行join操作时，提示：SQL_ANALYSIS_ERROR: Reference 't.id' is ambiguous, could be: t.id, t.id.; - 数据湖探索 DLI

id.; 出现这个提示，表示进行join操作的两个表中包含相同的字段，但是在执行命令时，没有指定该字段的归属。例如：在表tb1和tb2中都包含字段“id”。错误的命令： select id from tb1 join tb2; 正确的命令： select tb1.id from

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
创建弹性资源池并添加队列 - 数据湖探索 DLI

弹性资源池为DLI作业运行提供所需的计算资源（CPU和内存），用于灵活应对业务对计算资源变化的需求。创建弹性资源池后，您可以在弹性资源池中创建多个队列，队列关联到具体的作业和数据处理任务，是资源池中资源被实际使用和分配的基本单元，即队列是执行作业所需的具体的计算资源。同一弹性资源池中，队列之间的计算资源支持共享。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
DLI作业开发流程 - 数据湖探索 DLI

您还可以通过自定义镜像增强DLI的计算环境，通过下载DLI提供的基础镜像再按需制作自定义镜像，将作业运行需要的依赖（文件、jar包或者软件）、私有能力等内置到自定义镜像中，可以改变Spark作业和Flink作业的容器运行环境，增强作业的功能、性能。例如，在自定义镜像中加入机器学习相关的Python

帮助中心 > 数据湖探索 DLI > 用户指南
弹性资源池规格变更 - 数据湖探索 DLI

弹性资源池规格变更使用场景包年包月的弹性资源池CU数在规格（包周期CU）的范围内使用包年包月计费，超过规格（包周期CU）的部分则按弹性资源池CU时计费的方式计费，您可以根据实际CU的使用情况通过规格变更来使得计费更优惠。例如，当前弹性资源池的规格（包周期CU）为64CU，实际使

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
创建Flink Jar作业 - 数据湖探索 DLI

选择作业运行时使用的队列资源。应用程序选择Jar作业程序包。 Jar包的管理方式：上传OBS管理程序包：提前将对应的jar包上传至OBS桶中。并在此处选择对应的OBS路径。上传DLI管理程序包：提前将对应的jar包上传至OBS桶中，并在DLI管理控制台的“数据管理>程序包

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

在下拉列表中选择要使用的队列。选择Spark版本。在下拉列表中选择支持的Spark版本，推荐使用最新版本。不建议长期混用不同版本的Spark/Flink引擎。长期混用不同版本的Spark/Flink引擎会导致代码在新旧版本之间不兼容，影响作业的执行效率。当作业依赖于特定版本的库或组件，

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
DLI Spark 2.3.2版本停止服务（EOS）公告 - 数据湖探索 DLI

2版本停止服务后，正在使用该版本的作业有哪些影响？在Spark 2.3.2 EOS时间后创建的队列，在执行作业时不支持选择已经EOS的计算引擎。历史创建的队列仍然可以使用Spark 2.3.2执行作业，但作业执行过程中出现的错误，不再提供该版本的任何技术服务支持，请您尽快更换至新版本的计算引擎。 DLI

帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
Flink Opensource SQL如何解析复杂嵌套 JSON？ - 数据湖探索 DLI

各数据类型获取元素的方法： - map：map['key'] - array：array[index] - row：row.key array 的起始下标从 1 开始，即 array[1] 是 array 的第一个元素。 array 的元素必须同类型，row 的元素可以不同类型。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
DLI SDK功能矩阵 - 数据湖探索 DLI

SDK提供的接口函数进行二次开发。 Java、Python SDK功能矩阵请参见表1 表1 SDK功能矩阵语言功能内容 Java OBS授权介绍将OBS桶的操作权限授权给DLI的Java SDK使用说明。队列相关介绍创建队列、获取默认队列、查询所有队列、删除队列的Java

帮助中心 > 数据湖探索 DLI > SDK参考 > DLI SDK
创建DLI自定义委托权限 - 数据湖探索 DLI

3及以上版本的引擎执行作业时，当您所需的委托没有包含在DLI系统委托dli_management_agency时，您需要在IAM页面创建相关委托，并在作业配置中添加新建的委托信息。dli_management_agency包含跨源操作、消息通知、用户授权操作所需的权限，除此之外的其他委

 帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI访问其他云服务的委托权限
增强型跨源连接类 - 数据湖探索 DLI

增强型跨源连接绑定队列失败怎么办？ DLI增强型跨源连接DWS失败怎么办？创建跨源成功但测试网络连通性失败怎么办？怎样配置DLI队列与数据源的网络连通？为什么DLI增强型跨源连接要创建对等连接？ DLI创建跨源连接，绑定队列一直在创建中怎么办？新建跨源连接，显示已激活，但使用时提示communication

帮助中心 > 数据湖探索 DLI > 常见问题
查询作业状态 - 数据湖探索 DLI

Insert作业执行过程中扫描到的错误记录数。 input_size Long 作业执行过程中扫描文件的大小，单位字节。 result_count Integer 当前作业返回的结果总条数或insert作业插入的总条数。 database_name String 记录其操作的表所在的数据库名称。类

 帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API

总条数： 1154

上一页
1
...
53
54
55
...
58
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用DLI分析电商BI报表 - 数据湖探索 DLI

查询弹性资源池下所有队列 - 数据湖探索 DLI

DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

Spark 3.1.1版本说明 - 数据湖探索 DLI

创建并使用跨源链接 - 数据湖探索 DLI

设置Flink作业优先级 - 数据湖探索 DLI

使用DLI提交Flink Jar作业 - 数据湖探索 DLI

Spark 3.3.1版本说明 - 数据湖探索 DLI

对两个表进行join操作时，提示：SQL_ANALYSIS_ERROR: Reference 't.id' is ambiguous, could be: t.id, t.id.; - 数据湖探索 DLI

创建弹性资源池并添加队列 - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

弹性资源池规格变更 - 数据湖探索 DLI

创建Flink Jar作业 - 数据湖探索 DLI

创建Spark作业 - 数据湖探索 DLI

DLI Spark 2.3.2版本停止服务（EOS）公告 - 数据湖探索 DLI

Flink Opensource SQL如何解析复杂嵌套 JSON？ - 数据湖探索 DLI

DLI SDK功能矩阵 - 数据湖探索 DLI

创建DLI自定义委托权限 - 数据湖探索 DLI

增强型跨源连接类 - 数据湖探索 DLI

查询作业状态 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线