搜索_华为云

创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

在下拉列表中选择要使用的队列。选择Spark版本。在下拉列表中选择支持的Spark版本，推荐使用最新版本。不建议长期混用不同版本的Spark/Flink引擎。长期混用不同版本的Spark/Flink引擎会导致代码在新旧版本之间不兼容，影响作业的执行效率。当作业依赖于特定版本的库或组件，

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
使用DLI提交Flink Jar作业 - 数据湖探索 DLI

单击“提交”完成弹性资源池的创建。在弹性资源池的列表页，选择要操作的弹性资源池，单击操作列的“添加队列”。配置队列的基础配置，具体参数信息如下。表3 弹性资源池添加队列基础配置参数名称参数说明配置样例名称弹性资源池添加的队列名称。 dli_queue_01 类型选择创建的队列类型。

帮助中心 > 数据湖探索 DLI > 快速入门
下载JDBC驱动包 - 数据湖探索 DLI

JDBC Driver中获取最新版本的JDBC安装包。 JDBC版本2.X版本功能重构后，仅支持从DLI作业桶读取查询结果，如需使用该特性需具备以下条件：在DLI管理控制台“全局配置 > 工程配置”中完成作业桶的配置。提交工单申请开启查询结果写入桶特性的白名单。如果使用maven构

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南 > 使用JDBC提交Spark SQL作业
Spark 3.3.1版本说明 - 数据湖探索 DLI

提升对象存储服务（OBS）在处理小文件写入时的性能，提高数据传输效率。动态Executor shuffle数据优化提升资源扩缩容的稳定性，当shuffle文件不需要时清理Executor。支持配置小文件合并使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
Flink Opensource SQL如何解析复杂嵌套 JSON？ - 数据湖探索 DLI

各数据类型获取元素的方法： - map：map['key'] - array：array[index] - row：row.key array 的起始下标从 1 开始，即 array[1] 是 array 的第一个元素。 array 的元素必须同类型，row 的元素可以不同类型。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
DLI作业开发流程 - 数据湖探索 DLI

您还可以通过自定义镜像增强DLI的计算环境，通过下载DLI提供的基础镜像再按需制作自定义镜像，将作业运行需要的依赖（文件、jar包或者软件）、私有能力等内置到自定义镜像中，可以改变Spark作业和Flink作业的容器运行环境，增强作业的功能、性能。例如，在自定义镜像中加入机器学习相关的Python

帮助中心 > 数据湖探索 DLI > 用户指南
查询作业状态 - 数据湖探索 DLI

Insert作业执行过程中扫描到的错误记录数。 input_size Long 作业执行过程中扫描文件的大小，单位字节。 result_count Integer 当前作业返回的结果总条数或insert作业插入的总条数。 database_name String 记录其操作的表所在的数据库名称。类

 帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
创建DLI自定义委托权限 - 数据湖探索 DLI

3及以上版本的引擎执行作业时，当您所需的委托没有包含在DLI系统委托dli_management_agency时，您需要在IAM页面创建相关委托，并在作业配置中添加新建的委托信息。dli_management_agency包含跨源操作、消息通知、用户授权操作所需的权限，除此之外的其他委

 帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI访问其他云服务的委托权限
Flink Jar作业开发基础样例 - 数据湖探索 DLI

供用户调用的方法，DLI只对这些方法的兼容性做出产品保证。图4 配置参数表3 参数说明名称描述 CU数量一个CU为1核4G的资源量。CU数量范围为2~400个。管理单元设置管理单元的CU数，支持设置1~4个CU，默认值为1个CU。并行数作业中每个算子的最大并行数。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink Jar作业开发指南
取消作业（推荐） - 数据湖探索 DLI

取消作业（推荐）功能介绍该API用于取消已经提交的作业，若作业已经执行结束或失败则无法取消。调试您可以在API Explorer中调试该接口。 URI URI格式： DELETE /v1.0/{project_id}/jobs/{job_id} 参数说明表1 URI 参数

 帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
DLI SDK功能矩阵 - 数据湖探索 DLI

SDK提供的接口函数进行二次开发。 Java、Python SDK功能矩阵请参见表1 表1 SDK功能矩阵语言功能内容 Java OBS授权介绍将OBS桶的操作权限授权给DLI的Java SDK使用说明。队列相关介绍创建队列、获取默认队列、查询所有队列、删除队列的Java

帮助中心 > 数据湖探索 DLI > SDK参考 > DLI SDK
最佳实践内容概览 - 数据湖探索 DLI

最佳实践内容概览本指导从数据迁移、数据分析提供了完整的端到端最佳实践内容，帮助您更好的使用DLI进行大数据分析和处理。数据迁移您可以通过云数据迁移服务CDM轻松的将其他云服务或者业务平台的数据迁移至DLI。包括以下最佳实践内容：迁移Hive数据至DLI，具体请参考迁移Hive数据至DLI。

帮助中心 > 数据湖探索 DLI > 最佳实践
增强型跨源连接类 - 数据湖探索 DLI

增强型跨源连接绑定队列失败怎么办？ DLI增强型跨源连接DWS失败怎么办？创建跨源成功但测试网络连通性失败怎么办？怎样配置DLI队列与数据源的网络连通？为什么DLI增强型跨源连接要创建对等连接？ DLI创建跨源连接，绑定队列一直在创建中怎么办？新建跨源连接，显示已激活，但使用时提示communication

帮助中心 > 数据湖探索 DLI > 常见问题
count函数如何进行聚合 - 数据湖探索 DLI

count函数如何进行聚合使用count函数进行聚合的正确用法如下： SELECT http_method, count(http_method) FROM apigateway WHERE service_id = 'ecs' Group BY http_method

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
查看赋权对象使用者权限信息 - 数据湖探索 DLI

授权对象，和赋权API中的“object”对应。 "jobs.flink.flink作业ID"，查询指定的作业。 "groups.程序包组名"，查询指定的程序包组。 "resources.程序包名"，查询指定程序包。说明：查看分组下的程序包时，“object”的格式为"resources

帮助中心 > 数据湖探索 DLI > API参考 > 权限相关API
DLI弹性资源池和队列类 - 数据湖探索 DLI

DLI弹性资源池和队列类怎样查看弹性资源池和作业的资源使用情况？怎样判断当前DLI队列中的作业是否有积压？怎样查看DLI队列负载？怎样监控DLI队列上的作业异常？怎样将老版本的Spark队列切换成通用型队列在default队列执行DLI SQL失败，提示超时异常怎么办？

帮助中心 > 数据湖探索 DLI > 常见问题
执行查询语句报错：The current account does not have permission to perform this operation,the current account was restricted. Restricted for - 数据湖探索 DLI

该提示信息说明您可能因账户欠费获余额不足导致操作受限。解决方案：检查账户状态。请先确认是否欠费，如有欠费请充值。重新登录账户。如果充值后仍然提示相同的错误，请退出账号后重新登录。父主题： SQL作业运维类

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
获取服务端连接地址 - 数据湖探索 DLI

括了Endpoint和项目编号。操作步骤连接DLI服务的地址格式为：jdbc:dli://<endPoint>/<projectId>。因此您需要获取对应的Endpoint和项目编号。在地区和终端节点获取DLI对应的Endpoint；在华为云页面上方菜单栏，单击用户名，然后在“我的凭证”页面获取项目编号。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南 > 使用JDBC提交Spark SQL作业
Flink jobmanager日志一直报Timeout expired while fetching topic metadata怎么办？ - 数据湖探索 DLI

topic metadata" ，说明Flink作业在尝试获取Kafka主题的元数据时超时了。此时您需要先检查Flink作业和Kafka的网络连通性，确保执行Flink作业所在的队列可以访问Kafka所在的VPC网络。若果网络不可达，请先配置网络连通后再重新执行作业。操作方法请参考测试地址连通性。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
怎样查看弹性资源池和作业的资源使用情况？ - 数据湖探索 DLI

怎样查看弹性资源池和作业的资源使用情况？在大数据分析的日常工作中，合理分配和管理计算资源，可以提供良好的作业执行环境。您可以根据作业的计算需求和数据规模分配资源、调整任务执行顺序，调度不同的弹性资源池或队列资源以适应不同的工作负载。待提交作业所需的CUs需小于等于弹性资源池的剩余可用CUs，才可以确保作业任务的正常执行。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI弹性资源池和队列类

总条数： 1545

上一页
1
...
73
74
75
...
78
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建Spark作业 - 数据湖探索 DLI

使用DLI提交Flink Jar作业 - 数据湖探索 DLI

下载JDBC驱动包 - 数据湖探索 DLI

Spark 3.3.1版本说明 - 数据湖探索 DLI

Flink Opensource SQL如何解析复杂嵌套 JSON？ - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

查询作业状态 - 数据湖探索 DLI

创建DLI自定义委托权限 - 数据湖探索 DLI

Flink Jar作业开发基础样例 - 数据湖探索 DLI

取消作业（推荐） - 数据湖探索 DLI

DLI SDK功能矩阵 - 数据湖探索 DLI

最佳实践内容概览 - 数据湖探索 DLI

增强型跨源连接类 - 数据湖探索 DLI

count函数如何进行聚合 - 数据湖探索 DLI

查看赋权对象使用者权限信息 - 数据湖探索 DLI

DLI弹性资源池和队列类 - 数据湖探索 DLI

执行查询语句报错：The current account does not have permission to perform this operation,the current account was restricted. Restricted for - 数据湖探索 DLI

获取服务端连接地址 - 数据湖探索 DLI

Flink jobmanager日志一直报Timeout expired while fetching topic metadata怎么办？ - 数据湖探索 DLI

怎样查看弹性资源池和作业的资源使用情况？ - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线