搜索_华为云

如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 - 数据湖探索 DLI

partitions参数提高并行度操作场景 Spark作业在执行shuffle类语句，包括group by、join等场景时，常常会出现数据倾斜的问题，导致作业任务执行缓慢。该问题可以通过设置spark.sql.shuffle.partitions提高shuffle read

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
Flink Jar作业是否支持上传配置文件，要如何操作？ - 数据湖探索 DLI

fileName为需要访问的文件名。本节示例适用于Flink 1.12版本。Flink 1.15版本的Jar作业开发指导请参考Flink Jar写入数据到OBS开发指南。配置文件使用方法方案一：直接在main函数里面加载文件内容到内存，然后广播到各个taskmanager，这种方式适合那种需要提前加载的少量变量。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
怎样查看弹性资源池和作业的资源使用情况？ - 数据湖探索 DLI

怎样查看弹性资源池和作业的资源使用情况？在大数据分析的日常工作中，合理分配和管理计算资源，可以提供良好的作业执行环境。您可以根据作业的计算需求和数据规模分配资源、调整任务执行顺序，调度不同的弹性资源池或队列资源以适应不同的工作负载。待提交作业所需的CUs需小于等于弹性资源池的

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI弹性资源池和队列类
运行Spark作业报java.lang.AbstractMethodError - 数据湖探索 DLI

运行Spark作业报java.lang.AbstractMethodError Spark 2.3对内部接口Logging做了行为变更，如果用户代码里直接继承了该Logging，且编译时使用的是低版本的Spark，那么应用程序在Spark 2.3的环境中运行将会报java.lang

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
SQL作业运行报错：DLI.0002 FileNotFoundException - 数据湖探索 DLI

SQL作业运行报错：DLI.0002 FileNotFoundException 问题现象 SQL作业执行报错，报错信息大致如下： Please contact DLI service. DLI.0002: FileNotFoundException: getFileStatus

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
DDL语法定义 - 数据湖探索 DLI
DDL语法定义 - 数据湖探索 DLI

DDL语法定义 CREATE TABLE语句 CREATE CATALOG语句 CREATE DATABASE语句 CREATE VIEW语句 CREATE FUNCTION语句父主题： SQL语法约束与定义

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > SQL语法约束与定义
弹性资源池CU设置 - 数据湖探索 DLI

弹性资源池CU设置 CU设置主要是为了控制弹性资源池扩缩容的最大最小CU范围，避免无限制的资源扩容风险。例如，当前弹性资源池CU设置的最大CU为256CU，并且该弹性资源池添加了2个队列，2个队列扩缩容策略最小CU数为64CU，这时如果该弹性资源池再添加一个队列并且该队列最小C

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
跨源访问MRS HBase，连接超时，日志未打印错误怎么办？ - 数据湖探索 DLI

修改主机信息”，在弹出的对话框中，填写主机信息。格式：“IP 主机名/域名”，多条信息之间以换行分隔。 MRS主机信息获取，详细请参考《数据湖探索用户指南》中的“修改主机信息”章节描述。父主题：增强型跨源连接类

 帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
DLI增强型跨源连接DWS失败怎么办？ - 数据湖探索 DLI

0/0，端口8000，仍然无法连接，继续排查子网配置。客户的DWS子网关联了网络ACL。网络ACL是一个子网级别的可选安全层，通过与子网关联的出方向/入方向规则控制出入子网的数据流。关联子网后，网络ACL默认拒绝所有出入子网的流量，直至添加放通规则。通过检查，发现其DWS所在子网关联的ACL是空值。因此，问题的原

 帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
创建非弹性资源池队列（废弃，不推荐使用） - 数据湖探索 DLI

AZ策略采用双AZ策略创建的队列，当某个AZ不可用时，仍然能够从其他AZ正常访问数据，适用于对可用性要求较高的场景。说明：当前包年/包月计费模式和按需计费专属资源模式支持双AZ策略。双AZ能提高您的数据可用性。双AZ属性一旦启用，后续无法修改。 CPU架构 X86 鲲鹏规格

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
Flink Opensource SQL如何解析复杂嵌套 JSON？ - 数据湖探索 DLI

13:13:13,1997-04-25T14:14:14,{flink=123},123,{inner_map={key=234}},234) 各数据类型获取元素的方法： - map：map['key'] - array：array[index] - row：row.key array 的起始下标从

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
手动停止了Flink作业，再次启动时怎样从指定Checkpoint恢复？ - 数据湖探索 DLI

手动停止了Flink作业，再次启动时怎样从指定Checkpoint恢复？问题现象在创建Flink作业时开启了Checkpoint，指定了Checkpoint保存的OBS桶。手工停止Flink作业后，再次启动该Flink作业怎样从指定Checkpoint恢复。解决方案由于Flink

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业咨询类
二进制函数和运算符 - 数据湖探索 DLI

VVVV from_base64url(string) → varbinary 使用URL安全字符，将base64编码的string解码为二进制数据。 select from_base64url('helloworld'); -- 85 e9 65 a3 0a 2b 95 to_hex(binary)

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
DLI datasourceV1表和datasourceV2表 - 数据湖探索 DLI

v1表（以下简称V1表）：DLI的Datasource表格式，建表/插入/truncate命令使用DLI自定义的command，表的数据路径为$tablepath/UUID/数据文件。图1 DLI datasource v1表 DLI datasource v2表（以下简称V2表）：spark

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
获取Spark作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

仅支持获取AK、SK、SecurityToken。获取到AK、SK、SecurityToken后，请参考如何使用凭据管理服务替换硬编码的数据库账号密码查询凭据。约束限制仅支持Spark3.3.1版本（Spark通用队列场景）使用委托授权访问临时凭证：在创建作业时，请配置作业使用Spark3

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
初始化DLI客户端 - 数据湖探索 DLI

初始化DLI客户端使用DLI Python SDK工具访问DLI，需要用户初始化DLI客户端。用户可以使用AK/SK(Access Key ID/Secret Access Key)或Token两种认证方式初始化客户端，示例代码如下。完整样例代码和依赖包说明请参考：Python

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
批量删除队列定时扩缩容计划（废弃） - 数据湖探索 DLI

批量删除队列定时扩缩容计划（废弃）功能介绍该API用于批量删除队列定时扩缩容计划。当前接口已废弃，不推荐使用。调试您可以在API Explorer中调试该接口。 URI URI格式： POST /v1/{project_id}/queues/{queue_name}/plans/batch-delete

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 队列相关API（废弃）
单个删除队列定时扩缩容计划（废弃） - 数据湖探索 DLI

单个删除队列定时扩缩容计划（废弃）功能介绍该API用于删除指定ID的队列定时扩缩容计划。当前接口已废弃，不推荐使用。调试您可以在API Explorer中调试该接口。 URI URI格式： DELETE /v1/{project_id}/queues/{queue_name}/plans/{plan_id}

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 队列相关API（废弃）
为什么SQL作业一直处于“提交中”？ - 数据湖探索 DLI

为什么SQL作业一直处于“提交中”？ SQL作业一直在提交中，有以下几种可能：刚购买DLI队列后，第一次进行SQL作业的提交。需要等待5~10分钟，待后台拉起集群后，即可提交成功。若刚刚对队列进行网段修改，立即进行SQL作业的提交。需要等待5~10分钟，待后台重建集群后，即可提交功。

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
在DLI使用Delta提交Spark Jar作业 - 数据湖探索 DLI

在DLI使用Delta提交Spark Jar作业 1. 添加如下依赖 <dependency> <groupId>io.delta</groupId> <artifactId>delta-core_2.12</artifactId> <version>2.3

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > DLI中使用Delta开发作业

总条数： 1508

上一页
1
...
70
71
72
...
76
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 - 数据湖探索 DLI

Flink Jar作业是否支持上传配置文件，要如何操作？ - 数据湖探索 DLI

怎样查看弹性资源池和作业的资源使用情况？ - 数据湖探索 DLI

运行Spark作业报java.lang.AbstractMethodError - 数据湖探索 DLI

SQL作业运行报错：DLI.0002 FileNotFoundException - 数据湖探索 DLI

DDL语法定义 - 数据湖探索 DLI

弹性资源池CU设置 - 数据湖探索 DLI

跨源访问MRS HBase，连接超时，日志未打印错误怎么办？ - 数据湖探索 DLI

DLI增强型跨源连接DWS失败怎么办？ - 数据湖探索 DLI

创建非弹性资源池队列（废弃，不推荐使用） - 数据湖探索 DLI

Flink Opensource SQL如何解析复杂嵌套 JSON？ - 数据湖探索 DLI

手动停止了Flink作业，再次启动时怎样从指定Checkpoint恢复？ - 数据湖探索 DLI

二进制函数和运算符 - 数据湖探索 DLI

DLI datasourceV1表和datasourceV2表 - 数据湖探索 DLI

获取Spark作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

初始化DLI客户端 - 数据湖探索 DLI

批量删除队列定时扩缩容计划（废弃） - 数据湖探索 DLI

单个删除队列定时扩缩容计划（废弃） - 数据湖探索 DLI

为什么SQL作业一直处于“提交中”？ - 数据湖探索 DLI

在DLI使用Delta提交Spark Jar作业 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线