搜索_华为云

Spark SQL常用配置项说明 - 数据湖探索 DLI

join操作，并且表有大量的动态分区时，这可能会导致在数据解析时消耗大量的内存资源，导致Driver节点的内存不足，并触发频繁的Full GC。在这种情况下，可以配置该参数为false即禁用动态分区修剪优化，有助于减少内存使用，避免内存溢出和频繁的Full GC。但禁用此优化可能会降低查询性

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
离线Compaction配置 - 数据湖探索 DLI

该至少半小时调度一次。 Compaction作业配置的资源，vcore数至少要大于等于单个分区的桶数，vcore数与内存的比例应为1：4即1个vcore配4G内存。父主题： Bucket调优示例

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
查询作业状态 - 数据湖探索 DLI

作业开始的时间。是单位为“毫秒”的时间戳。 duration Long 作业运行时长，单位毫秒。 status String 此作业的当前状态，包含运行中（RUNNING）、规格变更中（SCALING）、提交中（LAUNCHING）、已完成（FINISHED）、已失败（FAILED）、已取消（CANCELLED）。 input_row_count

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

读取数据时，每一批次获取数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 batchsize 写入数据时，每一批次写入数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 truncate 执行overwrite

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
DLI Flink与MRS Flink有什么区别？ - 数据湖探索 DLI

支持对接企业内部统一监控告警系统（prometheus）。支持Flink作业速率、输入输出数据量、作业算子反压值、算子延迟、作业cpu和内存使用率查看。仅支持Flink UI 多版本支持支持不同作业使用不同Flink版本单Flink集群仅支持单版本下的作业开发易用性即

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
修改队列网段（废弃） - 数据湖探索 DLI

指定修改网段的队列名称。请求消息表2 请求参数参数名称是否必选参数类型说明 cidr_in_vpc 否 String 队列虚拟私有云网段。不同CU规格队列支持的网段范围： 16cu: 10.0.0.0/8 ~ 10.255.255.0/24 172.16.0.0/12 ~ 172.31.255

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 队列相关API（废弃）
Spark 3.1.1版本说明 - 数据湖探索 DLI

Spark 3.1.1版本说明数据湖探索（DLI）遵循开源Spark计算引擎的发布一致性。本文介绍Spark 3.1.1版本所做的变更说明。更多Spark 3.1.1版本说明请参考Spark Release Notes。 Spark 3.1.1版本发布时间版本名称发布时间

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
Hudi常见配置参数 - 数据湖探索 DLI

当CompactedLogScanner合并所有日志文件时，此配置有助于选择是否应延迟读取日志块。选择true以使用I/O密集型延迟块读取（低内存使用），或者为false来使用内存密集型立即块读取（高内存使用）。 true hoodie.compaction.reverse.log.read HoodieLogF

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
创建并提交SQL作业 - 数据湖探索 DLI

创建并提交SQL作业 SQL编辑器简介 SQL作业编辑器支持使用SQL语句执行数据查询操作。支持SQL2003，兼容SparkSQL，详细语法描述请参见《数据湖探索SQL语法参考》。在总览页面，单击左侧导航栏中的“SQL编辑器”或SQL作业简介右上角的“创建作业”，可进入“SQL编辑器”页面。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
Spark作业开发类 - 数据湖探索 DLI

partitions参数提高并行度 Spark jar 如何读取上传文件添加Python包后，找不到指定的Python环境为什么Spark jar 作业一直处于“提交中”？父主题： Spark作业相类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类
怎样升级DLI作业的引擎版本 - 数据湖探索 DLI

怎样升级DLI作业的引擎版本 DLI提供了Spark和Flink计算引擎，为用户提供了一站式的流处理、批处理、交互式分析的Serverless融合处理分析服务，当前，Flink计算引擎推荐版本：Flink 1.15，Spark计算引擎推荐版本： Spark 3.3.1。本节操作介绍如何升级作业的引擎版本。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
查看Flink作业详情 - 数据湖探索 DLI

展示用户Flink作业字节的输出总数。单位：字节。 Flink作业CPU使用率展示用户Flink作业的CPU使用率。单位：%。 Flink作业内存使用率展示用户Flink作业的内存使用率。单位：%。 Flink作业最大算子延迟展示用户Flink作业的最大算子延迟时间，单位ms。 Flink作业最大算子反压

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
导入数据 - 数据湖探索 DLI
导入数据 - 数据湖探索 DLI

MAXCOLUMNS 2000 20000 设置MAXCOLUMNS Option的值后，导入数据会对executor的内存有要求，所以导入数据可能会由于executor内存不足而失败。 DATEFORMAT：指定列的日期格式。 OPTIONS('DATEFORMAT'='dateFormat')

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
DLI“包年/包月”和“按需计费”计费模式队列和“队列CU时套餐包”下线（EOL）公告 - 数据湖探索 DLI

按需计费模式：按弹性资源池的实际CUs计费。包年/包月计费模式：按弹性资源池的实际CUs计费，其中规格部分包年/包月，超出规格的部分按需计费。弹性资源池CU时套餐包：按购买的套餐包周期价格扣费，其中套餐包内的规格包周期计费，超出套餐包规格的部分按需计费。更多弹性资源池计费信息请参考弹性资源池计费。怎样创建“弹性资源池队列”？

帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
对象存储OBS源表 - 数据湖探索 DLI

设置新文件的监控时间间隔，并且必须设置 > 0 的值。每个文件都有其路径唯一标识，一旦发现新文件，就会处理一次。已处理的文件在 source 的整个生命周期内存储在 state 中，因此，source 的 state 在 checkpoint 和 savepoint 时进行保存。更短的时间间隔意

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > 对象存储OBS
包年包月弹性资源池设置了定时扩缩容时，怎样计费？ - 数据湖探索 DLI

现使用过程中大部分时间CU数在128CU以上（假设每天累计12个小时实际CUs为128CUs，超出规格64CUs。），因此在2023/03/10 15:50:04变更弹性资源池规格为128CU。弹性资源池计费详情请参见数据湖探索价格详情。价格仅供参考，实际计算请以数据湖探索价格详情中的价格为准。

帮助中心 > 数据湖探索 DLI > 计费说明 > 计费相关问题
查询作业模板列表 - 数据湖探索 DLI

name String 创建时用户指定的批处理名称，不能超过128个字符。 driverMemory String Spark应用的Driver内存，参数配置例如2G, 2048M。该配置项会替换“sc_type”中对应的默认参数，使用时必需带单位，否则会启动失败。 driverCores

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业模板相关API
查询批处理作业状态 - 数据湖探索 DLI

"state":"Success"} 状态码状态码如表3所示。表3 状态码状态码描述 200 查询成功。 400 请求错误。 500 内部服务器错误。错误码调用接口出错后，将不会返回上述结果，而是返回错误码和错误信息，更多介绍请参见错误码。父主题： Spark作业相关API

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
查询队列详情 - 数据湖探索 DLI

resource_type 否 String 资源类型。 vm：ecf集群 container：容器化集群（k8s） cu_spec 否 Integer 队列的规格大小。对于包周期队列，表示包周期部分的CU值；对于按需队列，表示用户购买队列时的初始值。 cu_scale_out_limit 否 Integer

帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
取消批处理作业 - 数据湖探索 DLI

"msg": "deleted" } 状态码状态码如表3所示。表3 状态码状态码描述 200 删除成功。 400 请求错误。 500 内部服务器错误。错误码调用接口出错后，将不会返回上述结果，而是返回错误码和错误信息，更多介绍请参见错误码。父主题： Spark作业相关API

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API

总条数： 279

上一页
1
2
3
4
5
...
14
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark SQL常用配置项说明 - 数据湖探索 DLI

离线Compaction配置 - 数据湖探索 DLI

查询作业状态 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

DLI Flink与MRS Flink有什么区别？ - 数据湖探索 DLI

修改队列网段（废弃） - 数据湖探索 DLI

Spark 3.1.1版本说明 - 数据湖探索 DLI

Hudi常见配置参数 - 数据湖探索 DLI

创建并提交SQL作业 - 数据湖探索 DLI

Spark作业开发类 - 数据湖探索 DLI

怎样升级DLI作业的引擎版本 - 数据湖探索 DLI

查看Flink作业详情 - 数据湖探索 DLI

导入数据 - 数据湖探索 DLI

DLI“包年/包月”和“按需计费”计费模式队列和“队列CU时套餐包”下线（EOL）公告 - 数据湖探索 DLI

对象存储OBS源表 - 数据湖探索 DLI

包年包月弹性资源池设置了定时扩缩容时，怎样计费？ - 数据湖探索 DLI

查询作业模板列表 - 数据湖探索 DLI

查询批处理作业状态 - 数据湖探索 DLI

查询队列详情 - 数据湖探索 DLI

取消批处理作业 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线