搜索_华为云

优化数据倾斜场景下的Spark SQL性能 - MapReduce服务 MRS

示例：执行下面SQL语句，a表倾斜或b表倾斜都无法触发该优化。 select aid FROM a FULL OUTER JOIN b ON aid=bid; 不支持LEFT OUTER JOIN的右表倾斜处理。示例：执行下面SQL语句，b表倾斜无法触发该优化。 select aid FROM

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
扩容MRS集群 - MapReduce服务 MRS
扩容MRS集群 - MapReduce服务 MRS

群，也不建议重启集群和修改集群配置。扩容成功：集群扩容成功后集群状态为“运行中”，计费会按照新增节点加上已有节点使用的资源计算。扩容失败：集群扩容失败时集群状态为“运行中”。用户可以执行作业，也可以重新进行扩容操作。扩容成功后，可以在集群详情的“节点管理”页签查看集群的节点信息。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群容量调整
窗口函数 - MapReduce服务 MRS
窗口函数 - MapReduce服务 MRS

Functions 所有的聚合函数都能通过添加over子句来当做窗口函数使用。聚合函数将在当前窗口框架下的每行记录进行运算。下面的查询生成每个职员按天计算的订单价格的滚动总和。 select dept,userid,sal,sum(sal) over (partition by dept

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
spark.yarn.executor.memoryOverhead设置不生效如何处理？ - MapReduce服务 MRS

Spark任务需要调整executor的overhead内存，设置了参数spark.yarn.executor.memoryOverhead=4096，但实际计算的时候依旧按照默认值1024申请资源。原因分析从Spark 2.3版本开始，推荐使用新参数spark.executor.memoryO

帮助中心 > MapReduce服务 MRS > 常见问题 > 性能优化类
自动续费 - MapReduce服务 MRS
自动续费 - MapReduce服务 MRS

续费的规则如下所述：以MRS集群的到期日计算第一次自动续费日期和计费周期。 MRS集群自动续费周期根据您开通自动续费的途径不同，遵循不同的规则。在MRS集群到期前均可开通自动续费，到期前7日凌晨3:00首次尝试自动续费，如果扣款失败，每天凌晨3:00尝试一次，直至MRS集群到期或者续费成功。

帮助中心 > MapReduce服务 MRS > 计费说明 > 续费
配置HetuEngine物化视图推荐能力 - MapReduce服务 MRS

感知、自动学习、自动诊断服务，开启物化视图推荐能力后，系统能自动学习并推荐对业务最有价值的物化视图SQL，使HetuEngine具备自动预计算加速能力，在相关场景下在线查询效率获得倍数提升，同时有效降低系统负载压力。前提条件集群运行正常并至少安装一个QAS实例。已创建用于访问HetuEngine

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 配置HetuEngine物化视图
配置HDFS DiskBalancer磁盘均衡 - MapReduce服务 MRS

长时间运行的集群会因为曾经删除过大量的文件，或者集群中的节点做磁盘扩容等操作导致节点上出现磁盘间数据不均衡的现象。磁盘间数据不均衡会引起HDFS整体并发读写性能的下降或者因为不恰当的HDFS写策略导致业务故障。此时需要平衡节点磁盘间的数据密度，防止异构的小磁盘成为该节点的性能瓶颈。本章节适用于MRS

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS
规划HDFS容量 - MapReduce服务 MRS
规划HDFS容量 - MapReduce服务 MRS

DataNode以Block的形式，保存用户的文件和目录，同时在NameNode中生成一个文件对象，对应DataNode中每个文件、目录和Block。 NameNode文件对象需要占用一定的内存，消耗内存大小随文件对象的生成而线性递增。DataNode实际保存的文件和目录越多，NameNode

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS运维管理
Spark Streaming性能调优 - MapReduce服务 MRS

生产环境中是不能关闭的。日志归档调优参数“spark.eventLog.group.size”用来设置一个应用的JobHistory日志按照指定job个数分组，每个分组会单独创建一个文件记录日志，从而避免应用长期运行时形成单个过大日志造成JobHistory无法读取的问题，设置为“0”时表示不分组。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本）
Presto - MapReduce服务 MRS
Presto - MapReduce服务 MRS

为Worker1，Worker2，Worker3… ，多个Worker实例共同与Coordinator交互执行计算任务，相比较单实例，能够大大提高节点资源的利用率和计算效率。 Presto多实例仅作用于ARM架构规格，当前单节点最多支持4个实例。更多Presto部署信息请参考：https://prestodb

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍
退订MRS包周期集群指定节点 - MapReduce服务 MRS

若节点隔离/退服失败，请登录Manager，单击在任务列表中查询并单击隔离/退服主机失败的任务名，根据界面提示信息处理。在集群详情页选择“节点管理 > 退订节点”。选择需要退订的节点并单击“确定”。目前一次操作最多可以退订20个Core节点，退订后的Core节点数不能小于2。图1

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群容量调整
Bitwise函数 - MapReduce服务 MRS
Bitwise函数 - MapReduce服务 MRS

Bitwise函数 bit_count(x, bits) → bigint 计算2的补码表示法中x中设置的位数（视为有符号位的整数）。 SELECT bit_count(9, 64); -- 2 SELECT bit_count(9, 8); -- 2 SELECT bit_count(-7

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
Flink常用配置参数 - MapReduce服务 MRS

pool-size-factor 计算线程池大小的因子，计算公式：ceil（可用处理器*因子），计算结果限制在pool-size-min和pool-size-max之间。 1.0 否 akka.client-socket-worker-pool.pool-size-max 基于因子计算的线程数上限。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink运维管理
ALM-12017 磁盘容量不足 - MapReduce服务 MRS

Condition 系统当前指标取值满足自定义的告警设置条件。对系统的影响业务失败：磁盘容量不足时，如果需要修改或使用该磁盘上的数据，可能会导致作业运行失败。可能原因告警阈值配置不合理。磁盘配置无法满足业务需求，磁盘使用率达到上限。处理步骤检查阈值设置是否合理。在FusionInsight

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
更换CA证书 - MapReduce服务 MRS
更换CA证书 - MapReduce服务 MRS

mv server.cer ca.crt mv server_key.pem ca.key 若由集群用户生成，执行以下命令在管理节点的omm用户目录生成证书文件和密钥文件：生成密钥文件：执行以下命令，查看OpenSSL的版本是否为1.1.1及之后版本。 /usr/bin/openssl

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群安全配置 > 更换MRS集群证书
MapReduce应用开发简介 - MapReduce服务 MRS

最后返回给客户端。通常作业的输入和输出都会被存储在文件系统中。整个框架负责任务的调度和监控，以及重新执行已经失败的任务。 MapReduce主要特点如下：大规模并行计算适用于大型数据集高容错性和高可靠性合理的资源调度父主题： MapReduce应用开发概述

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > MapReduce开发指南 > MapReduce应用开发概述
Yarn节点配置调优 - MapReduce服务 MRS

MRS 3.x及之后：16384 MRS 3.x之前：8192 CPU虚拟核数建议将此配置设定在逻辑核数的1.5～2倍之间。如果上层计算应用对CPU的计算能力要求不高，可以配置为2倍的逻辑CPU。参数描述默认值 yarn.nodemanager.resource.cpu-vcores

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Yarn > Yarn性能调优
补丁基本信息说明 - MapReduce服务 MRS

Spark执行任务时，报错Ranger策略为空，导致批量Spark任务失败。各组件日志默认保留数量和大小太少，无法支撑问题定位。 SparkSQL任务进行Ranger鉴权，偶发鉴权失败。解决HBase问题： HBase在大量写入的场景下，回收站会被打满不能及清理导致磁盘空间不被释放。 [HBASE-27580]

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群补丁说明 > MRS 3.3.0-LTS.1.1补丁说明
ALM-50209 生成元数据镜像文件失败的次数超过阈值 - MapReduce服务 MRS

ALM-50209 生成元数据镜像文件失败的次数超过阈值告警解释系统每30秒周期性检查FE节点生成元数据镜像文件失败的次数，当检查到失败的次数超出阈值（默认值为1）时产生该告警。当系统检查到FE节点生成元数据镜像文件失败的次数低于阈值时，告警清除。告警属性告警ID 告警级别

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
Spark Scala API接口介绍 - MapReduce服务 MRS

U): RDD[U] 对调用map的RDD数据集中的每个element都使用f方法，生成新的RDD。 filter(f: (T) => Boolean): RDD[T] 对RDD中所有元素调用f方法，生成将满足条件数据集以RDD形式返回。 flatMap[U](f: (T) => T

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > Spark应用开发常见问题 > Spark常用API介绍

总条数： 3161

上一页
1
...
11
12
13
...
159
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

优化数据倾斜场景下的Spark SQL性能 - MapReduce服务 MRS

扩容MRS集群 - MapReduce服务 MRS

窗口函数 - MapReduce服务 MRS

spark.yarn.executor.memoryOverhead设置不生效如何处理？ - MapReduce服务 MRS

自动续费 - MapReduce服务 MRS

配置HetuEngine物化视图推荐能力 - MapReduce服务 MRS

配置HDFS DiskBalancer磁盘均衡 - MapReduce服务 MRS

规划HDFS容量 - MapReduce服务 MRS

Spark Streaming性能调优 - MapReduce服务 MRS

Presto - MapReduce服务 MRS

退订MRS包周期集群指定节点 - MapReduce服务 MRS

Bitwise函数 - MapReduce服务 MRS

Flink常用配置参数 - MapReduce服务 MRS

ALM-12017 磁盘容量不足 - MapReduce服务 MRS

更换CA证书 - MapReduce服务 MRS

MapReduce应用开发简介 - MapReduce服务 MRS

Yarn节点配置调优 - MapReduce服务 MRS

补丁基本信息说明 - MapReduce服务 MRS

ALM-50209 生成元数据镜像文件失败的次数超过阈值 - MapReduce服务 MRS

Spark Scala API接口介绍 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线