搜索_华为云

Yarn节点配置调优 - MapReduce服务 MRS

MRS 3.x及之后：16384 MRS 3.x之前：8192 CPU虚拟核数建议将此配置设定在逻辑核数的1.5～2倍之间。如果上层计算应用对CPU的计算能力要求不高，可以配置为2倍的逻辑CPU。参数描述默认值 yarn.nodemanager.resource.cpu-vcores

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Yarn > Yarn性能调优
HDFS开源增强特性 - MapReduce服务 MRS

据传输，使得Join计算的性能大大降低，该过程如图1所示：图1 无同分布数据传输流程由于数据表文件是以HDFS Block方式存放在物理文件系统中，如果能把两个需要Join的文件数据块按Join Key分区后，一一对应地放在同一台机器上，则在Join计算的Reduce过程中无需传递数据，直接在节点本地做Map

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > HDFS
Spark Core内存调优 - MapReduce服务 MRS

查看CPU使用情况和内存占用情况，当任务和数据不是平均分布在各节点，而是集中在个别节点时，可以增大并行度使任务和数据更均匀的分布在各个节点。增加任务的并行度，充分利用集群机器的计算能力，一般并行度设置为集群CPU总和的2-3倍。操作步骤并行度可以通过如下三种方式来设置，用户可以根据实际的内存、CPU、数据以及应用程序逻辑的情况调整并行度参数。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core性能调优
通过Spark Streaming作业消费Kafka数据 - MapReduce服务 MRS

景的开发思路：接收Kafka中数据，生成相应DStream。对单词记录进行分类统计。计算结果，并进行打印。方案架构 Spark Streaming是一种构建在Spark上的实时计算框架，扩展了Spark处理大规模流式数据的能力。当前Spark支持两种数据处理方式：Direct

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
MRS集群支持的云服务器规格 - MapReduce服务 MRS

针对不同的应用场景，MRS使用到如下类型的弹性云服务器。通用计算增强型：C3型、C3ne型、C6型、C6s型、C7型内存优化型：M3型、M6型、M7型超高I/O型：I3型、IR3型鲲鹏内存优化型：KM1型鲲鹏超高I/O型：KI1型鲲鹏通用计算增强型：KC1型针对不同的应用场景，MRS使用到如下实例的裸金属服务器。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群规划 > MRS集群部署说明
Spark Streaming对接Kafka0-10样例程序开发思路 - MapReduce服务 MRS

开发思路场景说明假定某个业务Kafka每1秒就会收到1个单词记录。基于某些业务要求，开发的Spark应用程序实现如下功能：实时累加计算每个单词的记录总数。 “log1.txt”示例文件： LiuYang YuanJing GuoYijun CaiXuyu Liyuan FangBo

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark Streaming对接Kafka0-10样例程序
Spark Streaming任务一直阻塞 - MapReduce服务 MRS

ark Streaming都没有触发数据计算的任务（Spark Streaming默认有两个尝试运行的Job，就是图中两个）图2 Completed Jobs 回答经过定位发现，导致这个问题的原因是：Spark Streaming的计算核数少于Receiver的个数，导致部分

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > Spark Streaming
Spark Streaming对接Kafka0-10样例程序开发思路 - MapReduce服务 MRS

开发思路场景说明假定某个业务Kafka每1秒就会收到1个单词记录。基于某些业务要求，开发的Spark应用程序实现如下功能：实时累加计算每个单词的记录总数。 “log1.txt”示例文件： LiuYang YuanJing GuoYijun CaiXuyu Liyuan FangBo

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark Streaming对接Kafka0-10样例程序
Spark Streaming任务一直阻塞 - MapReduce服务 MRS

ark Streaming都没有触发数据计算的任务（Spark Streaming默认有两个尝试运行的Job，就是图中两个）图2 Completed Jobs 回答经过定位发现，导致这个问题的原因是：Spark Streaming的计算核数少于Receiver的个数，导致部分

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > Spark Streaming
配置Hive对接MemArtsCC - MapReduce服务 MRS

配置Hive对接MemArtsCC 操作场景本章节介绍在存算分离场景下如何配置Hive任务中集成MemArtsCC缓存，MemArtsCC会在将热点数据存储在计算侧集群，可以起到降低OBS服务端带宽的作用，利用MemArtsCC的本地存储，访问热点数据不必跨网络，可以提升Hive的数据读取效率。前提条件

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用MemArtsCC
配置Flink任务并行度 - MapReduce服务 MRS

查看CPU使用情况和内存占用情况，当任务和数据不是平均分布在各节点，而是集中在个别节点时，可以增大并行度使任务和数据更均匀的分布在各个节点。增加任务的并行度，充分利用集群机器的计算能力。操作步骤任务的并行度可以通过以下四种层次（按优先级从高到低排列）指定，用户可以根据实际的内存、CPU、数据以及应用程序逻辑的情况调整并行度参数。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flink > Flink性能调优
设置Spark Core并行度 - MapReduce服务 MRS

查看CPU使用情况和内存占用情况，当任务和数据不是平均分布在各节点，而是集中在个别节点时，可以增大并行度使任务和数据更均匀的分布在各个节点。增加任务的并行度，充分利用集群机器的计算能力，一般并行度设置为集群CPU总和的2-3倍。操作步骤并行度可以通过如下三种方式来设置，用户可以根据实际的内存、CPU、数据以及应用程序逻辑的情况调整并行度参数。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优
添加MRS节点引导操作安装第三方软件 - MapReduce服务 MRS

添加MRS节点引导操作安装第三方软件引导操作安装第三方软件前提条件已参考准备MRS节点引导操作脚本准备好引导操作脚本。创建集群时添加引导操作进入购买MRS集群页面。在购买集群页面，选择“自定义购买”。参考自定义购买MRS集群配置集群软件配置和硬件配置信息。在“高级配

 帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群节点 > 配置MRS集群节点引导操作
修改MRS集群系统域名 - MapReduce服务 MRS

在“概览”页签下的“基本信息”区域，单击“HSConsole WebUI”后的链接，进入HSConsole界面。对于运行中的计算实例，在实例的“操作”列单击“停止”，待计算实例处于“已停止”状态后，再单击“启动”重启计算实例。父主题：集群互信管理

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群安全配置 > 集群互信管理
设置并行度 - MapReduce服务 MRS
设置并行度 - MapReduce服务 MRS

查看CPU使用情况和内存占用情况，当任务和数据不是平均分布在各节点，而是集中在个别节点时，可以增大并行度使任务和数据更均匀的分布在各个节点。增加任务的并行度，充分利用集群机器的计算能力，一般并行度设置为集群CPU总和的2-3倍。操作步骤并行度可以通过如下三种方式来设置，用户可以根据实际的内存、CPU、数据以及应用程序逻辑的情况调整并行度参数。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > Spark Core调优
配置Flink任务并行度 - MapReduce服务 MRS

查看CPU使用情况和内存占用情况，当任务和数据不是平均分布在各节点，而是集中在个别节点时，可以增大并行度使任务和数据更均匀的分布在各个节点。增加任务的并行度，充分利用集群机器的计算能力。操作步骤任务的并行度可以通过以下四种层次（按优先级从高到低排列）指定，用户可以根据实际的内存、CPU、数据以及应用程序逻辑的情况调整并行度参数。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink性能调优
HyperLogLog函数 - MapReduce服务 MRS
HyperLogLog函数 - MapReduce服务 MRS

nct()，即每个元素出现的近似次数，进而通过很小的开销去完成整个查询。例如，只要计算每日每个用户浏览了多少次网页，就可以通过累加的方式，去计算每周、每年对应的数据，类似于通过汇总每日收入来计算每周收入。可以将approx_distinct()与GROUPING SETS一起

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
配置在Spark对接MemArtsCC - MapReduce服务 MRS

配置在Spark对接MemArtsCC 操作场景本章节介绍在存算分离场景下如何配置Spark任务中集成MemArtsCC缓存，MemArtsCC会在将热点数据存储在计算侧集群，可以起到降低OBS服务端带宽的作用，利用MemArtsCC的本地存储，访问热点数据不必跨网络，可以提升Spark的数据读取效率。前提条件

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用MemArtsCC
LakeFormation概述 - MapReduce服务 MRS

要注意以下约束限制： MRS集群和LakeFormation实例必须同在一个云账户下且属于同一个Region。 LakeFormation侧创建的接入客户端所在虚拟私有云，必须与MRS集群在同一虚拟私有云下。 MRS集群仅支持对接LakeFormation实例中名称为hive的Catalog。

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群元数据 > 配置LakeFormation数据连接
MRS所使用的弹性云服务器规格 - MapReduce服务 MRS

针对不同的应用场景，MRS使用到如下类型的弹性云服务器。通用计算增强型：C3型、C3ne型、C6型、C6s型、C7型内存优化型：M3型、M6型、M7型超高I/O型：I3型、IR3型鲲鹏内存优化型：KM1型鲲鹏超高I/O型：KI1型鲲鹏通用计算增强型：KC1型规格命名规则 AB.C.D

帮助中心 > MapReduce服务 MRS > API参考 > 附录

总条数： 2534

上一页
1
...
10
11
12
...
127
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Yarn节点配置调优 - MapReduce服务 MRS

HDFS开源增强特性 - MapReduce服务 MRS

Spark Core内存调优 - MapReduce服务 MRS

通过Spark Streaming作业消费Kafka数据 - MapReduce服务 MRS

MRS集群支持的云服务器规格 - MapReduce服务 MRS

Spark Streaming对接Kafka0-10样例程序开发思路 - MapReduce服务 MRS

Spark Streaming任务一直阻塞 - MapReduce服务 MRS

Spark Streaming对接Kafka0-10样例程序开发思路 - MapReduce服务 MRS

Spark Streaming任务一直阻塞 - MapReduce服务 MRS

配置Hive对接MemArtsCC - MapReduce服务 MRS

配置Flink任务并行度 - MapReduce服务 MRS

设置Spark Core并行度 - MapReduce服务 MRS

添加MRS节点引导操作安装第三方软件 - MapReduce服务 MRS

修改MRS集群系统域名 - MapReduce服务 MRS

设置并行度 - MapReduce服务 MRS

配置Flink任务并行度 - MapReduce服务 MRS

HyperLogLog函数 - MapReduce服务 MRS

配置在Spark对接MemArtsCC - MapReduce服务 MRS

LakeFormation概述 - MapReduce服务 MRS

MRS所使用的弹性云服务器规格 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线