搜索_华为云

配置HDFS DataNode数据均衡 - MapReduce服务 MRS

情况，比如集群中添加新数据节点的场景。如果HDFS出现数据不平衡的状况，可能导致多种问题，比如MapReduce应用程序无法很好地利用本地计算的优势、数据节点之间无法达到更好的网络带宽使用率或节点磁盘无法利用等等。所以MRS集群管理员需要定期检查并保持DataNode数据平衡。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS
提交Spark任务到新增Task节点 - MapReduce服务 MRS

添加子租户。当选中“非叶子租户”时表示当前租户可以再添加子租户。计算资源选择“Yarn”，系统将自动在Yarn中以租户名称创建任务队列。计算资源不选择“Yarn”时，系统不会自动创建任务队列。配置模式计算资源选择“Yarn”时，“配置模式”可选“基础”或“高级”。基础：需配置“默认资源池容量

 帮助中心 > MapReduce服务 MRS > 最佳实践 > MRS集群管理
使用Hive加载OBS数据并分析企业雇员信息 - MapReduce服务 MRS

查询使用以“cn”结尾的邮箱的员工信息。方案架构 Hive是建立在Hadoop上的数据仓库框架，提供大数据平台批处理计算能力，能够对结构化/半结构化数据进行批量分析汇总完成数据计算。提供类似SQL的Hive Query Language语言操作结构化数据，其基本原理是将HQL语言自动转换

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
ALM-14038 Router堆内存使用率超过阈值 - MapReduce服务 MRS

ALM-14038 Router堆内存使用率超过阈值告警解释系统每30秒周期性检测HDFS Router堆内存使用大小和能够分配的最大堆内存大小，计算堆内存使用大小和能够分配的最大堆内存大小的比值得到堆内存使用率，并把实际的HDFS Router堆内存使用率和阈值相比较。HDFS Rou

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
扩容MRS集群 - MapReduce服务 MRS
扩容MRS集群 - MapReduce服务 MRS

扩容MRS集群 MRS的扩容不论在存储还是计算能力上，都可以简单地通过增加Core节点或者Task节点来完成，不需要修改系统架构，降低运维成本。集群Core节点不仅可以处理数据，也可以存储数据。可以在集群中添加Core节点，通过增加节点数量处理峰值负载。集群Task节点主要用于处理数据，不存放持久数据。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群容量调整
LakeFormation概述 - MapReduce服务 MRS

LakeFormation是企业级一站式湖仓构建服务，提供元数据统一管理的可视化界面及API，兼容Hive元数据模型以及Ranger权限模型，支持无缝对接多种计算引擎及大数据云服务，使客户便捷高效地构建数据湖和运营相关业务，加速释放业务数据价值。您可以创建一个LakeFormation实例并与MR

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群元数据 > 配置LakeFormation数据连接
配置HetuEngine物化视图缓存能力 - MapReduce服务 MRS

在概览页签下的“基本信息”区域单击“HSConsole WebUI”后的链接，进入HSConsole界面。单击“计算实例”，查看待操作的租户的实例状态，当绿色图标和蓝色图标数量均为“0”时，可执行5配置开启物化视图改写能力。在“计算实例”页签，在待操作的实例所属租户所在行的“操作”列单击“配置”，进入“配置实例”页签，添加如下自定义参数。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 配置HetuEngine物化视图
Storm应用开发常用概念 - MapReduce服务 MRS

Storm应用开发常用概念 Topology 拓扑是一个计算流图。其中每个节点包含处理逻辑，而节点间的连线则表明了节点间的数据是如何流动的。 Spout 在一个Topology中产生源数据流的组件。通常情况下Spout会从外部数据源中读取数据，然后转换为Topology内部的源数据。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Storm开发指南（安全模式） > Storm应用开发概述
快速创建和使用HBase离线数据查询集群 - MapReduce服务 MRS

HBase集群使用Hadoop和HBase组件提供一个稳定可靠、性能优异、可伸缩、面向列的分布式云存储系统，适用于海量数据存储以及分布式计算的场景，用户可以利用HBase搭建起TB至PB级数据规模的存储系统，对数据轻松进行过滤分析，毫秒级得到响应，快速发现数据价值。操作流程

 帮助中心 > MapReduce服务 MRS > 快速入门
Storm应用开发常用概念 - MapReduce服务 MRS

Storm应用开发常用概念 Topology 拓扑是一个计算流图。其中每个节点包含处理逻辑，而节点间的连线则表明了节点间的数据是如何流动的。 Spout 在一个Topology中产生源数据流的组件。通常情况下Spout会从外部数据源中读取数据，然后转换为Topology内部的源数据。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Storm开发指南（普通模式） > Storm应用开发概述
场景说明 - MapReduce服务 MRS
场景说明 - MapReduce服务 MRS

现table1表有10条记录，表示有用户名分别为1-10的用户，用户的历史消费金额初始化都是0元。基于某些业务要求，开发的Spark应用程序实现如下功能：实时累加计算用户的消费金额信息：即用户总消费金额=用户的消费金额(kafka数据) + 用户历史消费金额(table1表的值)，更新到table1表。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 开发Spark应用 > Streaming从Kafka读取数据再写入HBase
优化数据倾斜场景下的Spark SQL性能 - MapReduce服务 MRS

分桶后，部分桶中的数据远高于其他分桶。最终导致部分Task过重，运行很慢；其他Task过轻，运行很快。一方面，数据量大Task运行慢，使得计算性能低；另一方面，数据量少的Task在运行完成后，导致很多CPU空闲，造成CPU资源浪费。通过如下配置项可开启自动进行数据倾斜处理功能，

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
窗口函数 - MapReduce服务 MRS
窗口函数 - MapReduce服务 MRS

窗口函数窗口函数跨查询结果的行执行计算。它们在HAVING子句之后但在ORDER BY子句之前运行。调用窗口函数需要使用OVER子句来指定窗口的特殊语法。窗口具有三个组成部分：分区规范，它将输入行分为不同的分区。这类似于GROUP BY子句如何将行分为聚合函数的不同组。排序

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
快速购买MRS集群 - MapReduce服务 MRS

HBase集群使用Hadoop和HBase组件提供一个稳定可靠，性能优异、可伸缩、面向列的分布式云存储系统，适用于海量数据存储以及分布式计算的场景，用户可以利用HBase搭建起TB至PB级数据规模的存储系统，对数据轻松进行过滤分析，毫秒级得到响应，快速发现数据价值。快速购买MRS集群

 帮助中心 > MapReduce服务 MRS > 用户指南 > 购买MRS集群
ALM-16002 Hive SQL执行成功率低于阈值 - MapReduce服务 MRS

SQL执行成功率低于阈值告警解释系统每30秒周期性检测执行的HQL成功百分比，HQL成功百分比由一个周期内Hive执行成功的HQL数/Hive执行HQL总数计算得到。该指标可通过“集群 > 待操作的集群名称 > 服务 > Hive > 实例 > 具体的HiveServer实例”查看。执行的HQL成

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
调整Spark Core进程参数 - MapReduce服务 MRS

在使用spark-submit命令时，添加“--executor-memory MEM”参数设置内存。示例在执行spark wordcount计算中。1.6T数据，250个executor。在默认参数下执行失败，出现Futures timed out和OOM错误。因为数据量大，t

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core性能调优
调整Spark Core进程参数 - MapReduce服务 MRS

在使用spark-submit命令时，添加“--executor-memory MEM”参数设置内存。示例在执行spark wordcount计算中。1.6T数据，250个executor。在默认参数下执行失败，出现Futures timed out和OOM错误。因为数据量大，t

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优
ClickHouse数据分布设计 - MapReduce服务 MRS

GB数据需要写入到集群中，需要将30 GB数据均匀切分后分别放到shard-1、shard-2和shard-3的3个分片节点中，以充分发挥MPP查询时并行计算能力，避免数据在shard间倾斜计算出现木桶效应，导致SQL查询性能较差。可通过弹性负载均衡（Elastic Load Balance，简称ELB）访问ClickHouse，来实现数据均匀。

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范 > ClickHouse集群规划
MapReduce应用开发简介 - MapReduce服务 MRS

MapReduce应用开发简介 Hadoop MapReduce是一个使用简易的并行计算软件框架，基于它写出来的应用程序能够运行在由上千个服务器组成的大型集群上，并以一种可靠容错的方式并行处理上T级别的数据集。一个MapReduce作业（application/job）通常会把

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > MapReduce开发指南 > MapReduce应用开发概述
MapReduce应用开发简介 - MapReduce服务 MRS

MapReduce应用开发简介 MapReduce简介 Hadoop MapReduce是一个使用简易的并行计算软件框架，基于它写出来的应用程序能够运行在由上千个服务器组成的大型集群上，并以一种可靠容错的方式并行处理上T级别的数据集。一个MapReduce作业（applicat

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > MapReduce开发指南（普通模式）

总条数： 806

上一页
1
...
12
13
14
...
41
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置HDFS DataNode数据均衡 - MapReduce服务 MRS

提交Spark任务到新增Task节点 - MapReduce服务 MRS

使用Hive加载OBS数据并分析企业雇员信息 - MapReduce服务 MRS

ALM-14038 Router堆内存使用率超过阈值 - MapReduce服务 MRS

扩容MRS集群 - MapReduce服务 MRS

LakeFormation概述 - MapReduce服务 MRS

配置HetuEngine物化视图缓存能力 - MapReduce服务 MRS

Storm应用开发常用概念 - MapReduce服务 MRS

快速创建和使用HBase离线数据查询集群 - MapReduce服务 MRS

Storm应用开发常用概念 - MapReduce服务 MRS

场景说明 - MapReduce服务 MRS

优化数据倾斜场景下的Spark SQL性能 - MapReduce服务 MRS

窗口函数 - MapReduce服务 MRS

快速购买MRS集群 - MapReduce服务 MRS

ALM-16002 Hive SQL执行成功率低于阈值 - MapReduce服务 MRS

调整Spark Core进程参数 - MapReduce服务 MRS

调整Spark Core进程参数 - MapReduce服务 MRS

ClickHouse数据分布设计 - MapReduce服务 MRS

MapReduce应用开发简介 - MapReduce服务 MRS

MapReduce应用开发简介 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线