搜索_华为云

Spark Core内存调优 - MapReduce服务 MRS

Spark Core内存调优操作场景 Spark是内存计算框架，计算过程中内存不够对Spark的执行效率影响很大。可以通过监控GC（Garbage Collection），评估内存中RDD的大小来判断内存是否变成性能瓶颈，并根据情况优化。监控节点进程的GC情况（在客户端的conf/spark-default

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core性能调优
Yarn与其他组件的关系 - MapReduce服务 MRS

Yarn与其他组件的关系 Yarn和Spark组件的关系 Spark的计算调度方式，可以通过Yarn的模式实现。Spark共享Yarn集群提供丰富的计算资源，将任务分布式的运行起来。Spark on Yarn分两种模式：Yarn Cluster和Yarn Client。 Yarn

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > YARN
Hudi表索引设计规范 - MapReduce服务 MRS

loomfiter机制，将布隆索引内容写入到Parquet文件的footer中。 Bucket索引：在写入数据过程中，通过主键进行Hash计算，将数据进行分桶写入；该索引写入速度最快，但是需要合理配置分桶数目；Flink、Spark均支持该索引写入。状态索引：Flink引擎独有

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Hudi数据表设计规范
ALM-12052 TCP临时端口使用率超过阈值 - MapReduce服务 MRS

'{print $NF}' | awk '$1 >"开始端口值" {print $1}' | sort -u | wc -l，计算临时端口使用数。使用公式计算临时端口使用率，临时端口使用率=（临时端口使用数/临时端口总数）*100，确认临时端口使用率是否超过阈值。是，执行7。否，执行6。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
Manager关键特性 - MapReduce服务 MRS

以在界面上根据业务需要，在集群中创建租户、管理租户。创建租户时将自动创建租户对应的角色、计算资源和存储资源。默认情况下，新的计算资源和存储资源的全部权限将分配给租户的角色。修改租户的计算资源或存储资源，对应的角色关联权限将自动更新。 Manager还提供了多实例的功能，使用户

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Manager
使用CDM服务迁移Hadoop数据至MRS集群 - MapReduce服务 MRS

使用CDM服务迁移Hadoop数据至MRS集群应用场景本章节适用于将线下IDC机房或者公有云Hadoop集群中的数据（支持数据量在几十TB级别或以下的数据量级）迁移到华为云MRS服务。本章节以通过华为云CDM服务 2.9.1.200版本进行数据迁移为例介绍。不同版本操作可能有差异，具体操作详情以实际版本对应的操作指导为准。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移
Flink应用性能调优建议 - MapReduce服务 MRS

Flink应用性能调优建议配置内存 Flink是依赖内存计算，计算过程中内存不够对Flink的执行效率影响很大。可以通过监控GC（Garbage Collection），评估内存使用及剩余情况来判断内存是否变成性能瓶颈，并根据情况优化。监控节点进程的YARN的Container

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Flink开发指南 > Flink应用开发常见问题
Streaming任务打印两次相同DAG日志 - MapReduce服务 MRS

子来实现底层的计算。 Take算子会以Partition为单位多次触发计算。在该问题中，由于Shuffle操作，导致take算子默认有两个Partition，Spark首先计算第一个Partition，但由于没有数据输入，导致获取结果不足10个，从而触发第二次计算，因此会出现RDD的DAG结构打印两次的现象。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > Spark Streaming
经验总结 - MapReduce服务 MRS
经验总结 - MapReduce服务 MRS

使用mapPartitions，按每个分区计算结果如果每条记录的开销太大，例： rdd.map{x=>conn=getDBConn;conn.write(x.toString);conn.close} 则可以使用MapPartitions，按每个分区计算结果，如： rdd.mapPartitions(records

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优
ClickHouse概述 - MapReduce服务 MRS
ClickHouse概述 - MapReduce服务 MRS

被预先聚合、部分数据尚未被聚合的情况。因此，在执行聚合计算时，SQL中仍需要使用GROUP BY子句。 AggregatingMergeTree AggregatingMergeTree是预先聚合引擎的一种，用于提升聚合计算的性能。AggregatingMergeTree引擎能够

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ClickHouse
经验总结 - MapReduce服务 MRS
经验总结 - MapReduce服务 MRS

使用mapPartitions，按每个分区计算结果如果每条记录的开销太大，例： rdd.map{x=>conn=getDBConn;conn.write(x.toString);conn.close} 则可以使用MapPartitions，按每个分区计算结果，如 rdd.mapPartitions(records

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core性能调优
经验总结 - MapReduce服务 MRS
经验总结 - MapReduce服务 MRS

使用mapPartitions，按每个分区计算结果如果每条记录的开销太大，例 rdd.map{x=>conn=getDBConn;conn.write(x.toString);conn.close} 则可以使用MapPartitions，按每个分区计算结果，如 rdd.mapPartitions(records

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > Spark Core调优
ALM-12101 AZ不健康 - MapReduce服务 MRS

AZ的健康状态由AZ内的存储资源（HDFS）、计算资源（Yarn）和关键角色的健康度是否超过配置阈值决定。 AZ亚健康有两种：计算资源（Yarn）不健康，存储资源（HDFS）健康，任务无法提交到本AZ，但是数据可以继续往本AZ内读写。计算资源（Yarn）健康，存储资源（HDFS）

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
如何让不同的业务程序分别用不同的Yarn队列？ - MapReduce服务 MRS

选择“叶子租户”：当前租户为叶子租户，不支持添加子租户。选择“非叶子租户”：当前租户为非叶子租户，支持添加子租户，但租户层级不能超过5层。计算资源为当前租户选择动态计算资源。选择“Yarn”时，系统自动在Yarn中以子租户名称创建任务队列。如果是叶子租户，叶子租户可直接提交到任务队列中。

帮助中心 > MapReduce服务 MRS > 常见问题 > 作业管理类
Storm开源增强特性 - MapReduce服务 MRS

种SQL-like的语言，相对于SQL，CQL中增加了（时序）窗口的概念，将待处理的数据保存在内存中，进行快速的内存计算，CQL的输出结果为数据流在某一时刻的计算结果。使用CQL，可以快速进行业务开发，并方便地将业务提交到Storm平台开启实时数据的接收、处理及结果输出；并可以在合适的时候中止业务。

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Storm
HetuEngine物化视图概述 - MapReduce服务 MRS

将高频访问的SQL查询和有高耗时的算子（连接，聚合等算子）的SQL通过建立物化视图进行预计算，然后在查询的SQL中将能匹配到物化视图的查询或者子查询转换为物化视图，避免了数据的重复计算，这种情况下往往能较大地提高查询的响应效率。物化视图通常基于对数据表进行聚合和连接的查询结果创建。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 配置HetuEngine物化视图
Storm与其他组件的关系 - MapReduce服务 MRS

Storm与其他组件的关系 Storm，提供实时的分布式计算框架，它可以从数据源（如Kafka、TCP连接等）中获得实时消息数据，在实时平台上完成高吞吐、低延迟的实时计算，并将结果输出到消息队列或者进行持久化。Storm与其他组件的关系如图1所示：图1 组件关系图 Storm和Streaming的关系

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Storm
Streaming任务打印两次相同DAG日志 - MapReduce服务 MRS

子来实现底层的计算。 Take算子会以Partition为单位多次触发计算。在该问题中，由于Shuffle操作，导致take算子默认有两个Partition，Spark首先计算第一个Partition，但由于没有数据输入，导致获取结果不足10个，从而触发第二次计算，因此会出现RDD的DAG结构打印两次的现象。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > Spark Streaming
HAVING - MapReduce服务 MRS
HAVING - MapReduce服务 MRS

HAVING HAVING与聚合函数和GROUP BY一起使用，来控制选在哪些组。 HAVING能够在分组和聚合计算之后，过滤掉不满足给定条件的组。例如： SELECT count(*), mktsegment, nationkey, CAST(sum(acctbal) AS bigint)

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine DQL SQL语法说明
Flink应用开发简介 - MapReduce服务 MRS

Flink应用开发简介 Flink是一个批处理和流处理结合的统一计算框架，其核心是一个提供了数据分发以及并行化计算的流数据处理引擎。 Flink最适合的应用场景是低时延的数据处理（Data Processing）场景：高并发pipeline处理数据，时延毫秒级，且兼具可靠性。 Flink整个系统包含三个部分：

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Flink开发指南 > Flink应用开发概述

总条数： 660

上一页
1
...
5
6
7
...
33
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark Core内存调优 - MapReduce服务 MRS

Yarn与其他组件的关系 - MapReduce服务 MRS

Hudi表索引设计规范 - MapReduce服务 MRS

ALM-12052 TCP临时端口使用率超过阈值 - MapReduce服务 MRS

Manager关键特性 - MapReduce服务 MRS

使用CDM服务迁移Hadoop数据至MRS集群 - MapReduce服务 MRS

Flink应用性能调优建议 - MapReduce服务 MRS

Streaming任务打印两次相同DAG日志 - MapReduce服务 MRS

经验总结 - MapReduce服务 MRS

ClickHouse概述 - MapReduce服务 MRS

经验总结 - MapReduce服务 MRS

经验总结 - MapReduce服务 MRS

ALM-12101 AZ不健康 - MapReduce服务 MRS

如何让不同的业务程序分别用不同的Yarn队列？ - MapReduce服务 MRS

Storm开源增强特性 - MapReduce服务 MRS

HetuEngine物化视图概述 - MapReduce服务 MRS

Storm与其他组件的关系 - MapReduce服务 MRS

Streaming任务打印两次相同DAG日志 - MapReduce服务 MRS

HAVING - MapReduce服务 MRS

Flink应用开发简介 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线