搜索_华为云

配置内存 - MapReduce服务 MRS
配置内存 - MapReduce服务 MRS

配置内存操作场景 Spark是内存计算框架，计算过程中内存不够对Spark的执行效率影响很大。可以通过监控GC（Garbage Collection），评估内存中RDD的大小来判断内存是否变成性能瓶颈，并根据情况优化。监控节点进程的GC情况（在客户端的conf/spark-defaults

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > Spark Core调优
Flink应用开发简介 - MapReduce服务 MRS

Flink应用开发简介简介 Flink是一个批处理和流处理结合的统一计算框架，其核心是一个提供了数据分发以及并行化计算的流数据处理引擎。它的最大亮点是流处理，是业界最顶级的开源流处理引擎。 Flink最适合的应用场景是低时延的数据处理（Data Processing）场景：高并

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（安全模式）
Flink应用开发简介 - MapReduce服务 MRS

Flink应用开发简介简介 Flink是一个批处理和流处理结合的统一计算框架，其核心是一个提供了数据分发以及并行化计算的流数据处理引擎。它的最大亮点是流处理，是业界最顶级的开源流处理引擎。 Flink最适合的应用场景是低时延的数据处理（Data Processing）场景：高并

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（普通模式）
获取MRS应用开发样例工程 - MapReduce服务 MRS

SparkJavaExample Spark Core任务的Java/Python/Scala/R示例程序。本工程应用程序实现从HDFS上读取文本数据并计算分析。 SparkRExample示例不支持未开启Kerberos认证的集群。 SparkPythonExample SparkScalaExample

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x）
快速创建和使用HBase离线数据查询集群 - MapReduce服务 MRS

创建与查询操作指导。 HBase集群使用Hadoop和HBase组件提供一个稳定可靠、性能优异、可伸缩、面向列的分布式云存储系统，适用于海量数据存储以及分布式计算的场景，用户可以利用HBase搭建起TB至PB级数据规模的存储系统，对数据轻松进行过滤分析，毫秒级得到响应，快速发现数据价值。

帮助中心 > MapReduce服务 MRS > 快速入门
使用Hive加载HDFS数据并分析图书评分情况 - MapReduce服务 MRS

供下一步数据应用使用。离线处理对处理时间要求不高，但是所处理数据量较大，占用计算存储资源较多，通常通过Hive/SparkSQL引擎或者MapReduce/Spark2x实现。本实践基于华为云MapReduce服务，用于指导您创建MRS集群后，使用Hive对原始数据进行导入

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
优化Flink内存GC参数 - MapReduce服务 MRS

优化Flink内存GC参数操作场景 Flink是依赖内存计算，计算过程中内存不够对Flink的执行效率影响很大。可以通过监控GC（Garbage Collection），评估内存使用及剩余情况来判断内存是否变成性能瓶颈，并根据情况优化。监控节点进程的YARN的Container

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flink > Flink性能调优
Spark Core内存调优 - MapReduce服务 MRS

Spark Core内存调优操作场景 Spark是内存计算框架，计算过程中内存不够对Spark的执行效率影响很大。可以通过监控GC（Garbage Collection），评估内存中RDD的大小来判断内存是否变成性能瓶颈，并根据情况优化。监控节点进程的GC情况（在客户端的conf/spark-default

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优
FlinkSQL支持MultiJoin算子 - MapReduce服务 MRS

当使用Flink的Full outer Join算子实现宽表拼接功能时，由于状态会被多次重复存储导致状态后端压力大，计算性能差。使用MultiJoin算子进行宽表拼接计算性能可以提升1倍。 FlinkSQL支持MultiJoin算子使用限制 MultiJoin算子只支持FULL OUTER

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink企业级能力增强
窗口函数 - MapReduce服务 MRS
窗口函数 - MapReduce服务 MRS

窗口函数窗口函数跨查询结果的行执行计算。它们在HAVING子句之后但在ORDER BY子句之前运行。调用窗口函数需要使用OVER子句来指定窗口的特殊语法。窗口具有三个组成部分：分区规范，它将输入行分为不同的分区。这类似于GROUP BY子句如何将行分为聚合函数的不同组。排序

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
MRS集群部署方案说明 - MapReduce服务 MRS

MRS集群部署方案说明 MRS当前提供的“分析集群”、“流式集群”和“混合集群”采用固定模板进行部署集群的进程，无法满足用户自定义部署管理角色和控制角色在集群节点中的需求。如需自定义集群部署方式，可在创建集群时的“集群类型”选择“自定义”，实现用户自主定义集群的进程实例在集群节点中的部署方式。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群规划 > MRS集群部署说明
Spark开源增强特性 - MapReduce服务 MRS

跨源复杂数据的SQL查询优化出于管理和信息收集的需要，企业内部会存储海量数据，包括数目众多的各种数据库、数据仓库等，此时会面临以下困境：数据源种类繁多，数据集结构化混合，相关数据存放分散等，这就导致了跨源复杂查询因传输效率低，耗时长。当前开源Spark在跨源查询时，只能对简单的filter进行下推，因此

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark
Spark SQL性能调优 - MapReduce服务 MRS

配置SparkSQL的分块个数 Spark动态分区插入场景内存优化小文件优化聚合算法优化 Datasource表优化合并CBO优化多级嵌套子查询以及混合Join的SQL调优父主题：使用Spark/Spark2x

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x
Spark Core内存调优 - MapReduce服务 MRS

Spark Core内存调优操作场景 Spark是内存计算框架，计算过程中内存不够对Spark的执行效率影响很大。可以通过监控GC（Garbage Collection），评估内存中RDD的大小来判断内存是否变成性能瓶颈，并根据情况优化。监控节点进程的GC情况（在客户端的conf/spark-default

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core性能调优
ALM-12052 TCP临时端口使用率超过阈值 - MapReduce服务 MRS

'{print $NF}' | awk '$1 >"开始端口值" {print $1}' | sort -u | wc -l，计算临时端口使用数。使用公式计算临时端口使用率，临时端口使用率=（临时端口使用数/临时端口总数）*100，确认临时端口使用率是否超过阈值。是，执行7。否，执行6。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
使用Hive加载OBS数据并分析企业雇员信息 - MapReduce服务 MRS

使用Hive加载OBS数据并分析企业雇员信息应用场景 MRS Hadoop分析集群，提供Hive、Spark离线大规模分布式数据存储和计算，进行海量数据分析与查询。本实践基于华为云MapReduce服务，用于指导您创建MRS集群后，使用Hive对OBS中存储的原始数据进行导入、分析等操作，展示了

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
优化Flink内存GC参数 - MapReduce服务 MRS

优化Flink内存GC参数操作场景 Flink是依赖内存计算，计算过程中内存不够对Flink的执行效率影响很大。可以通过监控GC（Garbage Collection），评估内存使用及剩余情况来判断内存是否变成性能瓶颈，并根据情况优化。监控节点进程的YARN的Container

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink性能调优
调整集群节点 - MapReduce服务 MRS

集群才允许扩容/缩容，其他状态则不允许扩容/缩容。集群状态和集群ID可参考查询集群列表接口获取。本章节的接口只支持流式集群、分析集群和混合集群，不支持自定义集群。接口约束无调用方法请参见如何调用API。 URI PUT /v1.1/{project_id}/clust

帮助中心 > MapReduce服务 MRS > API参考 > API V1.1 > 集群管理接口
快速开发ClickHouse应用 - MapReduce服务 MRS

量级。 ClickHouse的设计优点：数据压缩比高多核并行计算向量化计算引擎支持嵌套数据结构支持稀疏索引支持数据Insert和Update ClickHouse的应用场景：实时数仓场景使用流式计算引擎（如Flink）把实时数据写入ClickHouse，借助Cli

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用
Flink应用性能调优建议 - MapReduce服务 MRS

Flink应用性能调优建议配置内存 Flink是依赖内存计算，计算过程中内存不够对Flink的执行效率影响很大。可以通过监控GC（Garbage Collection），评估内存使用及剩余情况来判断内存是否变成性能瓶颈，并根据情况优化。监控节点进程的YARN的Container

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Flink开发指南 > Flink应用开发常见问题

总条数： 1896

上一页
1
...
4
5
6
...
95
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置内存 - MapReduce服务 MRS

Flink应用开发简介 - MapReduce服务 MRS

Flink应用开发简介 - MapReduce服务 MRS

获取MRS应用开发样例工程 - MapReduce服务 MRS

快速创建和使用HBase离线数据查询集群 - MapReduce服务 MRS

使用Hive加载HDFS数据并分析图书评分情况 - MapReduce服务 MRS

优化Flink内存GC参数 - MapReduce服务 MRS

Spark Core内存调优 - MapReduce服务 MRS

FlinkSQL支持MultiJoin算子 - MapReduce服务 MRS

窗口函数 - MapReduce服务 MRS

MRS集群部署方案说明 - MapReduce服务 MRS

Spark开源增强特性 - MapReduce服务 MRS

Spark SQL性能调优 - MapReduce服务 MRS

Spark Core内存调优 - MapReduce服务 MRS

ALM-12052 TCP临时端口使用率超过阈值 - MapReduce服务 MRS

使用Hive加载OBS数据并分析企业雇员信息 - MapReduce服务 MRS

优化Flink内存GC参数 - MapReduce服务 MRS

调整集群节点 - MapReduce服务 MRS

快速开发ClickHouse应用 - MapReduce服务 MRS

Flink应用性能调优建议 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线