搜索_华为云

MRS集群保留JDK说明 - MapReduce服务 MRS

MRS集群保留JDK说明 MRS集群是租户完全可控的大数据应用开发平台，用户基于平台开发业务后，将业务程序部署到大数据平台运行。由于需要具备开发调测能力，因此要在MRS集群中保留JDK。此外，MRS集群功能中如下关键特性也强依赖JDK。 HBase BulkLoad HBase

帮助中心 > MapReduce服务 MRS > 产品介绍 > 安全
创建FlinkServer集群连接 - MapReduce服务 MRS

单击“创建集群连接”，在弹出的页面中参考表1填写信息，单击“确定”，完成集群连接创建。创建完成后，可在对应集群连接的“操作”列对集群连接进行编辑、测试、删除等操作。图1 创建集群连接表1 创建集群连接信息参数名称参数描述集群连接名称集群连接的名称。描述集群连接名称描述信息。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > 创建FlinkServer作业前准备
CLEAN - MapReduce服务 MRS
CLEAN - MapReduce服务 MRS

0及之后版本。命令功能用于根据配置对Timeline上的Instant进行clean，删除老旧的历史版本文件，以减少hudi表的数据存储及读写压力。命令格式 RUN CLEAN ON tableIdentifier; RUN CLEAN ON tablelocation; 参数描述

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi SQL语法参考 > Hudi DML语法说明
性能优化类 - MapReduce服务 MRS
性能优化类 - MapReduce服务 MRS

性能优化类 Hadoop压力测试工具如何获取？如何提高集群Core节点的资源使用率？如何配置MRS集群knox内存？如何调整MRS集群manager-executor进程内存？如何设置Spark作业执行时自动获取更多资源？ spark.yarn.executor.memo

帮助中心 > MapReduce服务 MRS > 常见问题
提交Spark任务到新增Task节点 - MapReduce服务 MRS

节点。方案架构租户是MRS大数据平台的核心概念，使传统的以用户为核心的大数据平台向以多租户为核心的大数据平台转变，更好的适应现代企业多租户应用环境，如图1所示。图1 以用户为核心的平台和以多租户为核心的平台对于以用户为核心的大数据平台，用户直接访问并使用全部的资源和服务。

帮助中心 > MapReduce服务 MRS > 最佳实践 > MRS集群管理
配置JobHistory本地磁盘缓存 - MapReduce服务 MRS

配置JobHistory本地磁盘缓存配置场景 JobHistory可使用本地磁盘缓存spark应用的历史数据，以防止JobHistory内存中加载大量应用数据，减少内存压力，同时该部分缓存数据可以复用以提高后续对相同应用的访问速度。配置参数登录FusionInsight Manager系统，选择“集群 >

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark运维管理
MemArtsCC与其他组件的关系 - MapReduce服务 MRS

SMemArtsCCInputStream，该InputStream从部署在计算侧上的MemArtsCC集群读取数据，从而减少OBS服务端压力，提升数据读取性能的目标。 MemArtsCC会将数据持久化存储到计算侧的存储中（SSD），OBS对接MemArtsCC有如下使用场景：提升存算分离架构访问数据的性能

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > MemArtsCC
cache table使用指导 - MapReduce服务 MRS

SQL可以将表cache到内存中，并且使用压缩存储来尽量减少内存压力。通过将表cache，查询可以直接从内存中读取数据，从而减少读取磁盘带来的内存开销。但需要注意的是，被cache的表会占用executor的内存。尽管在Spark SQL采用压缩存储的方式来尽量减少内存开销、缓解GC压力，但当缓存的表较大或者缓存表

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > SQL和DataFrame
cache table使用指导 - MapReduce服务 MRS

SQL可以将表cache到内存中，并且使用压缩存储来尽量减少内存压力。通过将表cache，查询可以直接从内存中读取数据，从而减少读取磁盘带来的内存开销。但需要注意的是，被cache的表会占用executor的内存。尽管在Spark SQL采用压缩存储的方式来尽量减少内存开销、缓解GC压力，但当缓存的表较大或者缓存表

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > SQL和DataFrame
FlinkSQL支持MultiJoin算子 - MapReduce服务 MRS

本章节适用于MRS 3.5.0及以后版本。当使用Flink的Full outer Join算子实现宽表拼接功能时，由于状态会被多次重复存储导致状态后端压力大，计算性能差。使用MultiJoin算子进行宽表拼接计算性能可以提升1倍。 FlinkSQL支持MultiJoin算子使用限制 MultiJoin算子只支持FULL

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink企业级能力增强
Hudi数据表Archive规范 - MapReduce服务 MRS

Hudi数据表Archive规范 Archive（归档）是为了减轻Hudi读写元数据的压力，所有的元数据都存放在这个路径：Hudi表根目录/.hoodie目录，如果.hoodie目录下的文件数量超过10000就会发现Hudi表有非常明显的读写时延。规则 Hudi表必须执行Archive。

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Hudi数据表管理操作规范
产品优势 - MapReduce服务 MRS
产品优势 - MapReduce服务 MRS

员获取日志进行分析。 MRS具有开放的生态，支持无缝对接周边服务，快速构建统一大数据平台。以全栈大数据MRS服务为基础，企业可以一键式构筑数据接入、数据存储、数据分析和价值挖掘的统一大数据平台，并且与数据治理中心DataArts Studio及数据可视化等服务对接，为用户轻松解

 帮助中心 > MapReduce服务 MRS > 产品介绍
Hudi数据表Clean规范 - MapReduce服务 MRS

要执行。Clean操作的目的是为了清理旧版本文件（Hudi不再使用的数据文件），这不但可以节省Hudi表List过程的时间，也可以缓解存储压力。规则 Hudi表必须执行Clean。对于Hudi的MOR、COW表，都需要开启Clean。 Hudi表在写入数据时会自动判断是否需要

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Hudi数据表管理操作规范
Flink SQL逻辑开发规则 - MapReduce服务 MRS

proc_time AS t5 ON o.order_id = t5.id; 多流Join场景流表个数不超过三个当Join表过多时，状态后端压力太大会导致端到端时延增加。【示例】实时Join维表数3个： CREATE TABLE table1(id int, param1 string)

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > Flink SQL逻辑开发规范
Impala应用开发简介 - MapReduce服务 MRS

SQL查询。除了使用相同的统一存储平台之外，Impala还使用与Apache Hive相同的元数据，SQL语法（Hive SQL），ODBC驱动程序和用户界面（Hue中的Impala查询UI）。这为实时或面向批处理的查询提供了一个熟悉且统一的平台。作为查询大数据的工具补充，Imp

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Impala开发指南 > Impala应用开发概述
Flink作业引擎概述 - MapReduce服务 MRS

Flink作业引擎概述 Flink WebUI提供基于Web的可视化开发平台，用户只需要编写SQL即可开发作业，极大降低作业开发门槛。同时通过作业平台能力开放，支持业务人员自行编写SQL开发作业来快速应对需求，大大减少Flink作业开发工作量。 Flink WebUI功能仅支持MRS

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flink
在Beeline/JDBCServer模式下连续运行10T的TPCDS测试套会出现内存不足的现象 - MapReduce服务 MRS

在Beeline/JDBCServer模式下连续运行10T的TPCDS测试套会出现内存不足的现象问题在Driver内存配置为10G时，Beeline/JDBCServer模式下连续运行10T的TPCDS测试套，会出现因为Driver内存不足导致SQL语句执行失败的现象。回答

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > SQL和DataFrame
Executor进程Crash导致Stage重试 - MapReduce服务 MRS

Executor进程Crash导致Stage重试问题在执行大数据量的Spark任务（如100T的TPCDS测试套）过程中，有时会出现Executor丢失从而导致Stage重试的现象。查看Executor的日志，出现“Executor 532 is lost rpc with driver

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > Spark Core
Flink作业引擎概述 - MapReduce服务 MRS

Flink作业引擎概述 Flink WebUI提供基于Web的可视化开发平台，用户只需要编写SQL即可开发作业，极大降低作业开发门槛。同时通过作业平台能力开放，支持业务人员自行编写SQL开发作业来快速应对需求，大大减少Flink作业开发工作量。 Flink WebUI特点 Flink

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink
配置MRS集群对接Syslog服务器上报告警 - MapReduce服务 MRS

配置MRS集群对接Syslog服务器上报告警如果用户需要在统一的告警平台查看集群的告警和事件，管理员可以在FusionInsight Manager使用Syslog协议将相关数据上报到告警平台。 Syslog协议未做加密，传输数据容易被窃取，存在安全风险。前提条件对接服务器

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > 查看与配置MRS告警事件

总条数： 455

上一页
1
2
3
4
5
...
23
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

MRS集群保留JDK说明 - MapReduce服务 MRS

创建FlinkServer集群连接 - MapReduce服务 MRS

CLEAN - MapReduce服务 MRS

性能优化类 - MapReduce服务 MRS

提交Spark任务到新增Task节点 - MapReduce服务 MRS

配置JobHistory本地磁盘缓存 - MapReduce服务 MRS

MemArtsCC与其他组件的关系 - MapReduce服务 MRS

cache table使用指导 - MapReduce服务 MRS

cache table使用指导 - MapReduce服务 MRS

FlinkSQL支持MultiJoin算子 - MapReduce服务 MRS

Hudi数据表Archive规范 - MapReduce服务 MRS

产品优势 - MapReduce服务 MRS

Hudi数据表Clean规范 - MapReduce服务 MRS

Flink SQL逻辑开发规则 - MapReduce服务 MRS

Impala应用开发简介 - MapReduce服务 MRS

Flink作业引擎概述 - MapReduce服务 MRS

在Beeline/JDBCServer模式下连续运行10T的TPCDS测试套会出现内存不足的现象 - MapReduce服务 MRS

Executor进程Crash导致Stage重试 - MapReduce服务 MRS

Flink作业引擎概述 - MapReduce服务 MRS

配置MRS集群对接Syslog服务器上报告警 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线