搜索_华为云

运行HiveSql作业 - MapReduce服务 MRS

MRS集群中默认安装了一个客户端用于作业提交，也可直接使用该客户端。MRS 3.x及之后版本客户端默认安装路径为Master节点上的“/opt/Bigdata/client”，MRS 3.x之前版本为Master节点上的“/opt/client”。使用MRS集群客户端安装用户登录客户端所在的节点。执行以下命令初始化环境变量。

帮助中心 > MapReduce服务 MRS > 用户指南 > 提交MRS作业 > 运行MRS作业
ClickHouse数据分布设计 - MapReduce服务 MRS

GB数据需要写入到集群中，需要将30 GB数据均匀切分后分别放到shard-1、shard-2和shard-3的3个分片节点中，以充分发挥MPP查询时并行计算能力，避免数据在shard间倾斜计算出现木桶效应，导致SQL查询性能较差。可通过弹性负载均衡（Elastic Load Balance，简称ELB）访问ClickHouse，来实现数据均匀。

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范 > ClickHouse集群规划
Flume基本原理 - MapReduce服务 MRS
Flume基本原理 - MapReduce服务 MRS

应。如果在某次提交（commit）之前，数据传输出现了失败，将会再次开始上一次Transactions，并将上次发送失败的数据重新传输。因为commit操作已经将Transactions写入了磁盘，那么在进程故障退出并恢复业务之后，仍然可以继续上次的Transactions。父主题：

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Flume
MRS组件应用开发简介 - MapReduce服务 MRS

应用的开发编译操作可参考组件开发指南对应章节。图1 MRS组件应用开发流程表1 MRS组件应用开发流程说明阶段说明准备开发环境在进行应用开发前，需首先准备开发环境，推荐使用IntelliJ IDEA工具，同时本地需完成JDK、Maven等初始配置。准备连接集群配置文件

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x）
Spark客户端使用实践 - MapReduce服务 MRS

准备样例工程所需数据。将场景说明中的原日志文件放置在HDFS系统中。本地新建两个文本文件，分别将log1.txt及log2.txt中的内容复制保存到input_data1.txt和input_data2.txt。在HDFS上建立一个文件夹“/tmp/input”，并上传input_data1

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本）
Oozie客户端配置说明 - MapReduce服务 MRS

Manager，选择“集群 > 待操作集群的名称 > 服务 > Oozie ”，单击“oozie WebUI”后的超链接进入Oozie页面，在Oozie的WebUI上查看任务运行结果。图1 任务运行结果父主题：使用Oozie客户端提交作业

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Oozie > 使用Oozie客户端提交作业
MRS组件应用开发简介 - MapReduce服务 MRS

应用的开发编译操作可参考组件开发指南对应章节。图1 MRS组件应用开发流程表1 MRS组件应用开发流程说明阶段说明准备开发环境在进行应用开发前，需首先准备开发环境，推荐使用IntelliJ IDEA工具，同时本地需完成JDK、Maven等初始配置。准备连接集群配置文件

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版）
通过Spark Streaming作业消费Kafka数据 - MapReduce服务 MRS

Job被运行，而对应偏移量的数据在Kafka中已准备好。这些偏移量信息也被可靠地存储在checkpoint文件中，应用失败重启时可以直接读取偏移量信息。图1 Direct Kafka接口数据传输需要注意的是，Spark Streaming可以在失败后重新从Kafka中读取并处

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
Flink性能调优建议 - MapReduce服务 MRS

TM的Slot数和TM的CPU数成倍数关系在Flink中，每个Task被分解成SubTask，SubTask作为执行的线程单位运行在TM上，在不开启Slot Sharing Group的情况下，一个SubTask是部署在一个slot上的。即使开启了Slot Sharing Gr

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > Flink性能调优开发规范
配置MRS集群用户的OBS的细粒度访问权限 - MapReduce服务 MRS

spark-beeline在开启Kerberos认证的集群中提交作业的内置用户名为spark，在未开启Kerberos认证的集群中提交作业的内置用户名为omm。 hbase shell在开启Kerberos认证的集群提交作业的内置用户名为hbase，在未开启Kerberos认证的集群中提交作业的内置用户名为omm。

帮助中心 > MapReduce服务 MRS > 用户指南 > 配置MRS集群存算分离 > 配置MRS集群通过IAM委托对接OBS
创建FlinkServer流表源 - MapReduce服务 MRS

新建流表访问Flink WebUI，请参考访问FlinkServer WebUI界面。单击“流表管理”进入流表管理页面。单击“新建流表”，在新建流表页面参考表1填写信息，单击“确定”，完成流表创建。创建完成后，可在对应流表的“操作”列对流表进行编辑、删除等操作。图1 新建流表表1

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flink > 创建FlinkServer作业前准备
实时OLAP场景介绍 - MapReduce服务 MRS

延有要求，如离线报表场景、实时报表的数据初始化场景。数据加载方式：在存在DataArts Studio工具的场景下，数据加载统一使用CDM进行（DataArts Studio需要2.10及以上版本）。在不存在DataArts Studio工具的场景下，可以使用Spark或者

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析 > 实时OLAP数据分析
HDFS on Hue - MapReduce服务 MRS
HDFS on Hue - MapReduce服务 MRS

左侧导航栏单击文件。进入“文件浏览器”页面。勾选目录的复选框，单击页面上方的“操作”，单击“存储策略”。图1 存储策略在弹出的对话框中设置新的存储策略，单击“确定”。在“静态存储策略”页签设置静态存储策略，单击“保存”。在“动态存储策略”页签可创建、删除、修改动态存储策略，详细的参数介绍如表2所示。表2 动态存储策略参数介绍

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hue（MRS 3.x及之后版本） > 使用Hue WebUI典型场景
开启TableStatus多版本特性下，最新tablestatus文件丢失或损坏，如何恢复 - MapReduce服务 MRS

或损坏，则无法恢复已删除的segment信息，因为只有丢失或损坏的tablestatus文件才存在该segment的删除信息。不支持在mv表上使用该工具。由于最新的tablestatus文件存在问题，使用该工具恢复后无法正常查询时，可以移除最新的tablestatus文件，使

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData常见问题
创建FlinkServer流表源 - MapReduce服务 MRS

新建FlinkServer流表步骤访问Flink WebUI，请参考访问FlinkServer WebUI界面。单击“流表管理”进入流表管理页面。单击“新建流表”，在新建流表页面参考表1填写信息，单击“确定”，完成流表创建。创建完成后，可在对应流表的“操作”列对流表进行编辑、删除等操作。图1 新建流表表1

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > 创建FlinkServer作业前准备
查询集群节点列表 - MapReduce服务 MRS

只能由英文字母和数字组成，且长度为[1-64]个字符。默认取值：不涉及 cluster_id 是 String 参数解释：集群ID。如果指定集群ID，则获取该集群做过补丁更新的最新版本元数据。获取方法，请参见获取集群ID。约束限制：不涉及取值范围：只能由英文字母、数字

 帮助中心 > MapReduce服务 MRS > API参考 > API V2 > 集群管理接口
CREATE MATERIALIZED VIEW - MapReduce服务 MRS

管理计算实例时，预先创建维护实例后，可通过设置need_auto_refresh为true，创建具备自动刷新能力的物化视图，它会自动创建并提交物化视图刷新任务，在此基础上，可对refresh_duration，start_refresh_ahead_of_expiry,refresh_priority等属性做进一步配置来调整自动刷新任务。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine DDL SQL语法说明
调整集群节点 - MapReduce服务 MRS

表示扩容时是否在新增节点上执行创建集群时指定的引导操作。约束限制：不涉及取值范围： true：跳过引导操作。 false：执行引导操作。默认取值： false scale_without_start 否 Boolean 参数解释：扩容后是否启动扩容节点上的组件。约束限制：

帮助中心 > MapReduce服务 MRS > API参考 > API V1.1 > 集群管理接口
运行SparkSql作业 - MapReduce服务 MRS

t脚本两种形式，如果SQL语句涉及敏感信息，也可使用脚本文件方式提交。用户可以在MRS管理控制台在线创建一个作业并提交运行，也可以通过MRS集群客户端来以命令行形式提交作业。操作视频本视频以在MRS集群的管理控制台上提交并查看SparkSql作业为例进行说明。因不同版本操

 帮助中心 > MapReduce服务 MRS > 用户指南 > 提交MRS作业 > 运行MRS作业
使用Hive加载HDFS数据并分析图书评分情况 - MapReduce服务 MRS

创建MRS集群后，使用Hive对原始数据进行导入、分析等操作，展示了如何构建弹性、低成本的离线大数据分析。方案架构 Hive是建立在Hadoop上的数据仓库框架，提供大数据平台批处理计算能力，能够对结构化/半结构化数据进行批量分析汇总完成数据计算。提供类似SQL的Hive Query

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析

总条数： 691

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

运行HiveSql作业 - MapReduce服务 MRS

ClickHouse数据分布设计 - MapReduce服务 MRS

Flume基本原理 - MapReduce服务 MRS

MRS组件应用开发简介 - MapReduce服务 MRS

Spark客户端使用实践 - MapReduce服务 MRS

Oozie客户端配置说明 - MapReduce服务 MRS

MRS组件应用开发简介 - MapReduce服务 MRS

通过Spark Streaming作业消费Kafka数据 - MapReduce服务 MRS

Flink性能调优建议 - MapReduce服务 MRS

配置MRS集群用户的OBS的细粒度访问权限 - MapReduce服务 MRS

创建FlinkServer流表源 - MapReduce服务 MRS

实时OLAP场景介绍 - MapReduce服务 MRS

HDFS on Hue - MapReduce服务 MRS

开启TableStatus多版本特性下，最新tablestatus文件丢失或损坏，如何恢复 - MapReduce服务 MRS

创建FlinkServer流表源 - MapReduce服务 MRS

查询集群节点列表 - MapReduce服务 MRS

CREATE MATERIALIZED VIEW - MapReduce服务 MRS

调整集群节点 - MapReduce服务 MRS

运行SparkSql作业 - MapReduce服务 MRS

使用Hive加载HDFS数据并分析图书评分情况 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线