搜索_华为云

从零开始使用Spark SQL - MapReduce服务 MRS

HDFS路径：/user/userinput 图1 从OBS导入数据至HDFS 提交Spark SQL语句。在MRS控制台选择“作业管理”，具体请参见运行Spark作业。只有“mrs_20160907”集群处于“运行中”状态时才能提交Spark SQL语句。输入创建表的Spark SQL语句。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark（MRS 3.x之前版本）
准备本地应用开发环境 - MapReduce服务 MRS

目录的“conf”目录下，用于后续调测，例如“/opt/client/conf”。准备开发用户时获取的keytab文件也放置于该目录下，主要配置文件说明如表2所示。例如客户端软件包为“FusionInsight_Cluster_1_Services_Client.tar”，下

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Kudu开发指南（安全模式） > 准备Kudu应用开发环境
使用Broker Load方式导入数据至Doris - MapReduce服务 MRS

"FileNumber":1,"FileSize":5540} 1 row in set (0.01 sec) 可手动取消Broker Load作业状态不为“CANCELLED”或“FINISHED”的导入任务，取消时需要指定待取消导入任务的Label ，命令为： CANCEL LOAD

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Doris > Doris数据导入
安装补丁前准备 - MapReduce服务 MRS

安装补丁前准备安装补丁前需要手动进行以下相关检查。检查所有节点管理平面网络是否互通登录FusionInsight Manager界面，选择“运维 > 告警 > 告警”。查看当前集群是否存在“ALM-12089 节点间网络互通异常”或“节点故障”等告警。是，节点间网络不互通，请联系运维人员修复。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群补丁说明 > MRS 3.2.0-LTS.1.8补丁说明
Spark读写Hudi资源配置建议 - MapReduce服务 MRS

//堆外内存基于Spark进行ETL计算，CPU核心：内存比例建议>1:2，推荐1：4~1：8 上一个规则是指纯读写的资源配比，如果Spark的作业除了读写还有业务逻辑计算，该过程会导致需要内存增加，因此建议CPU核心与内存的比例大于1：2，如果逻辑比较复杂适当调大内存，这要基于实际情

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Spark on Hudi开发规范
MapReduce与其他组件的关系 - MapReduce服务 MRS

Master组成。其中ResourceManager是一个全新的资源管理系统，而ApplicationMaster则负责MapReduce作业的数据切分、任务划分、资源申请和任务调度与容错等工作。父主题： MapReduce

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > MapReduce
HBase应用开发建议 - MapReduce服务 MRS

储；同时读取的数据存放在同一行；同时读取的数据存放在同一cell。查询频繁属性放在Rowkey前面部分。Rowkey的设计在排序上必须与主要的查询条件契合。离散度较好的属性作为RowKey组成部分。分析数据离散度特点以及查询场景，综合各种场景进行设计。存储冗余信息，提高检索性能。使用二级索引，适应更多查询场景。

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > HBase应用开发规范
配置Flink对接Kafka安全认证 - MapReduce服务 MRS

证。 Kerberos认证配置客户端配置。在Flink配置文件“flink-conf.yaml”中，增加kerberos认证相关配置（主要在“contexts”项中增加“KafkaClient”），示例如下： security.kerberos.login.keytab: /

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink用户权限管理
准备本地应用开发环境 - MapReduce服务 MRS

XX/XXX_HSBroker/etc/”目录，下载“hetuserver.jks”文件，并将该文件也放置到“resources”目录下，主要配置文件说明如表3所示。表3 配置文件文件名称作用 hdfs-site.xml 集群HDFS相关配置参数。 hetuserver-client

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HetuEngine开发指南（安全模式） > 准备HetuEngine应用开发环境
离线Compaction配置 - MapReduce服务 MRS

例如1小时左右生成一个Compaction计划的话，执行Compaction计划的调度任务应该至少半小时调度一次。 Compaction作业配置的资源，vcore数至少要大于等于单个分区的桶数，vcore数与内存的比例应为1：4即1个vcore配4G内存。父主题： Bucket调优示例

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Bucket调优示例
创建大量ZNode后ZooKeeper Server启动失败 - MapReduce服务 MRS

可能存在以下场景，在ZooKeeper中创建的数据过大，需要大量时间与leader同步，并保存到硬盘。在这个过程中，如果ZooKeeper需要运行很长时间，则需确保没有其他监控应用程序kill ZooKeeper而判断其服务停止。父主题： ZooKeeper常见问题

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ZooKeeper > ZooKeeper常见问题
访问Hue WebUI界面 - MapReduce服务 MRS

Browsers”管理Hive中的表。需要MRS集群已安装Hive。使用查看HDFS中的目录和文件。需要MRS集群已安装HDFS。使用查看MRS集群中所有作业。需要MRS集群已安装YARN。使用创建的用户第一次登录Hue WebUI，需修改密码。用户获取Hue WebUI的访问地址后，可以给

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hue（MRS 3.x之前版本）
Hudi Compaction操作说明 - MapReduce服务 MRS

迟，因而进行不阻塞摄入的异步Compaction很有意义。异步Compaction会进行如下两个步骤：调度Compaction：由入湖作业完成，在这一步，Hudi扫描分区并选出待进行compaction的FileSlice，最后CompactionPlan会写入Hudi的Timeline。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > 数据管理维护
Spark SQL样例程序开发思路 - MapReduce服务 MRS

input_data2.txt /tmp/input，上传数据文件。开发思路统计日志文件中本周末网购停留总时间超过2个小时的女性网民信息。主要分为四个部分：创建表，将日志文件数据导入到表中。筛选女性网民，提取上网时间数据信息。汇总每个女性上网总时间。筛选出停留时间大于两个小时的女性网民信息。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark SQL样例程序
Flink开启Checkpoint样例程序（Java） - MapReduce服务 MRS

hijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWZYX0987654321"; // 算子的主要逻辑，每秒钟向流图中注入10000个元组 public void run(SourceContext<Tuple4<Long, String

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（普通模式） > 开发Flink应用 > Flink开启Checkpoint样例程序
Spark Core样例程序开发思路 - MapReduce服务 MRS

-putinput_data2.txt /tmp/input，上传数据文件。开发思路统计日志文件中本周末网购停留总时间超过2个小时的女性网民信息。主要分为四个部分：读取原文件数据。筛选女性网民上网时间数据信息。汇总每个女性上网总时间。筛选出停留时间大于两个小时的女性网民信息。运行前置操作

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark Core样例程序
MRS集群用户权限模型 - MapReduce服务 MRS

rn的组件ACL规则仍将生效），用户需通过Ranger管理界面添加策略进行资源的赋权。 Ranger的权限模型由多条权限策略组成，权限策略主要由以下几方面组成：资源组件所提供的可由用户访问的对象，例如HDFS的文件或文件夹、Yarn中的队列、Hive中的数据库/表/列等。用户

 帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群用户 > 集群用户权限概述
MapReduce Shuffle调优 - MapReduce服务 MRS

GC时间不应超过task运行时间的10%，即GC time elapsed (ms)/CPU time spent (ms)<10%。主要通过如下参数进行调整。参数入口：进入Yarn服务参数“全部配置”界面，在搜索框中输入参数名称。具体操作请参考修改集群服务配置参数章节。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用MapReduce > MapReduce性能调优
MapReduce Shuffle调优 - MapReduce服务 MRS

GC时间不应超过task运行时间的10%，即GC time elapsed (ms)/CPU time spent (ms)<10%。主要通过如下参数进行调整。参数入口：进入Yarn服务参数“全部配置”界面，在搜索框中输入参数名称。具体操作请参考修改集群服务配置参数章节。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Mapreduce > MapReduce性能调优
Flink SQL逻辑开发建议 - MapReduce服务 MRS

t1 多个Flink作业或者insert into语句写同一张Gauss for MySQL时建议过滤回撤数据当有多个Flink作业写同一张MySQL表时，其中一个Flink作业发送回撤数据（-D、-U）到目标表删除整行数据，再插入本次更新的数据，导致其他作业写入的字段全部丢失。

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > Flink SQL逻辑开发规范

总条数： 2268

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

从零开始使用Spark SQL - MapReduce服务 MRS

准备本地应用开发环境 - MapReduce服务 MRS

使用Broker Load方式导入数据至Doris - MapReduce服务 MRS

安装补丁前准备 - MapReduce服务 MRS

Spark读写Hudi资源配置建议 - MapReduce服务 MRS

MapReduce与其他组件的关系 - MapReduce服务 MRS

HBase应用开发建议 - MapReduce服务 MRS

配置Flink对接Kafka安全认证 - MapReduce服务 MRS

准备本地应用开发环境 - MapReduce服务 MRS

离线Compaction配置 - MapReduce服务 MRS

创建大量ZNode后ZooKeeper Server启动失败 - MapReduce服务 MRS

访问Hue WebUI界面 - MapReduce服务 MRS

Hudi Compaction操作说明 - MapReduce服务 MRS

Spark SQL样例程序开发思路 - MapReduce服务 MRS

Flink开启Checkpoint样例程序（Java） - MapReduce服务 MRS

Spark Core样例程序开发思路 - MapReduce服务 MRS

MRS集群用户权限模型 - MapReduce服务 MRS

MapReduce Shuffle调优 - MapReduce服务 MRS

MapReduce Shuffle调优 - MapReduce服务 MRS

Flink SQL逻辑开发建议 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线