搜索_华为云

从零开始使用Spark - MapReduce服务 MRS

从零开始使用Spark 本章节提供从零开始使用Spark提交sparkPi作业的操作指导，sparkPi是最经典的Spark作业，它用来计算Pi（π）值。操作步骤准备sparkPi程序。开源的Spark的样例程序包含多个例子，其中包含sparkPi。可以从https://archive

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark（MRS 3.x之前版本）
在线检索MRS集群日志 - MapReduce服务 MRS

在线检索MRS集群日志 MRS集群Manager支持在线检索并显示组件的日志内容，用于问题定位等其他日志查看场景，管理员可在线按照节点范围或者组件角色范围快速检视所有日志，通过关键字分析快速定位问题。本章节操作仅支持MRS 3.x及之后的版本。在线检索日志登录FusionInsight

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > 查看MRS集群日志
使用Spark - MapReduce服务 MRS
使用Spark - MapReduce服务 MRS

使用Spark 运行Spark应用时修改split值报错提交Spark任务时提示参数格式错误磁盘容量不足导致Spark、Hive和Yarn服务不可用引入jar包不正确导致Spark任务无法运行 Spark任务由于内存不够或提交作业时未添加Jar包，作业卡住提交Spark任

 帮助中心 > MapReduce服务 MRS > 故障排除
使用Hudi - MapReduce服务 MRS
使用Hudi - MapReduce服务 MRS

使用Hudi Hudi表概述使用Spark Shell创建Hudi表使用spark-sql操作Hudi表使用Hudi-Cli.sh操作Hudi表 Hudi写操作 Hudi读操作 Hudi数据管理维护 Hudi SQL语法参考 Hudi Schema演进配置Hudi数据列默认值

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版）
集群在线扩缩容 - MapReduce服务 MRS

集群在线扩缩容大数据集群的处理能力通常可以通过增加集群的节点数来横向扩展，当集群规模不符合业务要求时，用户可以通过该功能进行集群节点规模的调整，进行扩容或者缩容；在缩容节点时，MRS会智能地选择负载最少或者迁移数据量最小节点，并且在缩容过程中，缩容节点不再接收新的任务，正在执行

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 产品功能 > 集群管理
使用Storm - MapReduce服务 MRS
使用Storm - MapReduce服务 MRS

使用Storm 从零开始使用Storm 使用Storm客户端使用客户端提交Storm拓扑访问Storm的WebUI 管理Storm拓扑查看Storm拓扑日志 Storm常用参数配置Storm业务用户密码策略迁移Storm业务至Flink Storm日志介绍性能调优

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版）
使用HDFS - MapReduce服务 MRS
使用HDFS - MapReduce服务 MRS

使用HDFS 修改RPC端口后HDFS NameNode实例都变为备状态通过公网IP连接使用HDFS客户端报错使用Python远程连接HDFS的端口失败 HDFS容量达到100%导致上层服务HBase、Spark等不可用启动HDFS和Yarn服务报错“Permission denied”

帮助中心 > MapReduce服务 MRS > 故障排除
使用Storm - MapReduce服务 MRS
使用Storm - MapReduce服务 MRS

提交Storm拓扑后Worker运行异常，日志提示Failed to bind to XXX 使用jstack命令查看进程堆栈提示“well-known file is not secure” 使用Storm-JDBC插件开发Oracle写入Bolt时发现数据无法写入 Storm业务拓扑配置GC参数不生效 Storm

帮助中心 > MapReduce服务 MRS > 故障排除
使用Loader导入数据 - MapReduce服务 MRS

过滤器类型选择文件过滤的条件。“WILCARD”表示使用通配符过滤，“REGEX”表示使用正则表达式匹配。与“路径过滤器”和“文件过滤器”配合使用。不选择值时默认为通配符过滤。路径过滤器与“过滤器类型”配合使用，配置通配符或正则表达式对源文件的输入路径包含的目录进行过滤

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导入
使用HBase - MapReduce服务 MRS
使用HBase - MapReduce服务 MRS

使用HBase 创建HBase权限角色 HBase客户端使用实践快速使用HBase进行离线数据分析使用BulkLoad工具向HBase迁移数据 HBase数据操作 HBase企业级能力增强 HBase性能调优 HBase运维管理 HBase常见问题 HBase故障排除

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版）
使用HBase - MapReduce服务 MRS
使用HBase - MapReduce服务 MRS

集群上下电之后HBase启动失败文件块过大导致HBase数据导入失败使用Phoenix创建HBase表后，向索引表中加载数据报错在MRS集群客户端无法执行hbase shell命令 HBase shell客户端在使用中有INFO信息打印在控制台导致显示混乱 RegionServer剩余内存不足导致HBase服务启动失败

 帮助中心 > MapReduce服务 MRS > 故障排除
使用Yarn - MapReduce服务 MRS
使用Yarn - MapReduce服务 MRS

使用Yarn 集群启动Yarn后产生大量作业占用资源通过客户端hadoop jar命令提交任务后返回“GC overhead”报错 Yarn汇聚日志过大导致节点磁盘被占满 MapReduce任务异常，临时文件未删除 Yarn客户端的端口信息错误导致提交任务后报错connection

帮助中心 > MapReduce服务 MRS > 故障排除
开源sqoop-shell工具使用指导 - MapReduce服务 MRS

sqoop2-shell有两种获取登录认证信息的方式，第一种通过配置文件获取，具体配置项请参考使用sqoop-shell工具导入数据到HDFS、使用sqoop-shell工具导入数据到HBase；第二种方式则使用参数直接提供认证信息，这个方式有两种模式：密码模式和Kerberos认证模式。进入交互模式命令

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 客户端工具说明
快速使用Flume采集节点日志 - MapReduce服务 MRS

快速使用Flume采集节点日志操作场景 Flume支持将采集的日志信息导入到Kafka。前提条件已创建开启Kerberos认证的包含Flume、Kafka等组件的流式集群。可参考购买自定义集群。已配置网络，使日志生成节点与流集群互通。使用Flume客户端（MRS 3.x之前版本）

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume
使用Oozie - MapReduce服务 MRS
使用Oozie - MapReduce服务 MRS

使用Oozie 并发提交大量oozie任务时，任务一直没有运行 Oozie调度HiveSQL作业报错处理在MRS集群外客户端提交不了Oozie任务或两个小时才提交成功

 帮助中心 > MapReduce服务 MRS > 故障排除
cache table使用指导 - MapReduce服务 MRS

cache table使用指导问题 cache table的作用是什么？cache table时需要注意哪些方面？回答 Spark SQL可以将表cache到内存中，并且使用压缩存储来尽量减少内存压力。通过将表cache，查询可以直接从内存中读取数据，从而减少读取磁盘带来的内存开销。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > SQL和DataFrame
Flink客户端使用实践 - MapReduce服务 MRS

Flink客户端使用实践本节提供使用Flink运行wordcount作业的操作指导。使用Flink客户端前提条件 MRS集群中已安装Flink组件。集群正常运行，已安装集群客户端，例如安装目录为“/opt/hadoopclient”。以下操作的客户端目录只是举例，请根据实际安装目录修改。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink
使用Hudi - MapReduce服务 MRS
使用Hudi - MapReduce服务 MRS

使用Hudi Hudi表概述使用Spark Shell创建Hudi表使用Hudi-Cli.sh操作Hudi表 Hudi写操作 Hudi读操作数据管理维护 Hudi常见配置参数 Hudi性能调优 Hudi常见问题

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版）
快速使用Flume采集节点日志 - MapReduce服务 MRS

快速使用Flume采集节点日志 Flume支持将采集的日志信息导入到Kafka。前提条件已创建开启Kerberos认证的包含Flume、Kafka等组件的流式集群。可参考购买自定义集群。已配置网络，使日志生成节点与流集群互通。使用Flume客户端普通集群不需要执行2-6。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flume
使用ZooKeeper客户端 - MapReduce服务 MRS

使用ZooKeeper客户端 Zookeeper是一个开源的，高可靠的，分布式一致性协调服务。Zookeeper设计目标是用来解决那些复杂，易出错的分布式系统难以保证数据一致性的。不必开发专门的协同应用，十分适合高可用服务保持数据一致性。背景信息在使用客户端前，除主管理节点以

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ZooKeeper

总条数： 5623

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

从零开始使用Spark - MapReduce服务 MRS

在线检索MRS集群日志 - MapReduce服务 MRS

使用Spark - MapReduce服务 MRS

使用Hudi - MapReduce服务 MRS

集群在线扩缩容 - MapReduce服务 MRS

使用Storm - MapReduce服务 MRS

使用HDFS - MapReduce服务 MRS

使用Storm - MapReduce服务 MRS

使用Loader导入数据 - MapReduce服务 MRS

使用HBase - MapReduce服务 MRS

使用HBase - MapReduce服务 MRS

使用Yarn - MapReduce服务 MRS

开源sqoop-shell工具使用指导 - MapReduce服务 MRS

快速使用Flume采集节点日志 - MapReduce服务 MRS

使用Oozie - MapReduce服务 MRS

cache table使用指导 - MapReduce服务 MRS

Flink客户端使用实践 - MapReduce服务 MRS

使用Hudi - MapReduce服务 MRS

快速使用Flume采集节点日志 - MapReduce服务 MRS

使用ZooKeeper客户端 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线