搜索_华为云

配置HDFS细粒度锁 - MapReduce服务 MRS

配置HDFS细粒度锁操作场景历史版本的HDFS使用了全局锁，读-写互斥，写-写互斥，即全局一把锁。但是实际上并非所有的读-写，写-写操作都会产生资源竞争。因此在该版本汇总引入了细粒度锁特性（FGL）。FGL对全局锁按照目录以及操作类型进行拆分，只有会产生资源竞争的操作才会使用同一个锁。因此极大地提升了写性能。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS企业级能力增强
提升HBase连续Put数据场景性能 - MapReduce服务 MRS

提升HBase连续Put数据场景性能操作场景对大批量、连续put的场景，配置下面的两个参数为“false”时能大量提升性能。 hbase.wal.hsync hbase.hfile.hsync 当提升性能时，缺点是对于DataNode（默认是3个）同时故障时，存在小概率数据丢

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase > HBase性能调优
配置Hive Python3样例工程 - MapReduce服务 MRS

配置Hive Python3样例工程操作场景为了运行MRS产品Hive组件的Python3接口样例代码，需要完成下面的操作。操作步骤客户端机器必须安装有Python3，其版本不低于3.6，最高不能超过3.8。在客户端机器的命令行终端输入python3可查看Python版本号。如下显示Python版本为3

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Hive开发指南（安全模式） > 准备Hive应用开发环境 > 导入并配置Hive样例工程
Join-To-Live - MapReduce服务 MRS
Join-To-Live - MapReduce服务 MRS

Join-To-Live Flink双流Join需要将数据存储在状态后端，目前普遍使用Rocksdb作为状态后端。在TTL过大或无法确定TTL或数据流量增加的场景下，大流量会导致状态数据增加，增加存储压力，从而导致作业稳定性下降，或TTL过期可能出现数据关联不准确。对于数据关联

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink企业级能力增强
设置HBase和HDFS的句柄数限制 - MapReduce服务 MRS

设置HBase和HDFS的句柄数限制操作场景当打开一个HDFS文件时，句柄数限制导出，出现如下错误： IOException (Too many open files) 此时可以参考该章节设置HBase和HDFS的句柄数。设置HBase和HDFS的句柄数限制联系集群管理员

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS
调整Hive元数据超时 - MapReduce服务 MRS

调整Hive元数据超时大分区表包含过多分区，导致任务超时，同时大量分区可能需要更多时间来加载与元存储缓存同步。因此，为了在更大规模存储中获得更好的性能，建议相应地调整加载元数据缓存最大超时时间和加载元数据连接池最大等待时间。使用HetuEngine管理员用户登录FusionInsight

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine性能调优
SparkSQL访问Hive分区表启动Job前耗时较长如何处理？ - MapReduce服务 MRS

SparkSQL访问Hive分区表启动Job前耗时较长如何处理？问题背景使用SparkSql访问Hive的一个数据存放于OBS的一个分区表，但是运行速度却很慢，并且会大量调用OBS的查询接口。 SQL样例： select a,b,c from test where b=xxx

帮助中心 > MapReduce服务 MRS > 常见问题 > 作业管理类
Flink on Hudi作业参数规则 - MapReduce服务 MRS

Flink on Hudi作业参数规则 Flink作业参数配置规范 Flink作业参数配置规范如下表所示。表1 Flink作业参数配置规范参数名称是否必填参数描述建议值 -c 必填指定主类名。根据实际情况而定 -ynm 必填 Flink Yarn作业名称。根据实际情况而定

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > Flink on Hudi开发规范
EditLog不连续导致NameNode启动失败 - MapReduce服务 MRS

EditLog不连续导致NameNode启动失败问题在JournalNode节点有断电，数据目录磁盘占满，网络异常时，会导致JournalNode上的EditLog不连续。此时如果重启NameNode，很可能会失败。现象重启NameNode会失败。在NameNode运行日志中会报如下的错误：

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS故障排除
配置Hive Python样例工程 - MapReduce服务 MRS

配置Hive Python样例工程操作场景为了运行MRS产品Hive组件的Python接口样例代码，需要完成下面的操作。操作步骤客户端机器必须安装有Python，其版本不低于2.6.6，最高不能超过2.7.13。在客户端机器的命令行终端输入python可查看Python版本号。如下显示Python版本为2

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Hive开发指南（普通模式） > 准备Hive应用开发环境 > 导入并配置Hive样例工程
配置Hive Python样例工程 - MapReduce服务 MRS

配置Hive Python样例工程操作场景为了运行MRS产品Hive组件的Python接口样例代码，需要完成下面的操作。操作步骤客户端机器必须安装有Python，其版本不低于2.6.6，最高不能超过2.7.13。在客户端机器的命令行终端输入python可查看Python版本号。如下显示Python版本为2

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Hive开发指南（安全模式） > 准备Hive应用开发环境 > 导入并配置Hive样例工程
配置NFS服务器存储NameNode元数据 - MapReduce服务 MRS

配置NFS服务器存储NameNode元数据操作场景本章节适用于MRS 3.x及后续版本。用户在部署集群前，可根据需要规划Network File System（简称NFS）服务器，用于存储NameNode元数据，以提高数据可靠性。如果您已经部署NFS服务器，并已配置NFS

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS > HDFS运维管理
配置NFS服务器存储NameNode元数据 - MapReduce服务 MRS

配置NFS服务器存储NameNode元数据操作场景本章节适用于MRS 3.x及后续版本。用户在部署集群前，可根据需要规划Network File System（简称NFS）服务器，用于存储NameNode元数据，以提高数据可靠性。如果您已经部署NFS服务器，并已配置NFS

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS运维管理
Oozie应用开发简介 - MapReduce服务 MRS

Oozie应用开发简介 Oozie简介 Oozie是一个用来管理Hadoop job任务的工作流引擎，Oozie流程基于有向无环图（Directed Acyclical Graph）来定义和描述，支持多种工作流模式及流程定时触发机制。易扩展、易维护、可靠性高，与Hadoop生态系统各组件紧密结合。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Oozie开发指南（安全模式）
【Hue WebUI】Hue WebUI页面无法访问 - MapReduce服务 MRS

【Hue WebUI】Hue WebUI页面无法访问现象描述 Hue服务组件的Hue WebUI页面打不开。原因分析端口未对外开放。浮动IP配置错误。一次性查询大量的数据，导致查询耗时长，占用了Hue中Hive的链接，导致Hue访问出现异常。排查思路在浏览器所在的本

 帮助中心 > MapReduce服务 MRS > 故障排除 > Web页面访问类 > 访问MRS组件Web UI界面常见异常问题
配置HDFS快速关闭文件功能 - MapReduce服务 MRS

配置HDFS快速关闭文件功能操作场景默认情况下关闭HDFS文件时需要等待所有的Block都上报成功（处于COMPLETED状态）。因此HDFS的一部分写性能消耗为等待DataNode块上报以及NameNode处理块上报。对于一个负载较大的集群，等待的消耗对集群影响较大。HDF

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS企业级能力增强
查看Flume客户端日志 - MapReduce服务 MRS

查看Flume客户端日志安装Flume客户端。进入Flume客户端日志目录，默认为“/var/log/Bigdata”。执行如下命令查看日志文件列表。 ls -lR flume-client-* 日志文件示例如下： flume-client-1/flume: total 7672

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flume > Flume运维管理
查看Flume客户端日志 - MapReduce服务 MRS

查看Flume客户端日志安装Flume客户端。进入Flume客户端日志目录，默认为“/var/log/Bigdata”。执行如下命令查看日志文件列表。 ls -lR flume-client-* 日志文件示例如下： flume-client-1/flume: total 7672

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume > Flume运维管理
ClickHouse增加磁盘容量 - MapReduce服务 MRS

ClickHouse增加磁盘容量随着业务量的增长，ClickHouse节点数据盘的磁盘容量已不能满足业务需求，需要扩容数据盘磁盘容量。如果购买MRS集群的计费模式为按需计费，扩容磁盘容量后MRS集群不支持转包周期。本章节仅适用于MRS 3.1.0版本。前提条件 ClickHouse集群和实例状态正常。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ClickHouse > ClickHouse运维管理 > ClickHouse集群管理
Hive应用开发简介 - MapReduce服务 MRS

Hive应用开发简介 Hive介绍 Hive是一个开源的，建立在Hadoop上的数据仓库框架，提供类似SQL的HQL语言操作结构化数据，其基本原理是将HQL语言自动转换成MapReduce任务或Spark任务，从而完成对Hadoop集群中存储的海量数据进行查询和分析。 Hive主要特点如下：

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Hive开发指南（普通模式）

总条数： 5439

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置HDFS细粒度锁 - MapReduce服务 MRS

提升HBase连续Put数据场景性能 - MapReduce服务 MRS

配置Hive Python3样例工程 - MapReduce服务 MRS

Join-To-Live - MapReduce服务 MRS

设置HBase和HDFS的句柄数限制 - MapReduce服务 MRS

调整Hive元数据超时 - MapReduce服务 MRS

SparkSQL访问Hive分区表启动Job前耗时较长如何处理？ - MapReduce服务 MRS

Flink on Hudi作业参数规则 - MapReduce服务 MRS

EditLog不连续导致NameNode启动失败 - MapReduce服务 MRS

配置Hive Python样例工程 - MapReduce服务 MRS

配置Hive Python样例工程 - MapReduce服务 MRS

配置NFS服务器存储NameNode元数据 - MapReduce服务 MRS

配置NFS服务器存储NameNode元数据 - MapReduce服务 MRS

Oozie应用开发简介 - MapReduce服务 MRS

【Hue WebUI】Hue WebUI页面无法访问 - MapReduce服务 MRS

配置HDFS快速关闭文件功能 - MapReduce服务 MRS

查看Flume客户端日志 - MapReduce服务 MRS

查看Flume客户端日志 - MapReduce服务 MRS

ClickHouse增加磁盘容量 - MapReduce服务 MRS

Hive应用开发简介 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线