搜索_华为云

HDFS样例程序开发思路 - MapReduce服务 MRS

HDFS样例程序开发思路场景说明 HDFS的业务操作对象是文件，代码样例中所涉及的文件操作主要包括创建文件夹、写文件、追加文件内容、读文件和删除文件/文件夹；HDFS还有其他的业务处理，例如设置文件权限等，其他操作可以在掌握本代码样例之后，再扩展学习。本代码样例讲解顺序为： HDFS初始化

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HDFS开发指南（安全模式） > 开发HDFS应用
MRS集群补丁说明 - MapReduce服务 MRS

MRS集群补丁说明 EulerOS补丁说明 MRS 3.3.1-LTS.1.2补丁说明 MRS 3.3.1-LTS.1.1补丁说明 MRS 3.3.0-LTS.1.1补丁说明 MRS 3.3.0.3.1补丁说明 MRS 3.2.0-LTS.1.10补丁说明 MRS 3.2.0-LTS

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维
批量构建HBase全局二级索引数据 - MapReduce服务 MRS

批量构建HBase全局二级索引数据场景介绍在用户的表中预先存在大量数据的情况下，可基于MapReaduce任务，批量构建已有数据的索引数据。批量构建全局二级索引数据只有处于INACTIVE状态的索引才能进行批量构建，如需重建索引数据，请先修改索引状态。数据表中存在大量数

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase企业级能力增强 > 配置HBase全局二级索引提升查询效率
配置Hive Python3样例工程 - MapReduce服务 MRS

配置Hive Python3样例工程操作场景为了运行MRS产品Hive组件的Python3接口样例代码，需要完成下面的操作。操作步骤客户端机器必须安装有Python3，其版本不低于3.6，最高不能超过3.8。在客户端机器的命令行终端输入python3可查看Python版本号。如下显示Python版本为3

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Hive开发指南（普通模式） > 准备Hive应用开发环境 > 导入并配置Hive样例工程
Doris建表规范 - MapReduce服务 MRS
Doris建表规范 - MapReduce服务 MRS

Doris建表规范该章节主要介绍创建Doris表时需遵循的规则和建议。 Doris建表规则在创建Doris表指定分桶buckets时，每个桶的数据大小应保持在100MB~3GB之间，单分区中最大分桶数量不超过5000。表数据超过5亿条以上必须设置分区分桶策略。表的分桶列不

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Doris应用开发规范
CarbonData - MapReduce服务 MRS
CarbonData - MapReduce服务 MRS

CarbonData CarbonData是一种新型的Apache Hadoop本地文件格式，使用先进的列式存储、索引、压缩和编码技术，以提高计算效率，有助于加速超过PB数量级的数据查询，可用于更快的交互查询。同时，CarbonData也是一种将数据源与Spark集成的高性能分析引擎。

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍
Spark SQL无法查询到ORC类型的Hive表的新插入数据 - MapReduce服务 MRS

Spark SQL无法查询到ORC类型的Hive表的新插入数据问题为什么通过Spark SQL无法查询到存储类型为ORC的Hive表的新插入数据？主要有以下两种场景存在这个问题：对于分区表和非分区表，在Hive客户端中执行插入数据的操作后，会出现Spark SQL无法查询到最新插入的数据的问题。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > SQL和DataFrame
Spark SQL无法查询到ORC类型的Hive表的新插入数据 - MapReduce服务 MRS

Spark SQL无法查询到ORC类型的Hive表的新插入数据问题为什么通过Spark SQL无法查询到存储类型为ORC的Hive表的新插入数据？主要有以下两种场景存在这个问题：对于分区表和非分区表，在Hive客户端中执行插入数据的操作后，会出现Spark SQL无法查询到最新插入的数据的问题。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > SQL和DataFrame
配置NFS服务器存储NameNode元数据 - MapReduce服务 MRS

配置NFS服务器存储NameNode元数据操作场景本章节适用于MRS 3.x及后续版本。用户在部署集群前，可根据需要规划Network File System（简称NFS）服务器，用于存储NameNode元数据，以提高数据可靠性。如果您已经部署NFS服务器，并已配置NFS

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS > HDFS运维管理
配置NFS服务器存储NameNode元数据 - MapReduce服务 MRS

配置NFS服务器存储NameNode元数据操作场景本章节适用于MRS 3.x及后续版本。用户在部署集群前，可根据需要规划Network File System（简称NFS）服务器，用于存储NameNode元数据，以提高数据可靠性。如果您已经部署NFS服务器，并已配置NFS

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS运维管理
配置HDFS细粒度锁 - MapReduce服务 MRS

配置HDFS细粒度锁操作场景历史版本的HDFS使用了全局锁，读-写互斥，写-写互斥，即全局一把锁。但是实际上并非所有的读-写，写-写操作都会产生资源竞争。因此在该版本汇总引入了细粒度锁特性（FGL）。FGL对全局锁按照目录以及操作类型进行拆分，只有会产生资源竞争的操作才会使用同一个锁。因此极大地提升了写性能。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS企业级能力增强
备NameNode节点长时间未启动，导致启动失败 - MapReduce服务 MRS

备NameNode节点长时间未启动，导致启动失败问题长时间没有启动备NameNode，edits文件由于老化策略被自动清理后，重新启动NameNode时找不到所需的edits文件，从而报错。 There appears to be a gap in the edit log.

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS故障排除
Hudi数据表Compaction规范 - MapReduce服务 MRS

Hudi数据表Compaction规范 mor表更新数据以行存log的形式写入，log读取时需要按主键合并，并且是行存的，导致log读取效率比parquet低很多。为了解决log读取的性能问题，Hudi通过compaction将log压缩成parquet文件，大幅提升读取性能。规则

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Hudi数据表管理操作规范
Hive Group By语句优化 - MapReduce服务 MRS

Hive Group By语句优化操作场景优化Group by语句，可提升命令执行速度和查询速度。 Group by的时候， Map端会先进行分组，分组完后分发到Reduce端， Reduce端再进行分组。可采用Map端聚合的方式来进行Group by优化，开启Map端初步聚合，减少Map的输出数据量。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive性能调优
Flume客户端安装失败 - MapReduce服务 MRS

Flume客户端安装失败问题现象安装Flume客户端失败，提示JAVA_HOME is null或flume has been installed。 CST 2016-08-31 17:02:51 [flume-client install]: JAVA_HOME is null

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Flume
SHOW - MapReduce服务 MRS
SHOW - MapReduce服务 MRS

SHOW_FS_PATH_DETAIL 本章节仅适用于MRS 3.3.0及之后版本。命令功能查看指定的FS路径的统计数据命令格式 call show_fs_path_detail(path=>'[path]', is_sub=>'[is_sub]', sort=>'[sort]');

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
配置Hive Python3样例工程 - MapReduce服务 MRS

配置Hive Python3样例工程操作场景为了运行MRS产品Hive组件的Python3接口样例代码，需要完成下面的操作。操作步骤客户端机器必须安装有Python3，其版本不低于3.6，最高不能超过3.8。在客户端机器的命令行终端输入python3可查看Python版本号。如下显示Python版本为3

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Hive开发指南（安全模式） > 准备Hive应用开发环境 > 导入并配置Hive样例工程
Flink on Hudi作业参数规则 - MapReduce服务 MRS

Flink on Hudi作业参数规则 Flink作业参数配置规范 Flink作业参数配置规范如下表所示。表1 Flink作业参数配置规范参数名称是否必填参数描述建议值 -c 必填指定主类名。根据实际情况而定 -ynm 必填 Flink Yarn作业名称。根据实际情况而定

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > Flink on Hudi开发规范
调整Hive元数据超时 - MapReduce服务 MRS

调整Hive元数据超时大分区表包含过多分区，导致任务超时，同时大量分区可能需要更多时间来加载与元存储缓存同步。因此，为了在更大规模存储中获得更好的性能，建议相应地调整加载元数据缓存最大超时时间和加载元数据连接池最大等待时间。使用HetuEngine管理员用户登录FusionInsight

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine性能调优
SparkSQL访问Hive分区表启动Job前耗时较长如何处理？ - MapReduce服务 MRS

SparkSQL访问Hive分区表启动Job前耗时较长如何处理？问题背景使用SparkSql访问Hive的一个数据存放于OBS的一个分区表，但是运行速度却很慢，并且会大量调用OBS的查询接口。 SQL样例： select a,b,c from test where b=xxx

帮助中心 > MapReduce服务 MRS > 常见问题 > 作业管理类

总条数： 5420

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

HDFS样例程序开发思路 - MapReduce服务 MRS

MRS集群补丁说明 - MapReduce服务 MRS

批量构建HBase全局二级索引数据 - MapReduce服务 MRS

配置Hive Python3样例工程 - MapReduce服务 MRS

Doris建表规范 - MapReduce服务 MRS

CarbonData - MapReduce服务 MRS

Spark SQL无法查询到ORC类型的Hive表的新插入数据 - MapReduce服务 MRS

Spark SQL无法查询到ORC类型的Hive表的新插入数据 - MapReduce服务 MRS

配置NFS服务器存储NameNode元数据 - MapReduce服务 MRS

配置NFS服务器存储NameNode元数据 - MapReduce服务 MRS

配置HDFS细粒度锁 - MapReduce服务 MRS

备NameNode节点长时间未启动，导致启动失败 - MapReduce服务 MRS

Hudi数据表Compaction规范 - MapReduce服务 MRS

Hive Group By语句优化 - MapReduce服务 MRS

Flume客户端安装失败 - MapReduce服务 MRS

SHOW - MapReduce服务 MRS

配置Hive Python3样例工程 - MapReduce服务 MRS

Flink on Hudi作业参数规则 - MapReduce服务 MRS

调整Hive元数据超时 - MapReduce服务 MRS

SparkSQL访问Hive分区表启动Job前耗时较长如何处理？ - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线