搜索_华为云

配置Spark小文件自动合并 - MapReduce服务 MRS

配置Spark小文件自动合并配置场景小文件自动合并特性开启后，Spark将数据先写入临时目录，再去检测每个分区的平均文件大小是否小于16MB（默认值）。如果发现平均文件大小小于16MB，则认为分区下有小文件，Spark会启动一个Job合并这些小文件，并将合并后的大文件写入到最终的表目录下。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强
HDFS文件读写时报错“Failed to place enough replicas” - MapReduce服务 MRS

HDFS文件读写时报错“Failed to place enough replicas” 问题背景与现象当用户在HDFS上执行写操作时，出现“Failed to place enough replicas:expected…”信息。原因分析 DataNode的数据接收器不可用。

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用HDFS
TEXTFILE类型文件使用ARC4压缩时查询结果乱码 - MapReduce服务 MRS

TEXTFILE类型文件使用ARC4压缩时查询结果乱码问题现象 Hive查询结果表做压缩存储（ARC4），对结果表做select * 查询时返回结果为乱码。可能原因 Hive默认压缩格式不是ARC4格式或者未开启输出压缩。解决方案在select结果乱码时，在beeline中进行如下设置。

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hive
HDFS基本原理 - MapReduce服务 MRS
HDFS基本原理 - MapReduce服务 MRS

NameNode 用于管理文件系统的命名空间、目录结构、元数据信息以及提供备份机制等，分为： Active NameNode：管理文件系统的命名空间、维护文件系统的目录结构树以及元数据信息；记录写入的每个“数据块”与其归属文件的对应关系。 Standby NameNode：与Active N

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > HDFS
HDFS样例程序开发思路 - MapReduce服务 MRS

HDFS的业务操作对象是文件，代码样例中所涉及的文件操作主要包括创建文件夹、写文件、追加文件内容、读文件和删除文件/文件夹；HDFS还有其他的业务处理，例如设置文件权限等，其他操作可以在掌握本代码样例之后，再扩展学习。本代码样例讲解顺序为： HDFS初始化创建目录写文件追加文件内容读文件

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HDFS开发指南（安全模式） > 开发HDFS应用
HDFS样例程序开发思路 - MapReduce服务 MRS

HDFS的业务操作对象是文件，代码样例中所涉及的文件操作主要包括创建文件夹、写文件、追加文件内容、读文件和删除文件/文件夹；HDFS还有其他的业务处理，例如设置文件权限等，其他操作可以在掌握本代码样例之后，再扩展学习。本代码样例讲解顺序为： HDFS初始化创建目录写文件追加文件内容读文件

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HDFS开发指南（普通模式） > 开发HDFS应用
MapReduce应用开发常用概念 - MapReduce服务 MRS

Hadoop shell命令 Hadoop基本shell命令，包括提交MapReduce作业，kill MapReduce作业，进行HDFS文件系统各项操作等。 MapReduce输入输出(InputFormat，OutputFormat) MapReduce框架根据用户指定的Inp

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > MapReduce开发指南 > MapReduce应用开发概述
mapred-default.xml文件解析异常导致WebHCat启动失败 - MapReduce服务 MRS

WebHCat/etc/”目录下面，且该文件内容为空。登录到Master1节点，将“/opt/Bigdata/*/*_WebHCat/etc/mapred-default.xml”文件拷贝到Master2节点，并修改文件的属组为“omm:wheel”。登录Manager，重启

 帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hive
如何查看MRS集群各组件配置文件路径？ - MapReduce服务 MRS

如何查看MRS集群各组件配置文件路径？常用组件配置文件路径如下所示：组件配置文件目录 ClickHouse 客户端安装路径/ClickHouse/clickhouse/config Flink 客户端安装路径/Flink/flink/conf Flume Flume客户端安

 帮助中心 > MapReduce服务 MRS > 常见问题 > 组件管理类
如何上传本地文件到集群内节点？ - MapReduce服务 MRS

如何上传本地文件到集群内节点？登录MapReduce服务管理控制台。选择“现有集群”，单击集群名，进入集群基本信息页面。在“节点管理”页签单击任一节点名称，登录到弹性云服务器管理控制台。参见申请弹性公网IP为集群的节点绑定一个弹性IP地址。参考上传文件到云服务器方式概览，将本地文件上传到集群节点。

帮助中心 > MapReduce服务 MRS > 常见问题 > 集群管理类
执行HDFS文件并发操作命令 - MapReduce服务 MRS

执行HDFS文件并发操作命令操作场景集群内并发修改文件和目录的权限及访问控制的工具。本章节适用于MRS 3.x及后续版本。对系统的影响因为集群内使用文件并发修改命令会对集群性能造成较大负担，所以在集群空闲时使用文件并发操作命令。前提条件已安装HDFS客户端或者包括H

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS > HDFS性能调优
使用Spark小文件合并工具说明 - MapReduce服务 MRS

此，小文件问题是制约Hadoop集群规模扩展的关键问题。本工具主要有如下两个功能：扫描表中有多少低于用户设定阈值的小文件，返回该表目录中所有数据文件的平均大小。对表文件提供合并功能，用户可设置合并后的平均文件大小。支持的表类型 Spark：Parquet、ORC、CSV、Text、Json。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core企业级能力增强
创建HDFS文件并写入内容 - MapReduce服务 MRS

创建HDFS文件并写入内容功能简介写文件过程为：使用FileSystem实例的create方法获取写文件的输出流。使用该数据流将内容写入到HDFS的指定文件中。在写完文件后，需关闭所申请资源。代码样例如下是写文件的代码片段，详细代码请参考com.huawei.bigdata

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HDFS开发指南（普通模式） > 开发HDFS应用
准备Spark连接集群配置文件 - MapReduce服务 MRS

tar”，继续解压该文件。进入客户端配置文件解压路径“*\Spark\config”，获取Spark配置文件，并所有的配置文件导入到Spark样例工程的配置文件目录中（通常为“resources”文件夹）。准备集群认证用户信息时获取的keytab文件也放置于该目录下。复制

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 准备Spark应用开发环境
配置ClickHouse对接OBS源文件 - MapReduce服务 MRS

[compression]) path：访问域名/OBS文件路径，登录OBS管理控制台，在左侧导航栏单击“并行文件系统”，在“并行文件系统”页面单击对应的文件系统名称，在“文件”页面单击文件名称，文件“链接”即path路径，如图1所示。图1 文件路径 ak：参数可选，具备访问OBS权限的ak。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse > ClickHouse数据导入
执行HDFS文件并发操作命令 - MapReduce服务 MRS

执行HDFS文件并发操作命令操作场景集群内并发修改文件和目录的权限及访问控制的工具。本章节适用于MRS 3.x及后续版本。对系统的影响因为集群内使用文件并发修改命令会对集群性能造成较大负担，所以在集群空闲时使用文件并发操作命令。前提条件已安装HDFS客户端或者包括H

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS性能调优
通过Flume采集指定目录日志系统文件至HDFS - MapReduce服务 MRS

system”，观察HDFS上“/flume/test”目录下是否有产生数据。图8 查看HDFS文件如上所示，文件目录下产生了收集的日志文件，文件名统一增加了前缀“over_”。下载日志文件“over_log1.txt”并查看内容，与写入的日志文件“log1.txt”内容一致。 Test log file 1

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
ALM-12041 关键文件权限异常 - MapReduce服务 MRS

败，产生一些临时文件，且没有读写可执行权限。如果这些文件产生在该告警的监控范围内，那么系统会上报该告警，告警原因可以看到是由于产生的临时文件权限异常导致，可以参照上述告警处理流程处理该告警，或者确认权限异常文件为临时文件后，可以直接删除。sed命令产生的临时文件类似于下图。收集故障信息。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-14006 HDFS文件数超过阈值 - MapReduce服务 MRS

ALM-14006 HDFS文件数超过阈值告警解释系统每30秒周期性检测HDFS文件数，并把实际文件数和阈值相比较。当检测到HDFS文件数指标超出阈值范围时产生该告警。平滑次数为1，HDFS文件数指标的值小于或等于阈值时，告警恢复；平滑次数大于1，HDFS文件数指标的值小于或等于阈值的90%时，告警恢复。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
Hive应用开发常用概念 - MapReduce服务 MRS

提供读写接口，提供Hive命令行接口来进行数据定义和元数据查询。基于MRS的HCatalog功能，Hive、MapReduce开发人员能够共享元数据信息，避免中间转换和调整，能够提升数据处理的效率。 WebHCat WebHCat运行用户通过Rest API来执行Hive DDL

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Hive开发指南（普通模式） > Hive应用开发概述

总条数： 2088

上一页
1
...
5
6
7
...
105
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置Spark小文件自动合并 - MapReduce服务 MRS

HDFS文件读写时报错“Failed to place enough replicas” - MapReduce服务 MRS

TEXTFILE类型文件使用ARC4压缩时查询结果乱码 - MapReduce服务 MRS

HDFS基本原理 - MapReduce服务 MRS

HDFS样例程序开发思路 - MapReduce服务 MRS

HDFS样例程序开发思路 - MapReduce服务 MRS

MapReduce应用开发常用概念 - MapReduce服务 MRS

mapred-default.xml文件解析异常导致WebHCat启动失败 - MapReduce服务 MRS

如何查看MRS集群各组件配置文件路径？ - MapReduce服务 MRS

如何上传本地文件到集群内节点？ - MapReduce服务 MRS

执行HDFS文件并发操作命令 - MapReduce服务 MRS

使用Spark小文件合并工具说明 - MapReduce服务 MRS

创建HDFS文件并写入内容 - MapReduce服务 MRS

准备Spark连接集群配置文件 - MapReduce服务 MRS

配置ClickHouse对接OBS源文件 - MapReduce服务 MRS

执行HDFS文件并发操作命令 - MapReduce服务 MRS

通过Flume采集指定目录日志系统文件至HDFS - MapReduce服务 MRS

ALM-12041 关键文件权限异常 - MapReduce服务 MRS

ALM-14006 HDFS文件数超过阈值 - MapReduce服务 MRS

Hive应用开发常用概念 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线