搜索_华为云

HDFS性能调优 - MapReduce服务 MRS
HDFS性能调优 - MapReduce服务 MRS

HDFS性能调优提升HDFS写数据性能配置HDFS客户端元数据缓存提高读取性能使用活动缓存提升HDFS客户端连接性能 HDFS网络不稳定场景调优优化HDFS NameNode RPC的服务质量优化HDFS DataNode RPC的服务质量执行HDFS文件并发操作命令

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS
HDFS性能调优 - MapReduce服务 MRS
HDFS性能调优 - MapReduce服务 MRS

HDFS性能调优提升HDFS写数据性能配置HDFS客户端元数据缓存提高读取性能使用活动缓存提升HDFS客户端连接性能 HDFS网络不稳定场景调优优化HDFS NameNode RPC的服务质量优化HDFS DataNode RPC的服务质量执行HDFS文件并发操作命令

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS
Impala应用开发建议 - MapReduce服务 MRS

OBS存储开启本地缓存 OBS数据存储场景可根据业务需求配置本地缓存，提升读取速率，配置单盘100GB本地缓存示例：—data_cache=/srv/BigData/data1/impala:100GB HDFS存储开启短路读 HDFS存储场景下可开启短路读，提升读取速率，具体请参考

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Impala应用开发规范
聚合算法优化 - MapReduce服务 MRS

聚合算法优化操作场景在Spark SQL中支持基于行的哈希聚合算法，即使用快速聚合hashmap作为缓存，以提高聚合性能。hashmap替代了之前的ColumnarBatch支持，从而避免拥有聚合表的宽模式（大量key字段或value字段）时产生的性能问题。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
Spark SQL无法查询到Parquet类型的Hive表的新插入数据 - MapReduce服务 MRS

回答由于Spark存在一个机制，为了提高性能会缓存Parquet的元数据信息。当通过Hive或其他方式更新了Parquet表时，缓存的元数据信息未更新，导致Spark SQL查询不到新插入的数据。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > SQL和DataFrame
创建集群 - MapReduce服务 MRS
创建集群 - MapReduce服务 MRS

创建集群功能介绍创建一个MRS集群。使用接口前，您需要先获取下的资源信息。通过VPC创建或查询VPC、子网通过ECS创建或查询密钥对通过终端节点获取区域信息参考MRS服务支持的组件获取MRS版本及对应版本支持的组件信息接口约束无调用方法请参见如何调用API。 URI

帮助中心 > MapReduce服务 MRS > API参考 > API V2 > 集群管理接口
Spark SQL无法查询到Parquet类型的Hive表的新插入数据 - MapReduce服务 MRS

回答由于Spark存在一个机制，为了提高性能会缓存Parquet的元数据信息。当通过Hive或其他方式更新了Parquet表时，缓存的元数据信息未更新，导致Spark SQL查询不到新插入的数据。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > SQL和DataFrame
Spark SQL无法查询到ORC类型的Hive表的新插入数据 - MapReduce服务 MRS

回答由于Spark存在一个机制，为了提高性能会缓存ORC的元数据信息。当通过Hive或其他方式更新了ORC表时，缓存的元数据信息未更新，导致Spark SQL查询不到新插入的数据。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > SQL和DataFrame
Spark SQL无法查询到ORC类型的Hive表的新插入数据 - MapReduce服务 MRS

回答由于Spark存在一个机制，为了提高性能会缓存ORC的元数据信息。当通过Hive或其他方式更新了ORC表时，缓存的元数据信息未更新，导致Spark SQL查询不到新插入的数据。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > SQL和DataFrame
HBase应用开发规则 - MapReduce服务 MRS

Table实例缓存如果一个Table实例可能长时间会被同一个线程固定且频繁地用到，例如，通过一个线程不断地往一个表内写入数据，那么这个Table在实例化后，就需要缓存下来，而不是每一次插入操作，都要实例化一个Table对象（尽管提倡实例缓存，但也不是在一个线程中一直沿用一个实例，

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > HBase应用开发规范
快速使用Hadoop - MapReduce服务 MRS

快速使用Hadoop 本章节提供从零开始使用Hadoop提交wordcount作业的操作指导，wordcount是最经典的Hadoop作业，它用来统计海量文本的单词数量。操作步骤准备wordcount程序。开源的Hadoop的样例程序包含多个例子，其中包含wordcount。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS
Flume业务配置指南 - MapReduce服务 MRS

常用Sink配置 HDFS Sink HDFS Sink将数据写入Hadoop分布式文件系统（HDFS）。常用配置如下表所示：表10 HDFS Sink常用配置参数默认值描述 channel - 与之相连的channel。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume > Flume运维管理
Spark Java API接口介绍 - MapReduce服务 MRS

广播变量允许保留一个只读的变量，缓存在每一台机器上，而非每个任务保存一份拷贝。 StorageLevel：数据存储级别。有内存（MEMORY_ONLY），磁盘（DISK_ONLY），内存+磁盘（MEMORY_AND_DISK）等。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark接口介绍
Spark Scala API接口介绍 - MapReduce服务 MRS

广播变量允许保留一个只读的变量，缓存在每一台机器上，而非每个任务保存一份拷贝。 StorageLevel：数据存储级别。有内存（MEMORY_ONLY），磁盘（DISK_ONLY），内存+磁盘（MEMORY_AND_DISK）等。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark接口介绍
ClickHouse客户端使用实践 - MapReduce服务 MRS

同时ClickHouse依靠Distributed引擎实现了分布式表机制，在所有分片（本地表）上建立视图进行分布式查询，使用很方便。ClickHouse有数据分片（shard）的概念，这也是分布式存储的特点之一，即通过并行读写提高效率。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse
执行balance失败报错“Source and target differ in block-size” - MapReduce服务 MRS

执行balance失败报错“Source and target differ in block-size” 问题背景与现象执行distcp跨集群拷贝文件时，出现部分文件拷贝失败“ Source and target differ in block-size. Use -pb to

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用HDFS
使用ZooKeeper客户端 - MapReduce服务 MRS

使用ZooKeeper客户端 Zookeeper是一个开源的，高可靠的，分布式一致性协调服务。Zookeeper设计目标是用来解决那些复杂，易出错的分布式系统难以保证数据一致性的。不必开发专门的协同应用，十分适合高可用服务保持数据一致性。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ZooKeeper
ALM-47003 MemArtsCC Worker进程内存使用超过阈值 - MapReduce服务 MRS

是否可自动清除 47003 重要是告警参数类别参数名称参数含义定位信息来源产生告警的集群或系统名称服务名产生告警的服务名称角色名产生告警的角色名称主机名产生告警的主机名对系统的影响单个CCWorker进程的内存使用超过最大限制内存后可能会出现进程重启，短暂影响缓存命中率

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-47004 MemArtsCC Worker的read请求平均时延超过阈值 - MapReduce服务 MRS

是否可自动清除 47004 重要是告警参数类别参数名称参数含义定位信息来源产生告警的集群或系统名称服务名产生告警的服务名称角色名产生告警的角色名称主机名产生告警的主机名对系统的影响单个CCWorker内部平均read请求处理时延超过最大阈值后，可能会出现缓存性能下降

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
Kafka连接ZooKeeper客户端时发生断链 - MapReduce服务 MRS

Kafka连接ZooKeeper客户端时发生断链问题现象 Kafka客户端连接ZooKeeper客户端时发生断链。客户端日志出现报错“ Received event :disconnected::none: with disconnected Writer Zookeeper”

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Kafka

总条数： 934

上一页
1
...
8
9
10
...
47
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

HDFS性能调优 - MapReduce服务 MRS

HDFS性能调优 - MapReduce服务 MRS

Impala应用开发建议 - MapReduce服务 MRS

聚合算法优化 - MapReduce服务 MRS

Spark SQL无法查询到Parquet类型的Hive表的新插入数据 - MapReduce服务 MRS

创建集群 - MapReduce服务 MRS

Spark SQL无法查询到Parquet类型的Hive表的新插入数据 - MapReduce服务 MRS

Spark SQL无法查询到ORC类型的Hive表的新插入数据 - MapReduce服务 MRS

Spark SQL无法查询到ORC类型的Hive表的新插入数据 - MapReduce服务 MRS

HBase应用开发规则 - MapReduce服务 MRS

快速使用Hadoop - MapReduce服务 MRS

Flume业务配置指南 - MapReduce服务 MRS

Spark Java API接口介绍 - MapReduce服务 MRS

Spark Scala API接口介绍 - MapReduce服务 MRS

ClickHouse客户端使用实践 - MapReduce服务 MRS

执行balance失败报错“Source and target differ in block-size” - MapReduce服务 MRS

使用ZooKeeper客户端 - MapReduce服务 MRS

ALM-47003 MemArtsCC Worker进程内存使用超过阈值 - MapReduce服务 MRS

ALM-47004 MemArtsCC Worker的read请求平均时延超过阈值 - MapReduce服务 MRS

Kafka连接ZooKeeper客户端时发生断链 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线