搜索_华为云

通过Slow Start调优MapReduce任务 - MapReduce服务 MRS

Start参数值小于1，比如0.8，则Reduce就可以利用集群剩余资源。操作步骤参数入口：进入Mapreduce服务参数“全部配置”界面，在搜索框中输入参数名称。具体操作请参考修改集群服务配置参数章节。参数描述默认值 mapreduce.job.reduce.slowstart.completedmaps

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Mapreduce > MapReduce性能调优
BE运行数据导入或查询任务报错 - MapReduce服务 MRS

se”。该参数主要用于避免导入失败，以提高导入的稳定性。 max_body_size：用于设置RPC的包大小阈值，默认为3GB。如果查询中带有超大 String 类型，或者bitmap类型数据时，可以通过修改该参数规避。父主题： Doris常见问题

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Doris > Doris常见问题
Repartition时有部分Partition没数据 - MapReduce服务 MRS

改善数据分块不均匀的情况，多次验证发现配置为质数或者奇数效果比较好。在Driver端的“spark-defaults.conf”配置文件中调整如下参数。表1 参数说明参数描述默认值 spark.sql.shuffle.partitions shuffle操作时，shuffle数据的分块数。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > SQL和DataFrame
HetuEngine域名修改后需要做什么 - MapReduce服务 MRS

HetuEngine域名修改后需要做什么问题用户修改域名后，会导致已安装的客户端配置和数据源配置失效，且新创建的集群不可用。对接不同域的数据源时，HetuEngine会自动的合并krb5.conf文件。域名修改后，kerberos认证的域名会发生变化，所以此前对接的数据源信息会失效。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见问题
DataNode的容量计算出错如何处理 - MapReduce服务 MRS

dir被配置在一个磁盘分区内，DataNode的容量计算将会出错。回答目前容量计算是基于磁盘的，类似于Linux里面的df命令。理想状态下，用户不会在同一个磁盘内配置多个data.dir，否则所有的数据都将写入一个磁盘，在性能上会有很大的影响。因此配置如下：例如，如果机器有如下磁盘：

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS常见问题
MapReduce大任务的AM调优 - MapReduce服务 MRS

存堆大小是1GB。操作步骤通过调大如下的参数来进行AM调优。参数入口：在Yarn客户端的“mapred-site.xml”配置文件中调整如下参数。“mapred-site.xml”配置文件在客户端安装路径的conf目录下，例如“/opt/client/Yarn/config”。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Mapreduce > MapReduce性能调优
为什么创建Hive表失败？ - MapReduce服务 MRS

shuffle.partitions”参数值为200，但distribute by字段的cardinality只有100，则输出的200个文件中，只有其中100个文件有数据，剩下的100个文件为空文件。也就是说，如果选取的字段的cardinality过低，如1，则会造成严重的数据倾斜，从而严重影响查询性能。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData常见问题
DataNode的容量计算出错如何处理 - MapReduce服务 MRS

dir被配置在一个磁盘分区内，DataNode的容量计算将会出错。回答目前容量计算是基于磁盘的，类似于Linux里面的df命令。理想状态下，用户不会在同一个磁盘内配置多个data.dir，否则所有的数据都将写入一个磁盘，在性能上会有很大的影响。因此配置如下：例如，如果机器有如下磁盘：

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS > HDFS常见问题
Storm样例程序开发思路 - MapReduce服务 MRS

将实时结果打印输出，如： apple：1 orange：1 apple：2 功能分解根据上述场景进行功能分解，如表1所示。表1 在应用中开发的功能序号步骤代码示例 1 创建一个Spout用来生成随机文本请参见创建Storm Spout 2 创建一个Bolt用来将收到的随机文本拆分成一个个单词

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Storm开发指南 > 开发Storm应用
修改HBase表 - MapReduce服务 MRS
修改HBase表 - MapReduce服务 MRS

以下代码片段在com.huawei.bigdata.hbase.examples包的“HBaseSample”类的testModifyTable方法中 public void testModifyTable() { LOG.info("Entering testModifyTable

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HBase开发指南（普通模式） > 开发HBase应用 > HBase数据读写样例程序
Kafka性能调优 - MapReduce服务 MRS
Kafka性能调优 - MapReduce服务 MRS

表1 调优参数配置参数缺省值调优场景 num.recovery.threads.per.data.dir 10 在Kafka启动过程中，数据量较大情况下，可调大此参数，可以提升启动速度。 background.threads 10 Broker后台任务处理的线程数目。数据量

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Kafka
Flink性能调优规则 - MapReduce服务 MRS

长时，可检查该Hudi表compaction是否正常。因为当长时间不做compaction时list性能会变差。在事实表与维度表关联场景中可以按表设置TTL降低状态后端数据量具体使用指导参考通过表级TTL进行状态后端优化。合理设置并行度任务运行的速度和并行度相关，一般来说

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > Flink性能调优开发规范
创建HBase表Region - MapReduce服务 MRS

以下代码片段在com.huawei.bigdata.hbase.examples包的“HBaseSample”类的testMultiSplit方法中。 public void testMultiSplit() { LOG.info("Entering testMultiSplit

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HBase开发指南（普通模式） > 开发HBase应用 > HBase数据读写样例程序
创建HBase表 - MapReduce服务 MRS
创建HBase表 - MapReduce服务 MRS

以下代码片段在com.huawei.bigdata.hbase.examples包的“HBaseSample”类的testCreateTable方法中。 public void testCreateTable() { LOG.info("Entering testCreateTable

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HBase开发指南（普通模式） > 开发HBase应用 > HBase数据读写样例程序
创建HBase表 - MapReduce服务 MRS
创建HBase表 - MapReduce服务 MRS

以下代码片段在com.huawei.bigdata.hbase.examples包的“HBaseSample”类的testCreateTable方法中。 public void testCreateTable() { LOG.info("Entering testCreateTable

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HBase开发指南（普通模式） > 开发HBase应用 > HBase数据读写示例程序
经验总结 - MapReduce服务 MRS
经验总结 - MapReduce服务 MRS

Spark的Shuffle过程需要写本地磁盘，Shuffle是Spark性能的瓶颈，I/O是Shuffle的瓶颈。配置多个磁盘则可以并行的把数据写入磁盘。如果节点中挂载多个磁盘，则在每个磁盘配置一个Spark的localDir，这将有效分散Shuffle文件的存放，提高磁盘I/O的效率。如果只有一个磁盘，配置了多个目录，性能提升效果不明显。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优
规划IoTDB容量 - MapReduce服务 MRS
规划IoTDB容量 - MapReduce服务 MRS

TSeriesPartitionSlot size + TConsensusGroupId size）= 0.68G IoTDBServer容量规格 IoTDB中数据以region分配在IoTDBServer上，region副本数默认是“3”，最终在IoTDBServer文件系统上表现为3个文件。上限

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用IoTDB > IoTDB运维管理
Cleaning - MapReduce服务 MRS
Cleaning - MapReduce服务 MRS

cleaning操作只有在满足触发条件后才会对分区的老版本数据文件进行清理，不满足触发条件虽然执行命令成功也不会执行清理。系统响应可在客户端中查看查询结果。父主题： Hudi CALL COMMAND语法说明

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
SHOW_TIME_LINE - MapReduce服务 MRS
SHOW_TIME_LINE - MapReduce服务 MRS

(table => 'hudi_table1', instant => '20220913144936897'"); 系统响应可在客户端中查看查询结果。父主题： Hudi CALL COMMAND语法说明

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
Kafka应用开发规则 - MapReduce服务 MRS

adminZkClient.createTopic(topic, partitions, replicas) Partition的副本数不要超过节点个数 Kafka中Topic的Partition的副本是为了提升数据的可靠性而存在的，同一个Partition的副本会分布在不同的节点，因此副本数不允许超过节点个数。

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Kafka应用开发规范

总条数： 6247

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

通过Slow Start调优MapReduce任务 - MapReduce服务 MRS

BE运行数据导入或查询任务报错 - MapReduce服务 MRS

Repartition时有部分Partition没数据 - MapReduce服务 MRS

HetuEngine域名修改后需要做什么 - MapReduce服务 MRS

DataNode的容量计算出错如何处理 - MapReduce服务 MRS

MapReduce大任务的AM调优 - MapReduce服务 MRS

为什么创建Hive表失败？ - MapReduce服务 MRS

DataNode的容量计算出错如何处理 - MapReduce服务 MRS

Storm样例程序开发思路 - MapReduce服务 MRS

修改HBase表 - MapReduce服务 MRS

Kafka性能调优 - MapReduce服务 MRS

Flink性能调优规则 - MapReduce服务 MRS

创建HBase表Region - MapReduce服务 MRS

创建HBase表 - MapReduce服务 MRS

创建HBase表 - MapReduce服务 MRS

经验总结 - MapReduce服务 MRS

规划IoTDB容量 - MapReduce服务 MRS

Cleaning - MapReduce服务 MRS

SHOW_TIME_LINE - MapReduce服务 MRS

Kafka应用开发规则 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线