搜索_华为云

Spark Core内存调优 - MapReduce服务 MRS

Spark Core内存调优操作场景 Spark是内存计算框架，计算过程中内存不够对Spark的执行效率影响很大。可以通过监控GC（Garbage Collection），评估内存中RDD的大小来判断内存是否变成性能瓶颈，并根据情况优化。监控节点进程的GC情况（在客户端的conf/spark-default

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core性能调优
Hive CBO原理介绍 - MapReduce服务 MRS

Hive CBO原理介绍 Hive CBO原理介绍 CBO，全称是Cost Based Optimization，即基于代价的优化器。其优化目标是：在编译阶段，根据查询语句中涉及到的表和查询条件，计算出产生中间结果少的高效join顺序，从而减少查询时间和资源消耗。 Hive中实现CBO的总体过程如下：

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Hive
KrbServer及LdapServer基本原理 - MapReduce服务 MRS

KrbServer及LdapServer基本原理 KrbServer及LdapServer简介为了管理集群中数据与资源的访问控制权限，推荐安装安全模式集群。在安全模式下，客户端应用程序在访问集群中的任意资源之前均需要通过身份认证，建立安全会话链接。MRS通过KrbServer为

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > KrbServer及LdapServer
Doris建表规范 - MapReduce服务 MRS
Doris建表规范 - MapReduce服务 MRS

Doris建表规范该章节主要介绍创建Doris表时需遵循的规则和建议。 Doris建表规则在创建Doris表指定分桶buckets时，每个桶的数据大小应保持在100MB~3GB之间，单分区中最大分桶数量不超过5000。表数据超过5亿条以上必须设置分区分桶策略。表的分桶列不

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Doris应用开发规范
配置内存 - MapReduce服务 MRS
配置内存 - MapReduce服务 MRS

配置内存操作场景 Spark是内存计算框架，计算过程中内存不够对Spark的执行效率影响很大。可以通过监控GC（Garbage Collection），评估内存中RDD的大小来判断内存是否变成性能瓶颈，并根据情况优化。监控节点进程的GC情况（在客户端的conf/spark-defaults

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > Spark Core调优
Storm-Kafka开发指引 - MapReduce服务 MRS

Storm-Kafka开发指引操作场景本文档主要说明如何使用Storm-Kafka工具包，完成Storm和Kafka之间的交互。包含KafkaSpout和KafkaBolt两部分。KafkaSpout主要完成Storm从Kafka中读取数据的功能；KafkaBolt主要完成Storm向Kafka中写入数据的功能。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Storm开发指南（安全模式） > Storm应用开发常见问题
IoTDB常用配置参数 - MapReduce服务 MRS

IoTDB常用配置参数操作场景 IoTDB通过多副本的部署架构实现了集群的高可用，每个Region（DataRegion和SchemaRegion）默认具有3个副本，也可配置3个以上。当某节点故障时，Region副本的其他主机节点上的副本可替代工作，保证服务能正常运行，提高集群的稳定性。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用IoTDB > IoTDB运维管理
切换Hive执行引擎为Tez - MapReduce服务 MRS

切换Hive执行引擎为Tez 操作场景 Hive支持使用Tez引擎处理数据计算任务，用户在执行任务前可手动切换执行引擎为Tez。前提条件集群已安装Yarn服务的TimelineServer角色，且角色运行正常。客户端切换执行引擎为Tez 安装并登录Hive客户端，具体操作请参考Hive客户端使用实践。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive企业级能力增强
Spark Core内存调优 - MapReduce服务 MRS

Spark Core内存调优操作场景 Spark是内存计算框架，计算过程中内存不够对Spark的执行效率影响很大。可以通过监控GC（Garbage Collection），评估内存中RDD的大小来判断内存是否变成性能瓶颈，并根据情况优化。监控节点进程的GC情况（在客户端的conf/spark-default

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优
指定用户、用户组取消同步 - MapReduce服务 MRS

指定用户、用户组取消同步功能介绍指定用户、用户组取消同步调用方法请参见如何调用API。 URI DELETE /v2/{project_id}/clusters/{cluster_id}/iam-sync-user 表1 路径参数参数是否必选参数类型描述 project_id

帮助中心 > MapReduce服务 MRS > API参考 > API V2 > IAM同步管理接口
Storm-Kafka开发指引 - MapReduce服务 MRS

Storm-Kafka开发指引操作场景本文档主要说明如何使用Storm-Kafka工具包，完成Storm和Kafka之间的交互。包含KafkaSpout和KafkaBolt两部分。KafkaSpout主要完成Storm从Kafka中读取数据的功能；KafkaBolt主要完成Storm向Kafka中写入数据的功能。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Storm开发指南（普通模式） > Storm应用开发常见问题
Set Digest函数 - MapReduce服务 MRS
Set Digest函数 - MapReduce服务 MRS

Set Digest函数概述 HetuEngine提供了几个处理MinHash技术的函数。 MinHash用于估计两个集合的Jaccard相似系数。它通常用于数据挖掘，用于大规模检测近乎相同的网页。通过使用这些信息，搜索引擎有效地避免了在搜索结果中显示两个几乎相同的网页。以下示例展示了如何使用Set

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
Loader常用参数 - MapReduce服务 MRS

Loader常用参数参数入口参数入口，请参考修改集群服务配置参数。参数说明表1 Loader常用参数配置参数说明默认值范围 mapreduce.client.submit.file.replication MapReduce任务在运行时依赖的相关job文件在HDF

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > Loader运维管理
多流Join场景支持配置表级别的TTL时间 - MapReduce服务 MRS

多流Join场景支持配置表级别的TTL时间本章节适用于MRS 3.3.0及以后版本。在Flink双流Join场景下，如果Join的左表和右表其中一个表数据变化快，需要较短时间的过期时间，而另一个表数据变化较慢，需要较长时间的过期时间。目前Flink只有表级别的TTL（Time

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink企业级能力增强
ALM-38001 Kafka磁盘容量不足 - MapReduce服务 MRS

ALM-38001 Kafka磁盘容量不足告警解释系统按60秒周期检测Kafka磁盘空间使用率，并把实际磁盘使用率和阈值相比较。磁盘使用率默认提供一个阈值范围。当检测到磁盘使用率高于阈值时产生该告警。用户可通过“运维 > 告警 > 阈值设置”，在服务列表下面，选择“Kafka

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
导入并配置Flink样例工程 - MapReduce服务 MRS

导入并配置Flink样例工程操作场景 Flink针对多个场景提供样例工程，包含Java样例工程和Scala样例工程等，帮助客户快速学习Flink工程。针对Java和Scala不同语言的工程，其导入方式相同。以下操作步骤以导入Java样例代码为例。操作流程如图1所示。图1 导入样例工程流程

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（普通模式） > 准备Flink应用开发环境
启用集群间拷贝功能备份集群数据 - MapReduce服务 MRS

启用集群间拷贝功能备份集群数据操作场景当用户需要将保存在HDFS中的数据从当前集群备份到另外一个集群时，需要使用DistCp工具。DistCp工具依赖于集群间拷贝功能，该功能默认未启用。两个集群都需要配置。该任务指导MRS集群管理员在MRS修改参数以启用集群间拷贝功能。对系统的影响

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase > HBase运维管理
Loader常用参数 - MapReduce服务 MRS

Loader常用参数本章节适用于MRS 3.x及后续版本。参数入口参数入口，请参考修改集群服务配置参数。参数说明表1 Loader常用参数配置参数说明默认值范围 mapreduce.client.submit.file.replication MapReduce

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader
启用MRS集群间拷贝功能 - MapReduce服务 MRS

启用MRS集群间拷贝功能当用户需要将保存在HDFS中的数据从当前集群备份到另外一个集群时，需要使用DistCp工具。DistCp工具依赖于集群间拷贝功能，该功能默认未启用，复制数据的集群双方都需要配置。管理员可以根据以下指导，在Manager修改参数以启用集群间拷贝功能，启用

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > 备份恢复MRS集群数据
Spark从Hive读取数据再写入HBase样例程序开发思路 - MapReduce服务 MRS

Spark从Hive读取数据再写入HBase样例程序开发思路场景说明假定Hive的person表存储用户当天消费的金额信息，HBase的table2表存储用户历史消费的金额信息。现person表有记录name=1,account=100，表示用户1在当天消费金额为100元。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark从Hive读取数据再写入HBase样例程序

总条数： 2600

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark Core内存调优 - MapReduce服务 MRS

Hive CBO原理介绍 - MapReduce服务 MRS

KrbServer及LdapServer基本原理 - MapReduce服务 MRS

Doris建表规范 - MapReduce服务 MRS

配置内存 - MapReduce服务 MRS

Storm-Kafka开发指引 - MapReduce服务 MRS

IoTDB常用配置参数 - MapReduce服务 MRS

切换Hive执行引擎为Tez - MapReduce服务 MRS

Spark Core内存调优 - MapReduce服务 MRS

指定用户、用户组取消同步 - MapReduce服务 MRS

Storm-Kafka开发指引 - MapReduce服务 MRS

Set Digest函数 - MapReduce服务 MRS

Loader常用参数 - MapReduce服务 MRS

多流Join场景支持配置表级别的TTL时间 - MapReduce服务 MRS

ALM-38001 Kafka磁盘容量不足 - MapReduce服务 MRS

导入并配置Flink样例工程 - MapReduce服务 MRS

启用集群间拷贝功能备份集群数据 - MapReduce服务 MRS

Loader常用参数 - MapReduce服务 MRS

启用MRS集群间拷贝功能 - MapReduce服务 MRS

Spark从Hive读取数据再写入HBase样例程序开发思路 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线