搜索_华为云

dfs.datanode.data.dir中定义的磁盘数量等于dfs.datanode.failed.volumes.tolerated的值时，DataNode启动失败 - MapReduce服务 MRS

DataNode进程关闭，导致NameNode为每一个存在DataNode上的block调度额外的副本，在没有故障的磁盘中引起不必要的块复制。为了防止此情况，用户可以通过配置DataNodes来承受dfs.data.dir目录的故障。登录Manager，选择“集群 > 服务 > HDFS > 配置 >

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS > HDFS故障排除
清理Loader作业残留历史数据 - MapReduce服务 MRS

历史记录可以保存的时间（小时）。 24 配置完成后，单击“保存”。单击“概览”进入Loader服务概览界面，选择“更多 > 重启服务”，验证用户身份后，单击“确定”，等待重启成功。父主题：管理Loader作业

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 管理Loader作业
dfs.datanode.data.dir中定义的磁盘数量等于dfs.datanode.failed.volumes.tolerated的值时，DataNode启动失败 - MapReduce服务 MRS

DataNode进程关闭，导致NameNode为每一个存在DataNode上的block调度额外的副本，在没有故障的磁盘中引起不必要的块复制。为了防止此情况，用户可以通过配置DataNodes来承受dfs.data.dir目录的故障。登录Manager，选择“集群 > 服务 > HDFS > 配置 >

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS故障排除
设置Spark Core并行度 - MapReduce服务 MRS

点。增加任务的并行度，充分利用集群机器的计算能力，一般并行度设置为集群CPU总和的2-3倍。操作步骤并行度可以通过如下三种方式来设置，用户可以根据实际的内存、CPU、数据以及应用程序逻辑的情况调整并行度参数。在会产生shuffle的操作函数内设置并行度参数，优先级最高。 testRDD

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优
Hudi表初始化 - MapReduce服务 MRS
Hudi表初始化 - MapReduce服务 MRS

资源才能完成 Hudi表在Hive元数据中，应该会存在1张内部表（手动创建），2张外部表（写入数据后自动创建）。 2张外部表，表名_ro（用户只读合并后的parquet文件，即读优化视图表），_rt（读实时写入的最新版本数据，即实时视图表）。父主题： Bucket调优示例

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Bucket调优示例
Kafka业务规格说明 - MapReduce服务 MRS

假设单个磁盘大小为M，该磁盘上有n个Partition（P0,P1……Pn），并且其中第m个Partition的每秒写入数据流量为Q(Pm) MB/s（计算方法：所属Topic的数据流量除以Partition数）、数据保存时间为T(Pm)小时，那么单个磁盘必须满足：根据吞吐量粗略计算，假设生产

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Kafka > Kafka常见问题
Kafka业务规格说明 - MapReduce服务 MRS

假设单个磁盘大小为M，该磁盘上有n个Partition（P0,P1……Pn），并且其中第m个Partition的每秒写入数据流量为Q(Pm) MB/s（计算方法：所属Topic的数据流量除以Partition数）、数据保存时间为T(Pm)小时，那么单个磁盘必须满足：根据吞吐量粗略计算，假设生产者

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Kafka > Kafka常见问题
扩容集群 - MapReduce服务 MRS
扩容集群 - MapReduce服务 MRS

对MRS集群进行扩容。调用方法请参见如何调用API。 URI POST /v2/{project_id}/clusters/{cluster_id}/expand 表1 路径参数参数是否必选参数类型描述 project_id 是 String 参数解释：项目编号。获取方法，请参见获取项目ID。

帮助中心 > MapReduce服务 MRS > API参考 > API V2 > 集群管理接口
为什么并行度大于待处理的block数目时，CarbonData仍需要额外的executor？ - MapReduce服务 MRS

性申请executor，因此CarbonData可获得所有节点上的executor。为了优化并行数据处理及并行读取块数据，运用动态分配的用户需配置以下特性。使用参数“spark.dynamicAllocation.executorIdleTimeout”并将此参数值设置为15min（或平均查询时间）。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData常见问题
Spark作业的Client模式和Cluster模式有什么区别？ - MapReduce服务 MRS

YARN-Cluster模式下，Driver运行在AM(Application Master)中，它负责向YARN申请资源，并监督作业的运行状况。当用户提交了作业之后，就可以关掉Client，作业会继续在YARN上运行，因而YARN-Cluster模式不适合运行交互类型的作业。 YARN-

帮助中心 > MapReduce服务 MRS > 常见问题 > 作业管理类
为什么并行度大于待处理的block数目时，CarbonData仍需要额外的executor？ - MapReduce服务 MRS

性申请executor，因此CarbonData可获得所有节点上的executor。为了优化并行数据处理及并行读取块数据，运用动态分配的用户需配置以下特性。使用参数“spark.dynamicAllocation.executorIdleTimeout”并将此参数值设置为15min（或平均查询时间）。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData故障排除
提升HBase实时读数据效率 - MapReduce服务 MRS

就会出现Region中存在多个HFile的情况，从而影响读取的性能。所以如果读取的性能不理想的时候，也要考虑写入的配置是否合理。读数据客户端调优 Scan数据时需要设置caching（一次从服务端读取的记录条数，默认是1），若使用默认值读性能会降到极低。当不需要读一条数据所

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase > HBase性能调优
Spark作业访问OBS报错“requestId=XXX”如何处理？ - MapReduce服务 MRS

Spark作业访问OBS报错，错误信息如下，如何处理？ xxx requestId=4971883851071737250 xxx 答：登录Spark客户端节点，进入conf目录，修改配置文件“core-site.xml”中的“fs.obs.metrics.switch”参数值为“false”。

帮助中心 > MapReduce服务 MRS > 常见问题 > 作业管理类
UPDATE - MapReduce服务 MRS
UPDATE - MapReduce服务 MRS

update h0 set price = price *2, name = 'a2' where id = 2; 系统响应可在driver日志和客户端中查看命令运行成功或失败。父主题： Hudi DML语法说明

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi SQL语法参考 > Hudi DML语法说明
ALTER COLUMN - MapReduce服务 MRS
ALTER COLUMN - MapReduce服务 MRS

table h0_1 alter column extl set default 'new_default_value'; 系统响应可在客户端中查看查询结果。父主题： Hudi DDL语法说明

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi SQL语法参考 > Hudi DDL语法说明
Spark Core内存调优 - MapReduce服务 MRS

点。增加任务的并行度，充分利用集群机器的计算能力，一般并行度设置为集群CPU总和的2-3倍。操作步骤并行度可以通过如下三种方式来设置，用户可以根据实际的内存、CPU、数据以及应用程序逻辑的情况调整并行度参数。在会产生shuffle的操作函数内设置并行度参数，优先级最高。 testRDD

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core性能调优
Kafka应用开发简介 - MapReduce服务 MRS

topic中获取消息的角色称为Consumer。 Broker Kafka集群中的每一个节点服务器称为Broker。 keytab file 存放用户信息的密钥文件。应用程序采用此密钥文件在集群中进行API方式认证。父主题： Kafka开发指南（普通模式）

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Kafka开发指南（普通模式）
Spark跨源复杂数据的SQL查询优化 - MapReduce服务 MRS

over inner join、aggregate over union all等。为应对不同应用场景的特殊需求，对所有下推模块设计开关功能，用户可以自行配置是否应用上述查询下推的增强。表1 跨源查询增加特性对比模块增强前增强后 aggregate 不支持aggregate下推

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark2x
BulkLoad和Put应用场景有哪些 - MapReduce服务 MRS

block大小。 put适合的场景：每次加载到单个Region的数据大小小于HDFS block大小的一半。数据需要实时加载。加载数据过程不会造成用户查询速度急剧下降。父主题： HBase应用开发常见问题

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HBase开发指南（安全模式） > HBase应用开发常见问题
Bulkload和Put应用场景有哪些 - MapReduce服务 MRS

block大小。 put适合的场景：每次加载到单个Region的数据大小小于HDFS block大小的一半。数据需要实时加载。加载数据过程不会造成用户查询速度急剧下降。父主题： HBase应用开发常见问题

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HBase开发指南（普通模式） > HBase应用开发常见问题

总条数： 5615

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

dfs.datanode.data.dir中定义的磁盘数量等于dfs.datanode.failed.volumes.tolerated的值时，DataNode启动失败 - MapReduce服务 MRS

清理Loader作业残留历史数据 - MapReduce服务 MRS

dfs.datanode.data.dir中定义的磁盘数量等于dfs.datanode.failed.volumes.tolerated的值时，DataNode启动失败 - MapReduce服务 MRS

设置Spark Core并行度 - MapReduce服务 MRS

Hudi表初始化 - MapReduce服务 MRS

Kafka业务规格说明 - MapReduce服务 MRS

Kafka业务规格说明 - MapReduce服务 MRS

扩容集群 - MapReduce服务 MRS

为什么并行度大于待处理的block数目时，CarbonData仍需要额外的executor？ - MapReduce服务 MRS

Spark作业的Client模式和Cluster模式有什么区别？ - MapReduce服务 MRS

为什么并行度大于待处理的block数目时，CarbonData仍需要额外的executor？ - MapReduce服务 MRS

提升HBase实时读数据效率 - MapReduce服务 MRS

Spark作业访问OBS报错“requestId=XXX”如何处理？ - MapReduce服务 MRS

UPDATE - MapReduce服务 MRS

ALTER COLUMN - MapReduce服务 MRS

Spark Core内存调优 - MapReduce服务 MRS

Kafka应用开发简介 - MapReduce服务 MRS

Spark跨源复杂数据的SQL查询优化 - MapReduce服务 MRS

BulkLoad和Put应用场景有哪些 - MapReduce服务 MRS

Bulkload和Put应用场景有哪些 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线