搜索_华为云

Doris集群高可用方案概述 - MapReduce服务 MRS

ons.html。 ELB负载均衡基于ELB的部署架构，可以将用户访问流量自动均匀分发到多台后端节点，扩展系统对外的服务能力，实现更高水平的应用容错。当其中一台Doris后端节点发生故障时，ELB通过故障转移方式正常对外提供服务，详细操作请参见配置通过ELB访问Doris集群。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Doris > Doris企业级能力增强 > 配置Doris高可用功能
日志聚合下如何查看Spark已完成应用日志 - MapReduce服务 MRS

ainer的日志聚合到HDFS中，并删除本地日志。详情请参见配置Container日志聚合功能。然而，开启container日志聚合功能之后，其日志聚合至HDFS目录中，只能通过获取HDFS文件来查看日志。开源Spark和Yarn服务不支持通过WebUI查看聚合后的日志。父主题：

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > Spark Core
Hive Group By语句优化 - MapReduce服务 MRS

Key可能被分发到不同的Reduce中，从而达到负载均衡，第二个Job再根据预处理的结果按照Group By Key分发到Reduce中完成最终的聚合操作。 Count Distinct聚合问题当使用聚合函数count distinct完成去重计数时，处理值为空的情况会使Reduc

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive性能调优
Hive Group By语句优化 - MapReduce服务 MRS

Key可能被分发到不同的Reduce中，从而达到负载均衡，第二个Job再根据预处理的结果按照Group By Key分发到Reduce中完成最终的聚合操作。 Count Distinct聚合问题当使用聚合函数count distinct完成去重计数时，处理值为空的情况会使Reduc

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive性能调优
配置Spark SQL语法支持关联子查询不带聚合函数 - MapReduce服务 MRS

配置Spark SQL语法支持关联子查询不带聚合函数本章节仅适用于MRS 3.3.1-LTS及之后版本。配置场景开源版本Spark SQL强制要求子查询关联中必须使用聚合函数，如果未使用聚合函数将报错“Error in query: Correlated scalar subqueries

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL企业级能力增强
访问Spark应用的聚合日志页面报“DNS查找失败”错误 - MapReduce服务 MRS

访问Spark应用的聚合日志页面报“DNS查找失败”错误问题采用http(s)://<spark ip>:<spark port>的方式直接访问Spark JobHistory页面时，如果当前跳转的Spark JobHistory页面不是FusionInsight代理的页面（Fus

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > Spark Core
ALTER TABLE - MapReduce服务 MRS
ALTER TABLE - MapReduce服务 MRS

ALTER TABLE 修改表结构时，针对聚合模型和非聚合模型的修改方式不同；针对Key列和Value列的修改方式也不同。其中：建表时指定AGGREGATE KEY时，为聚合模型；其他场景为非聚合模型。建表语句中的关键字'unique key'或'aggregate key'或'duplicate

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Doris > Doris常见SQL语法说明
Spark作业的Client模式和Cluster模式有什么区别？ - MapReduce服务 MRS

on启动的第一个容器。它负责和ResourceManager打交道并请求资源，获取资源之后告诉NodeManager为其启动Container。从深层次的含义讲YARN-Cluster和YARN-Client模式的区别其实就是ApplicationMaster进程的区别。 YAR

帮助中心 > MapReduce服务 MRS > 常见问题 > 作业管理类
Kafka基本原理 - MapReduce服务 MRS
Kafka基本原理 - MapReduce服务 MRS

Kafka是一个分布式的、分区的、多副本的消息发布-订阅系统，它提供了类似于JMS的特性，但在设计上完全不同，它具有消息持久化、高吞吐、分布式、多客户端支持、实时等特性，适用于离线和在线的消息消费，如常规的消息收集、网站活性跟踪、聚合统计系统运营数据（监控数据）、日志收集等大量数据的互联网服务的数据收集场景。

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Kafka
实时OLAP场景介绍 - MapReduce服务 MRS

ROLLUP等预聚合带来的查询优势。适合数据有大量更新的场景。对于聚合查询有较高性能需求的用户，推荐使用写时合并实现。 Duplicate适合任意维度的Ad-hoc查询。虽然无法利用预聚合的特性，但是不受聚合模型的约束，可以发挥列存模型的优势。适合不要求数据更新的通用查询场景。查询模式：

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析 > 实时OLAP数据分析
数据存储在OBS和HDFS有什么区别？ - MapReduce服务 MRS

量、安全、高可靠、低成本的数据存储能力。MRS可以直接处理OBS中的数据，客户可以基于OBS服务Web界面和OBS客户端对数据进行浏览、管理和使用，同时可以通过REST API接口方式单独或集成到业务程序进行管理和访问数据。数据存储在OBS：数据存储和计算分离，集群存储成本低，

帮助中心 > MapReduce服务 MRS > 常见问题 > 产品咨询类
HAVING - MapReduce服务 MRS
HAVING - MapReduce服务 MRS

HAVING HAVING与聚合函数和GROUP BY一起使用，来控制选在哪些组。 HAVING能够在分组和聚合计算之后，过滤掉不满足给定条件的组。例如： SELECT count(*), mktsegment, nationkey, CAST(sum(acctbal) AS bigint)

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine DQL SQL语法说明
配置WebUI上查看Container日志 - MapReduce服务 MRS

iner日志聚合功能。日志聚合功能是指：当应用在Yarn上执行完成后，NodeManager将本节点中所有container的日志聚合到HDFS中，并删除本地日志。详情请参见配置Container日志聚合功能。然而，开启container日志聚合功能之后，其日志聚合至HDFS目

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark运维管理
配置WebUI上查看Container日志 - MapReduce服务 MRS

iner日志聚合功能。日志聚合功能是指：当应用在Yarn上执行完成后，NodeManager将本节点中所有container的日志聚合到HDFS中，并删除本地日志。详情请参见配置Container日志聚合功能。然而，开启container日志聚合功能之后，其日志聚合至HDFS目

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark运维管理
配置通过ELB访问ClickHouse - MapReduce服务 MRS

单击“立即购买”，确认配置信息，并单击“提交”。创建完成后，在“负载均衡器”界面，选择对应的区域即可看到新建的负载均衡器。查看并获取该负载均衡器的私有IP地址。添加ELB监听器详细操作步骤请参考添加监听器。在“负载均衡器”界面，单击需要添加监听器的负载均衡名称。选择“监听器 > 添加监听器”。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse > ClickHouse企业级能力增强
Flink任务开发规则 - MapReduce服务 MRS

changelog与CDC格式的数据类似，只不过存储的方式不同，CDC格式数据会将更新前和更新后的数据在一行记录，而changelog数据会将更新数据拆分成两行，一行是对更新前数据的删除操作，一行是更新后的数据插入操作记录。Flink在计算的时候会将基于更新数据的聚合结果删除，再将基于更新后数据的计算结

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > Flink任务开发规范
配置通过ELB访问Doris集群 - MapReduce服务 MRS

企业项目：选择“default”。 “所属VPC”和“前端子网”参数需要和MRS Doris集群保持一致。单击“立即购买”，确认配置信息，并单击“提交”。创建完成后，在“负载均衡器”界面，选择对应的区域即可看到新建的负载均衡器。查看并获取该负载均衡器的公网IP地址。添加ELB监听器详细操作步骤请参考添加监听器。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Doris > Doris企业级能力增强 > 配置Doris高可用功能
配置HDFS DiskBalancer磁盘均衡 - MapReduce服务 MRS

长时间运行的集群会因为曾经删除过大量的文件，或者集群中的节点做磁盘扩容等操作导致节点上出现磁盘间数据不均衡的现象。磁盘间数据不均衡会引起HDFS整体并发读写性能的下降或者因为不恰当的HDFS写策略导致业务故障。此时需要平衡节点磁盘间的数据密度，防止异构的小磁盘成为该节点的性能瓶颈。本章节适用于MRS 3

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS
Doris基本原理 - MapReduce服务 MRS
Doris基本原理 - MapReduce服务 MRS

将被覆盖和被更新的数据进行标记删除，同时将新的数据写入新的文件。在查询时，所有被标记删除的数据都会在文件级别被过滤，读取出的数据就都是最新的数据，消除了读时合并中的数据聚合过程，并且能够在很多情况下支持多种谓词的下推。因此在许多场景都能带来比较大的性能提升，尤其是在有聚合查询的情况下。

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Doris
Hive服务健康状态和Hive实例健康状态的区别 - MapReduce服务 MRS

Hive服务健康状态和Hive实例健康状态的区别问题现象 Hive服务健康状态和Hive实例健康状态的区别是什么？解决方案 Hive服务的健康状态（也就是在Manager界面看到的健康状态）有Good，Bad，Partially Healthy，Unknown四种状态，四种

 帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hive

总条数： 3741

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Doris集群高可用方案概述 - MapReduce服务 MRS

日志聚合下如何查看Spark已完成应用日志 - MapReduce服务 MRS

Hive Group By语句优化 - MapReduce服务 MRS

Hive Group By语句优化 - MapReduce服务 MRS

配置Spark SQL语法支持关联子查询不带聚合函数 - MapReduce服务 MRS

访问Spark应用的聚合日志页面报“DNS查找失败”错误 - MapReduce服务 MRS

ALTER TABLE - MapReduce服务 MRS

Spark作业的Client模式和Cluster模式有什么区别？ - MapReduce服务 MRS

Kafka基本原理 - MapReduce服务 MRS

实时OLAP场景介绍 - MapReduce服务 MRS

数据存储在OBS和HDFS有什么区别？ - MapReduce服务 MRS

HAVING - MapReduce服务 MRS

配置WebUI上查看Container日志 - MapReduce服务 MRS

配置WebUI上查看Container日志 - MapReduce服务 MRS

配置通过ELB访问ClickHouse - MapReduce服务 MRS

Flink任务开发规则 - MapReduce服务 MRS

配置通过ELB访问Doris集群 - MapReduce服务 MRS

配置HDFS DiskBalancer磁盘均衡 - MapReduce服务 MRS

Doris基本原理 - MapReduce服务 MRS

Hive服务健康状态和Hive实例健康状态的区别 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线