搜索_华为云

聚合函数 - MapReduce服务 MRS
聚合函数 - MapReduce服务 MRS

聚合函数聚合函数对一组值进行运算，最终获得一个单值。除count()、count_if()、max_by()、min_by()和approx_distinct()外，其他聚合函数都忽略空值，并在没有输入行或所有值都为空时返回空值。例如sum()返回null而不是零，并且avg

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
聚合算法优化 - MapReduce服务 MRS

聚合算法优化操作场景在Spark SQL中支持基于行的哈希聚合算法，即使用快速聚合hashmap作为缓存，以提高聚合性能。hashmap替代了之前的ColumnarBatch支持，从而避免拥有聚合表的宽模式（大量key字段或value字段）时产生的性能问题。操作步骤要启动

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优
ALM-12037 NTP服务器异常 - MapReduce服务 MRS

检查是否能从NTP服务器获取时间。继续查看告警附加信息，是否提示不能从NTP服务器获取时间。是，执行9。否，执行10。联系NTP服务器的服务商，解决NTP服务器异常。确保NTP服务器正常后检查告警是否恢复。是，处理完毕。否，执行10。检查从NTP服务器获取的时间是否持续未更新。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12100 AD服务器连接异常 - MapReduce服务 MRS

通第三方AD服务器。是，执行7。否，执行8。执行以下命令查看是否能连通第三方AD服务。 telnet IP port 其中IP为第三方AD服务器IP地址，port为第三方AD服务器使用端口。是，执行8。否，联系运维人员检查网络。联系第三方AD服务管理人员，检查AD服务是否正常。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
聚合算法优化 - MapReduce服务 MRS

聚合算法优化操作场景在Spark SQL中支持基于行的哈希聚合算法，即使用快速聚合hashmap作为缓存，以提高聚合性能。hashmap替代了之前的ColumnarBatch支持，从而避免拥有聚合表的宽模式（大量key字段或value字段）时产生的性能问题。操作步骤要启动

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
配置Container日志聚合功能 - MapReduce服务 MRS

配置Container日志聚合功能配置场景 Yarn提供了Container日志聚合功能，可以将各节点Container产生的日志收集到HDFS，释放本地磁盘空间。日志收集的方式有两种：应用完成后将Container日志一次性收集到HDFS。应用运行过程中周期性收集Container输出的日志片段到HDFS。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Yarn
配置Container日志聚合功能 - MapReduce服务 MRS

enable 日志聚合路径是否包含Queue User。主要针对Hive作业，Queue User为Hive提交作业的真实用户。默认不开启。（该参数只在MRS 3.3.1以及之后版本支持。） true：表示日志聚合路径包含Queue User。 false：表示日志聚合路径不包含Queue

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Yarn
Hudi支持聚合函数 - MapReduce服务 MRS

的聚合函数实现相同主键的聚合操作。当前支持的聚合函数和数据类型如下： sum：求和函数可以跨多行聚合值，支持DECIMAL（小数）、SHORT（小整数）、INTEGER（整数）、BIGINT（大整数）、FLOAT（浮点数）和DOUBLE（双精度浮点数）数据类型。 product

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi
实时OLAP数据查询：基于Unique表的单表检索查询和聚合查询 - MapReduce服务 MRS

实时OLAP数据查询：基于Unique表的单表检索查询和聚合查询应用场景本场景通过基于Unique模型表查询符合条件的数据。基于Unique模型表聚合查询，支持MIN，MAX，SUM，REPLACE四种聚合算法。方案架构 Doris支持海量数据的亚秒级查询，支持单表数据的聚合查询和多表关联查询。Dori

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析 > 实时OLAP数据分析
配置NFS服务器存储NameNode元数据 - MapReduce服务 MRS

配置NFS服务器存储NameNode元数据操作场景本章节适用于MRS 3.x及后续版本。用户在部署集群前，可根据需要规划Network File System（简称NFS）服务器，用于存储NameNode元数据，以提高数据可靠性。如果您已经部署NFS服务器，并已配置NFS

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS运维管理
配置NFS服务器存储NameNode元数据 - MapReduce服务 MRS

配置NFS服务器存储NameNode元数据操作场景本章节适用于MRS 3.x及后续版本。用户在部署集群前，可根据需要规划Network File System（简称NFS）服务器，用于存储NameNode元数据，以提高数据可靠性。如果您已经部署NFS服务器，并已配置NFS

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS > HDFS运维管理
典型场景：从SFTP服务器导入数据到Hive - MapReduce服务 MRS

个SFTP服务器操作数据，单击“添加”可增加多行SFTP服务器的配置信息。表1 连接参数参数名说明示例名称 SFTP服务器连接的名称。 sftpName Sftp服务器的IP SFTP服务器的IP地址。 10.16.0.1 Sftp服务器端口 SFTP服务器的端口号。 22

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导入
修改MRS集群NTP服务器 - MapReduce服务 MRS

请准备新的NTP服务器并获取IP地址，并设置好集群与新NTP服务器的网络。请确保服务器的NTP服务状态正常，否则将导致本章节操作失败。修改MRS集群NTP服务器对系统的影响更换NTP服务器是高危操作，更换后集群时间可能将会变化。更换NTP服务器前NTP服务器与集群当前时间偏差大于150s，则需先停止集群，防止数据丢失。停止集群期间服务无法访问。

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群
ALM-12057 元数据未配置周期备份到第三方服务器的任务 - MapReduce服务 MRS

ALM-12057 元数据未配置周期备份到第三方服务器的任务告警解释系统安装完成后会检查元数据是否有周期备份到第三方服务器的任务，然后每1小时会检查一次。如果元数据未配置周期备份到第三方服务器的任务，将发送重要告警。在用户创建元数据周期备份到第三方服务器的任务后，告警消除。告警属性告警ID

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
访问Spark应用的聚合日志页面报“DNS查找失败”错误 - MapReduce服务 MRS

访问Spark应用的聚合日志页面报“DNS查找失败”错误问题采用http(s)://<spark ip>:<spark port>的方式直接访问Spark JobHistory页面时，如果当前跳转的Spark JobHistory页面不是FusionInsight代理的页面（

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > Spark Core
访问Spark应用的聚合日志页面报“DNS查找失败”错误 - MapReduce服务 MRS

访问Spark应用的聚合日志页面报“DNS查找失败”错误问题采用http(s)://<spark ip>:<spark port>的方式直接访问Spark JobHistory页面时，如果当前跳转的Spark JobHistory页面不是FusionInsight代理的页面（

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > Spark Core
配置Spark SQL语法支持关联子查询不带聚合函数 - MapReduce服务 MRS

配置Spark SQL语法支持关联子查询不带聚合函数本章节仅适用于MRS 3.3.1-LTS及之后版本。配置场景开源版本Spark SQL强制要求子查询关联中必须使用聚合函数，如果未使用聚合函数将报错“Error in query: Correlated scalar subqueries

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL企业级能力增强
Spark Distinct聚合优化 - MapReduce服务 MRS

Spark Distinct聚合优化本章节仅适用于MRS 3.3.1-LTS及之后版本。配置场景当SQL中存在多个count(distinct)聚合函数，且存在cube，rollup等导致数据膨胀的算子时，使用该特性可以有效减少数据的膨胀倍数，且减少shuffle落盘的数据

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强
日志聚合下如何查看Spark已完成应用日志 - MapReduce服务 MRS

日志聚合下如何查看Spark已完成应用日志问题当YARN开启了日志聚合功能时，如何在页面看到聚合后的container日志？回答当Yarn配置“yarn.log-aggregation-enable”为“true”时，就开启了container日志聚合功能。日志聚合功能

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > Spark Core
日志聚合下，如何查看Spark已完成应用日志 - MapReduce服务 MRS

日志聚合下，如何查看Spark已完成应用日志问题当YARN开启了日志聚合功能时，如何在页面看到聚合后的container日志？回答当Yarn配置“yarn.log-aggregation-enable”为“true”时，就开启了container日志聚合功能。日志聚合功能

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > Spark Core

总条数： 2717

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

聚合函数 - MapReduce服务 MRS

聚合算法优化 - MapReduce服务 MRS

ALM-12037 NTP服务器异常 - MapReduce服务 MRS

ALM-12100 AD服务器连接异常 - MapReduce服务 MRS

聚合算法优化 - MapReduce服务 MRS

配置Container日志聚合功能 - MapReduce服务 MRS

配置Container日志聚合功能 - MapReduce服务 MRS

Hudi支持聚合函数 - MapReduce服务 MRS

实时OLAP数据查询：基于Unique表的单表检索查询和聚合查询 - MapReduce服务 MRS

配置NFS服务器存储NameNode元数据 - MapReduce服务 MRS

配置NFS服务器存储NameNode元数据 - MapReduce服务 MRS

典型场景：从SFTP服务器导入数据到Hive - MapReduce服务 MRS

修改MRS集群NTP服务器 - MapReduce服务 MRS

ALM-12057 元数据未配置周期备份到第三方服务器的任务 - MapReduce服务 MRS

访问Spark应用的聚合日志页面报“DNS查找失败”错误 - MapReduce服务 MRS

访问Spark应用的聚合日志页面报“DNS查找失败”错误 - MapReduce服务 MRS

配置Spark SQL语法支持关联子查询不带聚合函数 - MapReduce服务 MRS

Spark Distinct聚合优化 - MapReduce服务 MRS

日志聚合下如何查看Spark已完成应用日志 - MapReduce服务 MRS

日志聚合下，如何查看Spark已完成应用日志 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线