搜索_华为云

Set Digest函数 - MapReduce服务 MRS
Set Digest函数 - MapReduce服务 MRS

MinHash用于估计两个集合的Jaccard相似系数。它通常用于数据挖掘，用于大规模检测近乎相同的网页。通过使用这些信息，搜索引擎有效地避免了在搜索结果中显示两个几乎相同的网页。以下示例展示了如何使用Set Digest函数来简单估计文本之间的相似性。通过使用函数ngrams()将输入

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
集群在线扩缩容 - MapReduce服务 MRS

集群在线扩缩容大数据集群的处理能力通常可以通过增加集群的节点数来横向扩展，当集群规模不符合业务要求时，用户可以通过该功能进行集群节点规模的调整，进行扩容或者缩容；在缩容节点时，MRS会智能地选择负载最少或者迁移数据量最小节点，并且在缩容过程中，缩容节点不再接收新的任务，正在执行

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 产品功能 > 集群管理
配置列统计值直方图Histogram用以增强CBO准确度 - MapReduce服务 MRS

配置列统计值直方图Histogram用以增强CBO准确度配置场景 Spark优化sql的执行，一般的优化规则都是启发式的优化规则，启发式的优化规则，仅仅根据逻辑计划本身的特点给出优化，没有考虑数据本身的特点，也就是未考虑算子本身的执行代价。Spark在2.2中引入了基于代价的优

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark运维管理
配置列统计值直方图Histogram用以增强CBO准确度 - MapReduce服务 MRS

配置列统计值直方图Histogram用以增强CBO准确度配置场景 Spark优化sql的执行，一般的优化规则都是启发式的优化规则，启发式的优化规则，仅仅根据逻辑计划本身的特点给出优化，没有考虑数据本身的特点，也就是未考虑算子本身的执行代价。Spark在2.2中引入了基于代价的优

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark运维管理
转换函数 - MapReduce服务 MRS
转换函数 - MapReduce服务 MRS

); select cast(186 as varchar); try_cast(value AS type) → type 与cast()相似，区别是转换失败返回null。 select try_cast(1860 as tinyint); _col0 ------- NULL

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
HetuEngine隐式转换对照表 - MapReduce服务 MRS

HetuEngine隐式转换对照表在开启隐式转换功能后，当数据类型不匹配时会隐式转换，但并是不是所有的数据类型都支持隐式转换。以下为当前隐式转换功能支持的数据类型转换表：表1 隐式转换对照表 - BOOLEAN TINYINT SMALLINT INTEGER BIGINT REAL

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine数据类型隐式转换
在线检索MRS集群日志 - MapReduce服务 MRS

在线检索MRS集群日志 MRS集群Manager支持在线检索并显示组件的日志内容，用于问题定位等其他日志查看场景，管理员可在线按照节点范围或者组件角色范围快速检视所有日志，通过关键字分析快速定位问题。本章节操作仅支持MRS 3.x及之后的版本。在线检索日志登录FusionInsight

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > 查看MRS集群日志
提升HBase实时读数据效率 - MapReduce服务 MRS

对于可以压缩的数据，配置压缩算法可以有效减少磁盘的IO，从而达到提高性能的目的。说明：并非所有数据都可以进行有效压缩。例如一张图片的数据，因为图片一般已经是压缩后的数据，所以压缩效果有限。常用的压缩算法是SNAPPY，因为它有较好的Encoding/Decoding速度和可以接受的压缩率。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase > HBase性能调优
配置HetuEngine物化视图推荐能力 - MapReduce服务 MRS

务，开启物化视图推荐能力后，系统能自动学习并推荐对业务最有价值的物化视图SQL，使HetuEngine具备自动预计算加速能力，在相关场景下在线查询效率获得倍数提升，同时有效降低系统负载压力。前提条件集群运行正常并至少安装一个QAS实例。已创建用于访问HetuEngine W

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 配置HetuEngine物化视图
提升HBase实时读数据效率 - MapReduce服务 MRS

对于可以压缩的数据，配置压缩算法可以有效减少磁盘的IO，从而达到提高性能的目的。说明：并非所有数据都可以进行有效压缩。例如一张图片的数据，因为图片一般已经是压缩后的数据，所以压缩效果有限。常用的压缩算法是SNAPPY，因为它有较好的Encoding/Decoding速度和可以接受的压缩率。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase性能调优
CarbonData调优思路 - MapReduce服务 MRS

压缩算法来压缩数据。虽然这些算法可处理任何类型的数据，但如果数据经过排序，相似值在一起出现时，就会获得更好的压缩率。 CarbonData数据加载过程中，数据基于Table中的列顺序进行排序，从而确保相似值在一起出现，以获得更好的压缩率。由于CarbonData按照Table中

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData性能调优
配置MapReduce Job基线 - MapReduce服务 MRS

基线数据做对比来获得。 Job基线的确定有如下三个原则：充分利用集群资源 Reduce阶段尽量放在一轮每个Task的执行时间要合理操作步骤原则一：充分利用集群资源。 Job运行时，会让所有的节点都有任务处理，且处于繁忙状态，这样才能保证资源充分利用，任务的并发度达到最大。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用MapReduce > MapReduce性能调优
OpenTSDB - MapReduce服务 MRS
OpenTSDB - MapReduce服务 MRS

来处理您向其投入的任何负载。每个TSD使用CloudTable集群中的HBase来存储和检索时间序列数据。数据模式经过高度优化，可快速聚合相似的时间序列，从而最大限度地减少存储空间。TSD的用户不需要直接访问底层存储。您可以通过HTTP API与TSD进行通信。所有通信都发生在同

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍
HBase启动后原生页面显示RegionServer个数多于实际个数 - MapReduce服务 MRS

HBase启动后，HMaster原生页面显示RegionServer个数多于实际RegionServer个数。查看HMaster原生页面，显示有4个RegionServer在线，如下图示：原因分析如下图可以看出，第三行hostname为controller-192-168-1-3节点和第四行hostname为

 帮助中心 > MapReduce服务 MRS > 故障排除 > 使用HBase
配置MapReduce Job基线 - MapReduce服务 MRS

基线数据做对比来获得。 Job基线的确定有如下三个原则：充分利用集群资源 Reduce阶段尽量放在一轮每个Task的执行时间要合理操作步骤原则一：充分利用集群资源。 Job运行时，会让所有的节点都有任务处理，且处于繁忙状态，这样才能保证资源充分利用，任务的并发度达到最大。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Mapreduce > MapReduce性能调优
Kafka与其他组件的关系 - MapReduce服务 MRS

Kafka作为一个消息发布-订阅系统，为整个大数据平台多个子系统之间数据的传递提供了高速数据流转方式。 Kafka可以实时接受来自外部的消息，并提供给在线以及离线业务进行处理。 Kafka与其他组件的具体的关系如下图所示：图1 与其他组件关系父主题： Kafka

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Kafka
ClickHouse物化视图概述 - MapReduce服务 MRS

普通物化视图与projection对比物化视图类型原表数据与物化视图一致性灵活性物化视图开发及维护复杂度普通物化视图数据从原表同步到物化视图需要时间窗。灵活性较高，有新的业务可开发新的物化视图。可开发复杂逻辑SQL语句的物化视图。复杂度较高，需要开发很多物化视图，每个物化视图都需要单独去管理和维护。

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范 > ClickHouse物化视图设计
手动续费 - MapReduce服务 MRS
手动续费 - MapReduce服务 MRS

可以将到期日统一设置到一个日期，便于日常管理和续费。图2展示了用户将两个不同时间到期的资源，同时续费一个月，并设置“统一到期日”后的效果对比。图2 统一到期日更多关于统一到期日的规则请参见如何设置统一到期日。父主题：续费

 帮助中心 > MapReduce服务 MRS > 计费说明 > 续费
Flink基本原理 - MapReduce服务 MRS
Flink基本原理 - MapReduce服务 MRS

erator Subtask放在不同的线程中独立执行。一个Operator的并行度，等于Operator Subtask的个数，一个Stream的并行度（分区总数）等于生成它的Operator的并行度，如图4所示。图4 Operator 紧密度高的算子可以进行优化，优化后可以将多个Operator

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Flink
YARN开源增强特性 - MapReduce服务 MRS

应用等待原因如果应用程序尚未启动，则提供作业等待原因信息。 Superior Scheduler和YARN开源调度器做了对比分析，如表2所示：表2 对比分析领域 YARN开源调度器 Superior Scheduler 多租户调度在同构集群上，只能选择容量调度器（Capacity

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > YARN

总条数： 202

上一页
1
2
3
4
5
...
11
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Set Digest函数 - MapReduce服务 MRS

集群在线扩缩容 - MapReduce服务 MRS

配置列统计值直方图Histogram用以增强CBO准确度 - MapReduce服务 MRS

配置列统计值直方图Histogram用以增强CBO准确度 - MapReduce服务 MRS

转换函数 - MapReduce服务 MRS

HetuEngine隐式转换对照表 - MapReduce服务 MRS

在线检索MRS集群日志 - MapReduce服务 MRS

提升HBase实时读数据效率 - MapReduce服务 MRS

配置HetuEngine物化视图推荐能力 - MapReduce服务 MRS

提升HBase实时读数据效率 - MapReduce服务 MRS

CarbonData调优思路 - MapReduce服务 MRS

配置MapReduce Job基线 - MapReduce服务 MRS

OpenTSDB - MapReduce服务 MRS

HBase启动后原生页面显示RegionServer个数多于实际个数 - MapReduce服务 MRS

配置MapReduce Job基线 - MapReduce服务 MRS

Kafka与其他组件的关系 - MapReduce服务 MRS

ClickHouse物化视图概述 - MapReduce服务 MRS

手动续费 - MapReduce服务 MRS

Flink基本原理 - MapReduce服务 MRS

YARN开源增强特性 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线