搜索_华为云

Set Digest函数 - MapReduce服务 MRS
Set Digest函数 - MapReduce服务 MRS

MinHash用于估计两个集合的Jaccard相似系数。它通常用于数据挖掘，用于大规模检测近乎相同的网页。通过使用这些信息，搜索引擎有效地避免了在搜索结果中显示两个几乎相同的网页。以下示例展示了如何使用Set Digest函数来简单估计文本之间的相似性。通过使用函数ngrams()将输入

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
设置并行度 - MapReduce服务 MRS
设置并行度 - MapReduce服务 MRS

节点。增加任务的并行度，充分利用集群机器的计算能力，一般并行度设置为集群CPU总和的2-3倍。操作步骤并行度可以通过如下三种方式来设置，用户可以根据实际的内存、CPU、数据以及应用程序逻辑的情况调整并行度参数。在会产生shuffle的操作函数内设置并行度参数，优先级最高。 testRDD

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > Spark Core调优
Hadoop压力测试工具如何获取？ - MapReduce服务 MRS

Hadoop压力测试工具如何获取？问： Hadoop压力测试工具如何获取？答： Hadoop压力测试工具社区获取地址：https://github.com/Intel-bigdata/HiBench。父主题：性能优化类

 帮助中心 > MapReduce服务 MRS > 常见问题 > 性能优化类
在Beeline/JDBCServer模式下连续运行10T的TPCDS测试套会出现内存不足的现象 - MapReduce服务 MRS

在Beeline/JDBCServer模式下连续运行10T的TPCDS测试套会出现内存不足的现象问题在Driver内存配置为10G时，Beeline/JDBCServer模式下连续运行10T的TPCDS测试套，会出现因为Driver内存不足导致SQL语句执行失败的现象。回答

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > SQL和DataFrame
集群在线扩缩容 - MapReduce服务 MRS

集群在线扩缩容大数据集群的处理能力通常可以通过增加集群的节点数来横向扩展，当集群规模不符合业务要求时，用户可以通过该功能进行集群节点规模的调整，进行扩容或者缩容；在缩容节点时，MRS会智能地选择负载最少或者迁移数据量最小节点，并且在缩容过程中，缩容节点不再接收新的任务，正在执行

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 产品功能 > 集群管理
在Beeline/JDBCServer模式下连续运行10T的TPCDS测试套会出现内存不足的现象 - MapReduce服务 MRS

在Beeline/JDBCServer模式下连续运行10T的TPCDS测试套会出现内存不足的现象问题在Driver内存配置为10G时，Beeline/JDBCServer模式下连续运行10T的TPCDS测试套，会出现因为Driver内存不足导致SQL语句执行失败的现象。回答

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > SQL和DataFrame
配置Flink任务并行度 - MapReduce服务 MRS

配置Flink任务并行度操作场景并行度控制任务的数量，影响操作后数据被切分成的块数。调整并行度让任务的数量和每个任务处理的数据与机器的处理能力达到更优。查看CPU使用情况和内存占用情况，当任务和数据不是平均分布在各节点，而是集中在个别节点时，可以增大并行度使任务和数据更均匀的

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flink > Flink性能调优
网络连接超时导致FetchFailedException - MapReduce服务 MRS

网络连接超时导致FetchFailedException 问题在380节点的大集群上，运行29T数据量的HiBench测试套中ScalaSort测试用例，使用以下关键配置（--executor-cores 4）出现如下异常： org.apache.spark.shuffle.F

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > Spark Core
在线检索MRS集群日志 - MapReduce服务 MRS

在线检索MRS集群日志 MRS集群Manager支持在线检索并显示组件的日志内容，用于问题定位等其他日志查看场景，管理员可在线按照节点范围或者组件角色范围快速检视所有日志，通过关键字分析快速定位问题。本章节操作仅支持MRS 3.x及之后的版本。在线检索日志登录FusionInsight

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > 查看MRS集群日志
配置列统计值直方图Histogram用以增强CBO准确度 - MapReduce服务 MRS

配置列统计值直方图Histogram用以增强CBO准确度配置场景 Spark优化sql的执行，一般的优化规则都是启发式的优化规则，启发式的优化规则，仅仅根据逻辑计划本身的特点给出优化，没有考虑数据本身的特点，也就是未考虑算子本身的执行代价。Spark在2.2中引入了基于代价的优

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark运维管理
网络连接超时导致FetchFailedException - MapReduce服务 MRS

网络连接超时导致FetchFailedException 问题在380节点的大集群上，运行29T数据量的HiBench测试套中ScalaSort测试用例，使用以下关键配置（--executor-cores 4）出现如下异常： org.apache.spark.shuffle.F

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > Spark Core
配置Flink任务并行度 - MapReduce服务 MRS

配置Flink任务并行度操作场景并行度控制任务的数量，影响操作后数据被切分成的块数。调整并行度让任务的数量和每个任务处理的数据与机器的处理能力达到更优。查看CPU使用情况和内存占用情况，当任务和数据不是平均分布在各节点，而是集中在个别节点时，可以增大并行度使任务和数据更均匀的

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink性能调优
配置列统计值直方图Histogram用以增强CBO准确度 - MapReduce服务 MRS

配置列统计值直方图Histogram用以增强CBO准确度配置场景 Spark优化sql的执行，一般的优化规则都是启发式的优化规则，启发式的优化规则，仅仅根据逻辑计划本身的特点给出优化，没有考虑数据本身的特点，也就是未考虑算子本身的执行代价。Spark在2.2中引入了基于代价的优

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark运维管理
设置Spark Core并行度 - MapReduce服务 MRS

节点。增加任务的并行度，充分利用集群机器的计算能力，一般并行度设置为集群CPU总和的2-3倍。操作步骤并行度可以通过如下三种方式来设置，用户可以根据实际的内存、CPU、数据以及应用程序逻辑的情况调整并行度参数。在会产生shuffle的操作函数内设置并行度参数，优先级最高。 testRDD

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优
FlinkSQL算子并行度 - MapReduce服务 MRS

FlinkSQL算子并行度本章节适用于MRS 3.5.0及以后版本。使用场景通过CompiledPlan提交的作业，算子的并行度、算子的TTL都以CompiledPlan中的值为准，而不是“flink-conf.yaml”中的值。FlinkSQL支持通过修改作业的CompiledPlan来设置算子并行度。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink企业级能力增强
为什么并行度大于待处理的block数目时，CarbonData仍需要额外的executor？ - MapReduce服务 MRS

为什么并行度大于待处理的block数目时，CarbonData仍需要额外的executor？问题为什么并行度大于待处理的block数目时，CarbonData仍需要额外的executor？回答 CarbonData块分布对于数据处理进行了如下优化：优化数据处理并行度。优化了读取块数据的并行性。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData常见问题
为什么并行度大于待处理的block数目时，CarbonData仍需要额外的executor？ - MapReduce服务 MRS

为什么并行度大于待处理的block数目时，CarbonData仍需要额外的executor？问题为什么并行度大于待处理的block数目时，CarbonData仍需要额外的executor？回答 CarbonData块分布对于数据处理进行了如下优化：优化数据处理并行度。优化了读取块数据的并行性。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData故障排除
Spark Core内存调优 - MapReduce服务 MRS

节点。增加任务的并行度，充分利用集群机器的计算能力，一般并行度设置为集群CPU总和的2-3倍。操作步骤并行度可以通过如下三种方式来设置，用户可以根据实际的内存、CPU、数据以及应用程序逻辑的情况调整并行度参数。在会产生shuffle的操作函数内设置并行度参数，优先级最高。 testRDD

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core性能调优
Flink性能调优建议 - MapReduce服务 MRS

通过调整对应算子并行度提升性能读写Hudi可以通过配置读写并发提升读写性能。读算子的并行度调整参数：read.tasks 写算子的并行度调整参数：write.tasks 采用状态索引在作业重启的时候（非Checkpoint重启），需要读目标表重建索引，可以增大该算子并行度提升性能。加载索引的并行度调整参数：write

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > Flink性能调优开发规范
Flink性能调优规则 - MapReduce服务 MRS

合理设置并行度任务运行的速度和并行度相关，一般来说提升并行度能有效提升读取的速度，但是过大的并行度可能导致部分节点资源的浪费，过小的并行度可能导致部分节点运行缓慢。对于SQL当前不能手动指定每个Task的并行度，指定的是所有Task统一的并行度。推荐Source的并行度由上游组件

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > Flink性能调优开发规范

总条数： 417

上一页
1
2
3
4
5
...
21
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Set Digest函数 - MapReduce服务 MRS

设置并行度 - MapReduce服务 MRS

Hadoop压力测试工具如何获取？ - MapReduce服务 MRS

在Beeline/JDBCServer模式下连续运行10T的TPCDS测试套会出现内存不足的现象 - MapReduce服务 MRS

集群在线扩缩容 - MapReduce服务 MRS

在Beeline/JDBCServer模式下连续运行10T的TPCDS测试套会出现内存不足的现象 - MapReduce服务 MRS

配置Flink任务并行度 - MapReduce服务 MRS

网络连接超时导致FetchFailedException - MapReduce服务 MRS

在线检索MRS集群日志 - MapReduce服务 MRS

配置列统计值直方图Histogram用以增强CBO准确度 - MapReduce服务 MRS

网络连接超时导致FetchFailedException - MapReduce服务 MRS

配置Flink任务并行度 - MapReduce服务 MRS

配置列统计值直方图Histogram用以增强CBO准确度 - MapReduce服务 MRS

设置Spark Core并行度 - MapReduce服务 MRS

FlinkSQL算子并行度 - MapReduce服务 MRS

为什么并行度大于待处理的block数目时，CarbonData仍需要额外的executor？ - MapReduce服务 MRS

为什么并行度大于待处理的block数目时，CarbonData仍需要额外的executor？ - MapReduce服务 MRS

Spark Core内存调优 - MapReduce服务 MRS

Flink性能调优建议 - MapReduce服务 MRS

Flink性能调优规则 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线