搜索_华为云

MRS Hive对接CSS服务配置说明 - MapReduce服务 MRS

Hive结构云搜索服务（Cloud Search Service，简称CSS）是一个基于Elasticsearch、OpenSearch且完全托管的在线分布式搜索服务，为用户提供结构化、非结构化文本、以及基于AI向量的多条件检索、统计、报表。云搜索服务是华为云ELK生态的一系列软件集合，为

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 周边云服务对接
Spark基本原理 - MapReduce服务 MRS
Spark基本原理 - MapReduce服务 MRS

用图进行建模。 MRS服务的SparkSQL兼容部分Hive语法（以Hive-Test-benchmark测试集上的64个SQL语句为准）和标准SQL语法（以tpc-ds测试集上的99个SQL语句为准）。 Spark的架构和详细原理介绍，请参见：https://archive.apache

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark
MRS 3.1.2-LTS.2补丁说明 - MapReduce服务 MRS

解决Zookeeper配置了配额仍然显示设置顶层配额失败的告警的问题解决老Guardian实例日志需要打印客户端IP的问题解决MemArtsCC使用TPCDS测试套写10TB数据，任务运行中，cc-sidecar不断重启的问题解决MemArtsCC裸机环境长稳运行中，cc-sidecar进程故障的问题

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群补丁说明
Flink SQL逻辑开发建议 - MapReduce服务 MRS

dt='201200417' and userid < 10 )b on a.key = b.key; 慎用正则表达式函数REGEXP 正则表达式是非常耗时的操作，对比加减乘除通常有百倍的性能开销，而且正则表达式在某些极端情况下可能会进入无限循环，导致作业阻塞。推荐首先使用LIKE。正则函数包括： REGEXP

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > Flink SQL逻辑开发规范
Flink应用性能调优建议 - MapReduce服务 MRS

大并行度使任务和数据更均匀的分布在各个节点。增加任务的并行度，充分利用集群机器的计算能力。任务的并行度可以通过以下四种层次（按优先级从高到低排列）指定，用户可以根据实际的内存、CPU、数据以及应用程序逻辑的情况调整并行度参数。算子层次一个算子、数据源和sink的并行度可以通

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Flink开发指南 > Flink应用开发常见问题
创建CarbonData表 - MapReduce服务 MRS

一般情况下，列的数值复杂度高于5万，可以被认定为高复杂度，则需要排除掉字典编码，该参数为可选参数。说明：在非字典列中，只支持String和Timestamp数据类型。 DICTIONARY_INCLUDE 设置指定列生成字典，适用于数值复杂度低的列，可以提升字典列上的gr

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x之前版本）
Flink Job Pipeline样例程序开发思路 - MapReduce服务 MRS

是唯一的（并发度除外），否则，连接NettySink时会出现冲突，导致无法连接。 topic：订阅的NettySink的topic。 registerServerHandler：为注册服务器的句柄。 NettySource的并发度必须与NettySource的并发度相同，否则无法正常创建连接。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（普通模式） > 开发Flink应用 > Flink Job Pipeline样例程序
Flink Job Pipeline样例程序开发思路 - MapReduce服务 MRS

是唯一的（并发度除外），否则，连接NettySink时会出现冲突，导致无法连接。 topic：订阅的NettySink的topic。 registerServerHandler：为注册服务器的句柄。 NettySource的并发度必须与NettySource的并发度相同，否则无法正常创建连接。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（普通模式） > 开发Flink应用 > Flink Job Pipeline样例程序
Flink Job Pipeline样例程序开发思路 - MapReduce服务 MRS

须是唯一的（并发度除外），否则，连接NettySink时会出现冲突，导致无法连接。 topic：订阅的NettySink的topic。 registerServerHandler：为注册服务器的句柄。 NettySource的并发度必须与NettySink的并发度相同，否则无法正常创建连接。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（安全模式） > 开发Flink应用 > Flink Job Pipeline样例程序
迁移MRS集群内ClickHouse数据至其他MRS集群 - MapReduce服务 MRS

ouse_migration_tool/clickhouse-data-migration/comparison_result”目录下。对比如下迁移后的结果文件信息，确认迁移后源集群和目标集群数据的一致性： source_cluster_table_info：源集群迁出数据的统计

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse > ClickHouse运维管理
Flink Job Pipeline样例程序开发思路 - MapReduce服务 MRS

须是唯一的（并发度除外），否则，连接NettySink时会出现冲突，导致无法连接。 topic：订阅的NettySink的topic。 registerServerHandler：为注册服务器的句柄。 NettySource的并发度必须与NettySink的并发度相同，否则无法正常创建连接。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（安全模式） > 开发Flink应用 > Flink Job Pipeline样例程序
常用参数 - MapReduce服务 MRS
常用参数 - MapReduce服务 MRS

enabled为true，记录Spark事件的目录。在此目录下，Spark为每个应用程序创建文件，并将应用程序的事件记录到文件中。用户也可设置为统一的与HDFS目录相似的地址，这样History server就可以读取历史文件。 hdfs://hacluster/spark2xJobHistory2x spark

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark运维管理
配置Flink任务进程参数 - MapReduce服务 MRS

nager的个数相当于增大了任务的并发度。在资源充足的情况下，可以相应增加TaskManager的个数，以提高运行效率。配置TaskManager Slot数。每个TaskManager多个核同时能跑多个task，相当于增大了任务的并发度。但是由于所有核共用TaskManag

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flink > Flink性能调优
Spark常用配置参数 - MapReduce服务 MRS

enabled为true，记录Spark事件的目录。在此目录下，Spark为每个应用程序创建文件，并将应用程序的事件记录到文件中。用户也可设置为统一的与HDFS目录相似的地址，这样History server就可以读取历史文件。 hdfs://hacluster/spark2xJobHistory2x spark

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark运维管理
Flink Job Pipeline增强 - MapReduce服务 MRS

数据。取消NettySink算子运行等。也可以通过其属性获取以下信息： NettySink算子各个并发度的subtaskIndex信息。 NettySink算子的并发度。 RegisterServerHandler 该组件主要是与注册服务器交互的部件，在平台上定义了一系列接口，包括以下几种接口：

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Flink
配置Flink任务进程参数 - MapReduce服务 MRS

nager的个数相当于增大了任务的并发度。在资源充足的情况下，可以相应增加TaskManager的个数，以提高运行效率。配置TaskManager Slot数。每个TaskManager多个核同时能跑多个task，相当于增大了任务的并发度。但是由于所有核共用TaskManag

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink性能调优
SET/RESET - MapReduce服务 MRS
SET/RESET - MapReduce服务 MRS

shuffle并行度。 hoodie.upsert.shuffle.parallelism upsert方式写入数据时的spark shuffle并行度。 hoodie.delete.shuffle.parallelism delete方式删除数据时的spark shuffle并行度。 hoodie

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi SQL语法参考 > Hudi DML语法说明
HDFS开源增强特性 - MapReduce服务 MRS

有的Block分布在一起，不再需要跨节点读取数据就能完成计算，极大提高MapReduce Join性能。图2 无同分布与同分布数据块分布对比 HDFS开源增强特性：硬盘坏卷设置在开源版本中，如果为DataNode配置多个数据存放卷，默认情况下其中一个卷损坏，则DataNode将不再提供服务。配置项“dfs

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > HDFS
Spark On Hudi性能调优 - MapReduce服务 MRS

rack 3s 0s 优化shuffle并行度，提升Spark加工效率所谓的shuffle并发度如下图所示：集群默认是200，作业可以单独设置。如果发现瓶颈stage（执行时间长），且分配给当前作业的核数大于当前的并发数，说明并发度不足。通过以下配置优化。场景配置项集群默认值

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Spark on Hudi开发规范
Hudi性能调优 - MapReduce服务 MRS
Hudi性能调优 - MapReduce服务 MRS

进行调整。 dataSize如果只有几个G，推荐跑单节点运行spark，或者yarn模式但是只分配一个container。入湖程序的并行度p设置：建议 p = （dataSize）/128M, 程序分配core的数量保持和p一致即可。内存设置建议内存大小和core的比例大于1.5:1

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi

总条数： 471

上一页
1
...
16
17
18
...
24
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

MRS Hive对接CSS服务配置说明 - MapReduce服务 MRS

Spark基本原理 - MapReduce服务 MRS

MRS 3.1.2-LTS.2补丁说明 - MapReduce服务 MRS

Flink SQL逻辑开发建议 - MapReduce服务 MRS

Flink应用性能调优建议 - MapReduce服务 MRS

创建CarbonData表 - MapReduce服务 MRS

Flink Job Pipeline样例程序开发思路 - MapReduce服务 MRS

Flink Job Pipeline样例程序开发思路 - MapReduce服务 MRS

Flink Job Pipeline样例程序开发思路 - MapReduce服务 MRS

迁移MRS集群内ClickHouse数据至其他MRS集群 - MapReduce服务 MRS

Flink Job Pipeline样例程序开发思路 - MapReduce服务 MRS

常用参数 - MapReduce服务 MRS

配置Flink任务进程参数 - MapReduce服务 MRS

Spark常用配置参数 - MapReduce服务 MRS

Flink Job Pipeline增强 - MapReduce服务 MRS

配置Flink任务进程参数 - MapReduce服务 MRS

SET/RESET - MapReduce服务 MRS

HDFS开源增强特性 - MapReduce服务 MRS

Spark On Hudi性能调优 - MapReduce服务 MRS

Hudi性能调优 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线