搜索_华为云

Flink SQL逻辑开发建议 - MapReduce服务 MRS

flag IN ('wap', 'other'))AS web_uv FROM T GROUP BY day Flink SQL优化器可以识别相同的distinct key上的不同过滤器参数。例如示例中三个COUNT DISTINCT都在user_id列上。Flink可以只使用一

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > Flink SQL逻辑开发规范
访问MRS集群Manager - MapReduce服务 MRS

入方向规则”（页面入口：单击“管理安全组规则”）页签列表中描述列自动增加“MRS Manager public ip access control rule”，便于用户识别。图1 添加MRS集群安全组规则自动获取的访问公网IP与用户本机IP不一致，属于正常现象，无需处理。 9022端口为MRS集群knox

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群
恢复Hive业务数据 - MapReduce服务 MRS

系统管理员可以通过FusionInsight Manager创建恢复Hive任务并恢复数据。只支持创建任务手动恢复数据。 Hive备份恢复功能不支持识别用户的Hive表、索引、视图等对象在业务和结构上存在的关联关系。用户在执行备份恢复任务时，需要根据业务场景管理统一的恢复点，防止影响业务正常运行。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > 备份恢复MRS集群数据 > 恢复MRS集群组件数据
SparkSQL用户权限介绍 - MapReduce服务 MRS

否有表权限都可以进行查询。视图的权限是针对整个表而言的，不支持对其中的部分列创建视图权限。视图权限在SparkSQL权限上的限制与列权限相似，详细如下：在spark-sql模式下，只有视图权限而没有表权限，且没有HDFS的读取权限时，用户不能访问HDFS上存储的表的数据，即该情况下不支持对该表的视图进行查询。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark用户权限管理
SparkSQL权限介绍 - MapReduce服务 MRS

否有表权限都可以进行查询。视图的权限是针对整个表而言的，不支持对其中的部分列创建视图权限。视图权限在SparkSQL权限上的限制与列权限相似，详细如下：在spark-sql模式下，只有视图权限而没有表权限，且没有HDFS的读取权限时，用户不能访问HDFS上存储的表的数据，即该情况下不支持对该表的视图进行查询。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark用户权限管理
配置Doris对接Hive数据源 - MapReduce服务 MRS

Catalog，不仅能访问Hive，也能访问使用Hive Metastore作为元数据存储的系统，例如Iceberg、Hudi等。支持Managed Table。可以识别Hive Metastore中存储的Hive和Hudi元数据。如果想访问非当前用户创建的Catalog，需授予用户Catalog所在的OBS路径的操作权限。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Doris > Doris企业级能力增强 > 配置Doris支持多源数据
备份Hive业务数据 - MapReduce服务 MRS

系统管理员可以通过FusionInsight Manager创建备份Hive任务。支持创建任务自动或手动备份数据。 Hive备份恢复功能不支持识别用户的Hive表、索引、视图等对象在业务和结构上存在的关联关系。用户在执行备份恢复任务时，需要根据业务场景管理统一的恢复点，防止影响业务正常运行。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > 备份恢复MRS集群数据 > 备份MRS集群组件数据
快速配置参数 - MapReduce服务 MRS

enabled为true，记录Spark事件的目录。在此目录下，Spark为每个应用程序创建文件，并将应用程序的事件记录到文件中。用户也可设置为统一的与HDFS目录相似的地址，这样History server就可以读取历史文件。 hdfs://hacluster/spark2xJobHistory2x spark

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark运维管理
快速配置Spark参数 - MapReduce服务 MRS

enabled为true，记录Spark事件的目录。在此目录下，Spark为每个应用程序创建文件，并将应用程序的事件记录到文件中。用户也可设置为统一的与HDFS目录相似的地址，这样History server就可以读取历史文件。 hdfs://hacluster/spark2xJobHistory2x spark

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark运维管理
Flink应用性能调优建议 - MapReduce服务 MRS

大并行度使任务和数据更均匀的分布在各个节点。增加任务的并行度，充分利用集群机器的计算能力。任务的并行度可以通过以下四种层次（按优先级从高到低排列）指定，用户可以根据实际的内存、CPU、数据以及应用程序逻辑的情况调整并行度参数。算子层次一个算子、数据源和sink的并行度可以通

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Flink开发指南 > Flink应用开发常见问题
Flink Job Pipeline样例程序开发思路 - MapReduce服务 MRS

是唯一的（并发度除外），否则，连接NettySink时会出现冲突，导致无法连接。 topic：订阅的NettySink的topic。 registerServerHandler：为注册服务器的句柄。 NettySource的并发度必须与NettySource的并发度相同，否则无法正常创建连接。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（普通模式） > 开发Flink应用 > Flink Job Pipeline样例程序
Flink Job Pipeline样例程序开发思路 - MapReduce服务 MRS

是唯一的（并发度除外），否则，连接NettySink时会出现冲突，导致无法连接。 topic：订阅的NettySink的topic。 registerServerHandler：为注册服务器的句柄。 NettySource的并发度必须与NettySource的并发度相同，否则无法正常创建连接。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（普通模式） > 开发Flink应用 > Flink Job Pipeline样例程序
Flink Job Pipeline样例程序开发思路 - MapReduce服务 MRS

须是唯一的（并发度除外），否则，连接NettySink时会出现冲突，导致无法连接。 topic：订阅的NettySink的topic。 registerServerHandler：为注册服务器的句柄。 NettySource的并发度必须与NettySink的并发度相同，否则无法正常创建连接。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（安全模式） > 开发Flink应用 > Flink Job Pipeline样例程序
配置Flink任务进程参数 - MapReduce服务 MRS

nager的个数相当于增大了任务的并发度。在资源充足的情况下，可以相应增加TaskManager的个数，以提高运行效率。配置TaskManager Slot数。每个TaskManager多个核同时能跑多个task，相当于增大了任务的并发度。但是由于所有核共用TaskManag

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flink > Flink性能调优
Flink Job Pipeline样例程序开发思路 - MapReduce服务 MRS

须是唯一的（并发度除外），否则，连接NettySink时会出现冲突，导致无法连接。 topic：订阅的NettySink的topic。 registerServerHandler：为注册服务器的句柄。 NettySource的并发度必须与NettySink的并发度相同，否则无法正常创建连接。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（安全模式） > 开发Flink应用 > Flink Job Pipeline样例程序
SET/RESET - MapReduce服务 MRS
SET/RESET - MapReduce服务 MRS

shuffle并行度。 hoodie.upsert.shuffle.parallelism upsert方式写入数据时的spark shuffle并行度。 hoodie.delete.shuffle.parallelism delete方式删除数据时的spark shuffle并行度。 hoodie

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi SQL语法参考 > Hudi DML语法说明
Spark On Hudi性能调优 - MapReduce服务 MRS

rack 3s 0s 优化shuffle并行度，提升Spark加工效率所谓的shuffle并发度如下图所示：集群默认是200，作业可以单独设置。如果发现瓶颈stage（执行时间长），且分配给当前作业的核数大于当前的并发数，说明并发度不足。通过以下配置优化。场景配置项集群默认值

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Spark on Hudi开发规范
Hudi性能调优 - MapReduce服务 MRS
Hudi性能调优 - MapReduce服务 MRS

进行调整。 dataSize如果只有几个G，推荐跑单节点运行spark，或者yarn模式但是只分配一个container。入湖程序的并行度p设置：建议 p = （dataSize）/128M, 程序分配core的数量保持和p一致即可。内存设置建议内存大小和core的比例大于1.5:1

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi
Flink Job Pipeline增强 - MapReduce服务 MRS

数据。取消NettySink算子运行等。也可以通过其属性获取以下信息： NettySink算子各个并发度的subtaskIndex信息。 NettySink算子的并发度。 RegisterServerHandler 该组件主要是与注册服务器交互的部件，在平台上定义了一系列接口，包括以下几种接口：

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Flink
配置进程参数 - MapReduce服务 MRS

性能做优化。操作步骤配置Driver内存。 Driver负责任务的调度，和Executor、AM之间的消息通信。当任务数变多，任务平行度增大时，Driver内存都需要相应增大。您可以根据实际任务数量的多少，为Driver设置一个合适的内存。将“spark-defaults

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > Spark Core调优

总条数： 280

上一页
1
...
6
7
8
...
14
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Flink SQL逻辑开发建议 - MapReduce服务 MRS

访问MRS集群Manager - MapReduce服务 MRS

恢复Hive业务数据 - MapReduce服务 MRS

SparkSQL用户权限介绍 - MapReduce服务 MRS

SparkSQL权限介绍 - MapReduce服务 MRS

配置Doris对接Hive数据源 - MapReduce服务 MRS

备份Hive业务数据 - MapReduce服务 MRS

快速配置参数 - MapReduce服务 MRS

快速配置Spark参数 - MapReduce服务 MRS

Flink应用性能调优建议 - MapReduce服务 MRS

Flink Job Pipeline样例程序开发思路 - MapReduce服务 MRS

Flink Job Pipeline样例程序开发思路 - MapReduce服务 MRS

Flink Job Pipeline样例程序开发思路 - MapReduce服务 MRS

配置Flink任务进程参数 - MapReduce服务 MRS

Flink Job Pipeline样例程序开发思路 - MapReduce服务 MRS

SET/RESET - MapReduce服务 MRS

Spark On Hudi性能调优 - MapReduce服务 MRS

Hudi性能调优 - MapReduce服务 MRS

Flink Job Pipeline增强 - MapReduce服务 MRS

配置进程参数 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线