搜索_华为云

Spark client CLI介绍 - MapReduce服务 MRS

CLI详细的使用方法参考官方网站的描述：http://archive.apache.org/dist/spark/docs/3.3.1/quick-start.html。常用CLI Spark常用的CLI如下所示： spark-shell 提供了一个简单学习API的方法，类似于交互

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > Spark应用开发常见问题 > Spark常用API介绍
Spark client CLI介绍 - MapReduce服务 MRS

CLI详细的使用方法参考官方网站的描述：http://archive.apache.org/dist/spark/docs/3.3.1/quick-start.html。常用CLI Spark常用的CLI如下所示： spark-shell 提供了一个简单学习API的方法，类似于交互

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
Spark client CLI介绍 - MapReduce服务 MRS

CLI详细的使用方法参考官方网站的描述：http://archive.apache.org/dist/spark/docs/3.3.1/quick-start.html。常用CLI Spark常用的CLI如下所示： spark-shell 提供了一个简单学习API的方法，类似于交互

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > Spark应用开发常见问题 > Spark常用API介绍
优化小文件场景下的Spark SQL性能 - MapReduce服务 MRS

优化小文件场景下的Spark SQL性能配置场景 Spark SQL的表中，经常会存在很多小文件（大小远小于HDFS块大小），每个小文件默认对应Spark中的一个Partition，也就是一个Task。在很多小文件场景下，Spark会起很多Task。当SQL逻辑中存在Shuff

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
使用Hive CBO功能优化多表查询效率 - MapReduce服务 MRS

使CBO正确的优化。 CBO优化器会基于统计信息和查询条件，尽可能地使Join顺序达到更优。但是也可能存在特殊情况导致Join顺序调整不准确。例如数据存在倾斜，以及查询条件值在表中不存在等场景，可能调整出非优化的Join顺序。开启列统计信息自动收集时，需要在Reduce侧做聚合

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive性能调优
MapReduce任务commit阶段优化 - MapReduce服务 MRS

MapReduce任务commit阶段优化操作场景默认情况下，如果一个MR任务会产生大量的输出结果文件，那么该job在最后的commit阶段，会耗费较长的时间将每个task的临时输出结果commit到最终的结果输出目录。特别是在大集群中，大Job的commit过程会严重影响任务的性能表现。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用MapReduce > MapReduce性能调优
Spark动态分区插入场景内存优化 - MapReduce服务 MRS

Spark动态分区插入场景内存优化操作场景 SparkSQL在往动态分区表中插入数据时，分区数越多，单个Task生成的HDFS文件越多，则元数据占用的内存也越多。这就导致程序GC（Gabage Collection）严重，甚至发生OOM（Out of Memory）。经测试证

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
MapReduce任务commit阶段优化 - MapReduce服务 MRS

MapReduce任务commit阶段优化操作场景默认情况下，如果一个MR任务会产生大量的输出结果文件，那么该job在最后的commit阶段，会耗费较长的时间将每个task的临时输出结果commit到最终的结果输出目录。特别是在大集群中，大Job的commit过程会严重影响任务的性能表现。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Mapreduce > MapReduce性能调优
HDFS HA方案介绍 - MapReduce服务 MRS

由于每个集群只有一个NameNode，如果NameNode所在机器发生故障，将导致HDFS集群无法使用，除非NameNode重启或者在另一台机器上启动。这在两个方面影响了HDFS的整体可用性：当异常情况发生时，如机器崩溃，集群将不可用，除非重新启动NameNode。计划性的维

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > HDFS
FlinkSQL JSON_VALUE函数性能优化 - MapReduce服务 MRS

FlinkSQL JSON_VALUE函数性能优化本章节适用于MRS 3.5.0及以后版本。使用场景内置JSON_VALUE函数解析一个JSON item的多个字段时，复用上次JSON item的解析结果，提升算子性能。使用方法配置Flink作业时，可通过在FlinkServer

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink企业级能力增强
优化HDFS DataNode RPC的服务质量 - MapReduce服务 MRS

优化HDFS DataNode RPC的服务质量配置场景当客户端写入HDFS的速度大于DataNode的硬盘带宽时，硬盘带宽会被占满，导致DataNode失去响应。客户端只能通过取消或恢复通道进行规避，这会导致写入失败及不必要的通道恢复操作。本章节适用于MRS 3.x及后续版本。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS > HDFS性能调优
优化HDFS DataNode RPC的服务质量 - MapReduce服务 MRS

优化HDFS DataNode RPC的服务质量配置场景当客户端写入HDFS的速度大于DataNode的硬盘带宽时，硬盘带宽会被占满，导致DataNode失去响应。客户端只能通过取消或恢复通道进行规避，这会导致写入失败及不必要的通道恢复操作。本章节适用于MRS 3.x及后续版本。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS性能调优
优化数据倾斜场景下的Spark SQL性能 - MapReduce服务 MRS

示例：执行下面SQL语句，a表倾斜或b表倾斜都无法触发该优化。 select aid FROM a FULL OUTER JOIN b ON aid=bid; 不支持LEFT OUTER JOIN的右表倾斜处理。示例：执行下面SQL语句，b表倾斜无法触发该优化。 select aid FROM a

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优
优化小文件场景下的Spark SQL性能 - MapReduce服务 MRS

优化小文件场景下的Spark SQL性能配置场景 Spark SQL的表中，经常会存在很多小文件（大小远小于HDFS块大小），每个小文件默认对应Spark中的一个Partition，也就是一个Task。在很多小文件场景下，Spark会起很多Task。当SQL逻辑中存在Shuff

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优
导入并配置IoTDB样例工程 - MapReduce服务 MRS

导入并配置IoTDB样例工程背景信息获取IoTDB开发样例工程，将工程导入到IntelliJ IDEA开始样例学习。操作步骤参考获取MRS应用开发样例工程，获取样例代码解压目录中“src/iotdb-examples”目录下的样例工程，可根据实际业务场景选择对应的样例。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > IoTDB开发指南（普通模式） > 准备IoTDB应用开发环境
优化数据倾斜场景下的Spark SQL性能 - MapReduce服务 MRS

示例：执行下面SQL语句，a表倾斜或b表倾斜都无法触发该优化。 select aid FROM a FULL OUTER JOIN b ON aid=bid; 不支持LEFT OUTER JOIN的右表倾斜处理。示例：执行下面SQL语句，b表倾斜无法触发该优化。 select aid FROM a

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
Spark应用开发简介 - MapReduce服务 MRS

Computation）：支持迭代计算，有效应对多步的数据处理逻辑。数据挖掘（Data Mining）：在海量数据基础上进行复杂的挖掘分析，可支持各种数据挖掘和机器学习算法。流式处理（Streaming Processing）：支持秒级延迟的流式处理，可支持多种外部数据源。查询分析（Query An

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式）
如何设置Spark作业执行时自动获取更多资源？ - MapReduce服务 MRS

动态资源调度就是为了解决这种场景，根据当前应用任务的负载情况，实时的增减Executor个数，从而实现动态分配资源，使整个Spark系统更加健康。可通过如下方法开启动态资源分配功能，其他相关配置可参考Yarn模式下动态资源调度。登录FusionInsight Manager，选择“集群 > 服务

 帮助中心 > MapReduce服务 MRS > 常见问题 > 性能优化类
导入并配置HDFS样例工程 - MapReduce服务 MRS

操作场景 HDFS针对多个场景提供样例工程，帮助客户快速学习HDFS工程。以下操作步骤以导入HDFS样例代码为例。操作步骤参考获取MRS应用开发样例工程，下载样例工程到本地。导入样例工程到Eclipse开发环境。第一种方法：打开Eclipse，选择“File > New >

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > HDFS开发指南 > 准备HDFS应用开发环境
如何对insert overwrite自读自写场景进行优化 - MapReduce服务 MRS

如何对insert overwrite自读自写场景进行优化场景说明对于需要使用动态分区插入（使用历史分区更新）数据到目的表中，且和数据源表是同一张表时，由于直接在原表上执行insert overwrite可能会导致数据丢失或数据不一致的风险，建议先使用一个临时表来处理数据，再执行insert

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive故障排除

总条数： 1616

上一页
1
2
3
4
5
...
81
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark client CLI介绍 - MapReduce服务 MRS

Spark client CLI介绍 - MapReduce服务 MRS

Spark client CLI介绍 - MapReduce服务 MRS

优化小文件场景下的Spark SQL性能 - MapReduce服务 MRS

使用Hive CBO功能优化多表查询效率 - MapReduce服务 MRS

MapReduce任务commit阶段优化 - MapReduce服务 MRS

Spark动态分区插入场景内存优化 - MapReduce服务 MRS

MapReduce任务commit阶段优化 - MapReduce服务 MRS

HDFS HA方案介绍 - MapReduce服务 MRS

FlinkSQL JSON_VALUE函数性能优化 - MapReduce服务 MRS

优化HDFS DataNode RPC的服务质量 - MapReduce服务 MRS

优化HDFS DataNode RPC的服务质量 - MapReduce服务 MRS

优化数据倾斜场景下的Spark SQL性能 - MapReduce服务 MRS

优化小文件场景下的Spark SQL性能 - MapReduce服务 MRS

导入并配置IoTDB样例工程 - MapReduce服务 MRS

优化数据倾斜场景下的Spark SQL性能 - MapReduce服务 MRS

Spark应用开发简介 - MapReduce服务 MRS

如何设置Spark作业执行时自动获取更多资源？ - MapReduce服务 MRS

导入并配置HDFS样例工程 - MapReduce服务 MRS

如何对insert overwrite自读自写场景进行优化 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线