搜索_华为云

Spark Streaming性能调优 - MapReduce服务 MRS

Spark Streaming性能调优操作场景 Streaming作为一种mini-batch方式的流式处理框架，它主要的特点是：秒级时延和高吞吐量。因此Streaming调优的目标：在秒级延迟的情景下，提高Streaming的吞吐能力，在单位时间处理尽可能多的数据。本章节适用于输入数据源为

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本）
数据表报错Too many parts解决方法 - MapReduce服务 MRS

数据表报错Too many parts解决方法问题排查步骤磁盘或其他存储介质问题导致merge过慢或者中止。登录Manager页面，检查是否存在磁盘容量不足或其他磁盘告警，如果存在，请按照告警指导处理。如果是磁盘容量不足，也可以联系客户删除部分过期数据，释放空间，快速恢复业务

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ClickHouse > ClickHouse性能调优
ClickHouse数据表分区过多调优 - MapReduce服务 MRS

ClickHouse数据表分区过多调优问题排查步骤磁盘或其他存储介质问题导致merge过慢或者中止。登录Manager页面，检查是否存在磁盘容量不足或其他磁盘告警，如果存在，请按照告警指导处理。如果是磁盘容量不足，也可以联系客户删除部分过期数据，释放空间，快速恢复业务。 Zookeeper

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse > ClickHouse性能调优
ALM-43013 JDBCServer2x进程GC时间超出阈值 - MapReduce服务 MRS

ALM-43013 JDBCServer2x进程GC时间超出阈值告警解释系统每60秒周期性检测JDBCServer2x进程的GC时间，当检测到JDBCServer2x进程的GC时间超出阈值（连续3次检测超过12秒）时产生该告警。用户可通过“运维 >告警 > 阈值设置 > Spark2x

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
Spark应用开发规则 - MapReduce服务 MRS

Spark应用开发规则 Spark应用中，需引入Spark的类对于Java开发语言，正确示例： // 创建SparkContext时所需引入的类。 import org.apache.spark.api.java.JavaSparkContext // RDD操作时引入的类。 import

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Spark应用开发规范
MRS 3.2.0-LTS.1版本说明 - MapReduce服务 MRS

MRS 3.2.0-LTS.1版本说明发布日期 MRS 3.2.0-LTS.1 2023年4月28日更新内容服务模块主要变更点 ClickHouse 升级到22.3.2.2版本。 ClickHouse支持多租户，通过CPU优先级和内存限额分配资源。 Flink 升级到1.15.0

帮助中心 > MapReduce服务 MRS > 产品介绍 > 发行版本 > 版本说明
Spark应用开发常见问题 - MapReduce服务 MRS

Spark应用开发常见问题 Spark常用API介绍 structured streaming功能与可靠性介绍如何添加自定义代码的依赖包如何处理自动加载的依赖包运行SparkStreamingKafka样例工程时报“类不存在”问题 SparkSQL UDF功能的权限控制机制

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式）
MRS 2.1.0.1补丁说明 - MapReduce服务 MRS

MRS 2.1.0.1补丁说明补丁基本信息表1 补丁基本信息补丁号 MRS 2.1.0.1 发布时间 2020-02-12 解决的问题 MRS 2.1.0.1 修复问题列表： MRS Manager 优化V2作业提交hive sql返回结果、解决委托token提交V2作业失败问题

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群补丁说明
经验总结 - MapReduce服务 MRS
经验总结 - MapReduce服务 MRS

经验总结使用mapPartitions，按每个分区计算结果如果每条记录的开销太大，例： rdd.map{x=>conn=getDBConn;conn.write(x.toString);conn.close} 则可以使用MapPartitions，按每个分区计算结果，如 rdd.mapPartitions

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core性能调优
经验总结 - MapReduce服务 MRS
经验总结 - MapReduce服务 MRS

经验总结使用mapPartitions，按每个分区计算结果如果每条记录的开销太大，例 rdd.map{x=>conn=getDBConn;conn.write(x.toString);conn.close} 则可以使用MapPartitions，按每个分区计算结果，如 rdd.mapPartitions

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > Spark Core调优
Spark应用开发常见问题 - MapReduce服务 MRS

Spark应用开发常见问题 Spark常用API介绍 structured streaming功能与可靠性介绍如何添加自定义代码的依赖包如何处理自动加载的依赖包运行SparkStreamingKafka样例工程时报“类不存在”问题由于Kafka配置的限制，导致Spark Streaming

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式）
Spark应用开发常见问题 - MapReduce服务 MRS

Spark应用开发常见问题 Spark常用API介绍 structured streaming功能与可靠性介绍如何添加自定义代码的依赖包如何处理自动加载的依赖包运行SparkStreamingKafka样例工程时报“类不存在”问题由于Kafka配置的限制，导致Spark Streaming

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式）
配置MRS租户队列 - MapReduce服务 MRS

配置MRS租户队列用户可以根据业务需求，在MRS修改指定租户的队列配置，对队列进行扩容或缩容。Yarn任务队列和资源池关联，可实现资源的分配和调度。前提条件如果通过MRS管理控制台操作，需要已完成IAM用户同步（在集群详情页的“概览”页签，单击“IAM用户同步”右侧的“同步”

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群租户 > 配置MRS租户
使用distcp命令跨集群复制HDFS数据 - MapReduce服务 MRS

使用distcp命令跨集群复制HDFS数据操作场景 distcp是一种在集群间或集群内部拷贝大量数据的工具。它利用MapReduce任务实现大量数据的分布式拷贝。前提条件已安装Yarn客户端或者包括Yarn的客户端。例如安装目录为“/opt/client”。各组件业务用户由

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS > HDFS运维管理
使用distcp命令跨集群复制HDFS数据 - MapReduce服务 MRS

使用distcp命令跨集群复制HDFS数据操作场景 distcp是一种在集群间或集群内部拷贝大量数据的工具。它利用MapReduce任务实现大量数据的分布式拷贝。前提条件已安装Yarn客户端或者包括Yarn的客户端。例如安装目录为“/opt/client”。各组件业务用户由

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS运维管理
SQL和DataFrame - MapReduce服务 MRS
SQL和DataFrame - MapReduce服务 MRS

SQL和DataFrame Spark SQL ROLLUP和CUBE使用的注意事项 Spark SQL在不同DB都可以显示临时表如何在Spark命令中指定参数值 SparkSQL建表时的目录权限为什么不同服务之间互相删除UDF失败 Spark SQL无法查询到Parquet类型的

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题
存储配置 - MapReduce服务 MRS
存储配置 - MapReduce服务 MRS

存储配置参数描述默认值 hoodie.parquet.max.file.size Hudi写阶段生成的parquet文件的目标大小。对于DFS，这需要与基础文件系统块大小保持一致，以实现最佳性能。 120 * 1024 * 1024 byte hoodie.parquet.block.size

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi > Hudi常见配置参数
SparkSQL访问Hive分区表启动Job前耗时较长如何处理？ - MapReduce服务 MRS

SparkSQL访问Hive分区表启动Job前耗时较长如何处理？问题背景使用SparkSql访问Hive的一个数据存放于OBS的一个分区表，但是运行速度却很慢，并且会大量调用OBS的查询接口。 SQL样例： select a,b,c from test where b=xxx

帮助中心 > MapReduce服务 MRS > 常见问题 > 作业管理类
开启Succinct Trie特性 - MapReduce服务 MRS

开启Succinct Trie特性操作场景 Succinct Trie特性优化了HFile Block结构，开启后可以减少缓存空间的使用，降低缓存数据驱逐率，提升缓存命中率，适用于频繁读取数据的场景，优化了数据读取性能。本章节内容仅适用于MRS 3.3.1及之后版本。开启Succinct

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase性能调优
HiveServer或者MetaStore实例的健康状态为Concerning - MapReduce服务 MRS

HiveServer或者MetaStore实例的健康状态为Concerning 问题现象 HiveServer或者MetaStore实例的健康状态为Concerning。可能原因 HiveServer或者MetaStore实例在启动的时候发生异常，无法正常启动。如，当修改MetaStore

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hive

总条数： 820

上一页
1
...
30
31
32
...
41
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark Streaming性能调优 - MapReduce服务 MRS

数据表报错Too many parts解决方法 - MapReduce服务 MRS

ClickHouse数据表分区过多调优 - MapReduce服务 MRS

ALM-43013 JDBCServer2x进程GC时间超出阈值 - MapReduce服务 MRS

Spark应用开发规则 - MapReduce服务 MRS

MRS 3.2.0-LTS.1版本说明 - MapReduce服务 MRS

Spark应用开发常见问题 - MapReduce服务 MRS

MRS 2.1.0.1补丁说明 - MapReduce服务 MRS

经验总结 - MapReduce服务 MRS

经验总结 - MapReduce服务 MRS

Spark应用开发常见问题 - MapReduce服务 MRS

Spark应用开发常见问题 - MapReduce服务 MRS

配置MRS租户队列 - MapReduce服务 MRS

使用distcp命令跨集群复制HDFS数据 - MapReduce服务 MRS

使用distcp命令跨集群复制HDFS数据 - MapReduce服务 MRS

SQL和DataFrame - MapReduce服务 MRS

存储配置 - MapReduce服务 MRS

SparkSQL访问Hive分区表启动Job前耗时较长如何处理？ - MapReduce服务 MRS

开启Succinct Trie特性 - MapReduce服务 MRS

HiveServer或者MetaStore实例的健康状态为Concerning - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线