搜索_华为云

使用Spark Shell创建Hudi表 - MapReduce服务 MRS

使用Spark Shell创建Hudi表操作场景本指南通过使用spark-shell简要介绍了Hudi功能。使用Spark数据源，将通过代码段展示如何插入和更新Hudi的默认存储类型数据集： COW表。每次写操作之后，还将展示如何读取快照和增量数据。前提条件在Manager

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi
CarbonData性能调优常见配置参数 - MapReduce服务 MRS

CarbonData性能调优常见配置参数操作场景 CarbonData的性能与配置参数相关，本章节提供了能够提升性能的相关配置介绍。操作步骤用于CarbonData查询的配置介绍，详情请参见表1和表2。表1 Shuffle过程中，启动Task的个数参数 spark.sql.shuffle.partitions

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData性能调优
ALM-43010 JDBCServer2x进程堆内存使用超出阈值 - MapReduce服务 MRS

ALM-43010 JDBCServer2x进程堆内存使用超出阈值告警解释系统每30秒周期性检测JDBCServer2x进程堆内存使用状态，当检测到JDBCServer2x进程堆内存使用率超出阈值（最大内存的95%）时产生该告警。 MRS 3.3.0-LTS及之后的版本中，Spark2x

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-43012 JDBCServer2x进程直接内存使用超出阈值 - MapReduce服务 MRS

ALM-43012 JDBCServer2x进程直接内存使用超出阈值告警解释系统每30秒周期性检测JDBCServer2x进程直接内存使用状态，当检测到JDBCServer2x进程直接内存使用率超出阈值（最大内存的95%）时产生该告警。 MRS 3.3.0-LTS及之后的版本中

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
IoTDB性能调优 - MapReduce服务 MRS
IoTDB性能调优 - MapReduce服务 MRS

IoTDB性能调优配置场景 IoTDB主要利用堆内存完成读写操作。提高IoTDB内存可以有效提高IoTDB读写性能。配置描述登录集群FusionInsight Manager页面，选择“集群 > 服务 > IoTDB > 配置 > 全部配置”，进入IoTDB配置界面搜索并修改参数

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用IoTDB
使用Oozie客户端提交DistCp任务 - MapReduce服务 MRS

使用Oozie客户端提交DistCp任务操作场景该任务指导用户在使用Oozie客户端提交DistCp任务。请下载使用最新版本的客户端。前提条件 HDFS和Oozie组件安装完成且运行正常，客户端安装成功。如果当前客户端为旧版本，需要重新下载和安装客户端。已创建或获取访问

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Oozie > 使用Oozie客户端提交作业
MRS各组件样例工程汇总 - MapReduce服务 MRS

MRS各组件样例工程汇总样例工程获取地址参见获取MRS应用开发样例工程，切换分支为与MRS集群相匹配的版本分支，然后下载压缩包到本地后解压，即可获取各组件对应的样例代码工程。 MRS样例代码库提供了各组件的基本功能样例工程供用户使用，当前版本各组件提供的样例工程汇总参见表1。表

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x）
HDFS应用开发规则 - MapReduce服务 MRS

HDFS应用开发规则 HDFS NameNode元数据存储路径 NameNode元数据信息的默认存储路径为“${BIGDATA_DATA_HOME}/namenode/data”，该参数用于确定HDFS文件系统的元数据信息的保存路径。 HDFS需要开启NameNode镜像备份 NameNode

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > HDFS应用开发规范
恢复DBService元数据 - MapReduce服务 MRS

恢复DBService元数据操作场景在用户意外修改、删除或需要找回数据时，系统管理员对DBService进行重大操作（如升级、重大数据调整等）后，系统数据出现异常或未达到预期结果，模块全部故障无法使用，或者迁移数据到新集群的场景中，需要对DBService进行恢复数据操作。系统管理员可以通过

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > 备份恢复MRS集群数据 > 恢复MRS集群组件数据
使用Loader从HDFS导出数据到ClickHouse - MapReduce服务 MRS

使用Loader从HDFS导出数据到ClickHouse 本章节适用于MRS 3.3.0及以后版本。操作场景该任务指导用户使用Loader将文件从HDFS导出到ClickHouse。前提条件在FusionInsight Manager创建一个角色，添加ClickHouse逻辑集群的管理权限以及

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 创建Loader数据导出作业
安全加固 - MapReduce服务 MRS
安全加固 - MapReduce服务 MRS

安全加固加固Tomcat 在FusionInsight Manager使用过程中，针对Tomcat基于开源做了如下功能增强：升级Tomcat版本为官方稳定版本。设置应用程序之下的目录权限为500，对部分目录支持写权限。系统软件安装完成后自动清除Tomcat安装包。应用程序目录下针对工程禁用自动部署功能

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 安全
MapReduce REST API接口介绍 - MapReduce服务 MRS

MapReduce REST API接口介绍功能简介通过HTTP REST API来查看更多MapReduce任务的信息。目前Mapresuce的REST接口可以查询已完成任务的状态信息。完整和详细的接口请直接参考官网上的描述以了解其使用： http://hadoop.apache.org

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > MapReduce开发指南（普通模式） > MapReduce应用开发常见问题 > MapReduce接口介绍
基于Python3的Hive样例程序 - MapReduce服务 MRS

基于Python3的Hive样例程序功能介绍本章节介绍如何使用Python3连接Hive执行数据分析任务。样例代码安全模式连接Hive前需要使用集群客户端进行认证，使用kinit命令认证相应权限的Kerberos用户，认证后执行分析任务示例在“hive-examples/python3

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Hive开发指南（安全模式） > 开发Hive应用
ALM-12041关键文件权限异常（2.x及以前版本） - MapReduce服务 MRS

ALM-12041关键文件权限异常（2.x及以前版本）告警解释系统每隔一个小时检查一次系统中关键目录或者文件权限、用户、用户组是否正常，如果不正常，则上报故障告警。当检查到权限等均正常，则告警恢复。告警属性告警ID 告警级别可自动清除 12041 严重是告警参数参数名称

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12188 diskmgt磁盘监控服务不可用 - MapReduce服务 MRS

ALM-12188 diskmgt磁盘监控服务不可用告警解释 NodeAgent每隔5分钟检测diskmgt磁盘监控服务状态，当diskmgt磁盘监控服务不可用时产生此告警。 diskmgt磁盘监控服务恢复时，告警清除。告警属性告警ID 告警级别是否可自动清除 12188

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-16048 Tez或者Spark库路径不存在 - MapReduce服务 MRS

ALM-16048 Tez或者Spark库路径不存在告警解释系统每180秒周期性检测Tez和Spark库路径，不存在则产生该告警。告警属性告警ID 告警级别是否自动清除 16048 重要是告警参数参数名称参数含义来源产生告警的集群名称。服务名产生告警的服务名称

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
DataArts Studio调度Spark作业失败 - MapReduce服务 MRS

DataArts Studio调度Spark作业失败问题现象 DataArts Studio作业调度失败，显示读取“/thriftserver/active_thriftserver”路径下的数据失败。报错信息为： Can not get JDBC Connection, due

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Spark
Flume日志采集概述 - MapReduce服务 MRS

Flume日志采集概述 Flume是一个分布式、可靠和高可用的海量日志聚合的系统。它能够将不同数据源的海量日志数据进行高效收集、聚合、移动，最后存储到一个中心化数据存储系统中。支持在系统中定制各类数据发送方，用于收集数据。同时，提供对数据进行简单处理，并写到各种数据接受方（可定制）

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume
设计DAG - MapReduce服务 MRS
设计DAG - MapReduce服务 MRS

设计DAG 操作场景合理的设计程序结构，可以优化执行效率。在程序编写过程中要尽量减少shuffle操作，合并窄依赖操作。操作步骤以“同行车判断”例子讲解DAG设计的思路。数据格式：通过收费站时间、车牌号、收费站编号...... 逻辑：以下两种情况下判定这两辆车是同行车如果两辆车都通过相同序列的收费站

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > Spark Core调优
使用Spark Shell创建Hudi表 - MapReduce服务 MRS

使用Spark Shell创建Hudi表本章节仅适用于MRS 3.3.1-LTS及之前版本。操作场景本章节主要介绍了如何通过spark-shell使用Hudi功能。使用Spark数据源，通过代码段展示如何插入和更新Hudi的默认存储类型数据集COW表，以及每次写操作之后如何读取快照和增量数据

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi

总条数： 5655

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Spark Shell创建Hudi表 - MapReduce服务 MRS

CarbonData性能调优常见配置参数 - MapReduce服务 MRS

ALM-43010 JDBCServer2x进程堆内存使用超出阈值 - MapReduce服务 MRS

ALM-43012 JDBCServer2x进程直接内存使用超出阈值 - MapReduce服务 MRS

IoTDB性能调优 - MapReduce服务 MRS

使用Oozie客户端提交DistCp任务 - MapReduce服务 MRS

MRS各组件样例工程汇总 - MapReduce服务 MRS

HDFS应用开发规则 - MapReduce服务 MRS

恢复DBService元数据 - MapReduce服务 MRS

使用Loader从HDFS导出数据到ClickHouse - MapReduce服务 MRS

安全加固 - MapReduce服务 MRS

MapReduce REST API接口介绍 - MapReduce服务 MRS

基于Python3的Hive样例程序 - MapReduce服务 MRS

ALM-12041关键文件权限异常（2.x及以前版本） - MapReduce服务 MRS

ALM-12188 diskmgt磁盘监控服务不可用 - MapReduce服务 MRS

ALM-16048 Tez或者Spark库路径不存在 - MapReduce服务 MRS

DataArts Studio调度Spark作业失败 - MapReduce服务 MRS

Flume日志采集概述 - MapReduce服务 MRS

设计DAG - MapReduce服务 MRS

使用Spark Shell创建Hudi表 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线