-
ALM-12066 节点间互信失效 - MapReduce服务 MRS
请联系运维人员,并发送已收集的故障日志信息。 告警清除 此告警修复后,系统会自动清除此告警,无需手工清除。 参考信息 节点互信异常处理方法如下: 本操作需使用omm用户执行。 如果节点间网络不通,请先解决网络不通的问题,可以检查两个节点是否在同一个安全组,是否有设置hosts.deny、hosts
-
MRS 2.1.0.5补丁说明 - MapReduce服务 MRS
动重启服务不断服。 MRS 2.1.0.5补丁安装后,需要重新下载安装全量的客户端,包含Master节点的原始客户端和虚拟私有云的其他节点使用的客户端(即您自行搭建的客户端)。 主Master节点的原始客户端全量更新,请参见全量更新主Master节点的原始客户端。 备Master
-
配置Spark SQL防御 - MapReduce服务 MRS
用户“sparkuser”,该用户属于hive、hadoop、supergroup组,主组为hive,角色绑定sparkstatic1。 使用约束 防御规则默认动态生效时间为6分钟。 仅支持SQL类型作业。 拦截和熔断规则会中断SQL查询,请根据实际业务配置合理的值。 静态规则s
-
ALM-12055 证书文件即将过期 - MapReduce服务 MRS
Condition 系统当前指标取值满足自定义的告警设置条件。 对系统的影响 提示用户证书文件即将过期,如果证书文件过期,则会导致部分功能受限,无法正常使用。 可能原因 系统证书文件(CA证书、HA根证书、HA用户证书、Gaussdb根证书或者Gaussdb用户证书等)剩余有效期小于30天。 处理步骤
-
MRS 1.9.0.7补丁说明 - MapReduce服务 MRS
动重启服务不断服。 MRS 1.9.0.7补丁安装后,需要重新下载安装全量的客户端,包含Master节点的原始客户端和虚拟私有云的其他节点使用的客户端(即您自行搭建的客户端)。 主Master节点的原始客户端全量更新,请参见全量更新主Master节点的原始客户端。 备Master
-
Flume基本原理 - MapReduce服务 MRS
Flume的可用性则基于内建的Load Balancing和Failover机制。Channel及Agent都可以配多个实体,实体之间可以使用负载分担等策略。每个Agent为一个JVM进程,同一台服务器可以有多个Agent。收集节点(Agent1,2,3)负责处理日志,汇聚节点(
-
Manager基本原理 - MapReduce服务 MRS
集群中Kerberos提供组件用户安全认证功能,其服务名称为KrbServer,包含两种角色实例: KerberosServer:认证服务器,为MRS提供安全认证使用。 KerberosAdmin:管理Kerberos用户的进程。 Ldap 在OMS与集群中各部署一个。 OMS Ldap为用户认证提供数据存储。
-
ALM-18022 Yarn队列资源不足 - MapReduce服务 MRS
指标名=vCores”。 是,执行3。 否,执行4。 出现该定位信息表示Yarn集群内存或CPU不足,登录NodeManager节点,分别使用命令free -g和cat /proc/cpuinfo,查询节点可用内存和可用CPU,据此在FusionInsight Manager界面增大Yarn
-
备份ClickHouse元数据 - MapReduce服务 MRS
参见配置跨Manager集群互信。如果主备集群部署为普通模式,则不需要配置互信。 主备集群上的时间必须一致,而且主备集群上的NTP服务必须使用同一个时间源。 主备集群中,远端备份至HDFS,需要确保ClickHouse的HADOOP_RPC_PROTECTION配置项与HDFS的hadoop
-
配置消息通知 - MapReduce服务 MRS
缩成功/失败的场景下,由MRS管理面通过邮件或短信方式通知对应用户。 管理面检查大数据集群的告警信息,如果大数据集群的告警信息影响到服务的使用,其告警级别达到致命时,则发送信息通知给对应租户。 在用户集群的ECS机器被删除、关机、修改规格、重启、更新OS的行为,会导致大数据集群异
-
Spark REST API接口介绍 - MapReduce服务 MRS
加了查询SQL、JDBC Server和Streaming的信息的REST接口。开源REST接口完整和详细的描述请参考官网上的文档以了解其使用方法:https://spark.apache.org/docs/3.1.1/monitoring.html#rest-api。 准备运行环境
-
Flink开启Checkpoint样例程序(Scala) - MapReduce服务 MRS
total = udfState.getState } } 应用代码 该段代码是流图定义代码,具体实现业务流程,另外,代码中窗口的触发时间使用了event time。 import com.huawei.rt.flink.core.{SEvent, SEventSourceWithChk
-
Flink开启Checkpoint样例程序(Java) - MapReduce服务 MRS
udfState.getState(); } } 应用代码 该段代码是流图定义代码,具体实现业务流程,另外,代码中窗口的触发时间使用了processing time。 import org.apache.flink.runtime.state.filesystem.FsStateBackend;
-
Flink开启Checkpoint样例程序(Scala) - MapReduce服务 MRS
total = udfState.getState } } 应用代码 该段代码是流图定义代码,具体实现业务流程,另外,代码中窗口的触发时间使用了event time。 import com.huawei.rt.flink.core.{SEvent, SEventSourceWithChk
-
ALM-14010 NameService服务异常 - MapReduce服务 MRS
bigdata_env。如果集群采用安全版本,要进行安全认证,执行kinit hdfs命令,按提示输入密码(向MRS集群管理员获取密码)。如果集群采用非安全版本,需使用omm用户登录并执行命令,请确保omm用户具有客户端执行权限。 执行hdfs dfsadmin -safemode leave。 在“运维
-
OpenTSDB样例程序开发思路 - MapReduce服务 MRS
value):ShenZhen、Longgang 用户可以执行以下数据操作: 获取每天的监控数据,通过OpenTSDB的put接口将两个组数据点写入数据库中。 对已有的数据使用OpenTSDB的query接口进行数据查询和分析。 功能分解 根据上述的业务场景进行功能开发,需要开发的功能如表4所示。 表4 在OpenTSDB中开发的功能
-
MapReduce开源增强特性 - MapReduce服务 MRS
HA主备倒换的状态转移过程 JobHistoryServer高可用性 采用ZooKeeper实现主备选举和倒换。 JobHistoryServer使用浮动IP对外提供服务。 兼容JHS单实例,也支持HA双实例。 同一时刻,只有一个节点启动JHS进程,防止多个JHS操作同一文件冲突。 支持扩容减容、实例迁移、升级、健康检查等。
-
Flink开启Checkpoint样例程序(Java) - MapReduce服务 MRS
udfState.getState(); } } 应用代码 该段代码是流图定义代码,具体实现业务流程,另外,代码中窗口的触发时间使用了processing time。 import org.apache.flink.runtime.state.filesystem.FsStateBackend;
-
Flink开启Checkpoint样例程序(Java) - MapReduce服务 MRS
udfState.getState(); } } 应用代码 该段代码是流图定义代码,具体实现业务流程,另外,代码中窗口的触发时间使用了processing time。 import org.apache.flink.runtime.state.filesystem.FsStateBackend;
-
ALM-18010 ResourceManager进程垃圾回收(GC)时间超过阈值 - MapReduce服务 MRS
ResourceManager进程的垃圾回收时间过长,可能影响该ResourceManager进程正常提供服务。 可能原因 该节点ResourceManager实例堆内存使用率过大,或配置的堆内存不合理,导致进程GC频繁。 处理步骤 检查GC时间。 在FusionInsight Manager首页,选择“运维 >