检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
RS不会选择这些节点进行缩容。因为这些基础组件是集群运行的基础。 Core节点是存放集群业务数据的节点,在缩容时必须保证待缩容节点上的数据被完整迁移到其他节点,即完成各个组件的退服之后,才会执行缩容的后续操作(节点退出Manager和删除ECS等)。在选择Core节点时,会优先选
ode功能异常,导致NameNode的HA机制失效。一旦主NameNode故障,则整个HDFS服务将不可用。 可能原因 备NameNode被停止。 备NameNode实例运行状态异常。 备NameNode合并新的FsImage失败。 备NameNode数据目录空间不足。 备Nam
创建FlinkServer作业写入数据至Doris表 本章节适用于MRS 3.5.0及之后的版本。 操作场景 本章节提供了如何使用FlinkServer将Kafka数据写入到Doris中,和Doris数据和Kafka数据的Lookup Join操作指导。 前提条件 集群中已安装D
用户需满足以下条件之一即可: 加入System_administrator角色 属于kafkaadmin组 属于kafkasuperuser组 被授权的kafka组的用户 security.inter.broker.protocol=SASL_PLAINTEXT sasl.kerberos
信息,请参阅•Bad Records处理: carbon.options.is.empty.data.bad.record 指定空数据是否被视为bad record。有关详细信息,请参阅 Bad Records处理: carbon.options.sort.scope 指定数据加载期间排序的范围。
alNode节点的数据不同步时,NameNode将无法工作,导致HDFS服务不可用。 可能原因 JournalNode实例不存在(被删除或被迁移)。 JournalNode实例未启动或已停止。 JournalNode实例运行状态异常。 JournalNode节点的网络不可达。 处理步骤
用户需满足以下条件之一即可: 加入System_administrator角色 属于kafkaadmin组 属于kafkasuperuser组 被授权的kafka组的用户 security.inter.broker.protocol=SASL_PLAINTEXT sasl.kerberos
信息,请参阅•Bad Records处理: carbon.options.is.empty.data.bad.record 指定空数据是否被视为bad record。有关详细信息,请参阅 Bad Records处理: carbon.options.sort.scope 指定数据加载期间排序的范围。
quet文件存储的数据,log文件里面的数据将被忽略。 该视图数据并不一定是最新的,但是mor表一旦完成compact操作,增量log数据被合入到了base数据里面,这个时候该视图和实时视图能力一样。 父主题: 组件介绍
置“hadoop.security.authentication”为“kerberos”。 本Hive业务应用确实没有正确设置此配置,所以被认为不需要做kerberos认证。 分析Hive组件的“jdbc-examples”样例工程,不存在类似问题,是因为该工程的classpath路径下,存在core-site
per连接,旧连接不会释放导致Zookeeper不可用的问题。 解决ClickHouse偶现内置clickhouse用户多次认证失败,用户被锁,导致服务不可用的问题。 解决ClickHouse Replicated开头的复制表场景。删除分区时,如果分区不存在,Zookeeper会
标数据时,并非以当前实时的监控数据进行判断,而是收集近期的历史数据,因此存在时间延迟。 表1 健康检查报告记录 项目 说明 检查对象 表示被检查的对象,可打开下拉菜单查看详情。 状态 表示检查的结果状态,包含未发现问题、发现问题和检查中。 检查类型 表示执行检查的主体,包含“系统
和系统,这可能会导致业务延迟。 安全风险:设备分区丢失可能会导致客户的重要数据被盗窃或泄漏,从而对客户的业务产生严重影响。 可能原因 硬盘被拔出。 硬盘离线、硬盘坏道等故障。 处理步骤 打开FusionInsight Manager页面,选择“运维 > 告警 > 告警”,单击此告警所在行的。
tition数量,将RDD中的数据压缩到更少的partition中去。因为filter之后,RDD的每个partition中都会有很多数据被过滤掉,此时如果照常进行后续的计算,其实每个task处理的partition中的数据量并不是很多,有一点资源浪费,而且此时处理的task越多
至少一个角色实例运行状态为“故障”或被依赖的服务状态不正常。 服务的运行状态为“故障”,会触发告警,请根据告警信息处理。 未知 该服务中所有角色实例状态为“未知”。 正在恢复 后台系统正在尝试自动启动服务。 亚健康 该服务所依赖的服务状态不正常,异常服务的相关接口无法被外部调用,此时与状态不正常服务相关的上层业务会受到影响。
大量主备数据不一致,使得容灾主备倒换或者双读从备集群读取不到最新的数据。如果持续不处理,还会导致主集群的存储空间以及ZooKeeper节点被大量积压,最终导致主集群服务故障。 可能原因 网络异常。 RegionServer的Region分布不均匀。 备集群HBase服务规模过小。
隔离”,输入密码验证身份,单击“确定”。 确认待隔离主机信息并单击“确定”。 界面提示操作成功后单击“完成”,主机隔离完成,“运行状态”显示为“已隔离”。 以root用户登录到被隔离主机上,执行pkill -9 -u omm命令终止节点上的omm用户的进程,然后执行ps -ef | grep 'container' |
大量主备数据不一致,使得容灾主备倒换或者双读从备集群读取不到最新的数据。如果持续不处理,还会导致主集群的存储空间以及ZooKeeper节点被大量积压,最终导致主集群服务故障。 可能原因 网络异常。 RegionServer的Region分布不均匀。 备集群HBase服务规模过小。
义不同优先级的Job,后启动的高优先级Job能够获取运行中的低优先级Job释放的资源;低优先级Job未启动的计算容器被挂起,直到高优先级Job完成并释放资源后,才被继续启动。 该特性使得业务能够更加灵活地控制自己的计算任务,从而达到更佳的集群资源利用率。 容器可重用与任务优先级调
图3 任务Stages划分 表3 Stages监控信息 监控项 含义 SCHEDULED TIME SKEW 代表当前Stage节点并发任务被调度的时间 CPU TIME SKEW 可以判断是否存在Stage阶段并发任务是否存在计算倾斜 图4 Tasks划分(单击每个stage右边的小三角可见)