检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
客户应用程序或软件堆栈导致的故障,如业务异常、配置错误、数据损坏等,可通过部署新代码或使用备份恢复数据来解决。 基础设施 开启“RRO/RTO评估”时此参数可见。 配置基础设施的RPO目标和RTO目标。 基础设施故障导致的应用相关云服务资源故障,如ECS或RDS实例故障,可通过本地主备切换或重启或重新加载故障组件来解决。
单击右上角的“UniAgent安装”,进入UniAgent安装页面。 选择“弹性云服务器 ECS”。 这里选择“弹性云服务器 ECS”页签,是因为在创建资源类型为自建K8S的应用时,将一台ECS作为K8S集群控制节点。 选择UniAgent版本。 复制LINUX命令,登录到ECS中去执行。 父主题: 云服务安装UniAgent
侧部署,再指向第三方云的网关? 两边云都部署,通过APIG-Site部署模式,管理面在华为云,数据面都下沉到了第三方云(提供第三方云资源服务器,通过华为云IEF部署)。 父主题: 多活容灾方案相关问题
探针接入ECS 本章节指导您将探针接入ECS。 操作步骤 登录MAS控制台。 单击“混沌工程>探针管理”,进入“探针管理”页面。 在“我的应用”栏下选择所需安装的应用,该应用已纳管ECS资源。 选择“弹性云服务器 ECS”页签。 单击操作列“安装探针”。 待探针状态显示运行中,则安装完成。
UniAgent接入ECS 本章节指导您将UniAgent接入ECS。 远程安装步骤 登录MAS控制台。 单击“混沌工程>探针管理”,进入“探针管理”页面。 在“我的应用”栏下选择所需安装的应用。 单击右上角的“UniAgent安装”,进入UniAgent安装页面。 选择“弹性云服务器 ECS”。
创建应用-当资源类型选择为自建K8S 在纳管自建K8S之前,需要先创建一个纳管资源为ECS的应用,此ECS作为集群控制节点。 纳管集群控制节点。 选择一台ECS作为集群控制节点,该ECS需要能够通过ip地址访问集群,以下以ecs-cast-vpn这台机器为例。将集群的连接信息按K8S标准格式填入
props、etcd配置项在MAS服务中如何查询 登录MAS控制台,进入“多活管理”页面。 在“多活管理”页面中单击对应的实例,进入实例控制台。 单击“应用列表”选择本项目应用,查看应用ID,即为props.appId。 单击“监控列表”选择本项目监控器,查看监控器ID,即为props
复制LINUX命令,登录到主机中去执行。 代理接入可参考《应用运维管理AOM用户指南》的“代理区域管理”章节。 直连接入(公网) 云下主机,或非华为云主机,以及跨region接入的华为云主机也可以采用此方式接入。 登录MAS控制台。 单击“混沌工程>探针管理”,进入“探针管理”页面。 在“我的应用”栏下选择所需安装的应用。
云服务故障 表1 云服务 故障类型 故障模式 设置参数 弹性云服务器 ECS 启动弹性云服务器 关闭弹性云服务器 重启弹性云服务器 - 裸金属服务器 BMS 启动裸金属服务器 关闭裸金属服务器 重启裸金属服务器 - 云硬盘 EVS 删除云硬盘 - 云硬盘快照 EVS_SNAPSHOT
查看故障模式 针对ECS弹性云服务器、Docker容器、CCE、中间件、等不同对象提供CPU、内存、网络、进程等故障注入的故障模式,通过故障模式库提供各类故障的快速浏览和查询的能力。 查看故障模式 登录MAS控制台。 单击“混沌工程>故障模式库”,进入故障模式库页面。 选择故障模式类型、故障类型、故障模式并设置参数。
在使用边缘版多活实例前,需要准备虚拟机资源、安装Docker、挂载磁盘,以及检查虚拟机与MAS侧的端口是否连通。 虚拟机资源准备有以下两种场景,您可以根据实际场景准备虚拟机资源。 首次创建多活实例,需要根据MAS实例资源要求申请新的虚拟机。 在已创建过多活实例且实例已删除的虚拟机上重新创建多活实例。
环境以及安全保护策略。 创建VPC和子网的操作指导请参考创建虚拟私有云和子网,若需要在已有VPC上创建和使用新的子网,请参考为虚拟私有云创建新的子网。 创建安全组的操作指导请参考创建安全组,为安全组添加规则的操作指导请参考添加安全组规则。 父主题: 购买多活管理中心
有权限。 DRS ReadOnlyAccess:数据复制服务只读权限。 检查结果访问授权:授权技术专家查看并分析韧性Hub服务检查结果。 如权限在开启后被关闭,需重新开启权限。 父主题: 应用韧性Hub
Hub)基于华为内部IT最佳实践经验, 结合业界公有云方案,从应用可靠性角度, 帮助用户分析华为云云上资源部署情况,识别风险点并给出建议, 提升云上业务的稳定性。 应用韧性主要包括如下功能点: 描述应用:描述客户应用架构,涵盖应用内云服务器资源及关联关系;支持租户授权评估。 定义目标:明确应用重要性及需要评估的故障场景。
utMS 否 Integer 服务器选择超时(以毫秒为单位)。 localThresholdMS 否 Integer 当与副本集中的多个MongoDB实例进行通信时,驱动程序只会将请求发送到响应时间小于或等于响应时间最快的服务器加上本地阈值的服务器,以毫秒为单位。 heartbeatFrequencyMS
基础设施类故障 服务器硬件类 表1 服务器硬件类参数配置 故障类型 故障模式 设置参数 CPU CPU过载 usage 内存 内存过载 usage 磁盘 磁盘分区满 disk;usage 磁盘IO高 disk;usage 网卡 网卡down dev_name 网络通信类 表2 网络通信类参数配置
自动化运维,具体详情请参考AOM权限管理。 ECS所需最小权限为“ECS CommonOperations”策略,该策略为弹性云服务器普通用户权限,拥有该权限的用户可以执行开机、关机、重启、查询弹性云服务器的操作,具体详情请参考ECS权限管理。 被委托账号创建凭证,“委托账号”和“委托名”根据1配置。
选择记录集类型。 A – 将域名指向IPv4地址 CNAME – 将域名指向另外一个域名 MX – 将域名指向邮件服务器地址 TXT – 设置文本记录 SRV – 记录提供特定服务的服务器 记录集的值 填写记录集的值。 主机记录 填写主机记录。 主机记录指域名前缀,如不填写,默认添加时使用内
ST混沌工程服务提供丰富的故障模式库,通过混沌实验编排攻击目标、攻击策略进行故障注入,支持添加背景流量和资源监控,同时在故障注入能力的基础上,通过体系化的流程和规范来创建故障演练,从而验证和提升系统可靠性和技术团队应急响应能力。 发布区域:华北-北京四、华东-上海一、华南-广州 混沌工程
于被授予的权限对云服务进行操作。 MAS部署时通过物理区域划分,为项目级服务。授权时,“作用范围”需要选择“区域级项目”,然后在指定区域(如华北-北京1)对应的项目(cn-north-1)中设置相关权限,并且该权限仅对此项目生效;如果在“所有项目”中设置权限,则该权限在所有区域项