检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
方法,沉淀华为云SRE多年的故障模式库,内置300个+典型故障模式。 图1 全旅程混沌工程 风险分析:分析应用架构,找出风险点。 应急预案:针对风险点,制定应急预案。 故障演练:针对风险分析的结果和应急预案,制定演练方案,进行故障演练。 复盘改进:演练完成后,对演练进行复盘总结,输出演练报告和改进事项。
ScriptPropertiesModel 参数 是否必选 参数类型 描述 risk_level 是 String 风险等级 LOW:低风险 MEDIUM:中风险 HIGH:高风险 枚举值: LOW MEDIUM HIGH version 是 String 脚本版本号 最小长度:1 最大长度:10
资源进行韧性评估,帮助客户提前识别应用存在的风险并给出优化建议,支撑客户提升应用韧性,减少故障造成的影响。 应用韧性主要包含如下功能点: 评估/重新评估:能够自动对应用内支持的资源进行扫描检查,发现应用韧性方面存在的风险点;评估的类型有:节点、集群、网络、容灾、容器、业务和数据。
"project_id" : null, "properties" : { "host_name" : "host_name", "fixed_ip" : "x.x.x.x", "floating_ip"
运维总览 运维总览包含总览数据、风险冒泡、PRR评审汇总(生产准备度评估)、TOP5事件四个模块。总览数据可以全局视角观测运维态势情况,辅助运维优化改进和洞察决策。风险冒泡通过P3+事件单、WarRoom、变更导致故障以及紧急告警呈现当前运维态势风险情况。PRR评审汇总体现应用上线
行应对。 COC混沌演练为用户提供一站式的自动化演练能力,覆盖从风险识别、应急预案管理、故障注入到复盘改进的端到端演练流程。承载华为云SRE在混沌演练上多年的最佳实践,使客户能对云上应用主动地进行风险识别、消减和风险验证,持续提升云应用的韧性。 镜像与武器版本支持声明 COC混沌
演练规划所属的企业项目无需指定,和其关联的故障模式的企业项目保持一致 操作步骤 登录COC。 在左侧菜单栏选择“韧性中心 > 混沌演练”页面,选择“风险管理 > 演练规划”页签。 图1 演练规划页面 单击“创建演练规划”,选择故障模式,执行人,区域和计划演练时间 ,单击“确认”,即可完成演练规划的创建。
要通过修改账号基线添加基线账号;开启了全局基线的改密策略后,会按照基线中创建的账号来进行定期改密。 组件基线:创建账号基线创建的是组件基线,用户根据业务需求自定义创建;开启了组件基线的改密策略后,会按照基线中创建的账号来进行定期改密。 注意事项 组件基线需要关联组件。如果没有合适
演练报告有哪些内容? 演练报告包括演练过程的基本信息、服务恢复能力评分和复盘改进措施,并且能够生成复盘改进工单,确保演练中发现的问题能够落实改进。 父主题: 韧性中心常见问题
aom:uniagentAgent:install; aom:uniagentAgent:list; aom:uniagentInstallHost:list; aom:uniagentProxyRegion:get; iam:agencies:list; √ x x x coc:d
确认故障模式所属的企业项目、所属应用、事件级别、场景分类是否正确。 操作步骤 登录COC。 在左侧菜单栏选择“韧性中心 > 混沌演练”页面,选择“风险管理 > 故障模式”页签,单击“创建故障模式”。 图1 故障模式页面 参考表1 故障模式参数说明填写故障模式信息。 图2 创建故障模式 表1
请求鉴权信息等。 详细的公共请求消息头字段请参见表3。 表3 公共请求消息头 名称 描述 是否必选 示例 Host 请求的服务器信息,从服务API的URL中获取。值为hostname[:port]。端口缺省时使用默认的端口,https的默认端口为443。 否 使用AK/SK认证时该字段必选。
间。 企业项目 default 在下拉列表中选择企业项目。 版本号 1.0.0 请自定义填写脚本版本号。 风险等级 中 可选项“高”、“中”、“低”,请根据实际情况选择风险等级。 设置“定时设置”。 表2 参数说明 参数 示例 说明 时区 - 在下拉框选择定时任务执行的时区。 定时类型
待办描述 必选参数。 可输入中文字符、英文字母、数字及特殊字符,长度不超过1000字符 类型 必选参数。 待办类型,可以选择: 计划事件 风险预警 其他 重要性 必选参数。 待办的重要性,可以选择: 紧急 重要 次要 提示 责任人 必选参数。 待办的责任人可以选择: 排班 个人 通知渠道
混沌演练”页面,进入混沌演练页面。 单击“演练任务”页签,进入演练任务页面。 找到步骤三中创建的演练任务,单击操作列“启动演练”。 图7 启动演练 了解风险提示后,单击“确认”,进入演练记录详情页面。 支持查看攻击进度和攻击详情。等待演练完成,单击“创建演练报告”支持创建演练报告。 图8 演练记录详情
当前账号管理只支持单个主机的账号密码查询,成功“获取账号密码”的前提是主机账号“改密状态”为“成功”或“改密失败原因”为“导入的账号不参与改密”。若“改密状态”为“失败”,需要先根据反馈的改密失败原因进行相关处理。 ECS主机改密条件: 主机资源状态为“运行中”。 主机的UniAgent状态为“运行中”。
账号管理 概述 密钥管理 账号基线 改密策略 改密任务 管理账号密码 父主题: 自动化运维
混沌演练是什么? 混沌演练支持哪些攻击场景? 更多 智能客服 您好!我是有问必答知识渊博的的智能问答机器人,有问题欢迎随时求助哦! 社区求助 华为云社区是华为云用户的聚集地。这里有来自千行百业的技术牛人,为您解决技术难题。
事件创建改进单 操作场景 事件单受理过程发现该故障有改进事项,可创建改进单进行跟进处理。 前提条件 事件受理后才能创建改进单。 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 事件管理”,选择“待处理的”页签,单击事件标题进入“事件详情”页面。 在页面的右侧点击选择创建改
影响应用管理 操作场景 影响应用管理主要是管理在故障发生时,涉及的影响应用有哪些,并根据应用诊断,响应预案快速恢复应用。 操作步骤 登录COC。 左侧菜单栏选择“故障管理 > WarRoom”,可以查看WarRoom列表信息。 单击WarRoom列表中WarRoom名称,进入对应的“WarRoom详情”页面。