检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
进入COC“总览”后,可以看到快速配置中心。 图1 快速配置中心 如果“总览”页面,没有显示快速配置中心部分(图1显示的部分),点击顶部“快速配置中心”展开快速配置中心部分 图2 快速配置中心入口 点击卡片,进入对应场景的配置页面。
快捷混沌演练 操作场景 云运维中心(Cloud Operations Center,简称COC)为用户提供安全、高效的一站式智能运维平台,满足客户集中运维诉求。云运维中心的混沌演练功能支持用户配置演练模板、攻击模板,基于模板对物理机、虚拟机或CCE容器等进行故障演练。支持故障模式管理功能
快捷执行作业 操作场景 云运维中心(Cloud Operations Center,简称COC)为用户提供安全、高效的一站式智能运维平台,满足客户集中运维诉求。云运维中心的作业管理功能可以为用户提供自定义作业的操作以及在目标虚拟机上执行作业的能力。您可以通过该功能对目标实例(目前支持弹性云服务器
权限设计 访问参数列表页:需要list权限: coc:parameter:list 获取参数详情:需要get权限:coc:parameter:get 删除参数:需要操作类权限:coc:parameter:delete 创建参数:需要操作类权限:coc:parameter:create
为快速恢复业务的运作机制,支撑运维、研发、运营联合作战,保障业务快速恢复而组建的会议。已受理的事件可以启动Warroom,具体参考启动WarRoom。 Warroom使用指导,请参考WarRoom管理。 父主题: 故障管理常见问题
PRR检查项 PRR模板提前制定的产品立项、产品设计、产品上线三个阶段的检查项信息。 设置“PRR检查项”。 提前制定的产品立项、产品设计、产品上线三个阶段的检查项信息。
WarRoom 支持创建WarRoom和查询WarRoom信息的接口 创建Warrom 查询WarRoom信息 父主题: 故障管理
在运维过程中引入混沌工程,通过定期进行演练的方式,可以在现网问题发生前识别系统的薄弱点(软件Bug、方案设计不足之处、故障恢复流程卡点等),及早发现系统可用性的问题进行解决,持续提升应用韧性,建立运维信心。
从SLI/SLO、可冗余、可容灾、可过载控制、可故障管理、可变更能力、可运维、安全生产等维度,对服务可用性及运维能力提出基线要求,在服务产品开发前端构筑能力,进行相关需求规划、设计和开发工作,并在服务上线前进行生产准入审视。
事件管理 创建事件单 受理事件单 提交事件单解决方案 验证事件处理结果 查询事件单详情 事件相关枚举信息 父主题: 故障管理
图2 区域筛选 鼠标移动到云服务图标(云服务图标右上角红底数字代表告警数量)悬停,可以快速查看紧急/重要告警数量,以及资源实例的区域分布。 图3 鼠标悬停查看资源 单击云服务图标,可以查询对应资源类型的全部资源信息。
概述 在发生群体性故障或重大故障时,为快速恢复业务正常运行,支撑运维、研发、运营联合作战,保障业务快速恢复而组建的会议。可通过WarRoom添加故障恢复成员及时响应预案、通过发送故障进展及时知会关注故障的人员、通过应用诊断、响应预案等辅助应用快速恢复。
故障管理 事件管理 WarRoom 集成管理 父主题: API
构建丰富的故障模式库,制定相应的预防和恢复措施,有助于设计更加高可用的应用系统。通过识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。
附录 错误码 获取项目ID
事件类别 KEY 中文名称 英文名称 inc_type_p_security_issues 安全问题 Security issues inc_type_p_function_issues 功能问题 function issues inc_type_p_reliability_issues
API 应用资源管理 脚本管理 脚本工单 故障管理 补丁管理
事件状态 status KEY 中文名称 英文名称 incident_draft 草稿 DRAFT INCIDENT_STATUS_TRIGGERED 未受理 TRIGGERED INCIDENT_STATUS_ACKNOWLEDGED 已受理 ACKNOWLEDGED INCIDENT_STATUS_REJECTED
事件相关枚举信息 事件级别 事件类别 事件来源 事件状态 父主题: 事件管理
如何调用API 构造请求 认证鉴权 返回结果