检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
解决方案参数说明 参数 说明 短期方案(故障如何恢复) 请填写故障的短期方案。 单击“添加文件”上传短期方案相关附件。 支持最多上传10个文件,支持文件类型:jpg、png、docx、txt、pdf,上传文件不能超过10MB。 长期方案(如何避免再次发生) 请填写故障的长期方案。 单击“添加文件”上传长期方案相关附件。
选择需要查看资源所在的云厂商。 默认选择“华为云”。 选择需要同步的资源类型。 默认选择“弹性云服务器ECS”。 选择目标实例,单击实例名称。 单击下方的“查看资源详情”。 进入对应资源服务详情页面。 父主题: 资源管理
SLO管理概述 SLO(服务级别目标,Service Level Object)为业界通用指标,SLO实际值=1-(应用不可用时长/应用总时长)*100%,通常代表服务/应用的质量水平。 在COC中,Warroom、告警、事件(“业务是否中断”属性为“是”的事件单)等运维工单,会
ReadOnlyAccess 统一身份认证服务的只读权限 全局服务 [全局] 人员管理中读取IAM账户下的人员信息 RMS ReadOnlyAccess 资源管理服务只读权限 全局服务 [全局] 资源管理中同步纳管云服务资源 DCS UserAccess 分布式缓存服务普通用户权限(无实例创建、修改、删除、扩缩容)
SLA管理概述 SLA(服务等级协议,Service Level Agreement)在业界常用于衡量服务质量,云运维中心的SLA管理功能为客户提供了工单时效管理能力,当工单触发某SLA规则时,COC会记录工单SLA触发详情,并通知客户及时跟进和处理。 SLA功能概要如下: 支持
点击“确认”,完成Config服务开通。 AK/SK所对应的账号需添加Action。 创建策略:进入“IAM”服务,选择“策略”,点击“创建策略”,选择服务“EC2”,筛选操作并勾上“DescribeRegions”,点击“添加更多权限”,选择服务“Config”,筛选操作并勾上
coc:instance:start 启动云服务器的权限。 √ √ x x coc:instance:reboot 重启云服务器的权限。 √ √ x x coc:instance:stop 关闭云服务器的权限。 √ √ x x coc:instance:reinstallOS 重装弹性云服务器操作系统的权限。
密钥管理 操作场景 为了更加安全地保护您的主机帐号密码,云运维中心会使用DEW服务来加密您的主机帐号密码。在使用密钥管理之前,请先在DEW创建好密钥。 配置密钥 登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”。 在“日常运维”模块单击“账号管理”。 单击右上方“密钥管理”。
支持哪些攻击场景? 支持对华为云ECS实例、RDS实例、CCE集群和Pod等多个云服务的常见故障场景的模拟,支持对多个故障场景的自由编排和组合。 父主题: 韧性中心常见问题
SLO期望值)*全年服务总时长(min); 当SLO实际值≤SLO期望值时,ErrorBudget=0; 天/月 分钟 PRR看板 PRR看板(生产就绪程度评审)中包含评审服务汇总、评估雷达分布、服务复盘、改进任务闭环情况。评审服务汇总体现投入生产前各个服务当前所处的评审阶段,以
UniAgent的全称是统一数据采集Agent,主要是作为云服务运维系统的底座, 提供中间件指标采集、自定义指标采集能力和脚本下发执行通道。本章介绍UniAgent的安装、重装、升级、卸载和状态同步操作,安装完成后您可以通过UniAgent对资源执行自动化运维。 注意事项 当前只有弹性云服务器ECS的实例支持UniAgent的操作。
演练报告有哪些内容? 演练报告包括演练过程的基本信息、服务恢复能力评分和复盘改进措施,并且能够生成复盘改进工单,确保演练中发现的问题能够落实改进。 父主题: 韧性中心常见问题
API 应用资源管理 脚本管理 脚本工单 故障管理 补丁管理
事件管理 创建事件单 受理事件单 提交事件单解决方案 验证事件处理结果 查询事件单详情 事件相关枚举信息 父主题: 故障管理
事件类别 KEY 中文名称 英文名称 inc_type_p_security_issues 安全问题 Security issues inc_type_p_function_issues 功能问题 function issues inc_type_p_reliability_issues
事件状态 status KEY 中文名称 英文名称 incident_draft 草稿 DRAFT INCIDENT_STATUS_TRIGGERED 未受理 TRIGGERED INCIDENT_STATUS_ACKNOWLEDGED 已受理 ACKNOWLEDGED INCI
附录 错误码 获取项目ID
作业管理 概述 执行公共作业 审批配置 创建自定义作业 管理自定义作业 执行自定义作业 标签管理 父主题: 自动化运维
应用资源管理”。 单击左上方“应用管理”。 在左侧应用栏,选择应用,选择目标实例,单击实例名称。 图1 查看详情 单击下方的“查看资源详情”。 在对应资源服务详情页面查看资源详情。 父主题: 应用管理
应急预案 概述 自定义预案 公共预案 父主题: 韧性中心