检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
PRR模板的详细描述 应用分类 PRR模板所属的应用分类 PRR检查项 PRR模板提前制定的产品立项、产品设计、产品上线三个阶段的检查项信息 制定检查项信息,单击选择检查项所属的评审阶段“产品立项/产品设计/产品上线“,单击“添加检查大类“,右侧显示检查项信息,可以根据需要选择对应的检查项。 图3
(CCE)攻击场景 如果选择攻击目标来源为云数据库(RDS),则选择指定的云数据库实例,单击“下一步”。 图10 选择攻击目标为云数据库(RDS) 选择云数据库(RDS)攻击场景并填写场景的攻击参数,单击“完成”即可。 图11 云数据库(RDS)攻击场景 如果选择攻击目标来源为分
参数管理的页面权限? 权限设计 访问参数列表页:需要list权限: coc:parameter:list 获取参数详情:需要get权限:coc:parameter:get 删除参数:需要操作类权限:coc:parameter:delete 创建参数:需要操作类权限:coc:parameter:create
故障模式 故障模式是指应用在运行过程中可能出现的特定类型的问题或失效状态。构建丰富的故障模式库,制定相应的预防和恢复措施,有助于设计更加高可用的应用系统。通过识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。 操作场景
挂起问题 操作场景 问题单受理后,在定位阶段若需要创单人协助提供数据或其他信息;问题实施阶段变更需要审批等场景。支持问题处理人挂起问题单,问题单挂起后需要创建人审批。 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 问题管理”,进入“待我处理”的问题列表页面。 点击问题单
司带来巨大的经济损失和声誉影响。 在运维过程中引入混沌工程,通过定期进行演练的方式,可以在现网问题发生前识别系统的薄弱点(软件Bug、方案设计不足之处、故障恢复流程卡点等),及早发现系统可用性的问题进行解决,持续提升应用韧性,建立运维信心。对于无法避免的场景(硬件故障、服务器异常
从SLI/SLO、可冗余、可容灾、可过载控制、可故障管理、可变更能力、可运维、安全生产等维度,对服务可用性及运维能力提出基线要求,在服务产品开发前端构筑能力,进行相关需求规划、设计和开发工作,并在服务上线前进行生产准入审视。 父主题: PRR评审
资源总览 提供用户查看所购买资源(包含弹性云服务器、弹性公网IP、云数据库等)的能力。 操作场景 通过Cloud Operations Center查看资源(包含弹性云服务器、弹性公网IP、云数据库等)。 操作步骤 登录COC。 进入COC“总览”后,可以查看对应的资源信息。 图1
操作场景 解决该问题需要涉及变更实施操作。 前提条件 问题定位出解决方案详情页面,“是否需要变更”填写“需要变更”,问题单会走到待现网实施阶段。 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 问题管理”,进入“待我处理”的问题列表页面。 点击问题单名称进入问题详情页面,
演练操作动作,系统后台在演练不同阶段会自动设置对应的值。可以选择: inject_fault:表示演练处于故障注入阶段 check_fault_status:表示演练处于故障查询阶段 rollback:表示演练处于取消正在注入故障的阶段 clean:表示演练处于清理环境阶段 CAN_ROLLBACK
脚本入参字段会展示脚本默认参数,可单击“敏感参数”决定是否明文展示,单击参数输入框可编辑参数值。 d.输入执行用户,输入超时时间。 e.选择实例方式分为手动选择:用户手动勾选实例。选择全部:选择单region或者单应用关联的全部实例。 手动选择实例方式:单击“添加实例”,弹出实例选择弹窗。
单击“执行”。 图2 选择需要执行的作业 选择作业版本号,并检查作业步骤是否符合预期。 图3 检查作业步骤 选择执行类型。 “执行类型”分为两种:单账号执行/跨账号跨区域执行 图4 执行类型 选择填入“IAM权限委托”,IAM权限委托将用于runbook执行过程中,通过委托切换对应身份,然后执行作业。
填写任务名称,操作描述。 图6 填写基本信息 单击“输入”,按需选择service(产品短名)、apiName(api名称),如选择云数据库的ListSlowLogsNew(查询数据库慢日志)OpenAPI,显示具体的OpenAPI定义。 填写所需OpenAPI参数内容。 图7 添加输入信息 单击
云运维中心中的故障管理、资源运维等场景中,支持发送短信、邮件、语音、企业微信、钉钉等通知。如需使用需要先开通消息通知服务。 通知管理 云数据库 资源运维中,可以对云数据库进行批量操作。混沌演练中,支持对云数据库进行演练任务执行。 资源运维 混沌演练 裸金属服务器 资源运维中,可以对裸金属服务器进行批量操作、脚本执行、作业执行、定时任务等运维操作。
PRR评审 统计参与PRR评审的服务数量 参与PRR评审的服务数量 天/月 个 PRR评审通过情况 PRR评审 统计在PRR各阶段中,通过与未通过的服务数量 PRR各阶段,通过与未通过的服务数量 天/月 个 TOP5事件 TOP5事件 事件管理 统计严重性最高的事件Top5 根据选择时间
添加任务 填写任务名称,操作描述。 图6 添加基本信息 单击“输入”,按需选择service(产品短名)、apiName(api名称),如选择云数据库的ShowBackupPolicy(查询自动备份策略)OpenAPI,显示具体的OpenAPI定义。 填写“propertySelector
待现网实施 待验证 SLA目标 可开启SLA目标,在开启SLA之后,最多可以设置7天 通知对象 通知对象分为 工单责任人 排班 个人 其中工单责任人是默认通知 通知渠道 通知渠道分为 默认 短信 企业微信 钉钉 邮件 飞书 不通知 单击“确定”对SLA规则进行修改。 图7 配置SLA规则
PRR评审所属的应用的介绍信息 应用分类 PRR评审所属的应用的类别信息 评审阶段 PRR评审要发起的评审阶段 期望完成时间 PRR评审期望的完成时间 填写完基本信息后,选择PRR模板,会带出此模板在当前评审阶段需要进行的检查项,继续填写PRR评审的检查项信息 图3 发起PRR评审-填写PRR检查项信息
资源类型 目前支持纳管的资源类型: 弹性云服务器 ECS 目前支持托管(帐号导入)的资源类型: 弹性云服务器 ECS、分布式缓存服务 DCS、云数据库 RDS、分布式消息服务 DMS 帐号基线 基线帐号数量≤30个,关联的组件数量≤100个。
必选参数。 待办的重要性,可以选择: 紧急 重要 次要 提示 责任人 必选参数。 待办的责任人可以选择: 排班 个人 通知渠道 必选参数。 通知渠道分为: 默认 短信 企业微信 钉钉 邮件 飞书 不通知 截止时间 必选参数。 待办需要闭环的时间点 标签 可选参数。 推荐方案 必选参数。 可