检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
全旅程混沌工程方案 一站式资源运维 常见问题 了解更多常见问题、案例和解决方案 热门案例 COC权限如何配置? 首次安装UniAgent如何操作? 如果资源无法在资源管理页面中查询到,如何处理? 生成事件的流程? WarRoom是什么? 变更级别的定义? 混沌演练是什么? 混沌演练支持哪些攻击场景?
条件。 用户已经开通组织(Organizations)或已经加入到一个组织中,可到组织的服务页面查看。 图1 组织服务 用户所在组织将COC设置为可信服务,可到组织页面的可信服务查看。 图2 可信服务 当前执行跨账号运维操作的账号是组织管理员或者是组织管理员所委派的委托管理员。 图3
定时任务执行记录 查看定时任务执行记录 登录COC。 在左侧菜单栏选择“资源运维 > 自动化运维”,在“日常运维”模块单击“定时运维”,进入“定时运维”页面。 在“定时运维”页面,单击列表数据操作列的“更多 > 历史记录”,跳转定时任务“历史记录”页面。 图1 查看执行情况 单击工
鼠标悬停在右上角的用户名,选择下拉列表中的“我的凭证”。 在“API凭证”页面的项目列表中查看项目ID。 单击用户名,在下拉列表中单击“我的凭证”。 在“我的凭证”页面的项目列表中查看项目ID。 图1 查看项目ID 父主题: 附录
选需要配置的区域至右选框后,单击“确定”。配置好之后可在“操作”列单击“查看任务详情”查看配置区域的改密任务,也可根据业务需求进行删除。 图1 配置改密任务 至此全部配置工作完成,可至“帐号管理”页签“查询帐号密码”。 父主题: 帐号管理
确认”。 图1 事件单创建改进单 图2 创建改进单 改进信息提交后可以下事件详情页面,改进记录中查看改进单状态及当前责任人,同时点击改进名称会跳转至改进管理页面处理改进单。 图3 查看改进记录 父主题: 处理事件
单击右侧“修正”,右边弹出添加中断记录弹框,修改中断的不可用时间。 图3 修正中断记录 单击右侧“修正记录”,右边弹出添加中断记录弹框,查看修正的历史记录。 图4 查看中断修正记录 父主题: SLO管理
步骤描述,单击“保存”,完成创建应急预案。 图8 文档预案步骤 查看应急预案详情 登录COC。 在左侧菜单栏选择“韧性中心 > 应急预案”页面,选择“自定义预案”页签。 单击“应急预案”,查看应急预案。 图9 查看应急预案 编辑应急预案 登录COC。 在左侧菜单栏选择“韧性中心 >
审批人无法接收通知? 审批人没有在人员管理配置任何消息通知渠道。 消息渠道配置请参考:如何使用人员管理。 父主题: 自动化运维常见问题
字段说明: 执行账号:即租户账号名,可以通过我的凭证页面查看。 图7 查看账号名 执行区域:执行的目标对象所在的区域 委托名称:IAM中委托对象的名称 图8 获取委托名称 项目ID:IAM中的项目概念,执行的目标对象所在的项目的ID 图9 查看项目 图10 获取项目ID 填写执行基本信息,
作业,完成后单击“提交”;应急预案为文本预案,根据对应的步骤执行后,单击“提交”。 图4 执行应急预案页面 处理事件过程可查看事件关联的原始告警。 图5 查看事件关联告警信息 事件处理完后,可单击“事件处理”,填写事件处理结果。 填写事件处理信息后,单击“提交”。 图6 事件处理详情
运维事务中心 提供用户查询、跟踪运维待办事项的能力。 操作场景 通过Cloud Operations Center查询、跟踪运维待办事项。 操作步骤 登录COC。 进入COC“总览”后,左上角可以查询到待处理事件、待处理告警、我的待办的统计数量。 图1 运维事务跟踪 单击“待处理
成功率取值范围0~100,可以精确到小数点后一位。 单击“提交”。 图2 重启展示操作页 在“确认执行”弹框中,单击“确定”。 图3 确认执行 查看执行结果。 图4 查看结果 执行结果为“异常”时,可以通过点击“重试”或“批次重试”尝试重新执行失败的任务或批次。也可以点击“取消”或“批次取消”,跳过异常的任务或批次。
成功率取值范围0~100,可以精确到小数点后一位。 单击“提交”。 图2 重启展示操作页 在“确认执行”弹框中,单击“确定”。 图3 确认执行 查看执行结果。 图4 查看结果 执行结果为“异常”时,可以通过点击“重试”或“批次重试”尝试重新执行失败的任务或批次。也可以点击“取消”或“批次取消”,跳过异常的任务或批次。
成功率取值范围0~100,可以精确到小数点后一位。 单击“提交”。 图2 关机展示操作页 在“确认执行”弹框中,单击“确定”。 图3 确认执行 查看执行结果。 图4 查看结果 执行结果为“异常”时,可以通过点击“重试”或“批次重试”尝试重新执行失败的任务或批次。也可以点击“取消”或“批次取消”,跳过异常的任务或批次。
成功率取值范围0~100,可以精确到小数点后一位。 单击“提交”。 图2 关机展示操作页 在“确认执行”弹框中,单击“确定”。 图3 确认执行 查看执行结果。 图4 查看结果 执行结果为“异常”时,可以通过点击“重试”或“批次重试”尝试重新执行失败的任务或批次。也可以点击“取消”或“批次取消”,跳过异常的任务或批次。
成功率取值范围0~100,可以精确到小数点后一位。 单击“提交”。 图2 关机展示操作页 在“确认执行”弹框中,单击“确定”。 图3 确认执行 查看执行结果。 图4 查看结果 执行结果为“异常”时,可以通过点击“重试”或“批次重试”尝试重新执行失败的任务或批次。也可以点击“取消”或“批次取消”,跳过异常的任务或批次。
SLO(服务等级目标,Service Level Object),SLO管理目前对接Warroom、故障、告警等功能,自动化地完成SLO的计算,为SLO看板大屏提供数据。 查看SLO SLO指标配置 SLO中断记录 父主题: 基础配置
汇聚告警 登录COC。 在左侧菜单栏单击“故障管理 > 告警管理”,可以查看汇聚告警或原始告警列表信息。 在汇聚告警搜索框中输入告警单号、集成告警名称,“回车”进行搜索。 汇聚告警包含当前告警和历史告警。 图1 告警列表 处理告警 告警转事件 清除告警 历史告警 父主题: 告警管理
图1 问题级别 单击操作列“编辑”修改问题级别和描述。,若某个级别不需要开启可将列表中是否开启的开关关闭。 修改完后可在问题管理页面中查看最新的问题级别。 父主题: 问题流程