检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
审批人通过排班场景和排班角色决定 审批方式:一人通过 或 全部通过 3、支持添加多个审批环节 注:排班角色需配置具体的审批人才可生效,未配置审批人变更申请将无法提交成功。 编辑审批配置 登录COC。 在左侧菜单栏选择“变更管理 > 变更配置”页面,点击操作列的“编辑”,修改审批配置信息。 图3 修改审批配置
某智能客服运维人员在处理事件/告警时,事件处理闭环低效,无标准化事故处理流程、无明确故障恢复协同作战阵型、无应急响应预案。同类型故障场景重复出现,无运维经验沉淀,确定性故障场景无法自动恢复。存在多种级别的告警,处理告警缺乏规范性流程且处理效率较低。需要建立标准化的事件流程,实现规范性处理。 解决方案 端到端事件流程:
启动接入和引流,其传统运维模式日常运维工作以被动救火为主,缺乏主动运维理念和工具能力;应用上线前无有效途径识别可用性问题,上线后可用性现状无法精确掌握,运维团队缺少故障应急能力和实战经验;希望通过混沌演练对应用在生产环境的架构韧性进行一次引流前的“排雷”和“验收”,以确保在正式引流时无重大稳定性风险。
自动化运维常见问题 审批人无法接收通知? 自定义脚本参数输入值无效? 实例无法选择? 如何在不重启实例的情况下重置密码? 父主题: 资源运维常见问题
资源管理常见问题 首次安装UniAgent如何操作? 如果资源无法在资源管理页面中查询到,如何处理? 无法找到应用管理层级说明页面?
”; 在实例上安装UniAgent,需要您提供实例的管理员账号密码,若您的资源实例未安装UniAgent且您已忘记密码,则无法安装UniAgent、导致无法执行重置密码的公共脚本,请知悉! 父主题: 自动化运维常见问题
补丁基线不生效? 补丁基线中安装规则基线与自定义基线的区别? 补丁工单日志中出现all mirrors were tried异常如何处理? 机器无法选择? 补丁修复后合规性报告仍然为不合规如何处理? 补丁操作出现lsb_release not found异常如何处理? 父主题: 资源运维常见问题
参数仓库已选参数和已选主机实例不能跨Region? 安全生产规则,参数仓库已选参数和已选主机实例不允许跨Region操作,选择实例和参数仓库选择的区域需要一致。 图1 参数仓库 图2 选择实例 父主题: 参数管理常见问题
不分批:用户所有待执行的机器会全部在同一批次。 图5 选择分批策略 设置“熔断策略”。 熔断策略:用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 图6 设置熔断阈值 单击“提交”执行脚本。 图7 “提交”按钮 父主题: 脚本管理
未修改通知 未修改通知时间不能小于参数创建或修改的时间。 图1 通知时间小于系统时间 有到期删除策略时,未修改通知时间不能大于到期删除时间。 图2 未修改通知时间大于删除时间 父主题: 通知规则
全旅程混沌工程方案 一站式资源运维 常见问题 了解更多常见问题、案例和解决方案 热门案例 COC权限如何配置? 首次安装UniAgent如何操作? 如果资源无法在资源管理页面中查询到,如何处理? 生成事件的流程? WarRoom是什么? 变更级别的定义? 混沌演练是什么? 混沌演练支持哪些攻击场景?
作”列单击“订阅”。 图5 订阅 人员管理中的订阅用途简介: 单击“订阅”后,弹窗中可选择需要发起订阅的通知方式,只能选择一个。 订阅时,无法勾选已确认订阅的通知方式。 若用户所有的通知方式均已确认订阅,则在页面操作栏中的“订阅”按钮不可单击。 父主题: 人员管理
结束所有批次,指不再继续调用下一个批次,但是脚本执行中的实例,是不会进行中止执行的。 通过UniAgent下发执行的脚本,处于运行中的状态,是无法中止执行的,只能等待执行完成。 图16 作业工单详情 父主题: 作业管理
用户登录并验证权限 登录云运维中心COC后,在左侧导航栏选择“任务管理 > 待办中心”,单击右上角“ 创建待办”,尝试创建待办任务,如果无法创建待办任务(假设当前权限仅包含COC ReadOnlyAccess),表示“COC ReadOnlyAccess”已生效。 登录云运维中心COC后,在左侧导航栏选择“任务管理
别系统的薄弱点(软件Bug、方案设计不足之处、故障恢复流程卡点等),及早发现系统可用性的问题进行解决,持续提升应用韧性,建立运维信心。对于无法避免的场景(硬件故障、服务器异常下电、网络设备单板故障等)通过提前制定快速恢复应急预案进行应对。 COC混沌演练为用户提供一站式的自动化演
全链路故障诊断 操作场景 当事件创建后,您可以通过全链路故障诊断,快速定位故障根因。我们面向客户应用提供应用层、组件层、资源层的关系拓扑,实现基于资源和应用告警的异常染色,并提供资源核心指标查看与实例诊断能力。 前提条件 已完成在CMDB的应用创建和资源关联,并完成应用拓扑编辑。
提供用户创建应用的能力,便于按业务逻辑单元进行资源管理。 操作场景 通过Cloud Operations Center创建应用。 注意事项 同一个应用下不能同时存在子应用和组件。 操作步骤 登录COC。 在左侧菜单栏选择“资源管理 > 应用资源管理”,进入“应用资源管理”页面,选择“应用管理”页签,单击“创建应用”。
器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 输入“熔断策略”。 用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,可以精确到小数点后一位。 选择需要切换的镜像。 图2 可切换的镜像页面
器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 输入“熔断策略”。 用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,可以精确到小数点后一位。 输入登录凭证。 登录凭证:
合规性报告摘要 查看不合规的补丁状态,根据状态不同查看不同解决方案 表1 不同合规性状态的解决方案 不合规状态 解决方案 失败 查看生成此合规性报告的补丁工单日志,根据失败的日志解决此问题 已安装待重启 补丁已安装修复,待机器重启后生效,机器重启后扫描即可解决不合规问题 已拒绝 在补丁基